Wer wir sind:
Mit mehreren hunderttausend Servern ist Hetzner einer der größten Webhoster und Rechenzentren-Betreiber in Europa. Wir bieten unseren Kunden selbst entwickelte Hightech-Produkte und zuverlässige Infrastruktur zu fairen Preisen. Über 500 Mitarbeiter arbeiten täglich daran die digitale Zukunft mitzugestalten und unseren Kunden simple, effiziente Lösungen für komplexe Probleme bereit zu stellen.
Deine Aufgaben:
- Verantwortung für die Konzeption, Implementierung und den Betrieb unserer "Observability Tools"
- Betreuung und Weiterentwicklung unserer verteilten Systeme für Logging, Metriken und Tracing auf Basis von OpenSearch, Thanos und OpenTelemetry
- Sicherstellung der Skalierbarkeit, Performance und Hochverfügbarkeit der kritischen Observability-Infrastruktur
- Zusammenarbeit mit Entwicklerteams, um Monitoring-, Logging- und Tracing-Anforderungen zu definieren und zu implementieren
- Fehleranalyse und Behebung von komplexen technischen Problemen in den Produktionsumgebungen
- Weiterentwickeln von Kubernetes Operatoren (auch Open Source)
- Weiterer Ausbau des internen Toolings
Dein Profil:
- Abgeschlossenes Studium der Informatik, eine vergleichbare Ausbildung oder relevante Berufserfahrung
- Fundierte Kenntnisse im Bereich DevOps-Methoden und -Tools (CI/CD, Containerisierung mit Docker und Kubernetes, IaC wie Terraform oder Ansible/Puppet)
- Expertise im Observability-Bereich, insbesondere mit OpenSearch (oder Elasticsearch), Thanos, Jaeger und OpenTelemetry
- Praktische Erfahrung in der Administration und Skalierung von OpenSearch-Clustern, einschließlich Index-Management, Sharding und Performance-Optimierung
- Sichere Anwendung von Prometheus und Thanos zur Sammlung und Aggregation von Metriken über mehrere Cluster hinweg
- Gutes Verständnis von OpenTelemetry und dessen Einsatz zur Standardisierung von Traces, Metriken und Logs
- Gute Kommunikationsfähigkeiten auf Deutsch und Englisch sowie eine teamorientierte Arbeitsweise
Dein Umfeld bei Hetzner:
- Höhenverstellbare Schreibtische, kostenfreie Snacks & Getränke
- 6 Wochen Urlaub und Freizeitausgleich für 100 % der geleisteten Überstunden
- Kostenfreie Ressourcen für deine Projekte
- Möglichkeit, bis zu zwei Tage pro Woche mobil zu arbeiten