Über das Unternehmen
Apple sucht einen proaktiven Site Reliability Engineer zur Weiterentwicklung von Produktionsökosystemen. Sie werden eine Schlüsselrolle bei der Sicherstellung spielen, dass Services resilient, skalierbar und observierbar sind.
Aufgaben
- Gestaltung und Implementierung einer modernen Observability- und Alerting-Strategie mit Fokus auf hochkardinale Daten und aussagekräftige Signale
- Entwicklung von selbstheilenden Systemen zur Reduzierung von Toil durch aggressive Automatisierung
- Zusammenarbeit mit Entwicklungsteams zur Integration von Reliability in CI/CD-Pipelines
- Proaktive Identifikation und Mitigation von Performance-Bottlenecks vor Kundenauswirkungen
- Debugging auf Protokollebene und Optimierung des Datenverkehrs
Anforderungen
- Tiefes Verständnis von Linux-Interna und Netzwerk-Expertise (HTTP/2, HTTP/3 QUIC, HTTPS/TLS)
- Nachgewiesene Fähigkeit zur Automatisierung repetitiver Aufgaben mit Python oder Go
- Erfahrung mit modernen Monitoring-Suites (Prometheus, Grafana, ClickHouse)
- Kenntnisse in Data Structures und Algorithms zur Optimierung von Systemen
- Praktisches Wissen über SLIs, SLOs, Error Budgets, Release und Incident Management
Benefits
- Basis-Gehaltsspanne: USD 132.100 - 244.600
- Aktienbeteiligungsprogramme und Mitarbeiteraktienrabatte
- Umfassende Kranken- und Zahnversicherung
- Altersversorgungsleistungen
- Vergünstigte Produkte und kostenlose Services
- Kostenerstattung für berufliche Weiterbildung
- Mögliche diskretionäre Boni und Umzugshilfe