Über SAP
SAP ist ein globales Unternehmen, das über 400.000 Kunden weltweit bei der effizienten Zusammenarbeit unterstützt. Mit 200 Millionen Benutzern und über 100.000 Mitarbeitern weltweit ist SAP ein Marktführer in Enterprise-Resource-Planning-Software und cloud-nativen Geschäftslösungen.
Über die Rolle
Wir suchen einen erfahrenen Development Architect zur Gestaltung unserer Autonomous Operations Platform (AIOps). Sie werden Teil eines Teams sein, das die Zukunft der cloud-nativen Infrastruktur bei SAP und in Europa formt. Das Projekt ist Teil der EU-Initiative IPCEI-CIS zur Stärkung der digitalen Souveränität Europas.
Aufgaben
- Konzeptionierung und detaillierte Gestaltung einer autonomen Operations-Plattform
- Design verteilter Systeme für KI-gesteuerte Incident Management und automatische Behebung von Infrastrukturproblemen
- Entwicklung von Kubernetes-nativen Operatoren zur autonomen Fehlerbehebung basierend auf KI-Erkenntnissen
- Technische Führung bei Design- und Implementierungsansätzen innerhalb der Apeiro Reference Architecture
- Bewältigung von Herausforderungen wie Telemetrie-Korrelation über Logs, Metriken und Traces sowie automatisierte Root-Cause-Analyse
- Architektur produktiver Systeme mit Fokus auf KI/ML-Integration unter Berücksichtigung von Ausfallsicherheit
- Zusammenarbeit täglich mit verschiedenen Teams in der Apeiro-Ökosphäre und Linux Foundation NeoNephos-Gemeinschaft
- Mentoring und Wissenstransfer innerhalb des Teams
Anforderungen
- Tiefe Expertise in Programmiersprachen wie Python, Java oder Go mit Fokus auf verteilte Systeme und Cloud-native Architektur
- Bewiesene Erfahrung in einer dedizierten Software-Architektur-Rolle mit Problemlösungskompetenz
- Kubernetes-Fähigkeiten einschließlich Operator-Entwicklung und Multi-Cloud-Produktion
- Erfahrung mit Observability-Technologien (Prometheus, OpenTelemetry, Grafana, Distributed Tracing)
- Verständnis für Integration und Nutzung von KI/ML-Services
- Proficiency in CI/CD-Pipelines, Infrastructure-as-Code und GitOps-Workflows
- Verständnis von verteilten Systemfehlern und Resilience Patterns
- Fließende Englischkenntnisse in Wort und Schrift
Benefits
- Kontinuierliches Lernen und Skill-Entwicklung
- Großzügige Benefits und Wellbeing-Programme
- Flexible Arbeitsmodelle
- Unterstützung persönlicher Entwicklung
- Inklusive Unternehmenskultur
- Zusammenarbeit in einem hochmotivierten, internationalen Team
- Arbeit an zukunftsweisenden Technologien und Open-Source-Projekten
- Mentoring und Führungsmöglichkeiten