Über SAP
SAP hilft der Welt, besser zu funktionieren. Das Unternehmen ist ein führender Anbieter von End-to-End-Geschäftsanwendungssoftware und verwandten Diensten für Datenbanken, Analytik, intelligente Technologien und Experience Management. Mit 200 Millionen Nutzern und über 100.000 Mitarbeitern weltweit unterstützt SAP mehr als 400.000 Kunden bei effizienter Zusammenarbeit und besserer Nutzung von Business Intelligence.
Die Rolle
Als Development Architect werden Sie ein Autonomous Operations Platform (AIOps) konzeptualisieren und detailliert ausarbeiten. Sie planen und gestalten verteilte Systeme, die KI-gesteuerte Incident-Management ermöglichen, definieren Integrationen mit KI/ML-Services und entwickeln Kubernetes-native Operatoren, die Infrastrukturprobleme basierend auf KI-Erkenntnissen automatisch beheben.
Ihre technische Führung beeinflusst die Design- und Implementierungsansätze innerhalb der Apeiro Reference Architecture (ApeiroRA), Teil der EU-Initiative IPCEI-CIS zur Stärkung der digitalen Souveränität Europas.
Aufgaben
- Konzeptualisierung und detaillierte Ausarbeitung der Autonomous Operations Platform
- Design verteilter Systeme für KI-gesteuerte Incident-Management und Remediation
- Definition von Integrationen mit KI/ML-Services und Interpretation von Model-Outputs
- Entwicklung von Kubernetes-native Operatoren für autonome Infrastrukturautomatisierung
- Adressierung von Herausforderungen wie Telemetrie-Korrelation und automatisierte Root-Cause-Analyse
- Design produktiver Systeme mit Ausfalltoleranz und Resilienz bei Netzwerkpartitionierungen
- Technische Führung bei der Lösung komplexer Probleme im Cloud-Infrastructure-Betrieb
- Zusammenarbeit mit Teams im Apeiro-Ökosystem und der Linux Foundation NeoNephos Community
Anforderungen
Hard Skills
- Tiefe Expertise in Python, Java oder Go mit Fokus auf verteilte Systeme und Cloud-native Architektur
- Nachgewiesene Erfahrung in einer dedizierten Software-Architect-Rolle
- Kubernetes-Kenntnisse einschließlich Operator-Entwicklung und Multi-Cloud Production Operations
- Erfahrung mit Observability-Technologien (Prometheus, OpenTelemetry, Grafana, Timeseries-Datenbanken, Distributed Tracing)
- Verständnis für KI/ML-Service-Integration und Operational Decision Making
- Proficiency in CI/CD-Pipelines, Infrastructure-as-Code und GitOps-Workflows
- Verständnis von Failure Modes verteilter Systeme und Graceful Degradation
Soft Skills
- Aktive Beteiligung in Open-Source-Communities mit nachweisbaren Beiträgen
- Offene Kommunikation, konstruktives Feedback und Teamfähigkeit
- Fließende Englischkenntnisse (schriftlich und mündlich); Deutsch ist ein Plus
- Erfahrung in Mentoring und Wissensaustausch
- Innovationsfähigkeit und Bereitschaft, Status quo zu hinterfragen