Über Datadog
Datadog (NASDAQ: DDOG) ist ein globales SaaS-Unternehmen, das eine seltene Kombination aus Wachstum und Profitabilität bietet. Wir haben uns der Mission verschrieben, Silos abzubauen und Komplexität im Cloud-Zeitalter zu lösen, indem wir die digitale Transformation, die Cloud-Migration und das Infrastruktur-Monitoring der gesamten Technologie-Stacks unserer Kunden ermöglichen. Entwickelt von Ingenieuren für Ingenieure, wird Datadog von Organisationen aller Größen über eine Vielzahl von Branchen hinweg genutzt.
Deine Aufgaben
- Entwicklung von KI-gesteuerten Deployment-Gates: Entwerfen und umsetzen von Entscheidungssystemen, die Kundenbereitstellungen unter Verwendung von CI/CD-Kontext und Datadog-Telemetrie auswerten und sichere, erklärbare Allow/Block-Ergebnisse liefern
- Verantwortung für Evaluierungen und Rollouts: Definition von Präzisions-, Recall- und Vertrauensmetriken, Aufbau von Offline- und Online-Evaluierungen, Validierung von Änderungen im Schattenmodusmodus und sichere Förderung von Verbesserungen zur Durchsetzung
- Gestaltung von Robustheit und Sicherheit: Implementierung konservativer Standards, Leitplanken, Fallbackoptionen und manueller Eingriffspfade, damit sich die Gates unter verrauschten oder unvollständigen Daten vorhersehbar verhalten
- Partnerschaft mit dem Produktmanagement: Zusammenarbeit mit dem Produktmanager, um Kundenprobleme, Adoptionssignale und Roadmap-Ziele in konkrete technische Entscheidungen und Iterationen zu übersetzen
- Integration über die Datadog-Plattform hinweg: Zusammenarbeit mit internen KI-Teams, die die Fehlerhafte Bereitstellungserkennung-Pipeline, LLMs und KI-Agenten entwickeln
- Verantwortung für Produktionssysteme: Aufbau und Betrieb zuverlässiger Backend-Services, die sich im kritischen Pfad von Kundenbereitstellungen befinden, sowie On-Call-Bereitschaft für diese Dienste
Dein Profil
- Mindestens 5 Jahre Erfahrung mit Backend-Systemen und Microservices-Performance: Traces, Latenz-Breakdowns, Nebenläufigkeit und Resilienz-Muster
- Proficiency in einer modernen Programmiersprache, starkes API/Service-Design, Produktions-Ops (Monitoring, Alarmierung, On-Call-Rotation)
- Nachgewiesene Erfahrung bei der Bereitstellung von Software, die auf LLM/Agenten-Features basiert
- Komfort bei der Übernahme von Benutzerreisen, der Iteration von Prototyp -> Alpha -> GA und der Messung der Auswirkungen mit klaren Produktkennzahlen
- Verständnis des End-to-End-KI-Produktlebenszyklus, Vertrautheit mit Offline-/Online-Evaluierungen für KI-Systeme
- Nachgewiesene Fähigkeit, KI-Codingtools in den täglichen Arbeitsabläufen zu verwenden sowie KI-generierte Ausgaben zu validieren, zu kritisieren und zu verfeinern
Benefits
- Neue Mitarbeiteraktien (RSUs) und Mitarbeiteraktienoptionsplan (ESPP)
- Kontinuierliche berufliche Entwicklung, Produktschulung und Laufbahnplanung
- Internes Mentoren- und Buddy-Programm für interne Vernetzung
- Inklusive Unternehmenskultur und Möglichkeit, an unseren Community Guilds teilzunehmen
- Kostenlose, globale psychische Gesundheitsleistungen für Mitarbeiter und Angehörige ab 6 Jahren
- Wettbewerbsfähige, globale Leistungen