IT Innovationen und Forschung bei der BMW Group
Eine innovative Unternehmenskultur in einem so vielschichtigen Konzern wie der BMW Group lebt von komplexen Systemen und Netzwerken. Mit guten Ideen, Begeisterung und Teamgeist entwickeln unsere IT-Expert*innen unverwechselbar smarte und moderne Systeme. Dabei profitieren sie von ausreichend Budgets, aber auch von standardisierten Prozessen, um Lösungen effizienter umzusetzen. So kann eine IT realisiert werden, die neue Möglichkeiten schafft und damit die Basis unserer Unternehmenskultur und unseres Erfolges sichert.
Aufgaben
- Entwurf, Aufbau und Betrieb von GPU-zentrierter KI-Infrastruktur (insbesondere NVIDIA) in On-Prem- und Cloud-Umgebungen mit Fokus auf Leistung, Skalierbarkeit und Effizienz
- Übernahme der Architektur und des Betriebs von hochleistungsfähigen Rechenumgebungen für verteiltes Training und optimierte Modellausführung
- Optimierung von Rechenleistung, Speicher und Hochleistungsnetzwerken (z.B. InfiniBand, NCCL) zur Ermöglichung von KI-Workloads in industriellen Kontexten in großem Maßstab
- Entwicklung und Betrieb von Kerninfrukstrukturkomponenten wie Scheduling- und Ressourcenmanagementsystemen (z.B. SLURM, Ray, Run:ai) zur effizienten Nutzung geteilter GPU-Ressourcen
- Aufbau und Wartung automatisierter, reproduzierbarer Infrastruktur (z.B. Docker, Kubernetes, Terraform, Ansible, CI/CD)
- Technische Verantwortung für den KI-Infrastruktur-Stack, Definition von Best Practices und Anleitung weniger erfahrener Ingenieure
Anforderungen
- Universitätsabschluss in Informatik, Elektrotechnik oder verwandten Fächern
- 8-10 Jahre Berufserfahrung in der Industrie beim Aufbau und Betrieb von KI- und HPC-Infrastruktur
- Fundierte Hands-on-Erfahrung mit GPU-Systemen (insbesondere NVIDIA), einschließlich Treibern, CUDA und Performanceoptimierung
- Erfahrung mit verteilten Systemen und Hochleistungsnetzwerken (z.B. InfiniBand, NCCL) sowie Erfahrung in Cloud-Umgebungen (AWS, Azure) und On-Prem-Infrastruktur
- Praktische Erfahrung mit Ressourcenplanung und Workload-Orchestrierung (z.B. SLURM, Ray, NVIDIA Run:ai)
- Starke Erfahrung in der Infrastrukturautomatisierung (z.B. Docker, Kubernetes, Terraform, Ansible, CI/CD) und Kompetenz in Python für Infrastruktur- und systemnahe Werkzeuge
- Erfahrung mit dem Training, Finetuning oder Serving von ML-Modellen in der Produktion sowie Exposure zu großskaligen industriellen KI-Anwendungsfällen (z.B. Simulation, Robotik, Ingenieurwesen) wären von Vorteil
Benefits
- Herausfordernde Projekte zur Gestaltung der Mobilität von morgen
- Vielfältige Möglichkeiten für persönliche und fachliche Weiterentwicklung
- Attraktive, faire und leistungsorientierte Vergütung
- Hohe Arbeitsplatzsicherheit
- Jährliche Sonderzahlungen wie Urlaubsgeld, Weihnachtsgeld und Gewinnbeteiligung
- Flexible Arbeitszeiten mit 6 Wochen Jahresurlaub und Überstundenausgleich
- Rabatte auf BMW & MINI
- Zahlreiche weitere Benefits auf bmw.jobs/benefits