Über das Unternehmen
Deutsche Telekom IT Solutions Slovakia ist ein führender IT-Dienstleister mit über 3.900 Mitarbeitern in der Region. Das Unternehmen konzentriert sich auf innovative Informations- und Kommunikationstechnologie-Lösungen und bietet seinen Mitarbeitern umfangreiche Work-Life-Balance-Benefits.
Stellenbeschreibung
NVIDIA und die Deutsche Telekom entwickeln gemeinsam eine industrielle AI-Cloud für Europa. Als Senior DevOps Engineer und AI Consultant fungierst du als technischer Ansprechpartner für Unternehmenskunden und begleitest sie durch Onboarding, Training und Nutzung der AI-Plattform mit 10.000 GPUs auf NVIDIA DGX B200 Systemen und RTX Pro Servern.
Aufgaben
- Beratung von Kunden zu technischen Aspekten von GPU-Infrastruktur, AI/ML-Modelltraining und Plattformnutzung
- Leitung von Onboarding und Training für Kundenspezialisten zur optimalen Nutzung von GPU-Clustern und AI-Umgebungen
- Design und Implementierung von Proofs of Concept (PoCs) mit Umgebungssetup, Datenverarbeitungspipelines und Deployment-Workflows
- Anforderungsanalysen und Übersetzung von Geschäftsanforderungen in technische Spezifikationen
- Performance-Optimierung, Troubleshooting und Validierung von Lösungen
- Koordination funktionsübergreifender Teams in den Bereichen Infrastruktur, Netzwerk, Automatisierung, Sicherheit und AI-Services
- Entwicklung von Automatisierungskonzepten zur Verbesserung von Services und Betriebsmodellen
- Unterstützung bei Monitoring, Observability und Kapazitätsplanung für AI-Workloads
Anforderungen
- Master-Abschluss in Informationstechnologie, Computer Engineering oder Applied AI
- Fundierte Kenntnisse von NVIDIA GPU-beschleunigten Plattformen (DGX, B200, RTX Pro)
- Erfahrung im Betrieb und Training von selbst gehosteten LLMs mit Model Fine-Tuning und Inference-Optimierung
- Praktische Erfahrung mit Slurm, Run:AI oder anderen GPU-Workload-Schedulern
- Fortgeschrittene Linux-Administrationskenntnisse und Kubernetes-Verständnis
- Scripting-Kenntnisse (Python, Bash) für Automatisierung und Tooling
- Infrastructure as Code (Ansible, Terraform, Helm)
- Monitoring- und Visualisierungstools (Prometheus, Grafana, Alertmanager)
- Erfahrung mit Data Engineering, Transformation und Migration-Tools
- Englisch auf C1-Niveau und ausgeprägter kundenorientierter Kommunikationsfähigkeiten
- Erfahrung mit Requirement Engineering und Software-Testing auf fortgeschrittenem Niveau
Benefits
- Umfangreiches Work-Life-Balance-Portfolio mit über 25 verschiedenen Benefits
- Finanzielle Benefits und variable Gehaltskomponenten
- Benefits mit Fokus auf Lernen und Entwicklung
- Benefits mit Fokus auf Gesundheit und Sport
- Benefits mit Fokus auf Familie und Work-Life-Balance
- Flexible Arbeitszeitgestaltung
- Möglichkeit für Remote Work innerhalb der Slowakei
- Kontinuierliche Weiterbildung und Karrierewachstum