Über uns
Deutsche Telekom IT Solutions Slovakia ist seit 2006 unter dem Namen T-Systems Slovakia im Leben der Region Košice präsent und seitdem untrennbar mit der Region verbunden, als wir eines der Gründungsmitglieder von Košice IT Valley wurden.
Wir haben es geschafft, von Grund auf zum zweitgrößten Arbeitgeber im östlichen Teil des Landes mit mehr als 3900 Mitarbeitern zu wachsen.
Unser Ziel ist es, proaktiv neue Wege zur Verbessung zu finden und uns kontinuierlich zu einem Unternehmen zu entwickeln, das innovative Informations- und Kommunikationstechnologiedienstleistungen anbietet.
Aufgaben
- Beratung von Kunden zu allen technischen Aspekten im Zusammenhang mit GPU-Infrastruktur, KI/ML-Modelltraining und Plattformnutzung
- Leitung von Onboarding und Schulungen, Mentoring von Kundenspezialisten zur optimalen Nutzung ihrer GPU-Cluster und KI-Umgebungen
- Design und Implementierung von Proof of Concepts (PoCs), einschließlich Umgebungseinrichtung, Datenverarbeitungspipelines und Deployment-Workflows
- Durchführung von Anforderungsanalysen, Übersetzung von Geschäftsanforderungen in technische Spezifikationen
- Unterstützung der Kunden bei Leistungsoptimierung, Fehlerbehebung, Feinabstimmung und Validierung der gelieferten Lösungen
- Funktion als zentraler technischer Ansprechpartner, Koordination funktionsübergreifender Teams
- Vorschlag und Entwicklung von Automatisierungskonzepten zur Verbesserung von Dienstleistungen, Prozessen und Betriebsmodellen
- Sicherstellung der Anwendung von Best Practices in Bezug auf Zuverlässigkeit, Skalierbarkeit, verantwortungsvolle KI und Sicherheit
- Unterstützung bei Monitoring, Beobachtbarkeit und Kapazitätsplanung für KI-Workloads und GPU-Auslastung
Anforderungen
- Master-Abschluss in Informationstechnologie, Computer Engineering, Applied AI oder verwandtem Bereich
- Fundierte Kenntnisse von NVIDIA GPU-beschleunigten Plattformen (DGX, B200, RTX Pro Server)
- Erfahrung im Betrieb und Training von selbst-gehosteten LLMs, einschließlich Modell-Finetuning und Inferenz-Optimierung
- Praktische Erfahrung mit Slurm, Run:AI oder anderen GPU-Workload-Schedulern
- Fortgeschrittene Linux-Administrationskenntnisse
- Solides Verständnis von Kubernetes und containerisierten AI-Workflows
- Kenntnisse in Skripterstellung (Python, Bash) für Automatisierung, Datenmanipulation und Tooling
- Erfahrung mit Infrastructure as Code (Ansible, Terraform, Helm)
- Kenntnisse in Software-Defined Networking (SDN) und Hochleistungs-Netzwerkarchitekturen
- Erfahrung mit Monitoring- und Visualisierungstools (Prometheus, Grafana, Alert Manager)
- Erfahrung mit Data Engineering/Transformation/Migration-Tools und Pipelines
- Englischkenntnisse auf C1-Niveau
- Ausgeprägte kundenbezogene Kommunikationsfähigkeiten, sowohl technisch als auch nicht-technisch
- Erfahrung mit Anforderungsmanagement (Grundkenntnisse)
- Erfahrung mit Softwaretests, Qualitätssicherung und Validierung (mittleres Niveau)
- Analytische Denkweise, Problemlösungsfähigkeiten, strukturierter Ansatz zur Fehlerbehebung
- Fähigkeit, sowohl selbstständig zu arbeiten als auch mit funktionsübergreifenden Teams zu koordinieren
Benefits
- Attraktives und umfangreiches Work-Life-Balance-Portfolio
- Finanzielle Benefits
- Benefits mit Fokus auf Lernen und Entwicklung
- Benefits mit Fokus auf Gesundheit und Sport
- Benefits mit Fokus auf Familie und Work-Life-Balance
- Weitere Benefits