Über das Unternehmen
Deutsche Telekom System Solutions Slovakia arbeitet mit NVIDIA an der Entwicklung der weltweit ersten industriellen KI-Cloud für europäische Hersteller. Die KI-Fabrik in Deutschland wird 10.000 GPUs auf NVIDIA DGX B200-Systemen und RTX Pro Servern hosten.
Aufgaben
Als Senior Netzwerkingenieur bauen Sie die Netzwerkplattform für die Automatisierung und den Betrieb netzwerkbezogener Komponenten auf und automatisieren diese. Sie stellen den Netzwerk-Stack bereit und verwalten ihn, implementieren und optimieren das Monitoring und setzen bei Bedarf zusätzliche Komponenten ein.
Kernverantwortungen
- Koordination von Netzwerk-Lifecycle-Aktivitäten (Installationen, Upgrades, Änderungen, Firmware-Updates) zusammen mit Data Center und IaaS/PaaS Layer
- Bereitstellung und Wartung von InfiniBand-Switches gemäß ITIL-Standards
- Entwicklung und Pflege von Automatisierungsskripten zur Orchestrierung des gesamten Netzwerk-Umfangs
- Verwaltung von Betriebssystem und Firmware, Durchführung von Patches und Firmware-Upgrades im großen Maßstab
- Implementierung und Verwaltung von Monitoring-Lösungen für Netzwerkkomponenten
- Durchsetzung und Verbesserung von ITIL-Prozessen (Incident-, Problem-, Change-Management) unter Einhaltung von ZERO Outage-Richtlinien
- Verwaltung von High-Speed Fabric mit InfiniBand-, Ethernet- und RoCE-Technologien
- Design, Entwicklung, Test und Implementierung von PE/CE Datacenter-Konnektivität (CE-Router, Firewalls)
Anforderungen
Qualifikation und Erfahrung
- Master-Abschluss in Informationstechnologie
- Umfangreiche Erfahrung in Netzwerkinfrastruktur, Automatisierung und Betrieb
- Nachgewiesene Expertise in InfiniBand, Hochgeschwindigkeitsnetzwerken und Firewall-Management
- Fundiertes Verständnis von ITIL-Prozessen und AI/HPC-Infrastruktur
- Sehr gute Englischkenntnisse (C1-Niveau)
- Bereitschaft zur Teilnahme am Bereitschaftsdienst
Fachliche Kompetenzen
- Erfahrung mit NVIDIA/Mellanox Switch-Konfiguration und UFM-Management
- Erfahrung mit Data Center Routing und BGP/OSPF-Protokollen
- Erfahrung mit Linux-Netzwerken (Cumulus, Ubuntu, Debian) und Konfiguration von Bridges, Bonds, VLANs
- Erfahrung mit Firewall-Management (FortiGate: Policies, NAT, VPNs, IDS/IPS, HA)
- Erfahrung mit Automatisierungstools und Skriptsprachen
- Erfahrung mit Kubernetes und containerbasierte Technologien
- Vertrautheit mit NOC/SOC-Betrieb und On-Call-Rotationsmodellen
Soft Skills
- Gute Kommunikationsfähigkeiten und Präsentationsgeschick
- Analytisches Denkvermögen und Verhandlungsgeschick
- Grundlegende Projektmanagement- und Führungsfähigkeiten
- Teamfähigkeit