Über das Unternehmen
Join the AI & Data Platform team to drive operational excellence for cutting-edge applied AI challenges in retail. We are seeking a skilled DataOps Engineer to design, build, and maintain the robust data infrastructure essential for our AI and Automation initiatives. This critical role requires blending deep cloud expertise with an unwavering commitment to operational rigor, applying software engineering principles (DevOps/CI/CD) directly to the data ecosystem.
Deine Aufgaben
- Guarantee Data Reliability: Own DataOps implementation and CI/CD to ensure all production data pipelines are reliable, traceable, and scalable for AI initiatives.
- Optimize Data Velocity: Architect high-performance Airflow and platform solutions that dramatically accelerate data delivery and time-to-value for automation projects.
- Establish Data Trust: Drive quality and governance standards using dbt, transforming raw data into trusted, documented assets critical for robust ML applications.
- Orchestration & Reliability: Design, implement, and rigorously monitor production ETL/ELT pipelines using Apache Airflow (DAGs, custom operators). Implement advanced monitoring, logging, and error recovery to guarantee pipeline stability and data freshness for the AI platform.
- DataOps & CI/CD: Apply full DataOps and DevOps principles (CI/CD, version control, automated testing) across the entire data development lifecycle. Enforce rigorous code quality standards for all transformation logic (SQL/Python).
- Infrastructure & Performance: Manage and scale core data components (DW, Airflow) using Infrastructure as Code (IaC). Proactively optimize the AI & Data platform performance (query tuning, partitioning) to support low-latency AI inference and resolve critical production issues.
- Documentation: Maintain clear and comprehensive documentation for data pipelines and architecture.
Dein Profil
- 3+ Jahre Erfahrung in einer DataOps oder ähnlichen Data Engineer Rolle.
- Expertise in Apache Airflow (komplexe DAGs, benutzerdefinierte Operatoren, Produktionsmanagement).
- Fundierte Erfahrung mit dbt (Modellentwicklung, Datenkvalitätstests, Paketmanagement).
- Experten-SQL-Kenntnisse und tiefe Erfahrung mit Public-Cloud-Datendiensten (bevorzugt GCP) wie BigQuery, Snowflake, Redshift.
- Starke Python-Fähigkeiten für ETL/Airflow-Entwicklung.
- Erfahrung mit Infrastructure as Code (IaC)-Tools wie Terraform.
- Praktische Kenntnisse in Softwareentwicklungsprinzipien (Testen, CI/CD).
- Ausgezeichnete Zusammenarbeit- und analytische Fähigkeiten.
Unsere Leistungen
- Wir sind ein Great Place to Work: Unser tolerantes und empathisches Arbeitsumfeld ermöglicht es Ihnen, die Zukunft unseres Unternehmens mitzugestalten und bietet viel Raum für persönliche Entwicklung.
- Wir verbessern Ihr Work-Life-Balance: Gleitzeit und hybride Arbeitsmodelle sowie Sonderurlaubstage ermöglichen es Ihnen, Ihren Arbeitstag an Ihren Bedürfnissen auszurichten.
- Wir kommunizieren auf Augenhöhe: Wir sind ein Familienunternehmen, daher ist freundlicher Umgang für uns von größter Bedeutung.