Wir suchen einen Databricks Champion, der die Einführung, Optimierung und den Einsatz der Databricks-Plattform in unserem Unternehmen leitet. Diese Person wird sowohl als technischer Experte als auch als strategischer Botschafter fungieren und Dateningenieure, Analysten und Wissenschaftler befähigen, skalierbare, leistungsstarke Datenlösungen zu liefern.
Der ideale Kandidat verfügt über weitreichende Erfahrung mit Big Data-Architekturen, Delta Lake und Spark sowie über eine Leidenschaft für die Betreuung von Teams, die Förderung von Spitzenleistungen auf der Plattform und die Förderung einer datengesteuerten Kultur.
Setzen Sie sich für die Einführung von Databricks in allen Teams ein, indem Sie Best Practices, Frameworks und wiederverwendbare Komponenten definieren.
Entwerfen und implementieren Sie skalierbare Datenpipelines unter Verwendung von Apache Spark, Delta Lake und Databricks SQL.
Arbeiten Sie mit funktionsübergreifenden Teams (Data Engineering, Analytik, maschinelles Lernen und IT) zusammen, um robuste, Cloud-native Datenlösungen zu entwickeln.
Optimieren Sie die Leistung der Plattform, einschließlich Clusterkonfiguration, Kostenmanagement und Job-Orchestrierung.
Sie leiten Enablement-Initiativen, einschließlich Databricks-Workshops, Sprechstunden und Dokumentation für Ingenieure und Analysten.
Evaluieren und integrieren Sie neue Databricks-Funktionen und -Tools (z.B. Unity Catalog, Delta Live Tables, Model Serving).
Sie fungieren als primäre Verbindung zwischen internen Benutzern und Databricks Kundenerfolgs- und Support-Teams.
Fördern Sie eine Kultur der Datenexzellenz, indem Sie sich für Datenqualität, Governance und Automatisierung über den gesamten Datenlebenszyklus hinweg einsetzen.
Erforderlich:
5+ Jahre Erfahrung in den Bereichen Data Engineering, Data Science oder Platform Engineering.
2+ Jahre praktische Erfahrung mit Databricks (einschließlich Delta Lake und Spark-Optimierung).
Bevorzugt:
Databricks zertifizierter Dateningenieur / Datenwissenschaftler.
Erfahrung mit der Implementierung von Unity Catalog oder Delta Live Tables.
Erfahrung mit Data Lakehouse oder unternehmensweiten Analyseplattformen.
Erfahrung mit MLflow oder Pipelines für maschinelles Lernen
Starke Erfahrung mit Python, SQL und PySpark.
Tiefes Verständnis von Cloud-Datenarchitekturen (AWS, Azure oder GCP).
Erfahrung mit CI/CD-Pipelines, Infrastructure-as-Code und Data Governance.
Starke Kommunikations- und Kooperationsfähigkeiten - in der Lage, komplexe Konzepte für unterschiedliche Zielgruppen zu übersetzen.
We are seeking a Databricks Champion to lead the adoption, optimization, and best-practice use of the Databricks platform across our organization. This individual will act as both a technical expert and strategic evangelist, empowering data engineers, analysts, and scientists to deliver scalable, high-performance data solutions.
The ideal candidate will have deep experience in big data architecture, Delta Lake, and Spark, along with a passion for mentoring teams, driving platform excellence, and fostering a data-driven culture.
Champion Databricks adoption across teams by defining best practices, frameworks, and reusable components.
Design and implement scalable data pipelines leveraging Apache Spark, Delta Lake, and Databricks SQL.
Collaborate with cross-functional teams (Data Engineering, Analytics, Machine Learning, and IT) to develop robust, cloud-native data solutions.
Optimize platform performance, including cluster configuration, cost management, and job orchestration.
Lead enablement initiatives, including Databricks workshops, office hours, and documentation for engineers and analysts.
Evaluate and integrate new Databricks features and tools (e.g., Unity Catalog, Delta Live Tables, Model Serving).
Act as the primary liaison between internal users and Databricks customer success and support teams.
Promote a data excellence culture by advocating for data quality, governance, and automation across the data lifecycle.
Required:
5+ years of experience in data engineering, data science, or platform engineering.
2+ years of hands-on experience with Databricks (including Delta Lake and Spark optimization).
Preferred:
Databricks Certified Data Engineer / Data Scientist.
Experience implementing Unity Catalog or Delta Live Tables.
Background in data lakehouse or enterprise-scale analytics platforms.
Experience with MLflow or machine learning pipelines
Strong experience with Python, SQL, and PySpark.
Deep understanding of cloud data architectures (AWS, Azure, or GCP).
Experience with CI/CD pipelines, infrastructure-as-code, and data governance.
Strong communication and collaboration skills — able to translate complex concepts for diverse audiences.