Data Engineer (w/m/d) - AI
Location: Hamburg, Berlin, Gütersloh oder Remote (idealerweise max. 3 Stunden Reisezeit nach Berlin)
Build the Backbone of AI That Matters
Deine Mission
Wir sind nicht einfach ein weiteres Unternehmen, das seine Daten in die Blackbox eines anderen einspeist. Wir bauen unseren eigenen KI-Stack, der skalierbar, sicher und 100 % unter unserer Kontrolle ist. Wenn du es leid bist, Pipelines zusammenzupatchen, die niemand wirklich versteht, oder alte ETL-Monster zu warten, lies weiter.
Als Data Engineer - AI übernimmst du die Architektur und den Betrieb unserer KI- und Machine-Learning-Anwendungen — von Rohdaten bis hin zu produktionsreifen Modellen und Services. Du arbeitest Seite an Seite mit Data Scientists und ML Engineers, um Modelle wirklich nutzbar zu machen, und treibst das technische Rückgrat von Produkten, die im großen Maßstab laufen.
- Real engineering: Du klebst nicht nur APIs zusammen — du baust Systeme.
 - Sichtbare Wirkung: Deine Arbeit betreibt Live-Services — genutzt, getestet und geschätzt.
 - Tech-first Umgebung: Wir sind von Grund auf AI- und Data-fokussiert, nicht nur im Marketing.
 
Das wirst du tun
- Design, Build & Run: Architektur skalierbarer Data-Backends für unsere KI- und ML-getriebenen Produkte.
 - Brücke schlagen: Eng mit Data Scientists zusammenarbeiten, um ML-Prototypen in Produktion zu bringen
 - Automatisieren & Optimieren: Stabilität und Performance unserer ML-Modelle und KI-APIs sichern — Tests sollen selbstverständlich sein.
 - Neues erkunden: Cutting-Edge-Technologien in Machine Learning Ops, Feature Stores, Storage, Computing und Orchestrierung evaluieren — wenn es Open Source und vielversprechend ist, wirst du damit arbeiten.
 
Dein Toolkit
- Tiefes Wissen in Software Engineering, inkl. Testing und Design Patterns
 - Erfahrung mit Datenpipelines, ML-Datenvorverarbeitung, Feature Engineering und Storage-Techniken
 - Eine „get-code-into-prod“-Mentalität — du legst Wert auf Robustheit und Performance
 - Du blühst in agilen, cross-funktionalen Teams auf, in denen schnell geliefert und schneller gelernt wird
 
Deine Tools
- Python: Aufbau sauberer, skalierbarer Datenpipelines und ML-Backends, inklusive Frameworks wie TensorFlow, PyTorch oder scikit-learn
 - SQL: Effiziente Abfragen, komplexe Joins und große Datensätze beherrschen
 - Git: Versionskontrolle liegt dir im Blut. Du weißt, wie man sauber brancht, committet und im Team zusammenarbeitet.
 
Bonus-Skills (nice to have): Apache Hadoop, Spark / Docker, Kubernetes / Grafana, Prometheus, Graylog / Jenkins / Java, Scala / Shell-Scripting
⚙️ Unser Tech Stack
Wir bauen mit den Tools, die wir lieben (und wir lieben gute Tools): TypeScript, Node.js, React, Python, SQL, Scala, Java, Docker, Kubernetes, AWS, GCP, C++, GitHub und ab und zu eine Koffein-geladene Whiteboard-Skizze. Und wir haben keine Angst, etwas zu verwerfen, wenn es einen besseren Weg gibt. Schau dir unser Open-Source-Zeug an: github.com/smartclip 🎁
🎁 Deine Benefits
- 💻 Hochwertige Hardware (Mac/Linux/was immer du brauchst)
 - 🧠 Zugang zu Coursera, Udacity, Konferenzen, Hackathons & Coaching
 - 📦 „Smart Fridays“ – unsere 4-Tage-Woche, um deinen Flow zu schützen
 - 🏡 Flexible Arbeitszeiten & Remote Work – wir vertrauen dir, dass du deinen Job erledigst
 - 🚴 JobRad + Urban Sports Club Deals + kostenlose RTL+ Subscription
 - 🧳 Deutschlandticket-Zuschuss, tolle Team-Events und mehr
 
🎯 Ready to build AI that runs in production?
Drop us a line — we’d love to hear from you.
Deine Ansprechpartnerin
Sarah Jentzsch

smartclip is committed to creating a diverse and inclusive environment. All qualified applicants will receive consideration for employment without regard to race, ethnicity, nationality, age, gender, gender identity, religion, sexual orientation, disability, or any other diverse characteristics.
- Department
 - Engineering: Data Engineering
 - Locations
 - Berlin
 - Remote status
 - Fully Remote