Data engineer
Ref : 260306B001-
Date de début16/03/2026
-
Localisation
59 - Lille
-
Durée12 mois
-
Profil
Data Engineer
-
Secteur d'activité
Agro-alimentaire
Nous recherchons un Data engineer pour une mission de 12 mois renouvelables sur Lille.
Caractéristiques de la mission :
1) Description de la mission
Objectifs de la mission
• Objectifs à court terme : Assurer le développement et la mise en production des
pipelines de données nécessaires aux cas d'usage AI identifié. Garantir la qualité et
la fiabilité des données ingérées dans Microsoft Fabric.
• Objectifs à long terme : Construire le socle technique (connecteurs, logique de
transformation) pour contribuer à une migration vers Microsoft Fabric tout en
amenant l'équipe interne à l'autonomie par la pratique.
Livrables attendus
• Pipelines d'ingestion et de transformation : Flux de données développés
(Notebooks, Dataflows, Pipelines) intégrant les règles de gestion et de nettoyage.
• Modèles de données (Silver/Gold) : Tables et vues prêtes à l'emploi pour les
consommateurs (Power BI, AI, Analystes).
• Prototypes de migration : POCs (Preuve de Concept) sur la reprise des flux
complexes actuels (Semarchy/ETL externe) vers Microsoft Fabric.
• Code documenté et optimisé : Scripts Python/SQL commentés et conformes aux
standards définis.
Tâches à réaliser
• Développement Data Engineering : Coder les transformations de données
complexes (nettoyage, historisation, calculs) au sein de l'environnement Microsoft
Fabric.
• Intégration technique : Connecter Microsoft Fabric aux sources de données
existantes (Semarchy, bases internes/externes) et assurer l'alimentation du
OneLake.
• Accompagnement opérationnel : Réaliser des revues de code avec l'équipe interne
et faire du "Pair Programming" pour transmettre les bonnes pratiques de
développement.
• Préparation à la migration : Analyser techniquement les flux ETL existants et
proposer/implémenter les équivalents techniques dans Microsoft Fabric pour
préparer 2026/2027.2) Compétences et profil recherchés
Compétences techniques
• Développement Data (Cœur de métier) : Maîtrise avancée de Python et SQL.
Capacité à écrire du code performant et maintenable.
• Microsoft Microsoft Fabric & Azure Data : Expertise pratique sur les composants
Data Engineering (Lakehouse, Notebooks) et Data Factory (Pipelines).
Compréhension de l'architecture Medallion (Bronze/Silver/Gold).
• Modélisation & Qualité : Solides bases en modélisation de données (Star schema,
Data Vault, etc.) et en techniques de data quality / data cleansing.
• Intégration : Expérience dans la connexion à des systèmes hétérogènes (API, bases
relationnelles, fichiers plats).
Expérience attendue
• Années d'expérience : Profil Senior (7+ ans), avec un historique fort en
développement technique et projets complexes.
• Responsabilités passées : Avoir occupé un rôle de Tech Lead Data ou de
Développeur Senior référent. Une expérience concrète de migration de données ou
de changement d'outil ETL est un plus.
• Certification DP600 et DP700 sont un plus.
Compétences non techniques ("soft skills")
• Capacité de vulgarisation : Savoir expliquer simplement le "pourquoi" d'une
solution technique à l'équipe.
• Pédagogie active : Patience et volonté de faire monter les autres en compétence à
travers la pratique quotidienne.
• Pragmatisme : Capacité à livrer des solutions fonctionnelles rapidement tout en
respectant les standards de qualité