E X P E R I E N C E PROFESSIONNELLE
Oct. 2019
Data engineer
Capgemini – Crédit Agricole Leasing & Factoring
Aujourd’hui
Projet : Automatisation de l’intégration des données – reporting
• Environnement technique: shell, hadoop MAPR, hive, sqoop, power BI, Jenkins, GIT
• Mission : Création et mise à jour de chaines d'intégration et de traitement de données à partir de différentes
sources (oracle, sql server, csv …), mise à disposition des données transformées sur hive pour différents métiers,
exposition des résultats de traitement sur power BI
Mai-2017 à aujourd'hui: Capgemini Lille
❖ 09/2018 à aujourd'hui: KIABI - Data engineer
• Projet : Développement et intégration de données massives sur un cluster Hadoop
• Environement technique: shell, hadoop, python, spark, hive, impala, pig
• Mission : Création et mise à jour de chaines d'integration et de traitement de données de ventes, stock, produits, commandes … pour le datalake, création et mise à jour des scripts shell de lancement developpement des scripts pyspark/pig de traitement des données depuis différentes sources et formats (avro, parquet, csv ...), création et mise à disposition des tables et vues hive/impala pour visualiser les résultats des traitements, création et mise à jour des fichier de paramètres et variables d'environnements.
❖ 01/2018 - 08/2018: Leroy Merlin - Data scientist
• Projet : Direction Marketing big data
• Environnement technique: R, python, Teradata
• Mission : Développement de différents algorithmes de machine learning autour du thème de la supply chain: clustering des magasins, prévision des activités des entrepôts, détection des stocks suspects, détection et traitement des données des produits girafes.
❖ 05/2017 - 10/2017: Auchan - Data scientist
• Projet : Prévision des ventes Mise en place d'un algorithme de prévisions des ventes des magasins sur un périmètre de 15 marchés et 29 catégories
• Environnement technique: Teradata, R
• Mission : Préparation et nettoyage des données, analyse de l'algorithme existant, test des différents algorithmes de machine learning (SVM, Xgboost, Random Forest, NN, ...), mise en place d'un algorithme hybride (séries temporelles + Random Forest + simulation d'un bruit blanc dont les caractéristiques sont extraits dynamiquement depuis l'historique pour chaque couple (magasin, catégorie)
Formation
2017 Master 2 : Systèmes d’Information et Aide à la Décision (SIAD)
Université de Lille
❖ Compétences fonctionnelles
Contrôle de gestion, comptabilité analytique, supply chain, marketing
❖ Compétences techniques
SGBD : Teradata, Oracle, Écosystème Hadoop, pyspark, pig, hive impala, R, python, SQL, nosql
❖ Méthodes et Outils
Data science, data engineering, data mining, machine learning, algorithmes de AI: prévision, classification, scoring, segmentation …