: Data Engineer
StarClay (En interne)
6/2024 -
Chloé: Une solution cloud sur Google Cloud Platform pour l'analyse automatique des CVs, incluant l'extraction d'informations clés via OCR et NLP, et l'injection des données dans VSA et BigQuery. Des dashboards analytiques sont créés pour mesurer la pertinence de la solution, qui évolue selon les besoins du business et du recrutement.
Congé maternité
Groupe Renault: Data Engineer
4/2023 - 10/2023
Au sein du projet CAFE (Corporate Average Fuel Economy): une politique fédérale qui impose aux constructeurs une norme moyenne d&rsquoémission de CO2 pour les voitures qu&rsquoils mettent sur le marché.
Equipe: 7 Personnes
Equipe Projet: 1 Chef de projet /6 Profils data (Data analyst et data engineer)
Description et Objectifs de la mission :
â— Refactoring du projet CAFE sur la plateforme GCP
â— Extension du périmètre pour les véhicules LCV
â— Implémentation et déploiement de la nouvelle approche de la transformation en immatriculation
â— Optimisation des calculs
â— Automatisation de toute la chaîne de traitement.
Environnement Pyspark
GCP : Cloud Storag , BigQuery, DataProc, Vertex AI*
DLL
Data Engineer
Groupe Renault:
11/2022 - 2/2023
Un projet permettant le développement de ventes complémentaires des pièces de rechanges des véhicules aux réseau R3
Equipe: 4 Personnes
Equipe Projet: 2 Data engineers/ 1 manager/ 1 AMOA
Description et Objectifs de la mission :
â— La conception algorithmique des différents cas d&rsquousages
â— Identification des données sources
â— La réalisation du cas d&rsquousage de développement des ventes complémentaires:
â— Algorithme apriori pour les produits complémentaires
â— calcul de gain
â— la géolocalisation des MRA
â— la saisonnalité des ventes complémentaires
Environnement Python
GCP: BigQuery, Vertex AI
Data Engineer
Groupe Renault:
3/2021 - 9/2022
WAP: Mise en place d&rsquoun système de traitement automatisé des données reliées à la Garantie des véhicules et des batteries électriques
Equipe: 7 Personnes
Equipe Projet: 2 Data Engineer/ 1 Product Owner/ 2 Dev / 1 Business Analyst / 1 Project Leader
â— Mise à disposition et croisement des données des véhicules, des batteries, des offres de garantie, des volumes, des dépenses et de facturation.
â— Mise en place des chaînes de traitement data (Mise en &oeliguvre des chaînes de préparation de données, de produits de données et mode distribué des traitements)
â— Ordonnancement et Optimisation des traitements Data
â— Contribution et avis sur les problèmes de traitement Data
â— Mise à disposition des données traitées via une application Web
Environnement Python,
GCP: Cloud Storage, DataFlow, BigQuery, CloudSQL, Apache Beam
GitLab
Data Scientist
Groupe la poste:
9/2020 - 3/2021
Au sein du Pôle Sources & Solutions IA et Analytics
Equipe: 4 personnes
Equipe Projet: 2 Data Scientists / 1 manager/ 1 chef de projet
Description et Objectifs de la mission :
â— Compréhension de besoins et identification des données sources
â— Gestion de projets:chiffrage et capitalisation
â— Accompagnement des métiers sur les outils datalake (Hue, Dataiku, Tableau)
â— Réalisation des labs DSS
â— Création de dashboards répondant aux besoins des métiers
Environnement
et méthodologie Datalake: Hive,Hue, HDFS,
Préparation des données
Machine learning(Segmentation & classification)
Python, Pyspark, Scala, Spark, Tableau Desktop, Zeppelin
Dataîku
Data Engineer
Groupe Renault:
1/2019 - 9/2020
Au sein du projet CAFE (Corporate Average Fuel Economy): une politique fédérale qui impose aux constructeurs une norme moyenne d&rsquoémission de CO2 pour les voitures qu&rsquoils mettent sur le marché
Equipe: 9 personnes
Equipe Projet: 2 Data Engineers/ 2 Product Owners/ 1 coordinateur de projet/ 1 Scrum master/2 Dev/ 1 architecte transverse
â— Compréhension de besoins et identification des données sources
â— Nettoyage, restitution et transformation des données provenant des différentes sources Ingestion des données dans le datalake via le DLL
â— Industrialisation des processus métiers :
â—‹ Matching de co2 et masse
â—‹ Calcul de KPI financiers
â—‹ Transformations en immatriculations
â—‹ Intégration des options
â— Création de dashboards répondant aux besoins des métiers
Méthodologie et Environnement Hortonworks: Hive, HDFS, Oozie, Yarn, Apache Kafka
DBeaver, Hue
Préparation des données
Machine learning
Python, R, Scala, Spark, Spotfire, Zeppelin
DLL (DataLake Loader): ETL interne de Renault
GCP
Scrum
Data Scientist
Groupe La Poste:
1/2018 - 12/2018
Au sein de la direction Webmarketing du Groupe La Poste
Equipe: 3 personnes
Equipe Projet: 2 Data Scientists/1 directrice webmarketing
Description et Objectifs de la mission :
> > Analyses ad-hoc produire des connaissances pour aider au pilotage Analyses du business pour le pilotage de la performance de la Boutique. Analyse des ventes, analyse des comportements clients dont :
â— aide à l&rsquooptimisation des coûts d&rsquoacquisition lors de campagnes promotionnelles
â— suivi des cohortes de comportements de clients pour certaines gammes ou produits
â— analyses d&rsquoimpacts
> > Analyses complexes des données
â— Segmentation des clients pour :
o un meilleur retargeting des offres de la Boutique
o la recommandation des produits
o la relance des paniers avec appétence des produits o une meilleure connaissance des clients
â— Participation à l&rsquoélaboration du bilan semestriel
> > Visualisation des données
Visualisation de la répartition des clients et de leurs évolutions en France.
Méthodologie et Environnement Préparation des données
mathématiques et statistiques
Machine Learning
visualisation des données
Python, R, Scala, Spark, Kibana, Zeppelin, MLlib
Dataiku
Hortonworks
Data Scientist
Ventura associates:
12/2017 - 4/2018
Responsable de la partie Intelligence Artificielle et Big Data du projet HeyTalents.
Un projet de recrutement collaboratif et retargeting qui vise à améliorer la liaison des talents et
des recruteurs dans le monde entier.
Equipe: 7 personnes
Equipe Projet: 1 Data Scientist/ 4 Dev/ 1 Chef de projet/ 1 PO/
Description et Objectifs de la mission :
â— Collecte des talents et des clients à partir de LinkedIn et Facebook en utilisant les
méthodes de scraping
â— Analyse des profils des candidats et des mandats
â— Implémentation des solutions de matching affinitaire entre les candidats et les talents
â— Recrutement prédictif pour l&rsquoanticipation des comportements des talents
Méthodologie et Environnement Python, Java, Apache Spark,
Jupyter, MLlib, Watson Personality Insights,
MongoDB
Scrum
Data Scientist
Sintegra Consulting:
12/2016 - 9/2017
Equipe d&rsquoanalyse des données pour l&rsquoaide à la décision. Je fais aussi partie de l&rsquoéquipe
formatrice de technologies liées à l&rsquoIntelligence artificielle et Big Data.
Equipe:
Equipe Projet: 5 Data Scientists/ 1 Lead Data
Description et Objectifs de la mission :
â— Définition et suivi des KPIs du framework AARRR (Acquisition- Activation - Retention-
Referral - Revenue)
â— Analyser les données de Facebook, linkedIn et MailChimp
â— Classification des profils des candidats selon de nombreux critères
â— Application de plusieurs algorithmes d&rsquoapprentissage automatique pour comprendre les
données historiques
Formatrice IA auprès de 150 ingénieurs en formation continue, tous les samedis sur un
semestre:
â— Fondamentaux en Machine Learning
â— Watson Explorer Foundational Components
â— IBM Watson Content Analytics
â— IBM Bluemix
Méthodologie et Environnement R, RapidMiner, Weka
IBM Bluemix, Watson Content Analytics (WCA)
Watson Explorer (WEX)
_Développeur Big Data
1/2016 - 11/2016
Ce projet consiste à permettre la scalabilité des algorithmes de sélection de variables
pour fonctionner correctement dans le contexte des Big Data.
Description et Objectifs de la mission :
â— Construire un serveur Hadoop/ Spark de machines physiques
â— Installation, configuration et test des composants de l&rsquoécosystème : HDFS et MapReduce
â— Implémentation des programmes MapReduce
â— Manipulation des Big Data
â— Travailler avec plusieurs machines virtuelles parallèles
Méthodologie et Environnement R
HDFS, MapReduce
Linux, Vmware