Christophe - Lead Data Scientist
Ref : 200711L002-
31650 ST ORENS DE GAMEVILLE
-
Data Scientist, Data Analyst, Consultant fonctionnel (41 ans)
-
Totalement mobile
-
Mandataire social de sa structure Freelance (SARL, SAS, EURL, etc)
EXPÉRIENCE PROFESSIONNELLE
PRÉDICTIONS DE VALEURS BOURSIÈRES 2020
TradeShifu
Développement de modèles prédictifs à destination de traders intraday : forecast du prix d’ouverture des plusieurs indices, du prix le plus haut, le plus bas, et de clôture. Les prédictions sont actuellement exploitées avec succès par plusieurs milliers de traders.
o Cadre du projet : Recherche et analyse des données, implémentation des pipelines de transformation, optimisation des modèles prédictifs, déploiement en production
o Technologies utilisées : Tensorflow v2, Keras ; scikit-learn, XGBoost ; statsmodel pour les modèles ARIMA, VAR, et GARCH
o Infrastructure utilisée : Microsoft Azure ML
o Ma contribution : J’ai développé toutes les phases du projet : analyse, implémentation, modélisation et mise en production
MAINTENANCE PRÉDICTIVE POUR AVION 2019
AIRBUS (via Tech Mahindra)
Avec une équipe de 4 personnes et en tant que data scientist senior, j’ai réalisé un modèle prédictif destiné à anticiper les pannes sur le système de pressurisation cabine (bleed) et optimiser les opérations de maintenance, en se basant sur les séries temporelles des capteurs embarqués ainsi que sur l’historique des opérations de maintenance. En tant qu’expert en Machine Learning, j’ai piloté les compétences complémentaires de l’équipe (data scientist junior, ingénieur système, développeur) pour transformer les données brutes en provenance des avions en prédictions fiables sur les défaillances du système de pressurisation.
o Cadre du projet : Analyse des données, implémentation des pipelines de transformation
des données, optimisation des modèles prédictifs, évaluation de leur qualité
o Technologies utilisées : Spark via l’api PySpark en Python ; scikit-learn, Keras pour les
modèles LSTM, XGBoost, Hyperopt, stats-model pour les modèles ARIMA, FoundryTS
(librairie propriétaire Palantir pour les time series)
o Infrastructure utilisée : plateforme Palantir (foundry) de Airbus (Skywise)
o Ma contribution : J’ai participé à toutes les phases du projet : analyse, implémentation,
modélisation et ai guidé les actions de l’équipe en identifiant les pistes à explorer et en
utilisant au mieux des compétences de chacun
MAINTENANCE PRÉDICTIVE POUR POMPES À CHALEUR 2018
GROUPE ATLANTIC
A partir des données techniques des pompes à chaleur du Groupe Atlantic, des données
d’intervention des opérations de maintenance et des données du call center, j’ai développé un
modèle prédictif pour permettre à l’équipe de planification des maintenances annuelles de prioriser
leurs interventions. Le modèle final était basé sur des réseaux de neurones récurrents (LSTM)
permettant la prévision (forecast) de séries temporelles.
o Cadre du projet : Analyse des données, implémentation des pipelines de transformation
des données, optimisation des modèles prédictifs, évaluation de leur qualité
o Technologies utilisées : Scikit-learn, Keras, XGBoost, Catboost, Hyperopt, BigML
o Infrastructure utilisée : serveurs CPU et GPU loués sur FloydHub ; Infrastructure BigML
o Ma contribution : j’ai implémenté la solution en intégralité ; j’ai aidé l’équipe métier à
définir le modèle et son cadre d’utilisation ; et j’ai récupéré toutes les données
potentiellement utiles auprès des différents services, qu’ils soient métier ou technique
ANIMATION DE FORMATIONS DE DATA SCIENCE 2018 - 2020
HUMAN CODERS
Animation des formations Machine Learning, Deep Learning et Machine Learning Avancé via
l’organisme de formation Human Coders en inter et intra entreprises. Animation de 20 formations en
2018 avec une note moyenne de 4,88/5 sur la pédagogie du formateur sur plus de 40 évaluations.
o Conception du contenu : contenu pédagogique progressif alternant explications
théoriques, mise en pratique en Python et sur BigML (plateforme de Machine Learning
qui ne nécessite pas de code), et retours d’expérience de cas réels.
o Animation : pédagogie progressive et adaptable selon le profil des participants :
développeurs, chercheurs, product owners…
AUTRES PROJETS DE DATA SCIENCE
ICAS/WPO, BOURSORAMA, GROUPE JOUVE, ALCATEL SUBMARINE NETWORK…
Depuis 2013 j’ai participé et mis en place de nombreux modèles prédictifs, à destination de
l’industrie (maintenance prédictive), du marketing (estimation de la valeur potentielle d’un client,
détection de churn…), finance (prévision de versement de dividendes…) et sécurité (détection de
fraude…).
Je suis également intervenu sur des aspects de conseil pour aider à la mise en place de
méthodologies projet, de bonnes pratiques ; ainsi que sur les aspects communication, AMOA,
gestion de la qualité, mise en production et monitoring des projets de data science.
PROFIL COMPLÉMENTAIRE EN INFORMATIQUE
RESPONSABLE SI 2011 - 2018
TAJ (groupe DELOITTE, 500 collaborateurs)
En tant que responsable SI du cabinet d’avocat Taj (500 collaborateurs), j’ai piloté de nombreux
projets d’envergure pour répondre aux attentes spécifiques des directions métier pendant près de 7
ans : applicatifs métier (automatisation de déclarations fiscales, logiciels de comptabilité…), outils
transverses (GED, intranet collaboratif…), et plateformes de communication (sites web et blog…).
o Définition de la stratégie informatique avec la direction générale et les métiers.
o Gestion des budgets d’investissement (500k€) et de fonctionnement (2M€).
o Pilotage des prestataires : DSI externalisée, TMA, éditeurs de logiciel.
o Gestion des projets stratégiques : intranet communautaire, GED, site internet…
o Management : équipe AMOA (2 pers.) et équipes techniques (5 pers.).
CONSULTANT SI CONFIRMÉ 2007 - 2011
WAVESTONE
En tant que consultant j’ai pu réaliser des missions en tant que chef de projet, gestionnaire de
contrats et AMOA m’ont permis entre autres de travailler entre autres clients pour la Caisse des
Dépôts et le Crédit Agricole. Quelques exemples de missions :
o Responsable SI adjoint pendant 2 ans chez CDC Numérique (filiale de la Caisse des
Dépôts)
o AMOA fonctionnelle et technique pendant 1 an chez Crédit Agricole S.A.
o Réalisation d’un business model ticket TGV au format ISO pour la SNCF.
o Audit d’une application stratégique de Machine Learning pour EDF.
COMPÉTENCES
Langages
Python, SQL, VBA (SSRS, VBA), Java, Javascript, PHP, HTML, CSS
Python libraries
Core/Viz : Numpy, Scipy, Pandas, Matplotlib, Seaborn, NLTK
Stats/Data mining : Statsmodels, pdmarima, R, FactoMineR et FactoShiny
Machine learning : Scikit-Learn, PySpark, XGBoost, Catboost, Vowpal Wabbit, LightGBM,
Hyperopt, Lime, Shap
Deep Learning : Tensorflow, Tensorflow v2, Keras
Data Science
Engineering: Spark
Databases: PostgreSQL, MySQL
Machine Learning: Un/Supervised approaches, Regression & Classification problems, Time
series
Deep Learning: CNN, RNN, LSTM, GRU
FORMATIONS
2020 Analyse des données multidimensionnelles (Agrocampus Ouest)
2020 Python for Time Series Analysis and Forecasting (Udemy)
2019 Spark and Python for Big Data with PySpark (Udemy)
2019 How to win a Data Science Competition : Learn from Top Kagglers (National Research University Higher School of Economics, Coursera)
2018 Deep Learning, CNN, Sequence Models (deeplearning.ai, Coursera)
2017 Machine Learning (Stanford, Coursera)
2014 Prise de parole en public (MC2, 2 jours)
2012 Réussir vos formations en informatique (Cegos, 4 jours)
2007 Ingénieur diplômé de l’ENSIMAG (École Nationale Supérieure d'Informatique et de Mathématiques Appliquées de Grenoble)
LANGUES
Anglais : professionnel
Espagnol : débutant
Français : natif