Christophe - Lead Data Scientist

Ref : 200711L002
Email vérifié
Photo de Christophe, Lead Data Scientist
Compétences
Expériences professionnelles
CV plus récent en cours de mise à jour
  • EXPÉRIENCE PROFESSIONNELLE

    PRÉDICTIONS DE VALEURS BOURSIÈRES 2020
    TradeShifu
    Développement de modèles prédictifs à destination de traders intraday : forecast du prix d’ouverture des plusieurs indices, du prix le plus haut, le plus bas, et de clôture. Les prédictions sont actuellement exploitées avec succès par plusieurs milliers de traders.
    o Cadre du projet : Recherche et analyse des données, implémentation des pipelines de transformation, optimisation des modèles prédictifs, déploiement en production
    o Technologies utilisées : Tensorflow v2, Keras ; scikit-learn, XGBoost ; statsmodel pour les modèles ARIMA, VAR, et GARCH
    o Infrastructure utilisée : Microsoft Azure ML
    o Ma contribution : J’ai développé toutes les phases du projet : analyse, implémentation, modélisation et mise en production

    MAINTENANCE PRÉDICTIVE POUR AVION 2019
    AIRBUS (via Tech Mahindra)
    Avec une équipe de 4 personnes et en tant que data scientist senior, j’ai réalisé un modèle prédictif destiné à anticiper les pannes sur le système de pressurisation cabine (bleed) et optimiser les opérations de maintenance, en se basant sur les séries temporelles des capteurs embarqués ainsi que sur l’historique des opérations de maintenance. En tant qu’expert en Machine Learning, j’ai piloté les compétences complémentaires de l’équipe (data scientist junior, ingénieur système, développeur) pour transformer les données brutes en provenance des avions en prédictions fiables sur les défaillances du système de pressurisation.
    o Cadre du projet : Analyse des données, implémentation des pipelines de transformation
    des données, optimisation des modèles prédictifs, évaluation de leur qualité
    o Technologies utilisées : Spark via l’api PySpark en Python ; scikit-learn, Keras pour les
    modèles LSTM, XGBoost, Hyperopt, stats-model pour les modèles ARIMA, FoundryTS
    (librairie propriétaire Palantir pour les time series)
    o Infrastructure utilisée : plateforme Palantir (foundry) de Airbus (Skywise)
    o Ma contribution : J’ai participé à toutes les phases du projet : analyse, implémentation,
    modélisation et ai guidé les actions de l’équipe en identifiant les pistes à explorer et en
    utilisant au mieux des compétences de chacun

    MAINTENANCE PRÉDICTIVE POUR POMPES À CHALEUR 2018
    GROUPE ATLANTIC
    A partir des données techniques des pompes à chaleur du Groupe Atlantic, des données
    d’intervention des opérations de maintenance et des données du call center, j’ai développé un
    modèle prédictif pour permettre à l’équipe de planification des maintenances annuelles de prioriser
    leurs interventions. Le modèle final était basé sur des réseaux de neurones récurrents (LSTM)
    permettant la prévision (forecast) de séries temporelles.
    o Cadre du projet : Analyse des données, implémentation des pipelines de transformation
    des données, optimisation des modèles prédictifs, évaluation de leur qualité
    o Technologies utilisées : Scikit-learn, Keras, XGBoost, Catboost, Hyperopt, BigML
    o Infrastructure utilisée : serveurs CPU et GPU loués sur FloydHub ; Infrastructure BigML
    o Ma contribution : j’ai implémenté la solution en intégralité ; j’ai aidé l’équipe métier à
    définir le modèle et son cadre d’utilisation ; et j’ai récupéré toutes les données
    potentiellement utiles auprès des différents services, qu’ils soient métier ou technique

    ANIMATION DE FORMATIONS DE DATA SCIENCE 2018 - 2020
    HUMAN CODERS

    Animation des formations Machine Learning, Deep Learning et Machine Learning Avancé via
    l’organisme de formation Human Coders en inter et intra entreprises. Animation de 20 formations en
    2018 avec une note moyenne de 4,88/5 sur la pédagogie du formateur sur plus de 40 évaluations.
    o Conception du contenu : contenu pédagogique progressif alternant explications
    théoriques, mise en pratique en Python et sur BigML (plateforme de Machine Learning
    qui ne nécessite pas de code), et retours d’expérience de cas réels.
    o Animation : pédagogie progressive et adaptable selon le profil des participants :
    développeurs, chercheurs, product owners…

    AUTRES PROJETS DE DATA SCIENCE
    ICAS/WPO, BOURSORAMA, GROUPE JOUVE, ALCATEL SUBMARINE NETWORK…

    Depuis 2013 j’ai participé et mis en place de nombreux modèles prédictifs, à destination de
    l’industrie (maintenance prédictive), du marketing (estimation de la valeur potentielle d’un client,
    détection de churn…), finance (prévision de versement de dividendes…) et sécurité (détection de
    fraude…).
    Je suis également intervenu sur des aspects de conseil pour aider à la mise en place de
    méthodologies projet, de bonnes pratiques ; ainsi que sur les aspects communication, AMOA,
    gestion de la qualité, mise en production et monitoring des projets de data science.

    PROFIL COMPLÉMENTAIRE EN INFORMATIQUE

    RESPONSABLE SI 2011 - 2018
    TAJ (groupe DELOITTE, 500 collaborateurs)

    En tant que responsable SI du cabinet d’avocat Taj (500 collaborateurs), j’ai piloté de nombreux
    projets d’envergure pour répondre aux attentes spécifiques des directions métier pendant près de 7
    ans : applicatifs métier (automatisation de déclarations fiscales, logiciels de comptabilité…), outils
    transverses (GED, intranet collaboratif…), et plateformes de communication (sites web et blog…).
    o Définition de la stratégie informatique avec la direction générale et les métiers.
    o Gestion des budgets d’investissement (500k€) et de fonctionnement (2M€).
    o Pilotage des prestataires : DSI externalisée, TMA, éditeurs de logiciel.
    o Gestion des projets stratégiques : intranet communautaire, GED, site internet…
    o Management : équipe AMOA (2 pers.) et équipes techniques (5 pers.).

    CONSULTANT SI CONFIRMÉ 2007 - 2011
    WAVESTONE

    En tant que consultant j’ai pu réaliser des missions en tant que chef de projet, gestionnaire de
    contrats et AMOA m’ont permis entre autres de travailler entre autres clients pour la Caisse des
    Dépôts et le Crédit Agricole. Quelques exemples de missions :
    o Responsable SI adjoint pendant 2 ans chez CDC Numérique (filiale de la Caisse des
    Dépôts)
    o AMOA fonctionnelle et technique pendant 1 an chez Crédit Agricole S.A.
    o Réalisation d’un business model ticket TGV au format ISO pour la SNCF.
    o Audit d’une application stratégique de Machine Learning pour EDF.




Études et formations
CV plus récent en cours de mise à jour
  • COMPÉTENCES

    Langages
    Python, SQL, VBA (SSRS, VBA), Java, Javascript, PHP, HTML, CSS

    Python libraries
    Core/Viz : Numpy, Scipy, Pandas, Matplotlib, Seaborn, NLTK
    Stats/Data mining : Statsmodels, pdmarima, R, FactoMineR et FactoShiny
    Machine learning : Scikit-Learn, PySpark, XGBoost, Catboost, Vowpal Wabbit, LightGBM,
    Hyperopt, Lime, Shap
    Deep Learning : Tensorflow, Tensorflow v2, Keras

    Data Science
    Engineering: Spark
    Databases: PostgreSQL, MySQL
    Machine Learning: Un/Supervised approaches, Regression & Classification problems, Time
    series
    Deep Learning: CNN, RNN, LSTM, GRU

    FORMATIONS

    2020 Analyse des données multidimensionnelles (Agrocampus Ouest)
    2020 Python for Time Series Analysis and Forecasting (Udemy)
    2019 Spark and Python for Big Data with PySpark (Udemy)
    2019 How to win a Data Science Competition : Learn from Top Kagglers (National Research University Higher School of Economics, Coursera)
    2018 Deep Learning, CNN, Sequence Models (deeplearning.ai, Coursera)
    2017 Machine Learning (Stanford, Coursera)
    2014 Prise de parole en public (MC2, 2 jours)
    2012 Réussir vos formations en informatique (Cegos, 4 jours)
    2007 Ingénieur diplômé de l’ENSIMAG (École Nationale Supérieure d'Informatique et de Mathématiques Appliquées de Grenoble)

    LANGUES

    Anglais : professionnel
    Espagnol : débutant
    Français : natif

D'autres freelances
Data Scientist SQL

Ces profils pourraient vous intéresser !
CV Data Scientist
Malick

Data Scientist

  • PARIS
PYTHON Data science SQL Dataiku Microsoft Power BI TABLEAU SOFTWARE
Bientôt disponible
CV Data Scientist SQL
Zineb

Data Scientist SQL

  • BRON
SQL PYTHON DATA Data science HTML CSS TABLEAU SOFTWARE Microsoft Power BI JAVASCRIPT JAVA
Disponible
CV Data Scientist
Louis

Data Scientist

  • PARIS
DATA SQL PYTHON TABLEAU SOFTWARE Data science DATAWAREHOUSE APACHE SPARK Google Cloud Platform
Disponible
CV Data Analyst
Linxuan

Data Analyst

  • ROSNY-SOUS-BOIS
Microsoft Power BI SQL AGILE PYTHON JIRA BIGQUERY MICROSOFT POWER QUERY Microsoft PowerApps GOOGLE DATA STUDIO
Disponible
CV Consultant SQL
Farouk

Consultant SQL

  • COLOMBES
ELASTICSEARCH SQL KIBANA DOCKER LINUX APACHE LUCENE C# AZURE Google Cloud Platform APACHE KAFKA
Disponible
CV Data Scientist SQL
Marième

Data Scientist SQL

  • BERRIAC
PHP MYSQL DRUPAL SQL JAVA ORACLE PYTHON SQL SERVER JAVASCRIPT WORDPRESS
Disponible
CV Data Scientist PYTHON
Adonija

Data Scientist PYTHON

  • TOULOUSE
DATAVIZ DATA PYTHON Data science SQL Microsoft Power BI BIG DATA DATAWAREHOUSE Data lake Google Cloud Platform
Disponible
CV Data Scientist PYTHON
Donatien

Data Scientist PYTHON

  • GIF-SUR-YVETTE
PYTHON DATA SQL APACHE SPARK Microsoft Power BI BIG DATA Cloud AWS
Disponible
CV Data Expert, PhD in Computer Science | Data Integration & Management, Semantic Web, ML and NLP
Raphaël

Data Expert, PhD in Computer Science | Data Integration & Management, Semantic Web, ML and NLP

  • NICE
PYTHON DATA BIG DATA Data science JAVA SQL EXCEL Apache NiFi
Disponible
CV Formateur PYTHON
Meryem

Formateur PYTHON

  • TOULOUSE
PYTHON JAVA SQL HTML WORDPRESS EXCEL CSS JAVASCRIPT VISUAL BASIC PHP
Disponible