Définition et Mise en place d’une plate-forme de traitement pour l’amélioration de la connaissance client.
Contenu de la mission :
• Construction de graphes avec les données parcours et CRM
• Mise en place de modèles uplift, scoring de propension/appétence et scoring anti-attrition/churn et de next purchase.
L’ENSAE-Formation continue
2015 - aujourd'hui
Enseignant dans le cadre du Certificat Data Scientist et modules autour de R, des outils Big Data, réseaux de neurones, et Optimisation.
R, Big Data, réseaux de neurones et Optimisation …
Audits :Intervenant auprès de différentes Entreprises
aujourd'hui
Interventions pour conseil et audites en phases amont projet : banques, énergie, pharma …
Stago
aujourd'hui
Audit et refonte du système de gestion des bases de données terrain (instruments déployés en laboratoire)
Contenu de la mission :
• Prise en main du datalake et du système décisionnel
• Présentation des aspects positifs et négatifs du système
• Proposition d’une solution alternative à mettre en place de manière incrémentale
Crédit Agricole SA (Paris)
aujourd'hui
Contenu de la mission :
• Mise en place d’une plate-forme de calcul distribué pour déploiement de modèles comme services web :
- Infrastructure permettant des appels synchrones et asynchrones
- WSGI, Flask, Celery, Redis, Ansible.
• Moteur de recherche sémantique sur des bases de connaissance :
- A partir d’une base étalon (requêtes/réponses souhaitées), hyper optimisation des paramètres du moteur de recherche (Elastic) via hyperopt
- En plus du TF-IDF, mise en place d’un plugin elastic utilisant des embedings pour le calcul de la similarité requête-document
- Apprentissage par les usages via des marqueurs AT Internet.
• Outil CRM d’analyse de parcours client :
- Construction de graphes avec les données parcours et CRM
- Clustering pour recherche de leads
- Data visualisations pour la sélection des parcours et des variables (funnels, sunburst, sankey, graphes) : d3.js, electron.
• Classification d’emails et recommandation de réponses pour des services Client :
- Chaine de traitements d’emails
- Benchmark de méthodes ML
- TensorFLow, Keras, CNN.
Mise en place et gestion de l’infrastructure (cloud et on premisce).
Contenu de la mission :
• Mécanismes de contrôle (freeIPA, OTP)
• Audits et backups
• Optimisation de l’utilisation des serveurs.
RTE (Paris)
aujourd'hui
Détection de communautés et visualisation de réseaux à partir de mapequation (inspiré de PageRank).
Contenu de la mission :
• Intégration du code C++ dans un package R (Rcpp), parallélisation du code (openMP)
• Étude de mécanismes de téléportation
• Visualisations sur l’évolution des communautés.
C++, R (Rcpp), OpenMP
APRR : Autoroutes Paris Rhin Rhône (Dijon)
aujourd'hui
Refonte des systèmes d’administration et d’exploitation.
Contenu de la mission :
• Formation à l’introduction des systèmes prédictifs dans les SI
• Organisation des systèmes pour intégrer des chaînes de traitement «data science »
• Plan des POCs pour la prévention d’événements à partir des données collectées par les capteurs (radars, caméras, senseurs ...).
GRT Gaz (Paris)
aujourd'hui
Prévision du pouvoir calorifique du gaz.
Contenu de la mission :
• Mise en place de modèles de prévisions du PCS au niveau des points de livraison des consommateurs.
Clear Channel (Paris)
aujourd'hui
Contenu de la mission :
• Mise en place d’une infrastructure technique permettant l’exploitation de volume de données conséquent, intégrée au SI Clear Channel actuel
• Intégration de données externes (dont les données provenant des panneaux digitaux)
• Développement des algorithmes de calcul des indicateurs (temps réel) sur la base des données externes
• Développement des algorithmes d’optimisation des campagnes
Études et formations
D.E.A Physique des Plasmas
Université Paul Sabatier (Toulouse III)
1995
Magistère MIMM (Méthodes Informatiques et modèles mathématiques)
Université Paul Sabatier (Toulouse III)
1994
Langues
Anglais - C2
Autres compétences
COMPÉTENCES TRANSVERSES
Concepts et enjeux de la Data Science
Architectures Big Data
Recueil et synthèse des besoins décisionnels
Modèles statistiques, Machine Learning, Deep Learning
Mise en place, pilotage et gestion de projets à composantes calcul
EXPERTISE TECHNOLOGIQUE
STATISTIQUES ET MACHINE LEARNING :
Bonne connaissance des principales méthodes fréquentistes et bayésiennes et de leur mise en œuvre
Mise en place de modèles d’optimisation numérique ad hoc
ARCHITECTURE ET DATA ENGINEERING
Définition et mise en place de systèmes orientés data science et des pratiques de gestion et contrôle.
Modélisation SQL et NoSQL
Pipelines de traitements de la définition des modèles de données au monitoring des modèles en production
Administration Linux,Azure, Aws, Kubernetes
PROGRAMMATION :
R, Python, C++ : utilisateur avancé
Calcul distribué
Utilisateur avancé de tensorflow, pytorch, pymc3, stan
COMPÉTENCES MANAGÉRIALES
Pilotage de projets
Coordination de projets avec les métiers
Enseignement data science
Encadrement data scientists et data engineers
AgileSQLWindowsOracleGestion d'équipePower BIRGPDGestion multi-projetsAudit de conformitéPHPPythonJavaScriptTableauCybersécuritéData Loss Prevention (DLP)EBIOSJava