Norbert - Data Scientist R
Ref : 160113F001-
94230 CACHAN
-
Data Scientist (52 ans)
-
Totalement mobile
-
En profession libérale
Expérience professionnelle
Avril 2018 – Septembre 2020 : Banque de France
Fonction : Consultant Senior Data Scientist
Mission :
Conception et développement des modèles explicatifs, prescriptifs et prédictifs du taux de règlement
du marché financier de la Zone Euro
Elaboration d’une typologie des acteurs du marché à travers les comptes cash dans la zone Euro
Jan 2017 – Mars 2018 : CNAM
Fonction : Consultant senior Data Scientist
Mission :
Maquettage et développement des modèles prédictifs de fraude à l’assurance maladie
Algorithmes et technologie : Machine Learning (Forêts aléatoires, SVM, logistique-Probit) sous
l’environnement R/RStudio
Poste depuis Janvier 2012 : Groupe Crédit Mutuel Strasbourg / EPS
Fonction :
Ingénieur statisticien en Charge des études statistiques, Data Mining et Econométrie.
Missions R & D réalisées :
- Développement des indicateurs de prévision des missions techniques SAV
- Développement des indicateurs d’évaluation des risques de pannes sur les équipements de la télésurveillance
- Développement des indicateurs de suivi de la performance des opérateurs téléphoniques
- Amélioration méthodologique des études d’impact par des techniques d’économétrie
- Amélioration du process de collecte de données pour garantir la qualité des études statistiques
- Développement du modèle de prévision en temps réel de charge de l’activité des téléconseillers (Appels sortants/entrants)
- Développement du modèle de prévision des sinistres chez les clients télé-surveillés
- Développement du modèle de scoring pour le ciblage des prospects de la téléassistance
- Développement du modèle d’attrition (résiliation) des clients de la télésurveillance.
Compétences et techniques mises en œuvre :
- Modèle de survie de vie :
o Estimation de la probabilité instantanée des pannes sur les matériels de télésurveillance avec traitement de la censure dans le modèle de Kaplan-Meier
o Loi de Weibull pour l’estimation du délai d’attrition par segment de clients
o Evaluation des risques de défauts en fonction du type et l’environnement des matériels : Modèle de survie généralisé à hasard proportionnel de COX.
- Techniques du Data Mining :
o Exploitation des Big Data de sources variées
o Modélisation prédictive par apprentissage supervisé : Réseaux de neurones, Arbres de décision, Modèle de régression par les splines adaptatives (MARS, PolyMARS), Forêts aléatoires et Séparateurs à vaste marge (SVM), les modèles de régression logistique binaire et multinomial et KNN (Plus proches voisins).
o Modélisation par apprentissage non supervisé : ACP, AFC, AFCM, Classification ascendante hiérarchique
- Maîtrise des requêtes de haut niveau : SQL/ORACLE, SQL/SAS Enterprise Guide et SQL/R.
- Gestion de flux de données : IBM SPSS MODELER 17.1
Oct 2010 – Déc 2011 : Ecole polytechnique de Lyon et CNRS/délégation de Grenoble
Fonction :
Attaché de recherche et d’enseignement en Post-doctorant (ATR) : Chargé d’études statistiques
Mission de recherche au CNRS
- Etude des facteurs d’exposition et de vulnérabilité des personnes sur le réseau routier du département du Gard en période d’inondation.
Mission d’enseignement à l’Ecole polytechnique de Lyon :
- Statistiques et informatique décisionnelle pour l’ingénieur
- Modélisation statistique des procédés industriels (MSPC) : Estimation des paramètres de contrôle
o Cartes de contrôle aux mesures
o Cartes de contrôle aux attributs
- Travaux pratiques :
o Méthodes exploratoires d’analyse des données : ACP, AFC, AFCM et AFD
o Séries chronologiques en 4ème et 5ème années
- Encadrement de projets de 5ème année à l’Ecole polytechnique de Lyon.
Logiciels utilisés : SAS 9.2, IBM SPSS MODELER 17.1, STATISTICA 10, R SPAD
Nov 2006 – Mai 2010 : CDD IFSTTAR - Institut Français des Sciences et Technologies des Transports, de l’Aménagement et Réseaux
Fonction :
Ingénieur Statisticien et Data Mining
Projet :
Développement des modèles statistiques de prévision des trajectoires d’avions et de charge de l’espace aérien en nombre d’avions.
Les résultats ont fait l’objet d’une soutenance de thèse en mathématiques appliquées soutenue en octobre 2010 et d’une publication scientifique à la Revue des Nouvelles Technologies.
Missions réalisées :
- Première classe de modèles proposés : Techniques d’apprentissage automatique supervisé
o Classification par arbres de décision et de régression (CART)
o Forêts aléatoires (random forests, Bootstrap)
o Séparateur à Vaste Marge (SVM)
- Deuxième classe de modèles proposés : Techniques de régression
o Régression Multivariée par les Splines Adaptatives (MARS)
o Régression de type PLS 1 et sur composantes principales – RCP
- Développement et validation d’un indicateur d’influence du vent sur les avions en vol
Compétences et logiciels :
- Techniques et outils de fouilles des données (Data mining)
- Exploitation des données multi-sources : Trafic aérien, météo et performances des avions
- Construction des variables synthétiques pour la mise en place des modèles de prévision
- SAS 9, MATLAB, SPAD 9, ORACLE.
Avr – Oct 2006 : STAGE GATE - Groupe d’Analyse et Théorie Economique à l’Université Lyon 2
Projet :
Evaluation économétrique de l’impact du stigmate du chômage sur les salaires et leur croissance. Source des données : Ministère de l’emploi et de la solidarité et la DARES
Missions réalisées :
- Evaluation des déterminants de la trajectoire salariale par modèle de régression logistique avec correction du biais de sélection par la méthode d’Heckman et Robb (Ratio de Mills)
- Estimation de la durée du chômage en fonction des caractéristiques individuelles et des politiques de l’emploi par le modèle général de durée de vie : Modèle à hasard proportionnel de Cox
- Validation des modèles économétriques multi-niveaux par genre (H/F) avec le test de Chow
- Evaluation des effets du capital humain sur la croissance salariale et le retour à l’emploi
Compétences et techniques :
- Exploitation des données longitudinales de panel et modèles économétriques
Logiciels : SAS 9.2, R, SPSS et STATA.
Avr - Oct 2005 : STAGE ATMO, Société de surveillance de la qualité de l’air en Poitou-Charentes
Mission réalisée :
- Développement d’un modèle statistique de prévision de l’ozone dans la région Poitou-Charentes.
- Réduction des coûts d’investissements sur les appareils de mesure d’O3, NOX et particules fines
Techniques et compétences :
- Modèles de régression générale
- Modèle de géostatistique (Krigéage, Co-Krigéage) pour la cartographie de la pollution
Logiciels : R sous Linux, EXCEL et ISATIS.
Juil - Oct 2004 : STAGE INSEE - Institut national de statistique et des études économiques
Mission :
Analyse de l’impact du lien de parenté du chef de ménage sur les activités domestiques des enfants. Données d’enquête ménage du Ghana 2000 réalisée par le Bureau international du travail.
Compétences et techniques mises en œuvre :
- Les techniques exploratoires d’analyses multidimensionnelles des données : ACP (Analyse en composantes principales), AFCM (Analyse factorielle des correspondances multiples)
- Validation d’un indicateur de mesure de l’intensité de l’activité domestique des enfants au Ghana.
Logiciels : SAS, R, EXCEL et SPAD.
Mai –Juillet 2004 : STAGE Laboratoire ARC’ANTIQUE de Loire Atlantique – Nantes
Mission :
Classification des matériaux archéologiques en fonction de la composition chimique
Techniques et compétences mises en œuvre :
- Classification ascendante hiérarchique (CAH) : Simple et sur composantes principales
Logiciels : R et EXCEL.
1999-2003 : CDI Ministère de l’éducation nationale
Missions :
- Enseignement des mathématiques/statistiques et animateur pédagogique du département.
INTERVENANT EN ECOLE D’INGENIEUR
2006-2010
- Ecole Polytechnique de Lyon :
o MSP (Maîtrise Statistique des procédés industriels)
o Analyse des données par des techniques exploratoires (ACP, AFC, AMC)
o Modèle de régression et étude des séries chronologiques : ARMA et ARIMA
o Encadrement des projets de fin de formation d’ingénieur
- Ecole Nationale des Travaux Publics de l’Etat / LYON :
o Méthodes de recueil des données
o Techniques de sondage et d’analyse des données
o Protocole des tests de conformité des produits industriels.
o Logiciels utilisés : SPAD 9 et R.
FORMATION UNIVERSITAIRE
2006-2010 Thèse de Doctorat soutenue à l’Université Claude Bernard Lyon 1
Spécialité Mathématiques appliquées – Statistique et économétrie
Financement : Ecole Nationale des Travaux Publics de l’Etat (ENTPE)
2005-2006 Master 2 Recherche - Economie quantitative et décision stratégique (EQUADES) -
Université Lumière Lyon 2
2004-2005 Master 2 Professionnel - Statistique Informatique et Techniques Numériques -
Université Claude Bernard Lyon 1
2003-2004 Master 1 Professionnel en Ingénierie Mathématique – Université de Nantes
Spécialité Probabilités, Statistiques et apprentissage des logiciels.
1994-1999 Diplômé de l’Ecole Normale Supérieure (ENS) en mathématique et statistique.
INFORMATIQUES ET LANGUES
Logiciels statistiques : SAS, SPSS MODELER 17.1, SPAD, R, STATA, STATISTICA 10, EXCEL.
Gestion de bases de données : SQL/ORACLE, SQL/SAS et SQL/ SAS ENTERPRISE GUIDE.
Bureautique : WORD, WORD-PAD, LATEX, BEAMER-LATEX et POWER-POINT.
Logiciels de cartographie : ISATIS, QGIS.
Langues :
Français : Courant.
Anglais : Opérationnel