Norbert - Data Scientist R

Ref : 160113F001
Photo de Norbert, Data Scientist R
Compétences
Expériences professionnelles
  • Expérience professionnelle

    Avril 2018 – Septembre 2020 : Banque de France
    Fonction : Consultant Senior Data Scientist
    Mission :
    Conception et développement des modèles explicatifs, prescriptifs et prédictifs du taux de règlement
    du marché financier de la Zone Euro
     Elaboration d’une typologie des acteurs du marché à travers les comptes cash dans la zone Euro

    Jan 2017 – Mars 2018 : CNAM
    Fonction : Consultant senior Data Scientist
    Mission :
    Maquettage et développement des modèles prédictifs de fraude à l’assurance maladie
     Algorithmes et technologie : Machine Learning (Forêts aléatoires, SVM, logistique-Probit) sous
    l’environnement R/RStudio

    Poste depuis Janvier 2012 : Groupe Crédit Mutuel Strasbourg / EPS
    Fonction :
    Ingénieur statisticien en Charge des études statistiques, Data Mining et Econométrie.
    Missions R & D réalisées :
    - Développement des indicateurs de prévision des missions techniques SAV
    - Développement des indicateurs d’évaluation des risques de pannes sur les équipements de la télésurveillance
    - Développement des indicateurs de suivi de la performance des opérateurs téléphoniques
    - Amélioration méthodologique des études d’impact par des techniques d’économétrie
    - Amélioration du process de collecte de données pour garantir la qualité des études statistiques
    - Développement du modèle de prévision en temps réel de charge de l’activité des téléconseillers (Appels sortants/entrants)
    - Développement du modèle de prévision des sinistres chez les clients télé-surveillés
    - Développement du modèle de scoring pour le ciblage des prospects de la téléassistance
    - Développement du modèle d’attrition (résiliation) des clients de la télésurveillance.

    Compétences et techniques mises en œuvre :
    - Modèle de survie de vie :
    o Estimation de la probabilité instantanée des pannes sur les matériels de télésurveillance avec traitement de la censure dans le modèle de Kaplan-Meier
    o Loi de Weibull pour l’estimation du délai d’attrition par segment de clients
    o Evaluation des risques de défauts en fonction du type et l’environnement des matériels : Modèle de survie généralisé à hasard proportionnel de COX.

    - Techniques du Data Mining :
    o Exploitation des Big Data de sources variées
    o Modélisation prédictive par apprentissage supervisé : Réseaux de neurones, Arbres de décision, Modèle de régression par les splines adaptatives (MARS, PolyMARS), Forêts aléatoires et Séparateurs à vaste marge (SVM), les modèles de régression logistique binaire et multinomial et KNN (Plus proches voisins).
    o Modélisation par apprentissage non supervisé : ACP, AFC, AFCM, Classification ascendante hiérarchique
    - Maîtrise des requêtes de haut niveau : SQL/ORACLE, SQL/SAS Enterprise Guide et SQL/R.
    - Gestion de flux de données : IBM SPSS MODELER 17.1

    Oct 2010 – Déc 2011 : Ecole polytechnique de Lyon et CNRS/délégation de Grenoble
    Fonction :
    Attaché de recherche et d’enseignement en Post-doctorant (ATR) : Chargé d’études statistiques
    Mission de recherche au CNRS
    - Etude des facteurs d’exposition et de vulnérabilité des personnes sur le réseau routier du département du Gard en période d’inondation.

    Mission d’enseignement à l’Ecole polytechnique de Lyon :
    - Statistiques et informatique décisionnelle pour l’ingénieur
    - Modélisation statistique des procédés industriels (MSPC) : Estimation des paramètres de contrôle
    o Cartes de contrôle aux mesures
    o Cartes de contrôle aux attributs

    - Travaux pratiques :
    o Méthodes exploratoires d’analyse des données : ACP, AFC, AFCM et AFD
    o Séries chronologiques en 4ème et 5ème années
    - Encadrement de projets de 5ème année à l’Ecole polytechnique de Lyon.
    Logiciels utilisés : SAS 9.2, IBM SPSS MODELER 17.1, STATISTICA 10, R SPAD

    Nov 2006 – Mai 2010 : CDD IFSTTAR - Institut Français des Sciences et Technologies des Transports, de l’Aménagement et Réseaux
    Fonction :
    Ingénieur Statisticien et Data Mining
    Projet :
    Développement des modèles statistiques de prévision des trajectoires d’avions et de charge de l’espace aérien en nombre d’avions.
    Les résultats ont fait l’objet d’une soutenance de thèse en mathématiques appliquées soutenue en octobre 2010 et d’une publication scientifique à la Revue des Nouvelles Technologies.

    Missions réalisées :
    - Première classe de modèles proposés : Techniques d’apprentissage automatique supervisé
    o Classification par arbres de décision et de régression (CART)
    o Forêts aléatoires (random forests, Bootstrap)
    o Séparateur à Vaste Marge (SVM)
    - Deuxième classe de modèles proposés : Techniques de régression
    o Régression Multivariée par les Splines Adaptatives (MARS)
    o Régression de type PLS 1 et sur composantes principales – RCP
    - Développement et validation d’un indicateur d’influence du vent sur les avions en vol

    Compétences et logiciels :
    - Techniques et outils de fouilles des données (Data mining)
    - Exploitation des données multi-sources : Trafic aérien, météo et performances des avions
    - Construction des variables synthétiques pour la mise en place des modèles de prévision
    - SAS 9, MATLAB, SPAD 9, ORACLE.

    Avr – Oct 2006 : STAGE GATE - Groupe d’Analyse et Théorie Economique à l’Université Lyon 2
    Projet :
    Evaluation économétrique de l’impact du stigmate du chômage sur les salaires et leur croissance. Source des données : Ministère de l’emploi et de la solidarité et la DARES

    Missions réalisées :
    - Evaluation des déterminants de la trajectoire salariale par modèle de régression logistique avec correction du biais de sélection par la méthode d’Heckman et Robb (Ratio de Mills)
    - Estimation de la durée du chômage en fonction des caractéristiques individuelles et des politiques de l’emploi par le modèle général de durée de vie : Modèle à hasard proportionnel de Cox
    - Validation des modèles économétriques multi-niveaux par genre (H/F) avec le test de Chow
    - Evaluation des effets du capital humain sur la croissance salariale et le retour à l’emploi

    Compétences et techniques :
    - Exploitation des données longitudinales de panel et modèles économétriques
    Logiciels : SAS 9.2, R, SPSS et STATA.

    Avr - Oct 2005 : STAGE ATMO, Société de surveillance de la qualité de l’air en Poitou-Charentes
    Mission réalisée :
    - Développement d’un modèle statistique de prévision de l’ozone dans la région Poitou-Charentes.
    - Réduction des coûts d’investissements sur les appareils de mesure d’O3, NOX et particules fines

    Techniques et compétences :
    - Modèles de régression générale
    - Modèle de géostatistique (Krigéage, Co-Krigéage) pour la cartographie de la pollution
    Logiciels : R sous Linux, EXCEL et ISATIS.

    Juil - Oct 2004 : STAGE INSEE - Institut national de statistique et des études économiques
    Mission :
    Analyse de l’impact du lien de parenté du chef de ménage sur les activités domestiques des enfants. Données d’enquête ménage du Ghana 2000 réalisée par le Bureau international du travail.
    Compétences et techniques mises en œuvre :
    - Les techniques exploratoires d’analyses multidimensionnelles des données : ACP (Analyse en composantes principales), AFCM (Analyse factorielle des correspondances multiples)
    - Validation d’un indicateur de mesure de l’intensité de l’activité domestique des enfants au Ghana.
    Logiciels : SAS, R, EXCEL et SPAD.

    Mai –Juillet 2004 : STAGE Laboratoire ARC’ANTIQUE de Loire Atlantique – Nantes
    Mission :
    Classification des matériaux archéologiques en fonction de la composition chimique
    Techniques et compétences mises en œuvre :
    - Classification ascendante hiérarchique (CAH) : Simple et sur composantes principales
    Logiciels : R et EXCEL.

    1999-2003 : CDI Ministère de l’éducation nationale
    Missions :
    - Enseignement des mathématiques/statistiques et animateur pédagogique du département.

    INTERVENANT EN ECOLE D’INGENIEUR
    2006-2010
    - Ecole Polytechnique de Lyon :
    o MSP (Maîtrise Statistique des procédés industriels)
    o Analyse des données par des techniques exploratoires (ACP, AFC, AMC)
    o Modèle de régression et étude des séries chronologiques : ARMA et ARIMA
    o Encadrement des projets de fin de formation d’ingénieur
    - Ecole Nationale des Travaux Publics de l’Etat / LYON :
    o Méthodes de recueil des données
    o Techniques de sondage et d’analyse des données
    o Protocole des tests de conformité des produits industriels.
    o Logiciels utilisés : SPAD 9 et R.

Études et formations
  • FORMATION UNIVERSITAIRE
    2006-2010 Thèse de Doctorat soutenue à l’Université Claude Bernard Lyon 1
    Spécialité Mathématiques appliquées – Statistique et économétrie
    Financement : Ecole Nationale des Travaux Publics de l’Etat (ENTPE)

    2005-2006 Master 2 Recherche - Economie quantitative et décision stratégique (EQUADES) -
    Université Lumière Lyon 2

    2004-2005 Master 2 Professionnel - Statistique Informatique et Techniques Numériques -
    Université Claude Bernard Lyon 1

    2003-2004 Master 1 Professionnel en Ingénierie Mathématique – Université de Nantes
    Spécialité Probabilités, Statistiques et apprentissage des logiciels.

    1994-1999 Diplômé de l’Ecole Normale Supérieure (ENS) en mathématique et statistique.

    INFORMATIQUES ET LANGUES
    Logiciels statistiques : SAS, SPSS MODELER 17.1, SPAD, R, STATA, STATISTICA 10, EXCEL.
    Gestion de bases de données : SQL/ORACLE, SQL/SAS et SQL/ SAS ENTERPRISE GUIDE.
    Bureautique : WORD, WORD-PAD, LATEX, BEAMER-LATEX et POWER-POINT.
    Logiciels de cartographie : ISATIS, QGIS.

    Langues :
    Français : Courant.
    Anglais : Opérationnel

D'autres freelances
Data Scientist R

Ces profils pourraient vous intéresser !
CV Etudiant
Colince

Etudiant

  • CALAIS
JAVA PYTHON C R REACT.JS DATA WEBDEV INFORMATICA SQL MONGODB
Disponible
CV Data Scientist Deep Learning
Steve

Data Scientist Deep Learning

  • LE CHESNAY
Data science PYTHON SQL Microsoft Power BI PANDAS DATA MICROSOFT POWER QUERY UNIX Google Cloud Platform R
Disponible
CV Actuaire IA, Data Scientist Senior, Economiste
Gilles Kué

Actuaire IA, Data Scientist Senior, Economiste

  • CHAMBOURCY
DATA R SAS PYTHON Lean Six Sigma SQL AGILE Microsoft Power BI BIG DATA EXCEL
Bientôt disponible
CV Data Analyst / Data Scientist / Développeur Full Stack
Ariel

Data Analyst / Data Scientist / Développeur Full Stack

  • CRÉTEIL
SQL PYTHON R AZURE Microsoft Power BI SAS MONGODB DJANGO JAVASCRIPT
Bientôt disponible
CV Ingénieur R&D PYTHON
Solène

Ingénieur R&D PYTHON

  • PARIS
VISUAL STUDIO PYTHON R Life Science & Healthcare SQL C C# C++ JAVA DOCKER
Disponible
CV Data Scientist PYTHON
Lina

Data Scientist PYTHON

  • VILLEJUIF
PYTHON SQL SAS R
CV Data Scientist Google Cloud Platform
Abdelwahed

Data Scientist Google Cloud Platform

  • ANDRÉSY
Google Cloud Platform TIBCO SPOTFIRE PYTHON SQL R
Disponible
CV Responsable des données et des études statistiques
Chourouk

Responsable des données et des études statistiques

  • SURESNES
SQL MS OFFICE R SAS PYTHON
Disponible
CV Data Analyst
Amina

Data Analyst

  • MARSEILLE
SQL DATA Qlik Sense TABLEAU SOFTWARE AIRTABLE R ORACLE PYTHON
Disponible
CV Data Scientist SAS
Fodé

Data Scientist SAS

  • MAISONS-LAFFITTE
SAS SQL R
Disponible