Vincent - Data Scientist PYTHON
Ref : 191212G001-
91200 ATHIS MONS
-
Data Scientist, Data Analyst, Consultant (51 ans)
-
Freelance
Expériences Professionnelles
Fév - Mai 2020
Axa, département Big Data & Nouvelles Technologies, service Infocentre Data
Surveillance, maintenance et évolutions des applications Infocentre WPS, assistance à utilisateurs Développement de scripts shells pour l’équipe Infocentre: suppression de données métiers obsolètes. Audit des habilitations à WPS pour préparation de l’infocentre vers le Cloud.
Environnement technique: linux, WPS, scripts shell
Janv - Mai
2019
Carrefour (indépendant), direction E-commerce et Nouvelles Activités
Développement d’une application de veille concurrentielle
• Analyses des données crawlées dans le domaine du BIO
• Mise en place d’un algorithme de matching de produits (chunking) dans l’application comparateur de
produits
• Veille sur les techniques de Deep Learning NLP et computer vision au sujet du matching de produits
• Annotation d’un échantillon de couples de produits via application Shiny ; évaluation de la performance du
modèle de chunking pour les données BIO
• Études et perspectives : mise en place du modèle dans l’application comparateur de produits pour le vin ;
amélioration du matching de produits grâce au Machine Learning et Deep Learning
Librairies & environnement technique: Linux, Jupyter Notebooks, Nltk, Pandas, Numpy, Pattern, Scikit-learn,
Spacy, Pycharm, Tensorflow, Keras, Shiny
Umanis
Avril - Juillet
2018
R&D système de recommandation de CV pour la direction de Umanis
En vue d’intégration de données vers des collections d’une base MongoDb, développement et livraison de
programmes Python :
• enrichissement de l’annuaire des collaborateurs Umanis
• Scraping des certifications Microsoft et enrichissement vers le modèle de données de type « ontologie »
• Enrichissement des compétences, projets et secteurs des consultants Umanis vers le modèle de données de
type« ontologie »
Environnement technique: Pandas, Xlrd, Openpyxl, Beautifulsoup, Windows, Linux, Excel, Protégé software,
Mongodb
Mai - Juin
2018
HETIC - Web school
Enseignant - intervenant en Machine Learning (36 heures) - Master M1 Big Data & Marketing Digital
Régression linéaire et logistique, principes du gradient descent et régularisation avec Python, Jupyter Notebooks,
Numpy, Scipy, Matplotlib, Scikit-Learn
URL des slides : ********.pdf
Juin 2016 à
Mars 2018
(6 mois)
Carrefour, direction E-commerce et Nouvelles Activités
Développement d’une application de veille concurrentielle
• Minhashing + Locality Sensitive Hashing
• Crawling de nouvelles données de fiches produits
• Analyses des données crawlées pour le vin et l’animalerie
• Exploration de méthodes non supervisées autour du matching de produits
• Développement d’un pipeline de matching de produits (méthode de chunking)
Méthodes: expressions régulières, minhash-LSH, tf-idf, chunking
Librairies: Nltk, Scrapy, Pandas, Numpy, Pattern, Scikit-Learn, R Shiny, Textreuse
Avril 2017 Rédaction d’article de blog
Présentation et application de la méthode MinHash-LSH avec R :
********-les-individus-similaires-au-sein-dune-large-populationminhash-lsh-pour-les-nuls-avec-r-v2/
Oct 2014 à
Nov 2017
Allianz, Développements d’applications décisionnelles SAS
Oct 2014 Cnam, Mémoire de Master M2: Propensity score matching, théorie et applications
Mise en place de méthodes de Propensity score matching automatisées pour études observationnelles. Analyse de
l’effet d’un programme sur le taux de retour à l’emploi avec SAS, R
********-score-matching?qid=59057ac0-de0c-40ef-a99df71dcdbba115&v=&b=&from_search=1
Mai 2014 à
Sept 2014
Renault, Direction Marketing France - Service CRM
Mise en place d’une application SAS et assistance aux activités de ciblage des clients Renault et Dacia
• Mise en place d'une application pour restituer les volumes de véhicules neufs « Freeway » Renault et Dacia
vendus via des mandataires
• Rédaction des spécifications fonctionnelles détaillées et d’un manuel utilisateurs
• Ciblage des clients particuliers Renault et Dacia :
• Études sur la provenance des possesseurs de véhicules neufs « Freeway » et de la concurrence
• Reportings des retours de campagnes marketing
Avril 2013 à
Mai 2014
GIE- Cartes bancaires, Direction Risk Management et Audit - Service Lutte Contre la Fraude et Systèmes
d’Information, Développement d’applications SAS
Banque de France - Autorité de contrôle prudentiel
Assistance auprès des contrôleurs de l’ACP sur les données comptables et prudentielles
Mars 2012 à
Fév 2013
Banque de France, Direction Générale des Statistiques, Direction de l’Ingénierie et de la Maîtrise d’Ouvrage
Statistique - Service d’Ingénierie et de Méthodologie Statistique
• Application statistique Bank Lending Survey sur la distribution des crédits en France auprès des
établissements bancaires au sein de la zone Euro
• Applications statistiques pour l’Observatoire de l’Épargne Règlementée, du micro-crédit et des données de
crédits auprès des Administrations Publiques et Locales
Nov 2010 à
Fév 2012
Développements, mise en place de systèmes décisionnels et BI pour AXA, Natixis
Environnements techniques: SAS (Base, Macro, Connect, Stat, Graph), SAS EG, SAS Data Integration Studio (ETL),
plateformes SAS BI, Unix, Linux, MVS, Oracle, VBA, Windows, Exce
Accenture
Nov 2006 à Oct
2010
Développements, mise en place de systèmes décisionnels et BI
pour Carrefour, Faurecia, AFD, EDF, Sanofi, ANPE
Environnement technique: SAS (Base, Macro), SAS Data Integration Studio (ETL), plateformes SAS BI, Unix, Linux,
Oracle, Informatica, VBA
Orange (CDD)
Mai - Sept 2006
Service de prévisions du Pôle Allocations Prévisions Analyse
Applications de prévisions d’appels vers les centres clients
Environnement technique: Excel, VBA
Renseignements complémentaires_____________________________________________________________________
• Préparation du CAPES et CAPLP de Mathématiques
Compétences Formations
• Big Data, Machine Learning & Deep Learning:
Python, R, Octave (Matlab), PySpark, Hadoop,
Tensorflow, Keras
• Statistiques, Décisionnel & BI : SAS
(macro/base/stat), SAS BI
• Datamining: SAS (macro/base/stat), SAS
Enterprise Miner
• SGBD : Oracle, SQL
• Windows, Unix & Linux (Shell), MVS
• Anglais : Niveau 3 (intermédiaire avancé) au Bulat
Test. Italien : lu, écrit, parlé
Formation
Nov 2018 : Coursera specialization Deep Learning Andrew Ng -
deeplearning.ai
2014 - 2016 Certifications (MOOC) - Coursera & EDX : Machine Learning
(Andrew Ng) ; Introduction to Big Data with Apache Spark ; Hadoop
Platform and Application Framework ; R Programming
2014 : Master Statistiques option statistique décisionnelle et extraction de
connaissances au CNAM (cours du soir)
Github : ********
Compétition Machine Learning : top 4%
********