Soumeya - Data Scientist R
Ref : 191210C002-
92600 ASNIERE SUR SEINE
-
Data Scientist, Consultant, Développeur (36 ans)
-
Télétravail si le client est à plus de 2h de son domicile
-
Bientôt freelance
EXPÉRIENCE PROFESSIONNELLE
D’Oct. 2019 à ce jour Data Scientist/ Data engineer
La Banque de France
SAS to R : Projet de migration des traitements SAS vers R. Au sein d’une équipe de 3 personnes avec
l’utilisation de méthodologie Agile.
Mise en œuvre
Participation aux travaux de conception et modélisation des données dans le DATALAKE
Accompagnement des utilisateurs au travers d’animation de travaux pratiques et de formation
La diffusion de quelques articles dans la communauté R de la Banque de France
Gestion de la relation utilisateur (statisticien) sur R et BigData
Conception/ Développement/ Recette/ Suivi de production
Environnement technique : R project, Jira
D’Avr. 2018 à Aout.2019 Data Scientist
Groupe Saint-Gobain
Saint-Gobain Distribution Bâtiment France (SGDBF)
Projet Vision 360° : Projet marketing de construction d’une application donnant une vision 360° du
client (Customer Value, Segmentation, Analyse des paniers). Au sein d’une équipe de 4 personnes
avec une initiative de mise en place d’une méthodologie Agile.
Mise en œuvre
Recueil des besoins
Études des demandes auprès du client
Analyse de faisabilité
Rédaction des spécifications fonctionnelles et techniques
Prise en charge du développement de scripts R/python (Arbre de décision XGBoost)
Création des datamarts pour chacun des thèmes (Customer Value, Chiffre d’affaire,
Segmentations, Analyse des paniers, Analyse par type de client, …)
Tests unitaires
Accompagnement à la recette métier
Mise en production des thèmes
Industrialisation du modèle Data science.
Environnement technique : Datalake Cloudera Data Science Workbench, R project, Python,
Pyspark, Hue, Hive, Impala, squirrel sql, dollar Universe, Jira
Formation Text Analytics : théorie et pratique
Mise en œuvre
Rédaction du support de la formation
Préparation des exercices et des exemples d’application
Animation des ateliers de formation
Environnement technique : IBM SPSS Modeler, IBM SPSS Text Analytics
Mars. 2018 Data Scientist
Air France
Projet POC d’avant-vente : Affectation automatique des mails aux différents services concernés
Mise en œuvre
Analyse textuelle,
Création du dictionnaire
Catégorisation des verbatims
Environnement technique : IBM SPSS Text Analytics
De Janv. 2018 à Fév.2018 Data Scientist
Saint-Gobain
Projet benchmark des solutions Data Science : Comparaison et analyse des outils data science afin de
choisir l’outil le plus adapté à l’environnement Big Data existant
Mise en œuvre
Comparaison de la performance des outils selon une grille de critères requis
Reproduction des flux métiers dans chacun des outils testés
Animation des ateliers avec les métiers et transfert des connaissances sur les outils
Environnement technique : DATAIKU, IBM SPSS Modeler, SAP HANA studio
De Déc. 2017 à Mai. 2018 Data Scientist
Edifixio
Projet interne de Data Science : Au sein d’une équipe de 5 personnes (Collaborateurs indiens), création
d’une application qui analyse les réseaux sociaux : typologie des publications gagnantes sur Facebook,
recommandation sur la rédaction des publications (inclut l’analyse de la concurrence)
Mise en œuvre
Pilotage des équipes en Inde + management d’un collaborateur data scientist (suivi
hebdomadaire, réunions, estimations des tâches, chiffrage)
Scraping des publications sur Facebook et twitter
Analyse exploratoire des publications
Étude de différents modèles de data science
Création d’un dashboard (R shiny) qui permet d’analyser les publications Facebook
Configuration d’un serveur R shiny et mise à disposition de l’application (adresse IP publique)
avec des droits d’accès
Environnement technique : R project, R shiny, IBM SPSS Modeler, IBM SPSS Text Analytics
De Oct. 2017 à Déc 2017 Data Scientist
SMCP
Projet segmentation clients : Répartir les clients dans des segments afin de lancer des campagnes
marketing
Mise en œuvre
Segmentation des clients
Analyse du parcours client
Environnement technique : R project
De Oct. 2016 à mars. 2017 Data Scientist
Rexel
Projet Modélisation : Modélisation des ruptures de stock
Mise en œuvre
Test de plusieurs modèles et étude des solutions
Création d’un nœud SPSS basé sur un modèle statistique
Environnement technique : R project, IBM SPSS Modeler
De Fév. 2016 à sep. 2017 Data Scientist
Leroy Merlin
Projet Vision 2025 : Au sein d’une équipe de 3 personnes, détection des principaux axes de
changement dans la stratégie de l’entreprise en 2025 en se basant sur les réponses des collaborateurs
au questionnaires proposés par l’entreprise.
Mise en œuvre
Analyse textuelle, création des dictionnaires, catégorisation des verbatims
Identification des valeurs de l’entreprise
Identification des tendances et des axes de changement
Environnement technique : R project, IBM SPSS Text Analytics, IBM Watson Analytics,
Gephi
Déc. 2016 Data Scientist
Castorama
Formation Modélisation sous SPSS Modeler : Théorie et pratique
Mise en œuvre
Rédaction du support de la formation
Préparation des exercices et des exemples d’application
Extraction et traitement des publications Facebook de la page Castorama
Animation des ateliers de formation
Environnement technique : IBM SPSS Modeler
Oct. 2016 Data Scientist
Pro BTP
Formation Text Analytics : Théorie et pratique
Mise en œuvre
Rédaction du support de la formation
Préparation des exercices et des exemples d’application
Animation des ateliers de formation
Environnement technique : IBM SPSS Modeler, IBM SPSS Text Analytics
Projet Tourisme : Analyse des centres d’intérêt des clients voyageurs
Mise en œuvre
Scraping du forum ********
Traitements textuels
Calcul des indicateurs de satisfaction
Géolocalisation
Projet Analyse produit : Rapprochement automatique des références produits, identification des
produits qui nécessitent plus de mise en avant.
Mise en œuvre
Scraping d’une partie des univers « smartphones » des sites web ******** et ********
Traitements textuels
Environnement technique : R project, IBM SPSS Text Analytics
De Fev. 2015 à Août. 2015 Data Scientist (stage)
Oocar
Projet : Réalisation d’un package R qui calcule les scores de l’éco-conduite dans une application mobile
Mise en œuvre
Implémentation des règles de l’éco-conduite et la création du package R
Étude et analyse des différents modèles de Machine Learning
Environnement technique : R project
COMPETENCES TECHNIQUES
Anglais
Certifications
Opérationnel
C2090-012: IBM SPSS Data Analysis for Business Partners v2 certification
ÉTUDES ET FORMATIONS
2015 Master Ingénierie mathématique pour les sciences du vivant - Université
Paris Descartes, France
2011 Ingénieur d’état en statistique, spécialité : statistique appliquée à
l’économie, Algérie
COMPÉTENCES TECHNIQUES
Système Windows, Linux (CentOS)
Outils et langages R project, R Shiny, IBM SPSS Modeler, IBM SPSS Text Analytics, Dataiku,
IBM Watson Analytics, Python, PySpark, Squirrel SQL, VBA, SQL,
HTML/CSS, Jira, Dollar Universe
Écosystème HADOOP CDSW (Cloudera Data Science Workbench), HIVE, HUE
Méthodologie Agile
COMPÉTENCES OPÉRATIONNELLES
Data Science Conception de modèles (régressif, prédictif, segmentation), utilisation
des algorithmes (les arbres de décision, random forest, réseaux de
neurones), Optimisation des modèles, Analyse textuelle
Data Ingénierie Développement des flux de collecte et de traitement des données
AMOA Analyse de l’existant, Analyse de besoins, Rédaction de spécifications
fonctionnelles, Recettes fonctionnelles, Support utilisateur
MOE Prise en charge d’études, Estimation de charges, Rédaction de
spécifications techniques, Développements, Tests unitaires,
Déploiements en recette, Recettes techniques, Déploiements en
production, Industrialisation, Gestion d’incidents de production