Alexandre - Consultant SPSS
Ref : 171110D002-
62610 LANDRETHUN LES ARDRES
-
Consultant, Data Scientist (48 ans)
-
Freelance
Expérience professionnelle
IRCEM(PROTECTION SOCIALE) DATA SCIENTIST MARS 2020- MARS2021
Mission Ø Classification de documents :
utilisation d'un réseau de neurones à convolution profond (InceptionV3)
pour distinguer 3 documents administratifs (avis d’imposition page1, 2&3,
relevé CPAM)
Résultats : précision de 97%
Ø Détection de la fraude à l’incapacité de travail :
Cadrage du projet, modélisation (combinaison de deux modèles :
RandomForest et Gradient Boosted Tree), mise en production (MLflow, Azure
Databricks)
Définition des KPI et suivi de l’algorithme en production (carte de contrôle)
Résultats : précision de 72%, indu estimé de 7,6 M€
Ø Création d’un ‘Feature Store’ (entrepôt de variables pour les data scientist) :
Cadrage du besoin, architecture de la solution
Mise en œuvre et déploiement sous forme d’un package Python avec
Pyspark et le Framework ‘Feature Factory’ du Databricks lab.
Environnement technique Python (PySpark, Keras, Graphframes, Pandastable, …), Databricks, Microsoft Azure, SQL,
IntelliJ, Git, deep learning, transfert learning
NCG(NORTH CONSULTING GROUP) DATA SCIENTIST FÉVRIER 2020
Mission Stratégie / Formation :
Ø Animation d’une session de formation aux enjeux de l’intelligence
artificielle (une journée)
- Les origines du Big Data
- Les limites des bases de données relationnelles
- Technologie du Big Data
- De la statistique à l’intelligence artificielle
Environnement technique Power Point
IRCEM(PROTECTION SOCIALE) DATA SCIENTIST AOUT A DECEMBRE 2019
Mission Marketing - ventes :
Ø Moteur de recommandation :
Cadrage du projet, modélisation de l’appétence au contrat « Obsèques »
(RandomForest, F1score = 80%)
Déploiement (tests unitaires, acceptance, environnement Azure Databricks)
Indicateurs de performance (gain, rendement, matrice de transition) pour le
suivi des modèles en production
Ø Détection de l’attrition :
Utilisation d’un auto-encodeur pour prédire le départ à la concurrence
Environnement technique Python (PySpark, Scikit-learn, Keras, Seaborn …), Databricks, Microsoft Azure, SQL, IntelliJ,
Git
KINGFISHER –CASTORAMA –
BRICODEPOT (RETAIL) DATA SCIENTIST NOVEMBRE -MARS 2019
Contexte Projet Système information – Migration SAP
Mission Consolidation, nettoyage et analyse des backlogs d’erreurs SAP :
- Durant le déploiement de SAP, consolidation quotidienne des rapports
d’erreurs (facturation, stock, commande…) à l’aide d’algorithmes développés
en VBA
- Développement d’un algorithme de correction automatique des erreurs
d’adressage de stock
- Création d’un tableau de bord de suivi hebdomadaire présenté au comité de
direction
Environnement technique VBA Excel, SAP, Python, Access
PUBLICIS ETO (MARKETING) DIRECTEUR PROJETS AOUT -SEPTEMBRE2018
Mission Ø Typologie clientèle :
Audit des données, statistique descriptives, segmentation (5 clusters),
présentation client
Ø Étude de l’évolution du comportement des clients avant et après une
segmentation :
Suivi des indicateurs en CA et en fidélité (fréquence achat, Net Promoter
Score) sur 24 mois
Présentation client
Gain attendu : poursuite du programme de fidélisation
Ø Business Model :
Simulation de l’impact d’un changement de programme de fidélité
Paramétrage des hypothèses, simulation des différents scénarios (carte
gratuite, payante, à durée limitée …)
Ø Management :
Encadrement d’une équipe de 3 Data Scientists
Environnement technique SQL, Excel, SAS, Python, SPSS Modeler, Tableau
CONRAD (RETAIL) AVRIL A JUIN 2018
Marketing :
Ø Segmentation clientèle B2B
Ø Référencement automatique des nouveaux produits :
Algorithme de sélection des produits à référencer (programme SAS)
Gain attendu : 2 M€ CA
Environnement technique : SAS, SQL, Excel
Stratégie :
Ø Recommandations sur l’infrastructure du système d’information
BONCOLAC (AGRO ALIMENTAIRE) MARS 2018
Supply Chain :
Ø Avant projet du changement de logiciel de prévisions des ventes :
Analyse du besoin, définition du périmètre, processus, planning
Environnement technique : SAP, APO, Excel, Power point
VITSE – TP (TRAVAUX PUBLICS) JANVIER A DECEMBRE 2017
Téléphonie mobile (Smart Data) :
Ø Segmentation des abonnés (flotte de 200 utilisateurs)
Algorithme de proposition du forfait le plus adapté (Arbre de décision mis en production sous Excel)
Optimisation du cout financier : baisse de 15%
Environnement technique : Excel, pdf
Infrastructure des données :
Ø Collecte des données des automates des machines mobiles vers un extranet (module développé avec des
Raspberry pi)
Ø Collecte des données photo et vidéo (mise en place caméras, serveur, acquisition logiciel et stockage)
Environnement technique : Automates Schneider Modicon, OpenVPN, Debian, Windows Server, MacOs, VMware
PSA (PEUGEOT CITROEN) – CAP GEMINI OCTOBRE A DECEMBRE 2016
Finance :
Ø Modélisation de la ventilation des demandes d’investissement par typologie de projet, par métier et par mois
(Réseau de neurones développé avec SPSS Modeler)
Ø Mise en production de la solution (Excel)
Ø Définition des indicateurs métiers
Environnement technique : SPSS Modeler, Excel
CHALLENGE DATA SCIENCE (DATASCIENCE.NET) SEPTEMBRE 2016
Agence Technique de l’Information sur l’Hospitalisation (ATIH) :
Ø Objectif : mieux anticiper l’augmentation des maladies chroniques
Ø Précision du modèle développé : 93.2%
Ø Classement : 36/303
Environnement technique : SPSS Modeler, Excel, Python (Scikitlearn, pandas)
CCI HAUTS-DE-FRANCE SEPTEMBRE 2016
Marketing - ventes :
Ø Audit de l’organisation : atelier de détection des objectifs métiers
Ø Gestion de l’avant-projet du scoring de recommandation de produit
MILLIM (RETAIL) JUILLET 2016
Marketing :
Ø Détection des critères de satisfaction client : analyse des commentaires libres sur internet (Text mining – Web scraping)
Environnement technique : R, Python
ASMODINE (RETAIL) JUIN 2016
Stratégie :
Ø Recommandations sur le business model d’exploitations des données clients
ARC INTERNATIONAL (INDUSTRIE) 2005 – 2015
Marketing - ventes :
Ø Optimisation des statistiques de ventes (6000 refs) : modélisation d’algorithmes adaptés au marché du verre.
Simplification du processus – Paramétrage SAP
Extraction et préparation des données à l’aide de Business Object
Key user du progiciel Skep (éditeur Dynasis)
Ø Organisation du service prévisions des filiales française (CA=100M€) et UK (CA=15M£) :
Développement d’un progiciel de prévisions (avec Access et Excel) et déploiement au Royaume uni, en Espagne et en France.
Formation et assistance des utilisateurs – KPI (fiabilité)
Ø Quantification de la corrélation entre les ventes en Russie et le cours du rouble :
(Extraction de l’historique du cours du rouble sur internet)
Finance :
Ø Consolidation et validation des Business Plans des 6 sites de production (répartis sur 4 continents) :
Contrôle de l’adéquation entre les ventes, les productions (500kt/an), les capacités (22 fours, 150 lignes de
fabrication), les stocks et les CAPEX (80M€/an)
Ø Simulation de la régionalisation des productions dont les conclusions ont abouti à l’achat d’un site en Russie (2
fours) et à la construction d’un four au Moyen Orient (80M$)
Ø Création d’un algorithme de calcul des couts rendus à destination qui permet de déterminer le site de
fabrication le plus profitable par article
Autres :
Ø Détection des anomalies sur les consommations de gaz et d’eau à l’aide de la maitrise statistique des procédés.
Déploiement de l’algorithme en Visual basic (VBA)
Environnement technique : BO, SKEP, Access, Excel, SAP
ASCOMETAL (INDUSTRIE) 2004
Planification :
Ø Création d’un contrôle de la cohérence des données issues du progiciel d’ordonnancement
Environnement technique : Factory Planner
ALCATEL SUBMARINE NETWORKS (INDUSTRIE) 1998 -2003
Tests des câbles sous marins à fibres optiques :
Ø Optimisation du flux de mesure : changement d’organisation de série à parallèle – choix d’outil moins cher et
plus réactif
Ø Augmentation de la productivité : mise en évidence d’une corrélation entre le niveau d’entrée du laser et le
succès des mesures physiques.
COMPETENCES
Data Mining, Statistiques, Machine learning :
Analyse Prédictive : Arbres de décision, Réseaux de neurones, Réseaux Bayésien, SVM, Modèles linéaire,
Régression Logistique, prévision des Séries Temporelles, Analyse de Survie
Construction de Typologies : Kmeans, Réseaux Kohonen, Two Step, Classification Hiérarchique
Analyse d’Associations : A priori, Carma, Séquences
Programmation : Visual Basic, SQL, Langage C, Python (NumPy, Scikitlearn, Pandas)
Logiciels : SPSS Statistics, SPSS Modeler, R, Excel (Expert), Access, Business Object, SKEP,
VMware, SAS Enterprise Guide
Certifications : SPSS Modeler (Modeler Pro, Data Analyst, Data Mining)
SPSS Statistics (Certified Specialist)
Gestion de projet : Avant projet, planning, ordonnancement, suivi
Méthodologie spécifique pour le Data Mining : Cross Industry Standard Process for Data
Mining (CRISP - DM)
LANGUES ETRANGERES
Anglais : Courant (Pratique professionnelle)
Allemand / Espagnol : Basique
FORMATION
Diplômes :
Consultant Expert Data Scientist (Stat – Prévisions) à Global Knowledge (Paris) – RNCP niveau1 - 2015 / 2016
Master2 OGP (Organisation et Génie de la Production / Supply chain) Université d’Artois (Béthune) - 2004
Maîtrise EEA (Electronique, Electrotechnique, Automatique) à l’USTL (Villeneuve d’Ascq) - 1997
DUT GEII (Génie Electrique et Informatique Industrielle) à l’IUT du Littoral (Calais) - 1995
BAC série C (mention Bien) lycée Sophie Berthelot (Calais) - 1993
Mooc :
Deep Learning – CNAM – 2018
Librairies Python pour la Data Science (Numpy – Pandas – Matplotlib – Scikitlearn) – Open classrooms – 2018
Fondamentaux pour le Big Data (Proba – Stat – SGBD – Python) Institut Mines – Télécom (Paris) – 2015
Formations complémentaires :
Chef de projet – Op’team 2010
Gestion des personnalités difficiles – Bernard Bruche – Paris – 2008