EXPERIENCES
Data Engineer Fullstack|GENERALI [01/2020 –à ce jour]
Projet : Le programme Chrysalide est un programme de transformation
numérique de la branche santé-prévoyance collective de Generali. Au sein
de ce programme, l’objectif du projet THUGS est de réaliser un tarificateur,
destiné aux services de souscriptions et de technique-assurance (actuaires),
qui permet de générer une étude du prix de l’assurance collective pour un
client potentiel, en fonction de ses caractéristiques et besoin. L’équipe,
composée de développeurs, actuaires, business analysts, testeurs et PPO,
fonctionnait en mode Agile.
Missions :
• Restructuration du format des données en entrée et sortie
• Formation des actuaires de l’équipe au développement Python
• Développement de modules fonctionnels
• Développement de l’UI de test
• Tests unitaires
• Méthodologie Agile/Scrum
Environnement Technique : Python 3 (numpy, pandas, flask, sqlalchemy),
JavaScript, React, PostgreSQL, GitLab, JIRA, Docker, Splunk, Jmeter
✓ Développeur Commando Python | SOCIETE GENERALE [04/2019 – 01/2020]
Projet : l’objectif de l’équipe commando est d’intervenir rapidement sur les
besoins applicatifs des équipes fonctionnelles en salles de marché. Deux
projets ont été traités en parallèle : la réalisation d’applications de contrôles
pour les équipes middle offices chargées des produits exotiques, et le
développement applicatif pour le suivi de la fusion des activités de marché
de CommerzBank, fraîchement acquises par la Société Générale. L’équipe
était composée de 15 à 18 développeurs, répartis au sein de 3 squads de 5
à 7 membres.
Missions :
• Contrôle automatique des produits exotiques
• Acquisition des produits de CommerzBank
• Parsing des documents contractuels
• Support technique pour les équipes du middle office
• Méthodologie Agile/Scrum
Environnement technique : Python 3, GitHub, JIRA, Jenkins, Docker, VBA
Data Scientist | NOKIA [09/2018 – 03/2019]
Projet : l’objectif du projet RPA FM était de permettre la résolution automatique
des alarmes sur les infrastructures 2G/3G/4G des clients (Vodafone India et Bharti
Africa). Le début de la mission marquait le commencement d’une nouvelle
phase pour le projet, avec d’une part un audit du modèle de machine learning
existant en vue de l’adapter aux futures évolutions du projet, et d’autre part une
première série de livraison aux clients avec le recrutement d’une équipe dédiée.
Missions :
Audit du projet :
• Analyse du modèle de machine learning existant
• Analyse de l’architecture du projet
• Suggestions de corrections urgentes et d’axes d’amélioration
• Collaboration avec l’équipe chargée de la V2 pour la mise en place
d’un nouveau modèle de machine learning pour les évolutions futures
Livraison :
• Recrutement d’une équipe de développeurs pour la production des
premiers livrables
• Répartition des alarmes entre les membres de l’équipe
• Parsing des logs
• Développement des alarmes qui m’étaient attribuées
• Suivi quotidien avec l’équipe fonctionnelle indienne
Environnement technique : Python 2, Pyspark, SQL, Amazon S3, MLlib, Gitlab, JIRA,
Docker
✓ Ingénieur étude et développement Python| ORANGE [03/2017 – 08/ 2018]
Projet GOTAM : l’équipe POM, composée d’une vingtaine de testeurs, et de deux
développeurs, a pour mission de s’assurer du bon fonctionnement des offres de
téléphonie mobile avant la sortie du nouveau catalogue, et de détecter les
dysfonctionnements une fois le catalogue lancé. Cette mission implique de tester un
nombre très important de scénarios. Le projet Gotam consistait en la création d’une
plateforme Python permettant d’automatiser, paralléliser et planifier ces tests, afin
d’augmenter de manière significative la couverture des scénarios avant les sorties
des catalogues.
Missions :
• Développement d’une plateforme de tests des offres mobiles, en préproduction et en production.
• Migration de la plateforme de Windows vers Linux
• Automatisation des tests d’offres postpayées
• Parsing des résultats de tests.
• Mise en place d’une base de données MongoDB pour stocker les
configurations des tests et leurs résultats.
Environnement Technique : Python, MongoDB, Git, mRemoteMG
✓ Ingénieur de recherche en intelligence artificielle |PICOM [2012/2016]
Projet : le rôle du Pôle de Compétitivité des Industries du Commerce est de mettre
en relation les grandes entreprises du retail avec des laboratoires publics de la région
Hauts-de-France afin de travailler sur des sujets communs. Le projet était la
réalisation, au sein du DIA (Département d’Informatique et Automatique), d’un
simulateur d’espaces de vente dirigé par des données réelles. J’étais responsable
de la conception et de la réalisation, en autonomie, du projet. J’ai pu bénéficier,
pendant 6 mois, du soutien d’un stagiaire que j’encadrais. Le simulateur était un
système multi-agents qui décrivait le comportement déambulatoire et d’achat
d’une surface de vente. Il était basé sur des données réelles (trajectoires et tickets
de caisse) d’un supermarché californien, et de connaissances expertes issues de la
littérature scientifique en marketing et psychologie.
Missions :
• Conception d’un modèle d’agent client à partir de connaissances expertes
• Recherche de données réelles
• Clustering sur les trajectoires de clients afin d’obtenir des comportements
déambulatoires types
• Règles d’association sur les tickets de caisse pour obtenir des paniers d’achat
réalistes
• Développement from scratch du simulateur en Java
pellier
********
BERTEK – SAS Société par actions simplifiée au capital de 20.000 euros.
Siège social : Immeuble le synergie, ********
intracommunautaire : FR67539582080
5/6
• Encadrement d’un stagiaire
• Encadrement de cours
• Communication scientifique (publication et conférence)
Environnement Technique : Java, Python, Matlab.
✓ Data Scientist| Projet personnel [2015/2017]
Projet : Roboprono, un projet de robot rentable sur les paris sportifs et hippiques.
Missions :
• Récupération en ligne de données historique pour entraîner les MLP
• Scrapping des cotes
• Sélection des données utiles
• Entraînement d’un MLP par type de parI
• Première version avec les paris basiques du football
• Ajout des paris simples des courses hippiques
• Ajouts successifs de paris football plus complexes et de paris d’autres sports
• Vente de pronostiques
Environnement technique : Java, Python, numpy, pandas, scikit-learn, scrapy
Machine Learning Engineer | INRIA [03/2012 – 09/2012]
Projet : L’équipe TAO de l’INRIA est une équipe de recherche spécialisée dans
l’apprentissage automatique, notamment via des algorithmes génétiques.
L’algorithme mEDEA est un algorithme évolutionnaire conçu au laboratoire qui
dirigeait l’évolution d’un essaim de robots. Ma mission consistait à proposer et
implémenter (afin de tester) des modifications de l’algorithme afin d’obtenir une
spécialisation des comportements des robots au sein de l’essaim. L’essaim était
constitué de cent robots virtuels dans un simulateur développé en C++.
Missions :
• Proposition d’évolutions pour l’algorithme évolutionnaire mEDEA
• Implémentation de ces évolutions dans le simulateur
• Dataviz et analyse statistique des logs
• Conclusion sur les mécanismes menant à la spécialisation des comportements
Environnement Technique : C++, Python, SVN, R
✓ NLP Engineer | LIMSI-CNRS [01/2011 – 05/2011]
Projet : l’objectif de la mission était la réalisation d’un corpus associant des phrases
françaises complexes à des phrases plus simples de même sens. Les phrases étaient
obtenues en récupérant le contenu d’articles de Wikipédia et de Vikidia (sorte de
Wikipédia pour pré-adolescents). Le corpus obtenu à par la suite été utilisé pour
réaliser un système de simplification automatique de phrases en français, à
destination des étrangers apprenant le français et des personnes possédant des
difficultés pour le langage.
Missions :
• Scrapping des articles de Wikipédia et Vikidia
• Conception d’un algorithme d’alignement des phrases, combinant similarité
cosinus et TF*IDF
• Réalisation automatique du corpus
Environnement technique : Java, Python, Perl
COMPETENCES FONCTIONNELLES
Métiers : Assurances, Santé, Banque, Intelligence artificielle, Data,
Informatique, Télécommunications
Savoir être : Adaptabilité, fiabilité, confidentialité, curiosité
Français : Langue maternelle
Anglais : courant
COMPETENCES TECHNIQUES
Domaines : Robotics, Data Mining, Mutli- agent based system
Langages et Framework : Python, R, Java, C++, JavaScript, PERL
Outils : AWS, Hadoop, Docker , Splunk, Spark, PySpark, ,GIT, scikit-learn,
pandas, numpy, JIRA, MLib
Méthodologie : Agile
Base de données : MongoDB, Hive
FORMATION
2012-2016 Doctorat – Intelligence artificielle, simulation MABS, Data
Mining - École des Mines de Douai
2012 Master 2 – Machine Learning, Statistiques, Robotique,
Systèmes multi-agents, NLP, speech recognition, web sémantique, Université
Paris-Sud XI