Florian - Data Scientist DATA
Ref : 210118B002-
14000 CAEN
-
Data Scientist, Data Analyst (33 ans)
-
Télétravail uniquement
-
En profession libérale
Expériences
Depuis
Septembre
2021
Data Scientist (freelance), CIRAD.
Dans le cadre du projet SWM (sustainable wildlife management), nous développons une application web
R Shiny afin de répondre aux besoins suivants :
- Lecture automatique de formulaires manuscrits via un OCR
- Correction semi-automatique des erreurs de saisie
- Création automatique de rapports de suivi de la chasse villageoise au Gabon
Mots clés : R, Shiny, DataViz, OCR
Avril
à août 2021
Data Engineer (freelance), Total.
- Développement et monitoring de pipeline d’ingestion et de traitement de données via Spark (en batch
comme en streaming)
- Maintenance de modèles prédictifs du risque d’explosion de plateformes pétrolières
Mots clés : Python, Spark, Streaming, Azure (Databricks, Cosmos, Azure function), Kafka
Mars 2021 Data Scientist (freelance), Kidiwe.
Implémentation et mise en production d’un moteur de recommandations de sorties scolaires
- Développement d’un algorithme de recommandations content-based
- Déploiement de l’API de recommandations via Azure
Mots clés : Python, Azure services, Django, API
Depuis
Janvier 2021
Mentor data analyst et data scientist (freelance), OpenClassroom, Caen.
Le rôle de mentor consiste à accompagner les étudiants au cours de leurs différents projets constituant les
parcours data analyst et data scientist, via un suivi personnalisé.
- Partage d’expériences : l’objectif principal est de guider les étudiants vers les bonnes pratiques et les
bons réflexes à adopter lors du déroulement d’un projet data
- Suivi de projets tuteurés : les discussions, en fonction des profils, s’articulent autour de conseils techniques
et de réflexions / retours sur la valeur ajoutée du projet de l’étudiant pour le client (fictif)
- Clarification du cours : lorsque certains points ne sont pas clairs, nous reprenons ensemble les notions
qui n’ont pas été assimilées
Janvier 2020
à Dec. 2020
Data Scientist / Data engineer (freelance), Commission Européenne.
Implémentation d’algorithmes de fertilisation dans le cadre du projet FaST platform (Farm Sustainability
Tool) de la commission européenne (via PwC)
- Développement de librairies Python pour les algorithmes de fertilisation espagnols, italiens et estoniens
se basant sur les données agricoles remontées par les agriculteurs ainsi que sur les données géographiques
- Création d’API d’ingestion de données géographiques (hydrologie, données de sol, zones protégées, ...)
- Construction d’interfaces d’administration via Django
Mots clés : Python, Django, GIS, GraphQL API, micro-services, Hasura, Docker, FastAPI
En savoir plus : ********
Depuis
décembre
2019
Freelance Data, Caen.
(Jan - Nov 2020) : Implémentation d’algorithmes de fertilisation dans le cadre du projet FaST platform
(Farm Sustainability Tool) de la commission européenne (via PwC)
- Développement de librairies Python pour les algorithmes de fertilisation espagnols, italiens et estoniens
- Création d’API d’ingestion de données (hydrologie, données de sol, zones protégées, ...)
- Construction d’interfaces d’administration via Django
Mots clés : Python, Django, GraphQL API, micro-services, Hasura, Docker, FastAPI
En savoir plus : ********
Oct. 2018
à Oct. 2019
Consultant Data Scientist, Octo Technology, Toulouse.
- Implémentation de pipeline de données, construction d’algorithmes de gestion de stocks et développement
de dashboards interactifs via PySpark et Slate au sein de l’écosystème Skywise, plateforme data d’Airbus.
- Développement de compétences autour des bonnes pratiques de code (craftmanship) et de
l’industrialisation de la data science.
Avril 2016
à Oct. 2018
Data Scientist, Oocar, start-up dans l’écosystème de la voiture connectée, Paris.
- Développement de packages R de machine learning afin d’analyser le comportement d’automobilistes à
partir de données IoT.
- Mise en place de base de données GIS et construction d’algorithmes autour des données GPS (exemple :
matching entre le réseau routier et les coordonnées des différents trajets).
- Construction d’algorithmes de maintenance prédictive.
Mars 2015
à Avril 2016
Consultant Data Scientist, Bluestone puis Ernst&Young (suite à un rachat), Paris.
- Développement de pipeline de données, d’algorithmes de segmentation clients et analyse du comportement
client via SAS au sein d’ERDF
- Construction de dashboards de visualisations interactives avec R Shiny pour le suivi des brevets chez
l’INPI.
Nov. 2013
à Fév. 2015
Data Scientist, Autobiz, Expert de la cote automobile, Suresnes.
- Développement de modèles de machine learning intégrant notamment les corrélations spatiales pour
l’estimation de la valeur actuelle et future de véhicules d’occasion.
- Construction d’algorithmes de pricing dynamique à destination des professionnels de l’automobile.
Avril
à Sept. 2013
Data scientist [Stage], INRA (institut de recherche), Toulouse.
- Classification semi-supervisée d’ARN à partir de données structurées et non structurées (graphes) grâce
à des modèles à noyaux et des méthodes ensemblistes (kernel k-means, recuit simulé, bagging)
- Publication d’un article de recherche : ********-00877561/document
Diplômes et Études
2010-2013 Magistère Économiste Statisticien, Université Toulouse I – Université Toulouse III.
Le Magistère amène les étudiants à maîtriser les outils théoriques et empiriques nécessaires à la pratique
de l’ingénierie statistique ou économique. Il complète également le master en y ajoutant une plus grande
dimension professionnelle.
2010-2013 L3 à M2 Statistique et Économétrie, TSE (Toulouse School of Economics).
Cette formation contient des cours généraux en statistique, en économétrie et des cours spécialisés dans
différents domaines d’applications.
2008-2010 D.U.T Statistique et Informatique Décisionnelle, Université de Caen.
L’informatique décisionnelle est une activité trans-disciplinaire, qui demande des compétences en
informatique, en statistique et en communication, enrichies d’une culture générale sur le fonctionnement
de l’entreprise
Compétences
Développement
R SQL
Python, pandas, sklearn Spark
GraphQL Django
Docker
Maths / Computer Science
Statistique Machine Learning
Data mining / Analytics Deep Learning / Computer Vision
DataViz
RShiny GIS
Matplotlib, seaborn, ggplot D3.js, Leaflet