Optimisation SQL
PROJET : Optimiser les performances en temps des bases de données des robots d’analyses médicales.
DOMAINE D’INTERVENTION :
Monitoring des requêtes SQL du framework, analyse des logs, détection des requêtes coûteuses.
Réécriture des requêtes, pose d’index, tuning de la configuration du serveur, fréquence de la maintenance (autovacuum).
ENVIRONNEMENT TECHNIQUE :
Serveur : PostgreSQL
Outil de monitoring et d’analyse : pg_stat_statements, auto_explain, R
Analyste des données spatiales
IAD INTERNATIONAL
février 2020 - juin 2020
PROJET : Fiabiliser les recherches de biens immobiliers par géolocalisation dans les filiales internationales de la société : Allemagne,
Espagne, France, Italie, Portugal.
DOMAINE D’INTERVENTION :
Audit des processus existants de géolocalisation, audit de qualité du référentiel adresses.
Proposition d’un schéma directeur pour assurer une récence optimale des data tout en fluidifiant les mises à jour.
ENVIRONNEMENT TECHNIQUE :
PostgreSQL, PostGIS
Analyste des données spatiales – Cartographe
DÉSERTIX
mai 2019 - aujourd'hui
– Membre du bureau
PROJET : DésertiX est une communauté de mathématiciens, géographes, ingénieurs, data scientists passionnés de sciences du
territoire réunis dans un projet collaboratif et ouvert d’utilisation des données de santé pour comprendre et résoudre les déserts
médicaux.
DOMAINE D’INTERVENTION :
Cartographie et analyses spatiales de l’accessibilité aux soins sur le territoire français.
Construction et alimentation du DataLake, développement des interfaces de consultation.
PROJET : Développement et optimisation de l’usage de la cartographie dans l‘entreprise : réduction des coûts pour les utilisations
web et print, nouvelles fonctionnalités de visualisation pour les études marketing.
DOMAINE D’INTERVENTION :
■ Simulations économiques selon les grilles tarifaires des fournisseurs de cartes (Google Maps, Mapbox, Maptiler, Jawg Maps,
Carto, …), proposition et tests de solutions alternatives à Google Maps.
■ Adaptation du site web existant pour une réduction de la facturation Google Maps (coût divisé par 2).
■ Utilisation d’OpenStreetMap et développement en C# du générateur de cartes personnalisées pour le Carnet de Voyage.
ENVIRONNEMENT TECHNIQUE :
■ Développement web sous .NET, C#, Javascript, JQuery.
■ API cartographiques GoogleMaps, Mapbox, OpenStreetMaps.
■ Cartographie et visualisation de données sous Leaflet, D3.js, Javascript.
PROJET : Création d’une base de connaissances sur le patrimoine immobilier de la ville de Tianjin en Chine, études statistiques et
restitutions cartographiques des dynamiques mémorielles et patrimoniales de la Ville.
DOMAINE D’INTERVENTION :
■ Définition d’une ontologie des connaissances sociales et patrimoniales sur la base d’un corpus documentaire audio et écrit
et d’un recueil de données sur le terrain.
▪ Tenue de réunions d’échange pour l’expression du besoin et la définition du périmètre d’étude.
▪ Maîtrise d’ouvrage de la construction ontologique.
■ Conception du modèle de données, développement de la base physique.
■ Scripts d’alimentation de la base depuis des fichiers CSV.
■ Analyses statistiques et représentations cartographiques.
ENVIRONNEMENT TECHNIQUE :
■ Base de données PostgreSQL – PostGIS, sous Linux Debian.
■ Analyses et visualisation de données sous R. Cartographie sous R, QGIS et Leaflet associé à D3.js.
■ Saisie OpenStreetMap sous iD.
INSTITUT NATIONAL DE L’AUDIOVISUEL
décembre 2017 - avril 2019
Concepteur BDD – Développeur SQL – Freelance
PROJET : Migration de données, alimentation du DataLake : dans le cadre de la refonte du SI documentaire de l’Institut National de
l’Audiovisuel, création et alimentation du modèle physique de données.
DOMAINE D’INTERVENTION :
■ Traduction du Modèle Conceptuel de Données en Modèle Physique de Données.
▪ Normalisation des entités, pose des contraintes, des index et des clés étrangères
■ Scripts de migration en SQL par Foreign Data Wrapper.
■ Développement des requêtes SQL d’exploitation par les outils de recherche.
■ Simulation d’une activité temps réel et montée en charge (stress tests)
■ Optimisations du modèle physique : partitionnement, index partiels
■ Documentation du processus de migration.
ENVIRONNEMENT TECHNIQUE :
■ Linux Debian, MariaDB, PostgreSQL, SQL, plpgSQL.
Développeur R – Freelance
L’ORÉAL
mai 2017 - janvier 2019
PROJET : Applications de traitement statistique des essais cliniques (3 applications à ce jour)
DOMAINE D’INTERVENTION :
■ Analyse des besoins : réunions avec les utilisateurs du futur outil (chimistes, biologistes, statisticiens), afin d’arbitrer sur les
fonctionnalités (méthodes statistiques, données d’input, interface, rendu des résultats).
■ Maquettage, proposition d’une IHM.
■ Développement et validation sur jeu de données test.
PROJET : Data Quality de la base « Études de danger » des environnements pipelines d’Air Liquide en Europe.
DOMAINE D’INTERVENTION :
■ Analyse et maintenance corrective des données spatiales
■ Maintenance corrective et évolutive des applications cartographiques
■ Documentation des process de traitement des données
MARS 2016 – JUILLET 2018
PROJET : Assistance à la réécriture d’une application de gestion des séries économétriques françaises depuis SAS (Statistical
Analysis System) vers PostgreSQL et R.
DOMAINE D’INTERVENTION :
■ Conception du modèle de données des séries temporelles.
■ Assistance aux développeurs de l’INSEE.
■ Refactoring et optimisation du code R développé.
ENVIRONNEMENT TECHNIQUE :
■ PostgreSQL, R, Rstudio, SAS
Statisticien – Freelance
juillet 2014 - aujourd'hui
décembre 2017 aujourd’hui Institut National de l’Audiovisuel
Dans le cadre de la fusion des SI de la Direction des Archives et du Dépot Légal, développement dumodèle physique du Data Lake sous PostgreSQL, migration des données, Data Quality et analyse statistique des stress tests. PostgreSQL, SQL et R.
mai 2017 aujourd’huiL’Oréal
Développement d’applications de traitement statistique des essais cliniques. Langage R.
mars 2016 aujourd'huiINSEE
Expert R / SAS / PostgreSQL auprès de la DESE (Direction des Études et Synthèses Économiques).
Assistance au portage de SAS vers R de l’application Ariège de gestion des séries économétriques.
Développement des scripts SQL de migration des données SAS vers PostgreSQL.
Études et formations
division CGSA Paris
ENSAE (École Nationale de la Statistique et de l'Administration Économique),
1986
Baccalauréat scientifique série C, Mathématiques supérieures et spéciales Bordeaux
1984
Langues
Anglais - C2
Autres compétences
EXPERTISES ET COMPÉTENCES
Domaines :
Traitement et analyse statistique des données, analyses exploratoires et décisionnelles, data mining
Algorithmie : optimisation multi-objectifs, segmentation, apprentissage machine, algorithmes de graphes
Bases de données spatiales : conception, traitement et analyse statistique des données spatiales
Conception de bases de données relationnelles : modélisation Entité – Relation, méthode MERISE
Outils :
Analyse statistique : R, SAS, SAS Macro
Géomatique : MapInfo et MapBasic, MapServer, QGis, Leaflet, OpenLayers
SGBD : PostgreSQL et PostGIS, MySQL
Langages de programmation : Python, C, JavaScript, Node.js, plpgSQL, SQL
Données :
Bases géographiques et de navigation routière : IGN, TomTom Maps, OpenStreetMap
Bases institutionnelles : La Poste, Hexavia, INSEE, SIRENE et sourcing Open Data