En tant qu’ingénieur de données, design de solution data for l’équipe sysdebug, en charge du déploiement de
correctifs embarqués et cloud sur les systèmes liés à la gestion de la flotte. Développement d’outils de
visualisations, de dashboard de recherche de véhicules et développement sur les systèmes clouds associés.
â Requêtes SQL, création et gestion de datasets
â Développement de cloud functions and scripting de tâches ETL, via compute engine.
â Design et maintenance de rapports looker studios.
â Migrations et création d’infrastructures via terraform.
GCP, BigQuery, SQL, Cloud Functions, Looker Studio, Terraform, Python.
En tant qu'ingénieur de données, développement d'une application de streaming basée sur Kotlin-Beam pour la
communication en temps réel avec les véhicules de la flotte.
â Création de règles d'alerting et de rapports de performance pour une application de streaming basée sur
Beam
â Impliqué dans les décisions relatives à l'infrastructure de l'application et de son environnement
â Intégration des métriques de performances à toutes les étapes de la pipeline
â Conception d'exportations de logs, d'alertes et de données de performance vers bigquery.
GCP, BigQuery, Cloud Functions, Looker Studio, Dataflow, Terraform, Kotlin, Apache Beam.
En tant qu'ingénieur de données, conception de solutions de données autour de la plateforme Connected Car
Services (Interface véhicules-cloud). Création de rapports de contrôle de qualité et de protocoles d'alerte pour
maintenir un niveau de qualité des données dans les systèmes d'entrée de l'entrepôt de données.
â Requêtes SQL, création et gestion de datasets
â Automatisation des processus dl'ingestion de données dans GCP depuis sources externes (azure, HDFS,
spreadsheets ...).
â Design de rapports Datastudio et Grafana.
â Automatisation de l'alerting et du monitoring via GCP cloud logging, scripts pythons, Datastudio et Grafana
â Audit financier de projets orientés donnés sur GCP, diffusion des best practices.
GCP, BigQuery, Cloud Functions, Datastudio, Grafana, Python, SQL, Pub-Sub.
En tant qu'ingénieur de données, conception et mise en œuvre de solutions ETL, de visualisations Datastudio et de
processus de validation des données autour du datalake Adeo. Développement pour les équipes retail et de
cybersécurité.
â Requêtes SQL, création et gestion de datasets
â Conception de rapports dans Datastudio et d'extraits automatisés dans google sheets à l'aide d'Apps Script
â Transformation et nettoyage des données à l'aide de requêtes SQL, de Python et de fonctions Cloud
â Rédaction de documentation technique
â Migration de données depuis Teradata vers Bigquery
GCP, BigQuery, Cloud Functions, Datastudio,Dataflow, Python, Apps Script (JS), SQL, Terraform, Pub-Sub, Agile, GIT
En tant qu’ingénieur de recherche, développement d'une plateforme en vue.js / flask / R proposant de l'analyse
statistique sur des jeux de données métiers pour les biologistes et biotechniciens.
â Nettoyage et traitement d’ensembles de données génomiques.
â Développement fullstack
â Conteneurisation de l'application initialement client lourd.
â Fine-tuning de modèles statistiques via R.
Vue.js, Flask, Python, MongoDB, GCP, GCE, Docker, R, Git
En tant qu'ingénieur de données au sein du département DWHCOM d'Air France, intervention dans une équipe de
15 professionnels en charge du développement de pipelines, de processus et de jobs sur le datawarehouse clientèle
d'Air France.
Intervention sur un projet de reconnaissance des clients, un algorithme de record linkage créé afin de consolider un
référentiel exhaustif des clients d'Air France à partir de multiples sources de données.
â Développement d'un pipeline de couplage d'enregistrements pour l'appariement de profils dans l'entrepôt
de données des clients d'Air France
â Création de pipelines de données Hadoop - Spark pour l'entrée dans l'entrepôt de données.
â Manipulation de données sur Azure
â Requêtage SQL
Spark, HDFS, Hadoop, Scala, Java, Python, MS Azure, Azure functions, Agile SAFe, Git, Gitlab CI/CD, Terraform,
Au sein du service d'oncologie de l'hôpital de Cherbourg et en collaboration avec le GREYC (laboratoire de
recherche en informatique), intervention en tant que développeur C++/QT sur un logiciel d'aide au diagnostic pour
les praticiens.
Le logiciel permet de compter automatiquement les cellules cancéreuses et saines sur une biopsie numérisée d'une
patiente atteinte d'un cancer du sein et de rendre ainsi compte de l'agressivité du cancer. Le médecin tient compte
des résultats pour ajuster son traitement.
Le logiciel a été vendu en 2023 à un laboratoire tiers pour être industrialisé.
â Développement C++/QT
â Redaction de documentation technique
â Développement de la deuxième version de l'algorithme d'imagerie en utilisant la bibliothèque CIMG et
opeanseadragon
C++, QT, CIMG, OpenSeaDragon, GIT