v Développement de pipelines de données pour le pôle finance et contrôle de gestion
v Alimentation des tables delta lake dans databricks
v Création de dashboards PowerBI pour le suivi des factures par le comité de direction d’Engie
v Mise en place de pipelines Spark de traitement de données financières et cartographique.
v Développement d’application web (React) afin de visualiser ces données
v Gestion et Alimentation des base de données Postgresql et ElasticSearch.
v Développement d’un backend (Rust) pour interagir avec les BDD depuis le front
v Orchestration et Développement des container (DockerFile + Kubernetes)
v Écriture de scripts gitlab-ci et tests pour la CI-CD
v Mise en place de pipelines Spark et Pandas (ainsi que leurs ordonnanceurs) de traitement de
données d’activité réseaux.
v Développement d’application web (React) afin de visualiser ces données
v Gestion et Alimentation des base de données Postgresql et ElasticSearch.
v Développement d’un backend (Rust) pour interagir avec les BDD depuis le front
v Développement des container (DockerFile + docker-compose)
v Écriture de scripts gitlab-ci et tests pour la CI-CD
v Implémentation de features sur un module de payment (BAAS) coté backend et frontend.
Environnements techniques : scala, java, akka, typescript, React, graphQL, kafka, protobuf, Sbt, Gitlab-CIv Mise en place de pipeline amenant des données de compteur linky vers un Datalake.
v Utilisation d’une banque de données partagé pour effectuer des calculs d’indicateurs
v Participation au design de la Data Platform sur AWS qui prenait en compte les données de
réclamation d’assurance venant de différentes sources
v Ecriture de jobs spark pour le traitement des données
v Exposition des données aux différents utilisateurs via Hive et phoenix
v Ecriture de scripts gitlab-ci pour la CI-CD
v Rédaction de scripts Jenkins pour mettre en place la chaîne CI-CD
v Mise en place d’une solution de fraude automatisée pour AXA France, UK et Belgique en tant que
Data Engineer
v Automatisation et orchestration de jobs
v Participation au design de la Data Platform sur AWS qui prenait en compte les données de
réclamation d’assurance venant de différentes sources
v Ecriture de jobs sparks pour le traitement des données
v Exposition des données aux différents utilisateurs via AWS Glue et Athena
v Ecriture de scripts Terraform pour faire des déploiements de Data Infrastructure as Code
v Utilisastion de Spark Graphframe pour explorer de nouvelles data business rules et détecter les
fraudes
v Rédaction de scripts Jenkins pour mettre en place la chaîne CI-CD
Projet 1 :
Constitution d'un Data Lake afin d'ingérer puis d'exposer les données d'exploitation des
serveurs rattachés aux Data Centers d'EDF à des applications consommatrices. Une API entrante
est utilisée par les sources de données, une API sortante est utilisée par les applications
consommatrices, et un système de stockage est mis en place entre les deux APIs (les trois étant
basés sur des technologies Big Data).
Projet 2 :
Développement d'une application Spark requêtant plusieurs sources de données issues du
référentiel IT d'EDF (Bases Oracle, API Web Services, ...) et exposant ces données au sein d'une
base PostgreSQL pour la génération de rapports quotidiens.
Réalisations :
v Mise en œuvre et support de la haute disponibilité des différents composants du Data Lake
v Développement, intégration et déploiement continu sur les technologies du Data Lake
v Support opérationnel de production (niveau 3)
v Automatisation et orchestration de jobs
v Réalisation de tests de charges et de validation fonctionnelle
v Mise en place des outils de supervision : intégration au framework de monitoring (ELK)
v Participation aux spécifications techniques et aux phases de conception
v Documentation nécessaire à la mise en production (DAT, DEX, PTI)
v Veille technologique
L’objectif du projet était de déterminer les facteurs d’évolution des prix des véhicules d’une année
à l’autre.
v Développement en Spark et Scala
v Travail sur un cluster amazon avec la distribution Mapr
v Création de workflows Oozie
v Création de tables et de requêtes sur Hive
v Organisation de nos données sur HDFS
v Feuille de calcul sur zeppelin
L’objectif du projet était de récupérer et d’enrichir les données des usines Renault afin de
d’avoir la traçabilité des pièces et de pouvoir reconstruire les prix de chacun des véhicules en
fonction de ses pièces.
v Création d’une architecture distribuée Big Data sur un cluster de 18 nœuds
v Ingestion de la donnée depuis différents systèmes d’information de Renault
v Création de workflows Oozie
v Analyse de la donnée avec les controleurs de gestion pour déterminer des règles métiers
v Création de tables et de requêtes sur Hive
v Formation sur Spark et scala
v Organisation de nos données sur HDFS
v Feuille de calcul sur zeppelin
L’objectif du projet est de récupérer, en temps réel, les transactions financières provenant
de plusieurs sources, à l’aide de MapR Stream et Spark Streaming afin de les enrichir, et les
stocker dans différents systèmes (MapR-DB, ElasticSearch et Oracle).
v Développement de nouvelles fonctionnalités et maintenance de l'existant. Ingestion de la
donnée depuis différents systèmes d’information de Renault
v Participation active à la mise en place de la stratégie Big Data chez Ingenico. Analyse de
la donnée avec les contrôleurs de gestion pour déterminer des règles métiers
v Développement des tests unitaires automatisés (continous integration). Formation sur
Spark et scala
v Participation à l'amélioration continue en identifiant des chantiers d'amélioration potentiels
(refactoring). Feuille de calcul sur zeppelin
v Amélioration des performances applicatives
v Partage de connaissances, contribution à la montée en compétence des développeurs
juniors
v Lead technique sur des équipes de dev offshore