Mettre en place une data warhouse / Data Lake
- Recueille de besoins.
- Installation de Talend.
- ELK pour l'Intelligent Log Monitoring dans Talend
- Installation d’un server / postgres On-Premises.
- Installation et paramétrage de l’infra GCP en Cloud.
- Architecture de la data Warehouse /Data Mart par service.
- Développements des Jobs d’alimentations Talend (sources vers destinations).
- Développements des Rapports Tableau.
- Classements des questions par thématiques (Indexation par ElasticSearch)
Environnement technique : Talend, SAS Entreprise Guide 7.1, IBM DB2, TeraData , Red Brick, Github, Tableau, Business Object BI 4
: Administrateur de la plateforme Talend Big Data -
Client : - Accor Hôtel
juillet 2018 - juin 2019
- Administrer la plateforme Talend Big Data On-premises.
- Gérer les serveurs d'installations.
- Administrer Git Lab
- Administrer Nexus
- Administrer la plateforme Control-M
- Nettoyages des serveurs Talend
- Migration de la plateforme Talend de la version 6.2 vers la 7.1 (DEV, REC et PROD)
Environnement technique : Talend Big Data 63.2 et 7.1, Github, GitLab, Nexus , Control-M, Linux MySQL
- BPCE (Banque Populaire Caisse d'Épargne): Projet MDM
avril 2018 - juin 2018
- Développer des jobs sur Talend MDM
- Sephora : Développeur Talend Big Data - Février 2018 – Mars 2018
Une vision 360 des données clients provenant des logs de son site internet dans le but de proposer un système de recommandation basé sur les comportements des clients.
Mission :
- Installation de TalendBig Data (Partie Administration – TAC et le studio sur chaque machine de Dev)
- Développement des jobs Talend qui permettent de :
• Se connecter en FTP pour récupérer les gros fichiers.
• Déposer les fichiers dans le HDFS de Hadoop.
• Créer et alimenter des tables HIVE à partir des fichiers déposés dans le ROWDATA.
• Utiliser tSqoop pour transférer les tables CRM(Oracle) vers le HDFS.
• Faire des filtrages et de la qualité des données.
• Croiser les données en mode ELT.
• Automatiser les jobs pour consommer chaque ficher déposé en FTP.
• Récupérer les données à chaud en utilisant Kafka en créant des Topics (tKafkaCreateTopic) et des entrées/sorties (tKafkaInput,tKafkaOutput).
• Gérer le lien entre Kafka, Spark Streaming et ElasticSearch et mettre les données à disposition du Kibana et Tableau.
Management de projet avec la méthode agile.
- Language Java.
- Language scala.
- Ecosystemehadoop.
- Gestion de bdd.
- Cycle de production.
- Ecosysteme spark.
- Data integration.
- Broker kafka.
- Ecosystemeelastic.
- Data visualization.
- Data management, sécurité & gouvernance de données.
- La restitution dans des projets big data.
Consultant Talend DI, ESB, MDM
Etat de Vaud Suisse
septembre 2016 - juillet 2017
Projet RCEnt (Registre cantonal des Entreprises) : Centralisation des données des entreprises de l’Etat de Vaud qui viennent des différentes ressources et les mettre à disposition pour d’autres services.
Mission :
Développement des Jobs Talend.
Intégration des données dans RCEnt à partir des différentesressources (fichier FOSC, REE, IDE, Web service)
Web Services SOAP, REST, Routes avec Talend ESB
Gérer les messages dans KAFKA.
Administration de Talend par TAC.
IMAD (Institut Genevoise de Maintien à Domicile) Suisse
février 2016 - juin 2016
Projet : Alimentation de la data Wherehouse interne de IMAD à partir des fichiers des prestations.
Mission :
Intégrer les fichiers journaliers des prestations dans la DWH par TIS.
Mettre les normes de développements sur Talend
Tests d’intégrités sur NetBeans (Java)
Projet : Alimentation d’une Data Mangement à partir des bases internes de la BRED et mettre les données à disposition du service marketing pour des compagnes de prospections.
Développement des Jobs d’alimentations et de la qualité de données par Talend Open Studio.
Versionning / partage des Jobs par GITHUB
Expertise Talend.
Migrations Talend vers Data Stage (IBM)
Participation à l’installation d’un cluster Hadoop (5 noeuds)
Environnement technique : Talend Open Studio 5.6.0, Oracle, Postgres, GIT
Consultant Talend(TOS)
Sopra Group (RH)
décembre 2014 - février 2015
Projet : Reprise des données entre HR et Pléiades
Mission :
Développements des Jobs Talend pour générer des fichiers intégrables dans Pléiades (Logiciel RH de SOPRA),
Mettre les normes de développements sur Talend
Automatisation des scripts Talend par Shell
Environnement technique : Talend Open Studio 5, Oracle
Consultant MDM / Big Data
Jems DataFactory :
novembre 2009 - juin 2019
Études et formations
Python, machine learning, LLM
Formation à l'université Paris8
2023
(3 mois) : Formation FITEC - BIG DATA
2017
Formation Business Object - Formation Jasper Report - Formation Palo
2011
Certification Talend (Talend / Paris)
2010
Formation Talend (Talend / Paris)
2009
Langues
Anglais - C2
Autres compétences
SYNTHESE DE COMPETENCES
Compétences techniques :
IA: Machine Learning, Deep Learning, Probabilistic Soft Logic (PSL), LLM, Natural language Processing(NLP), IA générative, Prompt-Engineering, Fine-Tunning
Big Data:Ecosystemehadoop, Ecosysteme spark, Broker kafka, Ecosysteme elastic, Data visualization.
Cloud : GCP
Web Services : REST, SOAP, Route
BI: Datawarehouse, ETL Talend/Informatica/Data Stage , Datamining (SAS, KXEN, SODAS, WEKA)
ETL : Talend DI / MDM / ESB / DQ / Big Data
Reporting :Cognos , Business Objects XI , BI4,Jasper Repport, Palo(Jedox), Tableau Software
Outils de développement : Eclipse, Netbeans, IntelliJ
CRM : SalesForce
Langages de programmation : J2EE, C, C++, LISP, CEPLEX, Perl, Java 8, scala
Web: HTML, XHTML, XML, CSS, Javascript
SGBD: SQL, Oracle 10g, PL/SQL, MySQL, PostgreSQL, SyBase IQ et ASE,
Systèmes d'exploitation : Windows, Linux, Unix
Méthodologie et modélisation: UML, Power AMC et MEGA, Agile(Scrum, DevOps)
Langues :
- Anglais : niveau intermédiaire
FORMATION/ CERTIFICATIONS
2012 : Formation InformaticaPowerCenter 9 - Formation MEGA (Outil de modélisation) (Nouveli – Paris)
2007 : Licence 3 Informatique - Université de Cergy – Pontoise
2008 : Master I Informatique (Orienté base de données) - Institut Galilée – Université Paris 13
2009 : Master II professionnel EID (Exploration Informatique des Données) - Institut Galilée – Université Paris 13.