Sauguy - Data engineer - Data scientist
Ref : 180411S003-
93 NOISY LE GRAND
-
Data Scientist, Développeur, DevOps (38 ans)
-
Freelance
Expérience professionnelle
Depuis Juillet 2021 : Formateur Big Data @ Univalence
• Production de support de formation pour l’enseignement supérieur (ESIPE, ESIEE)
o Base de données en Big data (Distributed storage, Stream processing, Microservices)
o Apache Spark et programmation fonctionnelle
• Environnement : Spark, Scala, Jupyter Notebook, Docker
Août - Déc 2021 : Développeur Web
• Institut de cours en ligne : Application de gestion de tickets de support
o Rôle et contributions : Developpeur java angular full stack
§ Rédaction du cahier des charges
§ Maquettage de l’architecture, des workflows et des vues site web
§ Développement des applications (API, Front back-office)
§ Tests unitaires et d’intégration
§ Animation des sprints meetings
o Environnement : Java, Springboot, Elasticsearch, Docker, Angular 12, Wordpress, PostGreSQL,
Gitlab
Depuis Mars 2021 : Consultant e-commerce
• Auto-entrepreneur en e-commerce :
o Création de site et boutiques en ligne (Wordpress, Shopify)
Depuis Janvier 2018 : Data engineer – Lansrod (SSII) – Paris
• Société Générale (SGCIB) : Core Team Datalake, Equipe en charge de l’administration et de la maintenance du Datalake SGCIB
o Rôle et contributions : Développeur et administrateur Hadoop
Maintenance et administration des clusters
Développements d’API web et de services de gestion des clusters
Support et accompagnement des équipes projets dans leur utilisation du Datalake
o Environnement : HDP 2.6 (Stack complète), SolR, ElasticSearch, Kafka, Spark, Flume, PostGreSQL, Java 8, Springboot, Jenkins, Github
Janv 2016 – Nov 2017 : Consultant technique Data engineer – Talan (SSII) – Paris
• EDF : Projet E.quilibre : Service en ligne proposant des conseils personnalisés pour faire des économies d’énergie à l’aide d’outils de suivi et de comparaison de consommation et de conseils liés aux équipements.
o Rôle et contributions : Consultant technique MOE/AMOA lors de la mise en place du service E.quilibre
Spécifications et recettes techniques et fonctionnelles
Participation et animation d’ateliers de cadrage et scrum-meeting
Conception et développement d’applications Big Data d’enrichissement de données consommation électrique et de qualité de données
Développements d’algorithmes d’interpolation de consommation
Développements de programmes SQL d’alimentation du Datamart
o Environnement : Hadoop, Spark, Java, Hbase, Hive, Oozie, Kafka, HDFS, Git, Jira, Jenkins, Maven, Oracle, R, Intégration continue
Aout 2013 – Déc 2015 : Consultant BI – Report One (éditeur de solutions BI) - Paris
• Missions :
o Mise en œuvre des produits MyReport pour modéliser les données, créer les rapports et analyses souhaitées par les clients, à partir de différents ERP (Sage, Akuitéo, MyPortal)
o Formation des clients et support technique des produits MyReport
o Intégration et programmation du CRM Collaboratif MyPortal chez les clients
• Projets principaux :
o Société Générale : Migration et optimisation de reports BO vers MyReport (BO, MyReport, SQL Server)
o Groupe Marie Claire (Presse) : Conduite complète du projet BI (Suivi des abonnements et de l’attrition) : Expression des besoins, implémentation de MyReport et de bases MySQL, collecte et modélisation des données, construction et présentation des tableaux de bords.
Avril-Juillet 2013 : Chargé d'études statistiques – In Numeri (société d’études statistiques) - Paris
• Mission (SAS) : l’ADEME (Agence de l’Environnement et de la Maîtrise de l’Energie) a mis en place un portail web présentant pour chaque collectivité territoriale des indicateurs de mesure de performance énergétique. Notre mission a été d’effectuer un audit et des analyses statistiques sur les données sources, puis de rédiger un rapport exhaustif sur la validité des indicateurs de mesure.
2011 – 2012 : Chargé d'études Data mining – Arvato (société de conseil en marketing) - Paris
• Missions (SAS & Excel) :
o Réalisation d’études statistiques pour de grands groupes. Etudes Ad hoc, analyses descriptives, segmentations et régressions dans le but d’améliorer la connaissance client.
o Création de tableaux de bords de suivi d’activité (Reporting analytique)
o Rédactions et présentations de rapports de synthèse
• Projets principaux :
o Idmacif (assureur auto): Construction de modèles de score d’appétence
o EDF : Etudes statistiques sur la satisfaction client et recommandations opérationnelles
Formation
2012 : Master 2 Techniques d'Information et de Décision dans l'Entreprise (Université Paris1 Sorbonne)
2010 : Master 1 Intelligence économique et stratégies compétitives (Université d’Angers)
2009 : Licence d’Economie : Théories économiques et Mathématiques appliquées (Université Paris12)
2005 : Baccalauréat : Sciences économiques et sociales (Angers)
Formations / MOOC:
• 2016: R Programming (Coursera.org)
• 2016: Hadoop Platform and Application Framework (Coursera.org)
• 2017: Machine Learning / Apprentissage automatique (Coursera.org)
• 2017: Neural Networks and Deep Learning (Coursera.org)
• 2017: Apache Spark 2.0 with Scala - Hands On with Big Data (Udemy)
2019: Microsoft Azure Cloud (Udemy)
• 2020: Spring & Hibernate (Udemy)
• 2020: Docker & Kubernetes on GCP (Udemy)
• 2021: Scala & Functional programming (Udemy)
• 2021: Python (Udemy)
• 2021: Web development (Udemy)
Informatique et Langues
Outils : Ecosystème Hadoop (Spark, Hbase, Hive, etc.), SAS, R (Certifié), MyReport, Oracle, SQL Server, MySQL
Langages et programmation: Java, Scala, Python, SQL, Unix, Matlab, Jenkins, Git
Bureautique: Pack Office, VBA
Anglais: Bon niveau