Bruno - Consultant AGILE, Data Scientist, ML/DL/GenAI (RAG). Data Quality

Ref : 161025S001
Email vérifié
Photo de Bruno, Consultant AGILE, Data Scientist, ML/DL/GenAI (RAG). Data Quality
Compétences
Expériences professionnelles
CV plus récent en cours de mise à jour
  • Expérience professionnelle

    Client Confidentiel – Secteur Energie R&D Juillet 2022 – Juillet 2023
     Rôle : Data Engineer, Data Quality
    Missions : Ingestion de données tabulaires et textuelles. Data Quality.
    Environnement technique : Clusters kubernetes , Kubeflow , Data Catalog (Datahub,
    OpenMetaData), Notebooks jupyter, PySpark, Dataiku-DSS, dvc

    LE POINT Janvier - Mars 2022
     Rôle : Data Engineer
    Missions : Audit data de la direction du Numérique (Marketing Digital), Data
    Gouvernance, Data Quality. Alteryx, Tableau, Dremio, Hadoop HDP sur cloud GCP.
    procedures stockées Maria-DB.
    EVA GROUP Juillet - Novembre 2021
     Rôle : Consultant Data, Mise en place offres forfait Gouvernance & Audit Data,
    ML Ops
    Missions : Mise en place des offres forfait Gouvernance & Audit Data, ML Ops.
    Recrutement de collaborateurs. Présentation / Atelier au Salon Big Data et IA 28
    septembre
    SONEPAR France (via Datasolution) Novembre 2020 – Février 2021
     Rôle : Chef de projet RUN , sites e-commerce Sonepar/Cged
    Missions : Soutien aux équipes de Prod Sonepar et à l'intégrateur Datasolution.
    Environnement technique : Intershop, Windows Server, Java / Tomcat, Oracle, Teams,
    Excel.
    BIO-MERIEUX RENNES (via THALES Rennes) Mars 2020 – Avril 2020
     Rôle : Senior Data Scientist
    Missions : Pour un fabricant US de biscuits , analyse des données fournisseurs. (EDA).
    Alertes qualité, factures fournisseurs.
    Environnement technique : Linux (Ubuntu), Notebooks jupyter, pandas, bokeh, plotly,
    networkx, scikit-learn, Excel.
    THALES Services (en sous-traitance) Avril 2019 - Janvier 2020
     Rôle : Référent Data Science
    Missions : Mise en place du socle de librairies ML et DL ,sur la Military Digital Stack
    (utilisée par 3 GBU Thales) .Rédaction et animation de formations. Conception /
    Amélioration de notebooks Zeppelin. Accompagnement des utilisateurs sur Cas d'Usages.
    POC ML-Flow.
     Environnement technique : Linux (CentOS), Hadoop (HDP, Guavus/Reflex, CDAP,
    pySpark, Zeppelin, hive, hbase, kerberos, Knox, Ranger, Atlas), Jenkins, Gitlab,
    Confluence/JIRA. Elasticsearch, Kafka, Janus Graph. MLFlow (POC)


    HSD (en sous-traitance) ******** De Juillet 2017 à Février 2018
    • Rôle : Senior Data Scientist, Data Engineer
    Missions : Construction d'un Data Lake (MapR). Parquettage de fichiers raw. Constitution et exploitation d'une base client pour la grande distribution. Segmentation clients. RFM.
    Prédiction (moment de vie). Classification non supervisée avec K-Means. Word2vec et RNN (GPU) pour Segmentations clients avançée. Mise en place Elasticsearch. ref.
    • Environnement technique : Linux (CentOS), Hadoop (MapR, pySpark, Oozie, jupyter, MLlib, scikit-learn, GitLab), Docker, Ansible, GPU Nvidia, Tensorflow, Keras.

    DALKIA (en sous-traitance) De Février 2017 à Juin 2017
    • Rôle : Architecte Big Data, CdP technique
    • Missions :Migration d’un portail client entre deux clouds. Conception d’un Data Lake / Data Lab. POC sur la plate-forme GCP (DataPrep (Trifacta), Datastore, Big Query, Dataflow, Data Studio). Conception architecture micro-service et socle.
    • Environnement technique : Linux (Ubuntu), Cassandra, Hadoop (Horton DP), StrongLoop, micro-services (kubernetes). Google Cloud Platform.

    Consultant indépendant De Mars 2015 à Janvier 2017
    • Rôle : Architecte technique, Data Engineer, Expert technique Jahia, Kaggler
    • Missions :Soutien CMS Jahia, Gestion de projet technique, Gestion de la données.

    Mise en oeuvre du machine learning.
    • Clients :Stime (Jahia) , MGP (Jahia) , Edenred (Cloud HPE)
    • Environnement technique : Jahia V6.5/ V7.0 , Oracle, JavaEE, OSGI, Spring MVC, Linux.
    • Rôle : Formateur en informatique : algorithmique et machine learning
    • Missions : Vacations pour ESILV, EFREI, ISEP, ESIEA, Centrale-Supelec, ESIC (Hadoop, Spark et Machine Learning (R) )

    • Mai 2016 Orange Guinée à Conakry : Formateur Hadoop développeur (5j). Sur la
    distribution Cloudera : installation, pig, hive, mahout, sqoop.

    ATOS Orléans (CDD) De Octobre 2014 à Février 2015
    • Rôle : Expert technique Jahia
    • Missions : Expertise et soutien à des projets Jahia. Création de site et/ou migration de versions, en méthodologie Agile / Scrum
    • Environnement technique : Jahia V6.5, V7.0 , Oracle, SQLserver. JavaEE, OSGI, Spring MVC.

    Ministère de l’économie - Secrétariat Général De Avril 2008 à mars 2014
    • Rôle : Chef de Projet MOE - Architecte
    • Mission : Coordination d'équipes, pilotage de prestataires en TMA, définition et réalisation d'architectures haute-disponibilité et PRA. Recettes. Tests de performance (JMeter). Rédaction des cahiers des charges, analyse UML.

     2011 - 2013 : Projet OGPS. 100K€ /an : Outil de Gestion de Parc et de Service (utilisant ITSM HP Asset Center et Manager). Applications péri-comptables (MCO).
    Liaisons avec Chorus (Delta, Berger). Formé à ITIL V3 Foundation

     2008 - 2011 : Projet GCP (Gestion de Contenu et Portails) 400k€/an et build de 5M€
    +. Objectif atteint : rationalisation des intranets de Bercy, en deux ans. 4 sites internet et 10 sites intranet mis en production.

     Formateur à l'IGPDE : cours « Concevoir un site web ». « Sensibilisation à l'open data et au web sémantique »
    • Environnement technique : CMS Jahia (Java, Tomcat, Spring, Hibernate), Oracle10gRAC, Centos

    Monnaie de Paris 2005 - 2008
    • Rôle : Chef de projet, expert technique e-commerce
    • Mission : DSI de 15 personnes. Ingénieur expert Enfinity, responsable technique de la boutique internet (Java, J2EE, Oracle, Intershop).
     Amélioration du CA de la boutique en ligne,
     Stabilisation des processus : Marketing, Paiement, Référencement, Temps de réponse
     Étude du marché CMS
     Changement de prestataire : TMA, hébergeur

     2007-2008 membre de l'équipe de pilotage du dialogue compétitif sur le choix d'un ERP. Choix de Sage X3 vs Lawson

    INTERSHOP France & Europe du Sud 2001 - 2004
    • Rôle : Responsable de l’équipe consulting, Local Area Manager
    • Mission : Consulting autour des progiciels e-business Enfinity, Gestion de contenu, e-Procurement, Paiement en ligne, Java, J2EE, Oracle, Intégration avec SAP (BAPI), XML.
     Réponses aux appels d’offres, avant-vente. POC.
     Coaching projet, formation, expertise, mise en production sur des projets de sites B2B. (Gemplus, Pechiney, St-Gobain) ou B2C (********, Gemplus), optimisation des performances.
     Pour Saint-Gobain Glass (SGG), avant-vente et réalisation d'un projet B2B d'un site extranet embarquant un configurateur Selectica et IntershopEnfinity pour la préparation et la commande de camions transportant le verre pour les distributeurs. Projet niveau Europe interfacé avec SAP (BAPI), hébergement
    LinkByNet. Equipe e-business de Sébastien Poher.

    GLOBEID Software 1998 - 2001
    • Rôle : Responsable des équipes : Projets spécifiques et validation
    • Mission : Encadrement de projet
    Modules de paiement avec équipes de 3 à 4 ingénieurs, dont un projet pour NYCE concernant un système de paiement avec authentification par CDROM. Déplacement à
    Denver et coordination avec équipes US et Australienne. Protocole ISO8583.
    Élaboration du Plan de Recrutement avec recrutement de l’équipe technique, 15 personnes, et sélection des prestataires extérieurs, 3 personnes.

    INFOTEL 1997 - 1998
    • Rôle : Chef de projet, Consultant, Formateur,
    • Mission : Mise en place d’un partenariat avec Netscape (Affiliate Plus), et d’un centre de compétence I*Net au sein de la Direction technique = 2 affaires remportées
     Réalisation d’une couche de communication reliant des PC et un MainFrame via Internet et un serveur Web sécurisé.
     Encadrement de 3 ingénieurs ; MQSeries
     Missions de Conseil chez PSA:Projet DIVA. Modélisation objet (UML)
     Formateur sur Netscape server, Conception Orientée Objet

    CR2A-DI (SOGETI) 1990 - 1997
    • Rôle : Chef de projet
    • Mission : Missions de Conseil et d’Expertise. Migration vers les systèmes UNIX et l’informatique distribuée : CORBA
     Modélisation OMT, langage Objet C++/Ada
     Responsabilité de développements à l’Aérospatiale Missiles (MBDA) (mission de quatre ans) : Calcul scientifique, visualisation scientifique 3D (Station Silicon Graphics)
     Encadrement d’une équipe de projets composée de 2 ingénieurs (200h/j): forfait pour l’EDF et le CEA
    • Environnement : Logiciel spécifique intégré de suivi du fluage sur éprouvettes métalliques. Temps réel, X11-Motif, Graphique 2D, Dataviews

    DIADEM 1988 - 1990
    • Rôle : Chef de projet
    • Mission :
     Conception et réalisation de logiciels de traitement d’images
     Imagerie 2D
     Réalisation de driver Unix. C

    DASSAULT SYSTEMES 1987 - 1988
    • Rôle : Développeur CATIA
    • Mission :
     Développement d'un module concernant un modeleur géométrique 2D/3D.
     En Fortran, sous MVS et VM.

Études et formations
CV plus récent en cours de mise à jour
  • Compétences

    Développement ML
    Scikit-learn, pandas , pyTorch/ fastai
    Keras /Tensorflow, XgBoost, Spark (python MLlib)
    Calcul distribué Hadoop (MapR, Cloudera), Spark ; éco-système Hadoop
    Hive, parquet, pig, Hbase, Hue, Oozie . HPC (MPI , PVM)
    Modélisation UML, BPMN, Méthode Praxeme, TOGAF,SOA. microservices
    Management Gestion d’équipe technique (projets Web ou Data).
    Méthode agile, Scrum
    Protocoles TCP-IP, HTTP, SOAP , REST, CORBA, Openstack
    Méthodes Cycle en V, Agile : Scrum, ITILV3
    Langages Java, JavaEE, C/C++, Python, R, Fortran, SAGE
    Outils MS-Project, Eclipse, NetBeans, RStudio
    Bases de données
    Oracle, mysql, PostgresSQL, MongoDB, Hive, Hbase,
    Neo4J, Cassandra, ELK

    Formations
    2006 Master2 Mathématiques fondamentales(Paris 7)

    1987 DEA de Calcul Scientifique et d'Analyse Numérique / Universités de Lyon et St-Étienne ;

    1984 Diplôme d'Ingénieur Civil des Mines de Saint-Etienne. Option informatique
    Participations à ICML 2015 (Lille), NIPS 2015 (Montréal).

    1er semestre 2016, Cours sur le Deep Learning par Yann Le Cun au Collège de France

    1er semestre ********
    Kaggle Paris Meetup (co-organisateur), pseudo kaggle bruno16

    Certifications
    2014 Formation CMS Jahia V6 (JEE) cursus 5j développeur

    2014 École d’été Web intelligence (Web sémantique)

    2012 MOOCs MongoDB

    2011 Formation de formateur pour l’IGDPDE

    2010 Formation ITIL v3

    2007 PHP avancé

    Langues
    Anglais : Nombreux séjours professionnels aux États-Unis et en Europe.
    Langue de travail dans de nombreux projets (Intershop, Edenred siège).

    Compétences transverses
    Modélisation UML, BPMN, OWL, Méthode Praxeme, TOGAF,SOA
    microservices
    Développement
    ML / DL
    Scikit-learn, pandas , fastai /pyTorch, Hugging Face (NLP),
    Keras /Tensorflow/TFX, XgBoost/ LightGBM, Spark ML
    Calcul distribué Hadoop (MapR, Cloudera,Horton), Spark ; éco-syst. Hadoop
    Hive, Nifi, parquet, Hbase, Hue, Ambari, Oozie.
    HPC (MPI , PVM)
    Management Gestion d’équipe technique (projets Web ou Data).
    Méthodes Agile, Scrum.
    Cloud GCP (BigQuery), AWS, Databricks,
    Paperspace (GPU), OVH, Gandi
    Méthodes Cycle en V, Agile : Scrum, ITILV3
    Langages Python, Java, JavaEE, C/C++, R, Fortran
    Outils de dev. git, gitlabEE, jupyter, Zeppelin, Jenkins
    Eclipse, NetBeans, RStudio.
    Bases de
    données
    Oracle, mysql, PostgresSQL, MongoDB, Hive, Hbase,
    Neo4J, Cassandra, Janus Graph, ELK
    Formations académiques
    2006 Master2 Mathématiques fondamentales(Paris 7)
    1987 DEA de Calcul Scientifique et d'Analyse Numérique / Universités de
    Lyon et St-Étienne ;
    1984 Diplôme d'Ingénieur Civil des Mines de Saint-Etienne. Option
    informatique
    Formations professionnelles
    2021 Spécialisation Coursera Machine Learning in Production ( 4cours) ,
    Formation logiciel Data Galaxy (1j) en DataCatalog / Data Gouvernance
    Juillet2019, Deep Learning Summer School à Varsovie (5j)
    1
    er semestre 2018 et ********
    Collège de France
    1
    er semestre ********
    France
    Formation SOA par Zenika novembre 2016 (4j)
    Participations à ICML 2015 (Lille), NIPS 2015 et 2018 (Montréal).
    Dev Fest (Paris2018, 2020)