Notre base de 171064 CV vous permet de trouver rapidement un Data scientist Toulouse freelance. Recevez gratuitement et sous 24h maximum les CV des meileurs intervenants disponibles.
Expérience professionnelle
LLM Engineer / Data Scientist IA KNDS (Depuis Octobre 2024)
Au sein de la division s'occupant du service après-vente/soutien des véhicules terrestres militaires,
dans une équipe de 5 personnes (2 interlocuteurs métier, 1 chef de projet, 2 Data Scientist), je participe
à divers projets en veillant à la sécurité et à la condentialité des données.
POC de Chatbot de Maintenance Prédictive : création d'un framework de test et de con-
guration pour le ne-tuning d'un chatbot, avec sélection dynamique de modèles (Ministral, Mistral,
Pixtral) et commandes de ne-tuning dédiées. Génération de Q&A via chiers JSON (interface ou manuel), conversion des modèles PyTorch (CUDA) au format ONNX, puis test d'inférence sous ONNX
Runtime pour valider la faisabilité de portage vers des environnements à ressources limitées.
POC de Fine-Tuning d'Images : mise en place d'un framework pour générer des images à partir
de données textuelles et visuelles, en s'appuyant sur Stable Diusion, Diusers, Gradio, Torch et des
techniques de Computer Vision (Text Inversion, DreamBooth, Full FineTuning, LoRA).
Pipeline MLOps pour la Segmentation : développement d'une chaîne de traitement pour segmenter un véhicule à partir de photos sur fond vert. Chaque image est annotée (via LabelMe) pour
identier roues, pare-chocs, etc. Un modèle CNN U-Net (PyTorch) est entraîné via la librairie diusers
(Hugging Face) pour la phase de diusion inverse, et MLow assure l'industrialisation (tracking des
expérimentations, suivi des performances).
Chatbot RAG : participation au développement (approche CI/CD) d'un chatbot d'aide à la maintenance, exploitant de nombreux PDF (Mistral, Streamlit, LangChain, Git, Conuence, Docker, Ollama,
Mistral). Le modèle bge-m3 est utilisé pour les embeddings.
Veille Technologique : étude de MLLM-Tool pour unier les POC de ne-tuning (multimodal et
chatbot LLM) et le chatbot RAG déjà en production, an d'assurer un déploiement et un suivi plus
cohérents.
Analyses et Visualisations : production de graphiques de Data Science pour diérents métiers :
maintenance prédictive (MTBF, Kaplan-Meier, Cox), analyse de l'existant et qualité des données.
Technologies : Python, Deep Learning, Réseaux de neurones convolutifs, ChatGPT O1, Jupyter, Git,
Conuence, JIRA, Markdown, Ollama, Docker, Ministral 3B, Mistral 7B, Mistral Large, Pixtral, Pixtral
Large, MLFlow, LabelMe
Packages Python : Pandas, NumPy, Matplotlib, Seaborn, TensorFlow, Scikit-Learn, PyTorch, Statsmodels, Transformers, Gradio, Streamlit, Socket, TensorRT, lifelines (KaplanMeier et Cox)
LLM Engineer / Data Scientist IA / CTO Boralia (Oct. 2020 - Oct. 2024)
Au sein d'une startup e-commerce dans le secteur du bien-être alternatif, où je supervise 2 collaborateurs (un technique et un métier), j'assure la mise en place et le fonctionnement de l'IT.
Infrastructure & Écosystème : création du site web et de l'application iOS, conguration des
serveurs mails et DNS, mise en place des outils collaboratifs, de la caisse enregistreuse et du système
de délité.
Analyse et Fidélisation : exploitation des données clients pour optimiser les campagnes marketing
(newsletters, ciblage) et améliorer l'expérience sur le site web.
Génération de Contenu via GPT-4 : développement d'un script automatisant la création et la
publication d'articles de blog SEO-friendly, générés par GPT-4.
NLP pour le Service Client : conception d'un outil Python (NLTK) traitant les demandes clients
par e-mail (problèmes de commande, questions récurrentes) et générant automatiquement des réponses
pré-remplies, validées ensuite par l'équipe support pour une productivité accrue
Projet SaaS (IA/Data/UX) : développement sous Flask (optique CI/CD) d'un système de ches
produits e-commerce personnalisées. Cette solution, déployée sur Azure (Compute/Docker/Kubernetes),
est conçue pour être scalable et vendue en mode SaaS auprès d'autres sites e-commerce.
Mise en place de pipelines : Déploiement et entraînement sur Azure Cloud Machine Learning
pour optimiser le cycle de vie des modèles de sélection des ches en fonction du client (suivi des
performances, sauvegardes des checkpoints, monitoring).
Technologies : Flask, FastAPI, Bert/Camembert, Azure (Cloud, Machine Learning), Kubernetes/Docker,
ReactJS, GPT OpenAI API, Gantt(Project), JIRA, Git, OVH Cloud, Plesk, Unix, Python, SQL
Packages Python : Pandas, NumPy, Matplotlib, Seaborn, TensorFlow, spaCy, Scikit-Learn, PyTorch,
Statsmodels, Requests, NLTK
Data Scientist / Data Analyst Groupe Renault (Oct. 2019 - Oct. 2020)
Au sein de la division CRM/Ciblage de Renault, composée d'une dizaine de personnes (spécialistes
Data, IT et métiers) :
Analyse des données de la base marketing et des prols clients.
Mise en ÷uvre de systèmes de scoring pour le prolage et la segmentation des individus, permettant
des stratégies de marketing ciblées.
Une attention particulière portée au RGPD dans chacune des analyses.
Technologies : Python, SQL, R, Shiny, Jupyter, Databricks, Power BI, Tableau.
Data Scientist / Data Engineer Thales (Nov. 2018 - Sept. 2019)
Au sein de la division s'occupant du service après-vente des viseurs infrarouges du Rafale, dans une
équipe de 5 personnes (Data et métiers) :
Nettoyage et organisation des bases de données.
Exploitation des données pour la maintenance prédictive.
Visualisation des données avec QlikView et collaboration avec les équipes Qlik.
Technologies : Hadoop, Spark, Hive, Python, Java, SQL.
Data Analyst / Data Scientist Groupe Renault (Oct. 2016 - Oct. 2018)
Mission internationale couvrant 12 pays, avec une dizaine d'interlocuteurs IT et métiers :
Identication, sélection et déploiement de best practices axées sur les données.
Extraction et analyse de données, prédictions et développement de propositions stratégiques.
Gestion de mission centrée sur les données, pilotage de la mise en place de ces best practices sur les
12 pays. Obtention de certications en Data Science de l'Université John Hopkins sur Coursera.
Technologies : R, Shiny, Python, SQL, SAP BusinessObjects.
Ingénieur Logiciel Allianz (Oct. 2015 - Sept. 2016)
Au sein d'une équipe en charge d'une extension Chrome pour l'achage de contenu d'aide :
Optimisation de l'extension (nouvelles méthodes de parsing, gestion de données).
Livraison du projet dans un délai de 10 mois.
Technologies : HTML, CSS, JavaScript, Jira.
Chargé de projet Canal+ (Mar. 2015 - Sept. 2015)
Au sein de la DSI, dans une équipe de 4 personnes (3 interlocuteurs techniques, 1 métier) :
Conception fonctionnelle, maquettage et participation au développement d'une interface web en méthodologie Agile (CI/CD).
Gestion des exigences, rédaction de spécications, développement d'interface en HTML/CSS.
Priorisation des risques, estimation des coûts, facilitation des réunions.
Technologies : JIRA, Git, HTML/CSS.