Expérience professionnelle
ModelRH (Novembre 2025 – En cours)
Rôle Data Scientist
Missions Mission courte de R&D et développement de solutions IA
• Accompagnement dans l’audit IA de l’entreprise
• Développement de POC R&D autour du métier d’analyste
• Mise en production d’une solution IA générative pour faciliter le travail de
rédaction
• Optimisation de la solution avec du contexte engineering et des techniques
avancés comme Human in the loop
Technologies Gemini, Qdrant, Structured outputs, Langfuse, Context engineering, LangGraph
Predexia (Juillet 2025 – Novembre 2025)
Rôle Data Scientist
Missions Aide technique au développement & amélioration d’une plateforme d’assistants IA
(Agents IA et RAG) - *******
• Développement d’un module de RAG généraliste.
• Mise en place de l’hybride search avec Qdrant.
• Amélioration du chunking sur des cas clients (documents PDFs, PowerPoint,
Word).
• Intégration du RAG dans un système d’agents avec Pydantic AI.
• Développement d’un agent IA de compte rendu de réunions
• Amélioration du Tool Calling en évaluant les meilleurs modèles et avec la
littérature (Berkeley function calling)
• Mise en place de monitoring avec Logfire
Technologies AWS, Bedrock, Langchain, Pydantic AI, Context Engineering, Structured output,
Hybrid search, Qdrant, Claude Sonnet, Logfire, Javascript
Reezet (Juin 2025 – Juillet 2025)
Rôle Lead Data Scientist – AI Engineer
Missions Développement d’une IA conversationnelle thérapeute : Contexte Engineering, RAG
et Structured Outputs (Application mobile MVP)
• Développement de la partie backend de l’IA pour l’application Reezet
(*******)
• Mise en place d’une base de données vectorielle avec du contenu thérapeutique
sélectionné par les experts métiers.
• Mise en place d’un RAG pour améliorer la réponse de l’IA pour que ça corresponde
à la vision Reezet.
• Analyse de la conversation et génération des critères d’évaluation, en utilisant les
mêmes principes du « LLM as a judge » et les structured outputs.
• Mise en place d’une mémoire long terme pour se souvenir des évènements de
l’utilisateur.
• Evaluation continue tout au long avec les équipes métiers.
• Mise en place de monitoring avec Langfuse
Technologies AWS, Azure foundry, FastAPI, Context Engineering, Qdrant, Structured Outputs,
OpenAI
Parti Politique Andorre (Mai 2025 – Juin 2025)
Rôle Lead Data Scientist
Missions Développement d’un RAG pour la ville d’Andorre
• Développement d’un Chatbot RAG pour renseigner les habitants d’Andorre sur les
projets de loi.
• Mise en place d’une base de données vectorielle Qdrant avec les documents de loi
de la ville d’Andorre.
• Développement d’un module de mise à jour automatique de la base vectorielle
pour rester à jour.
• Amélioration du chunking pour l’adapter aux documents de loi.
• Mise en place de détection de requêtes malveillantes pour assurer l’intégrité de
l’IA.
• Mise en place de monitoring avec Langfuse
Technologies AWS Bedrock, Langchain, Context Engineering, Hybrid search, BM25, Qdrant,
Structured Outputs, Metadata filtering
Telespazio – Thalès (Janvier 2025 – Mai 2025)
Rôle Lead Data Scientist
Missions Développement & Amélioration RAG (reprise de la mission 2024)
• Analyse détaillée des besoins et objectifs
• Reprise du produit réalisé en 2024 et amélioration vers de l’Agentic RAG.
• Mise en place de plusieurs Agents pour étendre la capacité du RAG (Agent pour
résumer, filtrer, ReAct…)
• Déploiement de la solution sur un cloud français (OVH)
• Mise en place du monitoring de la solution (retrieve + génération) avec Langfuse &
LLM as a Judge
• Amélioration de la phase de chunking avec des modèles de langages visuels
• Amélioration continue du RAG notamment de la phase du retrieve avec des
techniques comme de l’hybrid search (BM25 + semantic search), Query rewriting,
et du Reranking avec des modèles open-source
• Acculturation des équipes pour comprendre le RAG et les limites
Technologies Snowflake Embeddings (open-source), BM25, VLLM, Ollama, LlamaIndex,
Langchain, Qwen 2.5 14B, prompt engineering, Langfuse, Outlines (Structured O)
Actia automotive (Aout 2024 – Janvier 2025)
Rôle Data Scientist - Consultant IA générative
Missions Mise en place de plusieurs POCs au sein du groupe afin de diminuer les tâches
répétitives au sein des équipes métier et de favoriser l’acculturation à la data science
et à l’IA générative
• Déploiement et optimisation de plusieurs IA conversationnelles
• Appui technique pour les autres équipes sur tous les sujets d’IA, prompt
engineering, LLMs, modèles d’embeddings, méthodes de chunking, amélioration
de leurs systèmes...
• Formation des équipes en interne au NLP et à l’IA générative
• Aide à piloter les initiatives IA en cours au sein du groupe
Voici quelques projets déployés au cours d’une période de 6 mois :
• Développement d’une IA (POC) qui permet de générer des tests unitaires à partir
des fichiers de code C, avec des LLMs comme Claude 3.5
• Développement d’une IA (POC) qui permet de générer des tests Linux en langage
bash
• Développement d’une IA (POC) permettant d’extraire les exigences des clients au
sein de PDFs
• Développement d’IA conversationnelles spécialisées dans la documentation
technique des différentes équipes métier
• Développement d’une IA conversationnelle qui permet aux clients d’avoir un
service support de premier niveau (cela a permis de réduire le nombre de tickets
envoyés au support)
Technologies VectorDB (Pinecone, Qdrant), Embeddings (open-source), RAG, LlamaIndex,
Langchain, Claude, AWS/Azure, streamlit, prompt engineering, BM25
Telespazio – Thalès (Mai 2024 – Août 2024)
Rôle Lead Data Scientist
Missions Mise en place de plusieurs IA conversationnelles spécialisées dans les données
spatiales
• Benchmarking des modèles Open-Source
• Mise en place d’une architecture interne permettant de faire tourner des modèles
de langage pour garantir une confidentialité totale sur les données
• Déploiement de plusieurs modèles LLM
• Optimisation des IA conversationnelles
• Mise en place d’un pipeline d’évaluation et de tests de régression
• Mise en place d’un algorithme efficace pour l’intégration de fichiers PDF
complexes (tableaux, graphiques, photos...)
• Participation à la conception de l’interface utilisateur pour une expérience
adaptée
• Optimisation du RAG : optimisation de la récupération, optimisation des chunks,
intégration des métadonnées, réécriture des requêtes, etc
• Mise en production des différentes IA sur des Docker dans des serveurs internes
• Gestion d’une équipe de 3 personnes (data scientist, stagiaire, développeur web...)
Technologies VectorDB (Chroma), Embeddings (open-source), GraphRAG, LlamaIndex,
Langchain, Llama 3.1, Streamlit, prompt engineering, Neo4j
Continental (Mars 2024 – Mai 2024)
Rôle Consultant Data Scientist
Missions Développement d’un assistant conversationnel en IA générative basé sur le RAG pour
assister les techniciens dans l’identification et la résolution d’erreurs sur les lignes de
production (~2000 utilisateurs)
• Conception et optimisation du système de RAG (récupération des données,
chunking, métadonnées, réécriture de requêtes...)
• Intégration de documents industriels complexes (PDF techniques, schémas, logs
machines) via un pipeline d’ingestion robuste
• Évaluation continue des performances : mise en place de métriques internes, tests
de régression, scoring de pertinence, feedback utilisateur
• Déploiement de l’IA sur AWS (ECS, S3, Lambda) avec mise en production
sécurisée et scalable
• Mise en place d’un système de monitoring pour suivre les performances en temps
réel
• Optimisation des prompts et du comportement conversationnel pour une UX
adaptée aux techniciens sur le terrain
• Collaboration avec les équipes produit et terrain pour affiner les cas d’usage et
améliorer la pertinence des réponses
Technologies RAG, LlamaIndex, Langchain, VectorDB, Streamlit, prompt engineering, AWS
Bedrock, Langfuse
Nutripure (Janvier 2024 – Février 2024)
Rôle Data Scientist
Missions Déploiement d’une IA conversationnelle sur un site web e-commerce
• Benchmarking des IA génératives et réglages des paramètres d’inférence (choix du LLM,
température, tonalité…)
• Data ingestion de données non structurées : construction de la base de connaissances
vectorielle (vector DB) à partir du site web (scraping)
• Création de pipeline de structuration de la réponse via l’analyse sémantique de la question
de l’utilisateur puis génération de la réponse avec un LLM (architecture RAG)
• Optimisation du RAG : Retrieval optimisation, Chunk optimisation, Metadata integration,
Query rewriting, …
• Alimenter l’IA Générative avec l’historique de conversation (DynamoDB)
• Prompt engineering pour délimiter le discours de l’IA et éviter le débordement
• Création d’un widget à intégrer au site web
• Mise en production de la solution sur A WS
Technologies VectorDB (Pinecone), Embeddings, RAG, LlamaIndex, Langchain, Anthropic Claude, AWS,
Lambda, Bedrock, CloudFront, Streamlit, prompt engineering, Langfuse
Odécia (Octobtre 2023- Janvier 2024)
Rôle Data Scientist
Missions Projet Rédaction/RAG pour écrire automatiquement des réponses à appels d’offre publics
• Analyse des documents relatifs aux appels d’offre publics : cahier des charges, lots… au
moins une centaine de page pour chaque appel d’offre
• Analyse structurelle des relations entre les demandes et contraintes et les réponses déjà
faites, par marché
• Création d’une base de connaissances globale à partir des réponses déjà faites (data
ingestion de données non structurées)
• Création du pipeline de structuration de la réponse via l’analyse sémantique de l’appel
d’offre puis génération du texte des différentes parties avec un LLM et en s’appuyant sur la
base de connaissance (RAG)
• Finetuning de LLM sur un dataset d’instructions créé po...