Missions Data Scientist : Découvrez les offres de mission publiées

Je dépose une mission gratuitement
Je dépose mon CV
Vous êtes freelance ?
Sécurisez votre activité grâce au portage salarial !

Exemple de missions d'Anas,
Data Scientist habitant la Haute-Garonne (31)

Expérience professionnelle

ModelRH (Novembre 2025 – En cours)
Rôle Data Scientist
Missions Mission courte de R&D et développement de solutions IA
• Accompagnement dans l’audit IA de l’entreprise
• Développement de POC R&D autour du métier d’analyste
• Mise en production d’une solution IA générative pour faciliter le travail de
rédaction
• Optimisation de la solution avec du contexte engineering et des techniques
avancés comme Human in the loop
Technologies Gemini, Qdrant, Structured outputs, Langfuse, Context engineering, LangGraph

Predexia (Juillet 2025 – Novembre 2025)
Rôle Data Scientist
Missions Aide technique au développement & amélioration d’une plateforme d’assistants IA
(Agents IA et RAG) - *******
• Développement d’un module de RAG généraliste.
• Mise en place de l’hybride search avec Qdrant.
• Amélioration du chunking sur des cas clients (documents PDFs, PowerPoint,
Word).
• Intégration du RAG dans un système d’agents avec Pydantic AI.
• Développement d’un agent IA de compte rendu de réunions
• Amélioration du Tool Calling en évaluant les meilleurs modèles et avec la
littérature (Berkeley function calling)
• Mise en place de monitoring avec Logfire
Technologies AWS, Bedrock, Langchain, Pydantic AI, Context Engineering, Structured output,
Hybrid search, Qdrant, Claude Sonnet, Logfire, Javascript

Reezet (Juin 2025 – Juillet 2025)
Rôle Lead Data Scientist – AI Engineer
Missions Développement d’une IA conversationnelle thérapeute : Contexte Engineering, RAG
et Structured Outputs (Application mobile MVP)
• Développement de la partie backend de l’IA pour l’application Reezet
(*******)
• Mise en place d’une base de données vectorielle avec du contenu thérapeutique
sélectionné par les experts métiers.
• Mise en place d’un RAG pour améliorer la réponse de l’IA pour que ça corresponde
à la vision Reezet.
• Analyse de la conversation et génération des critères d’évaluation, en utilisant les
mêmes principes du « LLM as a judge » et les structured outputs.
• Mise en place d’une mémoire long terme pour se souvenir des évènements de
l’utilisateur.
• Evaluation continue tout au long avec les équipes métiers.
• Mise en place de monitoring avec Langfuse
Technologies AWS, Azure foundry, FastAPI, Context Engineering, Qdrant, Structured Outputs,
OpenAI

Parti Politique Andorre (Mai 2025 – Juin 2025)
Rôle Lead Data Scientist
Missions Développement d’un RAG pour la ville d’Andorre
• Développement d’un Chatbot RAG pour renseigner les habitants d’Andorre sur les
projets de loi.
• Mise en place d’une base de données vectorielle Qdrant avec les documents de loi
de la ville d’Andorre.
• Développement d’un module de mise à jour automatique de la base vectorielle
pour rester à jour.
• Amélioration du chunking pour l’adapter aux documents de loi.
• Mise en place de détection de requêtes malveillantes pour assurer l’intégrité de
l’IA.
• Mise en place de monitoring avec Langfuse
Technologies AWS Bedrock, Langchain, Context Engineering, Hybrid search, BM25, Qdrant,
Structured Outputs, Metadata filtering

Telespazio – Thalès (Janvier 2025 – Mai 2025)
Rôle Lead Data Scientist
Missions Développement & Amélioration RAG (reprise de la mission 2024)
• Analyse détaillée des besoins et objectifs
• Reprise du produit réalisé en 2024 et amélioration vers de l’Agentic RAG.
• Mise en place de plusieurs Agents pour étendre la capacité du RAG (Agent pour
résumer, filtrer, ReAct…)
• Déploiement de la solution sur un cloud français (OVH)
• Mise en place du monitoring de la solution (retrieve + génération) avec Langfuse &
LLM as a Judge
• Amélioration de la phase de chunking avec des modèles de langages visuels
• Amélioration continue du RAG notamment de la phase du retrieve avec des
techniques comme de l’hybrid search (BM25 + semantic search), Query rewriting,
et du Reranking avec des modèles open-source
• Acculturation des équipes pour comprendre le RAG et les limites
Technologies Snowflake Embeddings (open-source), BM25, VLLM, Ollama, LlamaIndex,
Langchain, Qwen 2.5 14B, prompt engineering, Langfuse, Outlines (Structured O)

Actia automotive (Aout 2024 – Janvier 2025)
Rôle Data Scientist - Consultant IA générative
Missions Mise en place de plusieurs POCs au sein du groupe afin de diminuer les tâches
répétitives au sein des équipes métier et de favoriser l’acculturation à la data science
et à l’IA générative
• Déploiement et optimisation de plusieurs IA conversationnelles
• Appui technique pour les autres équipes sur tous les sujets d’IA, prompt
engineering, LLMs, modèles d’embeddings, méthodes de chunking, amélioration
de leurs systèmes...
• Formation des équipes en interne au NLP et à l’IA générative
• Aide à piloter les initiatives IA en cours au sein du groupe
Voici quelques projets déployés au cours d’une période de 6 mois :
• Développement d’une IA (POC) qui permet de générer des tests unitaires à partir
des fichiers de code C, avec des LLMs comme Claude 3.5
• Développement d’une IA (POC) qui permet de générer des tests Linux en langage
bash
• Développement d’une IA (POC) permettant d’extraire les exigences des clients au
sein de PDFs
• Développement d’IA conversationnelles spécialisées dans la documentation
technique des différentes équipes métier
• Développement d’une IA conversationnelle qui permet aux clients d’avoir un
service support de premier niveau (cela a permis de réduire le nombre de tickets
envoyés au support)
Technologies VectorDB (Pinecone, Qdrant), Embeddings (open-source), RAG, LlamaIndex,
Langchain, Claude, AWS/Azure, streamlit, prompt engineering, BM25

Telespazio – Thalès (Mai 2024 – Août 2024)
Rôle Lead Data Scientist
Missions Mise en place de plusieurs IA conversationnelles spécialisées dans les données
spatiales
• Benchmarking des modèles Open-Source
• Mise en place d’une architecture interne permettant de faire tourner des modèles
de langage pour garantir une confidentialité totale sur les données
• Déploiement de plusieurs modèles LLM
• Optimisation des IA conversationnelles
• Mise en place d’un pipeline d’évaluation et de tests de régression
• Mise en place d’un algorithme efficace pour l’intégration de fichiers PDF
complexes (tableaux, graphiques, photos...)
• Participation à la conception de l’interface utilisateur pour une expérience
adaptée
• Optimisation du RAG : optimisation de la récupération, optimisation des chunks,
intégration des métadonnées, réécriture des requêtes, etc
• Mise en production des différentes IA sur des Docker dans des serveurs internes
• Gestion d’une équipe de 3 personnes (data scientist, stagiaire, développeur web...)
Technologies VectorDB (Chroma), Embeddings (open-source), GraphRAG, LlamaIndex,
Langchain, Llama 3.1, Streamlit, prompt engineering, Neo4j

Continental (Mars 2024 – Mai 2024)
Rôle Consultant Data Scientist
Missions Développement d’un assistant conversationnel en IA générative basé sur le RAG pour
assister les techniciens dans l’identification et la résolution d’erreurs sur les lignes de
production (~2000 utilisateurs)
• Conception et optimisation du système de RAG (récupération des données,
chunking, métadonnées, réécriture de requêtes...)
• Intégration de documents industriels complexes (PDF techniques, schémas, logs
machines) via un pipeline d’ingestion robuste
• Évaluation continue des performances : mise en place de métriques internes, tests
de régression, scoring de pertinence, feedback utilisateur
• Déploiement de l’IA sur AWS (ECS, S3, Lambda) avec mise en production
sécurisée et scalable
• Mise en place d’un système de monitoring pour suivre les performances en temps
réel
• Optimisation des prompts et du comportement conversationnel pour une UX
adaptée aux techniciens sur le terrain
• Collaboration avec les équipes produit et terrain pour affiner les cas d’usage et
améliorer la pertinence des réponses
Technologies RAG, LlamaIndex, Langchain, VectorDB, Streamlit, prompt engineering, AWS
Bedrock, Langfuse

Nutripure (Janvier 2024 – Février 2024)
Rôle Data Scientist
Missions Déploiement d’une IA conversationnelle sur un site web e-commerce
• Benchmarking des IA génératives et réglages des paramètres d’inférence (choix du LLM,
température, tonalité…)
• Data ingestion de données non structurées : construction de la base de connaissances
vectorielle (vector DB) à partir du site web (scraping)
• Création de pipeline de structuration de la réponse via l’analyse sémantique de la question
de l’utilisateur puis génération de la réponse avec un LLM (architecture RAG)
• Optimisation du RAG : Retrieval optimisation, Chunk optimisation, Metadata integration,
Query rewriting, …
• Alimenter l’IA Générative avec l’historique de conversation (DynamoDB)
• Prompt engineering pour délimiter le discours de l’IA et éviter le débordement
• Création d’un widget à intégrer au site web
• Mise en production de la solution sur A WS
Technologies VectorDB (Pinecone), Embeddings, RAG, LlamaIndex, Langchain, Anthropic Claude, AWS,
Lambda, Bedrock, CloudFront, Streamlit, prompt engineering, Langfuse

Odécia (Octobtre 2023- Janvier 2024)
Rôle Data Scientist
Missions Projet Rédaction/RAG pour écrire automatiquement des réponses à appels d’offre publics
• Analyse des documents relatifs aux appels d’offre publics : cahier des charges, lots… au
moins une centaine de page pour chaque appel d’offre
• Analyse structurelle des relations entre les demandes et contraintes et les réponses déjà
faites, par marché
• Création d’une base de connaissances globale à partir des réponses déjà faites (data
ingestion de données non structurées)
• Création du pipeline de structuration de la réponse via l’analyse sémantique de l’appel
d’offre puis génération du texte des différentes parties avec un LLM et en s’appuyant sur la
base de connaissance (RAG)
• Finetuning de LLM sur un dataset d’instructions créé po...

Voir le profil complet de ce freelance

Missions similaires parfois recherchées

Missions Data scientist Dataiku

Nos dernières missions de Data Scientist à pourvoir

Expert en IA & Data Science

Python Cloud AWS RGPD PySpark TensorFlow
01/06/2026
75 - PARIS
3 mois
Voir la mission

Data Engineer Innovation AWS/Python

Data Python Amazon AWS
ASAP
92 - NEUILLY-SUR-SEINE
35 mois
Voir la mission

Consultant Junior/confirmé DataScience DataEng.

SQL Python Apache Spark Microsoft Power BI Google Cloud Platform
ASAP
75 - PARIS
6 mois
Voir la mission

Data Analyst

SQL Python Dataviz PySpark Power BI
ASAP
33 - BORDEAUX
12 mois
Voir la mission

GenAI Agent Developer

Python LLM
ASAP
78 - VÉLIZY-VILLACOUBLAY
12 mois
Voir la mission

🚀 Consultant Data Scientist / Machine Learning – Environnement GCP & MLOps

Big Data BigQuery Microsoft Azure Machine Learning DataRobot MLOps
ASAP
75 - PARIS
86 mois
Voir la mission

Data Analyst / Data Scientist Confirmé SIRH (WORKDAY) – Mission Long Terme – 450 €/jour

Microsoft Power BI Workday Gestion SIRH
ASAP
92 - MONTROUGE
86 mois
Voir la mission

Chef de projet DATA

Agile ODI Jira Dataiku Power BI
ASAP
79 - NIORT
3 mois
Voir la mission

Data Engineer IA GEN

IA Générative
ASAP
75 - Paris 13ème
6 mois
Voir la mission

Data Scientist / Data Analyst IA

Google Cloud Platform SQL Python
ASAP
94 - Charenton le Pont
3 mois
Voir la mission
Je trouve ma mission

Les profils de Data Scientist ont aussi candidaté à :

LLM Engineer / AI Engineer – IA Générative & Agents

Python Azure Cloud AWS Google Cloud Platform LLM
ASAP
75 - PARIS
6 mois
Voir la mission

Data Analyst

SQL Teradata Python PySpark Dataiku
ASAP
92 - BOULOGNE-BILLANCOURT
12 mois
Voir la mission

Data Analyst Tableau / Power BI

Tableau Power BI
ASAP
92 - LA GARENNE-COLOMBES
9 mois
Voir la mission

Test Lead DATA

Data
ASAP
93 - SAINT-DENIS
12 mois
Voir la mission

Architecte Data

SQL DataStage Teradata Python Power BI
ASAP
69 - LYON
12 mois
Voir la mission

Data analyst Tableau Software - Secteur automobile

Microsoft Power BI Power BI Gestion multi-projets
ASAP
75 - PARIS
12 mois
Voir la mission

MLOps Engineer Senior

Python HashiCorp Terraform Kubernetes MLflow Kubeflow
ASAP
91 - MASSY
13 mois
Voir la mission

Sr. Data Platform Engineer

SQL Python Google Cloud Platform BigQuery Airflow
ASAP
75 - PARIS
12 mois
Voir la mission

Ingénierie Méthodes & Data Analyst (Production Data & Master Data)

Gestion multi-projets
ASAP
75 - PARIS
6 mois
Voir la mission

Senior AI Systems Engineer

Python
ASAP
75 - PARIS
4 mois
Voir la mission
Je trouve ma mission