Notre base de 143987 CV vous permet de trouver rapidement un Data scientist Toulouse freelance. Recevez gratuitement et sous 24h maximum les CV des meileurs intervenants disponibles.
Top projets Kaggle réalisés:
Nom de la compétition Objectif Classement
ASHRAE - Great Energy
Predictor III
Prédire la consommation
énergétique pour les gratte ciel
Top 5%, médial argent
Mercedes-Benz Greener
Manufacturing
Identifier la déformation des
pièces auto et réduire le temps
passé dans la phase test
Top 8%, médial bronze
Tweet Sentiment Extraction Extraire le texte responsible de
sentiments dans un tweet
Top 12%
Réalisation(s):
Lead Data scientist sur la chaine full-stack-data (data ingestion, data engineering, dataOps, data science, dataViz): - Construction de l’architecturé data ingestion - Mise en place d’une conception/templette data engineering/dataOps - Mise en place des pipelines CI/CD - Réalisation/gouvernance des modèles data science - Suivi de développement/Mise en production des modèles machine learning - Conseille sur les outils data Viz
Projets réalisés;
On promise: Cluster-Cloudera(10 nœuds: 5T de RAM, 320 CPU et 320T disque)
Détection des fraudes pour la direction IARD-COVEA
Construction la plateforme DMP( data management plateforme) des flux web pour la direction marketing Covea
Reconnaissance de texte OCR-text pour la direction IARD-COVEA
Sur le Cloud: Azure-Databricks
Analyse de Verbatim Social-Media( NLP)
Analyse de commentaires clients( NLP)
Reconnaissance de texte sur des données OCR a l’echelle
Gouvernance des modèles machine learning via MLOps/Mlflow databricks
Offre de service data science COVEA - Referent data sur les services managers Big Data/ Data science/IA - Réfèrent data sur le projet: Architecture/Migration/Mise a disposition d’une plateforme could(Azure/databricks) - Data architect sur les outils Big data/Data science du groupe Covea - Administrateur plateforme datalab/Cloud
Réalisation(s) :
Utilisation de la plateforme Dataiku pour:
- Data préparation: environ 1,5To des données CRM
- Prédiction des profiles docteurs clients a 80% sur le marché
pharmaceutique brésilien en utilisant le Random Forest
Réalisation(s) : - analyse statistique segmentée appliquée sur 120Go des
données (achats / pertes) - Mise a disposition d’une platforme big daata: un cluster avec
4 nœuds et 2 Vms outils ( Python et R) - Data ingestion: process oneshoot pour les fichiers
génératrices des tables R - Data préparation sur des tables R ( par mois, années,
produits) - Mise a disposition des tables agrégées par moi, année et
produits - Construire un modèle statistique qui les pertes déclarées
auprès des impôts
Réalisation(s) : - Créer une architecture distribuée BigData intégrant
l’écosystème Spark. - Créer une Base de données Cassandra (NoSQL orientée
colonnes). - Scraper les données via Python (scrapy & beautifulsoup) et
R. - Etudier et modéliser les données par des Méthodes de
Machine Learning via SparkMLlib - Analyser la segmentation du trafic aérien en utilisant Kmeans et la mixture gaussienne. - Réaliser le reporting et la data Visualisation de données de
trafic