Data Scientist freelance : nouveaux profils inscrits et nouvelles missions déposées

Déposez votre CV ou Déposez une mission gratuitement
Nos nouveaux

profils de data scientist

Nos dernières

missions de data scientist

Les profils

de data scientist

ont aussi postulé à

Le data scientist freelance

Le Data Scientist freelance est un responsable de la gestion et de l’analyse Big Data. Ce spécialiste des programmes informatiques, des statistiques et des chiffres traite les données d'une entreprise afin d'en extraire les informations pouvant l'aider dans sa prise de décisions. Il s’agit donc d’un poste à haute responsabilité, nécessitant une éducation de haut niveau et surtout des prédispositions naturelles. Découvrez dans cet article les compétences indispensables pour travailler en tant que freelance Data Scientist.

Maîtriser les bases de la Data science

En freelance, le Data Scientist doit maîtriser les fondamentaux de Data science. Plusieurs débutants font l’erreur d’appliquer des méthodes d'apprentissage automatique sans comprendre les bases de ces méthodes.

C'est une erreur. En tant que freelance Data Scientist, vous devez pouvoir différencier le deep learning et le machine learning. Vous devez également connaître les outils les plus utilisés. Finalement, le freelance Data Scientist sait différencier les problèmes de classification et de régression, et l’apprentissage non supervisé ou supervisé.

Connaître les langages informatiques

Le travail de Data Scientist en freelance requière la maîtrise un langage de programmation au minimum. Python est le langage informatique le plus couramment employé, il peut toutefois être remplacé par Java, R, Julia, C++ ou Pearl.

Python est généralement privilégié parce que c'est un langage généraliste avec plusieurs bibliothèques dédiées à la science des données. R est le langage dédié à la visualisation de données et à l’analyse statistique. Julia regroupe le meilleur des deux mondes et semble être plus rapide.

Pouvoir se servir du machine learning

L'apprentissage automatique est une compétence différenciant véritablement le Data analyst du Data Scientist. Les informaticiens l'utilisent pour créer les modèles prédictifs, qui se basent sur des données du passé afin de prédire les futures tendances.

Les divers algorithmes de machine learning permettent de résoudre plusieurs problèmes. En qualité de Data Scientist freelance, vous devez connaître le code de chacun de ces algorithmes, mais notamment la façon dont fonctionnent ces algorithmes.

Ainsi, vous pouvez opter pour le modèle correct en fonction des problèmes à aborder. Vous pouvez également configurer chaque hyper-paramètre et réduire les erreurs du modèle.

Analyser les données

Le Data Scientist freelance doit être à l’aise en manipulant et en analysant les données. Il doit pouvoir manipuler les données, les nettoyer et les mettre dans un format approprié à l’analyse. Le traitement de données est une étape importante pour simplifier une analyse de données et améliorer les résultats.

Quant à l’analyse de données, elle a pour objectif d’apprendre à base de données. À cet effet, le Data Scientist python utilise Pandas, SQL ou Excel. Il s'agit du travail d’un analyst Data Scientist. En utilisant l'apprentissage automatique, ce travail de Data Scientist freelance va plus loin.

Connaître les principales missions

Si un Data analyst indépendant a aussi pour mission l'exploitation et l’interprétation des données, un Data Scientist indépendant, a lui une vision plus globale. Le travail du Data Scientist freelance a un impact direct sur l’amélioration d'une activité globale d'une société.

Les missions du Data Scientist :

  • Définir les solutions de stockage des données
  • Identifier les outils d’analyse
  • Recueillir et analyser les données pertinentes
  • Elaborer des modèles de prédictions pour anticiper les évolutions des données
  • Construire les algorithmes pour améliorer les résultats de ciblage et de recherches
  • Créer des tableaux de bord adaptés pour rendre chaque résultat lisible et exploitable.

Exemple de missions d'Aziz, data scientist habitant Paris (75)

Expérience professionnelle

BPCE : Data Scientist
02/2019 – 03/2021
• Détection des IBANs à risque :
1. Enjeux : Plusieurs millions d’euros de préjudices dues à la fraude via l’ajout d’IBANs
frauduleux expliquées principalement par le phishing.
2. Objectifs : Développement d’une solution à l’aide du Machine Learning pour
identifier les IBANs à risque en utilisant les informations sur les clients, l’historique des
IBANs, les transactions bancaires et les données de connexions. Il est attendu par le
métier 1) une diminution du taux de faux positifs 2) une augmentation de la
couverture.
3. Approche adoptée : Une classification binaires a été utilisée. Le modèle de
Random Forest retenu comme optimal.
4. Résultat et apport du projet : La couverture est passée de 20 % à 32 % et le taux de
faux positifs de 40 % à 5 % seulement. Ce qui répond aux attentes du métier.
La solution déjà mise en place et reposant sur des règles informatiques classiques,
s’est dégradée avec le temps. Notre solution basée sur le data science et une
featurisation plus consistante avec une mise à jour des données et un contrôle des
scores de performances automatisé permet d’éviter une éventuelle dégradation de
détection.
5. Déploiement : La solution a été développée sous Python et mise à disposition du
client sous une API web développée avec le framwork FLASK. L’interface graphique
permet au client de consulter de façon intuitive les résultats de détection avec un
rafraîchissement quotidien des données.
6. L’équipe est constituée d’un consultant complétement autonome sur ce projet et
un chef de projet.
7. Technos utilisées : Python, Jupyter, Teradata, SQL, Dash/ Flask, Scikit-Learn, Pandas

Analyse des vidéos. Projet R&D confidentiel
1. Objectif : Le projet consiste à analyser le contenu visuel des vidéos et en extraire
l’information permettant l’identification de comportement anormal.
2. Tâches effectuées : Anonymisation automatique des visages dans la vidéo.
Détection des mouvements et des objets. Estimation de temps passé par une
personne devant une cible, Tracking, Etc. La confidentialité du projet nous impose à
ne pas donner plus de détail sur le projet.
3. Modèles et technologies utilisées :
- Les modèles de Deep Learning pré-entraînés ont été adoptés pour ce besoin.
A savoir : YoloV3 et MobilNet-SSD, ResSSD.
- OpenCV : La librairie de référence de Computer Vision sur Python.
- L’algorithme a été implémenté dans un environnement GPU.
4. L’équipe est constituée d’un consultant complétement autonome sur ce projet et
un chef de projet.
Robotisation de l’analyse des dossiers de crédit
1. Objectif du projet : Conception d’une solution d’automatisation de traitement des
dossiers de demande de prêts.
2. L’équipe : 2 consultants et un chef de projets
3. Mes tâches :
- Scraping automatisé des rapports financiers sur les sites des établissements
concernés.
- Extraction des données structurées via la technique de l’OCR.
4. Modèles et technologies utilisées : Python, Beautiful Soup, OCR, Tesseract, OpenCV.
• Analyse des Images Chèques (projet R&D):
1. Objectif : Développement d’un modèle exploitant l’analyse automatique des scans
des chèques destiné à lever, ou non, la réserve d’encaissement pour les remises de
chèques mises en réserve.
2. L’équipe est constituée de deux consultants et un chef de projet.
3. Mes tâches :
- Reconnaissance et extraction de l’écriture manuscrite sur les chèques.
- Constitution d’un dataset d’images de chiffres et de mots manuscrits
- Tests de similitudes avec des images targets
4. Modèles et technologies utilisées : Python, Azure, OCR, Deeplearning,
Autoencoders, OpenCV, Tensorflow, Keras.

Air Liquide : Data Scientist
09/2018 – 12/2018
Projet : Analyse de données de large industrie
Interlocuteurs : experts métier
Equipe : 5 Personnes
Equipe Projet : 2 Chef de projet – 2 Data Scientist Sénior / 1 Data Scientist Junior
Tâches effectuées :
- Recueillir le besoin du client et élaboration des use case
- Data quality & Data management
- Conception des modèles de Machine Learning pour prédire le comportement de
certains Indicateurs (ex : Coût de maintenance d’un site)
- Segmentations des sites de fabrication pour comparer leurs indicateurs
- Création de Dashboard Power BI & présentation
Environnement technique Python, Jupyter, Pandas, Scikit-Learn, Git, Linux
Modèles mathématiques K-means, Knn

Sonepar : Data Scientist
01/2018 – 07/2018
Projet : Analyse de l’Attrition Client
Interlocuteurs : Experts métiers
Equipe Projet : 1 Chef de projet / 2 Data Scientist
Tâches effectuées :
- Définir les notions de Client et d’attrition Client
- Data exploration et Data préparation
- Création de features pour caractériser le churn et modélisation
- Organisation d’ateliers avec les experts métier
- Industrialiser le process d’identification et de traitement de l’attrition Client
Environnement technique Python, Pandas, Scikit-Learn, Linux, Knime...

Voir le profil complet de ce freelance
Freelances similaires parfois recherchés

Data scientist Dataiku freelance