Albert Thibaut - Data Analyst Data Scientist SAS
Ref : 200303K001-
76100 ROUEN
-
Data Analyst, Data Scientist (32 ans)
-
Télétravail uniquement
-
Bientôt freelance
EXPERIENCES PROFESSIONNELLES
Data scientiste chez IRI - Paris
Septembre 2020 – Septembre 2021
• Réalisation des requêtes et exploitation des données
❖ Extraction des données à partir de requêtes SQL
❖ Transformation des tables de données
❖ Création de nouvelles variables
❖ Calcul des KPI sous SAS
❖ Exportation des données sous Excel
❖ Réalisation de visualisations
• Analyse des programmes d’estimation de données en SAS et Shell
❖ Optimisation des programmes SAS et Shell
❖ Test des programmes et des axes d’amélioration
❖ Standardisation du code
✓ Suppression des étapes manuelles
✓ Paramétrage et lancement par un serveur
• Automatisation de tâches
❖ Création d’un programme R qui récupère des données et effectue
des analyses et retourne une table de données en sortie
✓ Tableaux croisés de comptages
✓ Création de variables
✓ Regroupement et calcul de KPIs
❖ Création d’un macro-programme SAS qui permet d’automatiser
l’importation de plusieurs tables de données
❖ Réalisation des analyses statistiques et graphiques
• Proposition des solutions de vérification de la disponibilité et de la cohérence
des données
❖ Mise au point d’un programme Python qui vérifie la disponibilité des
données sur le serveur et effectue des analyses et calculs pour
s’assurer de la cohérence des données
Projets Universitaires
• Web scraping with python and political sentiment analysis on Tweets
❖ Application d’algorithmes aux tweets pour les classer en positifs,
négatifs ou neutres
• Application des différentes méthodes de scoring sur des variables issues de
bases de données recueillis sur internet
• Réalisation de tableaux de bords/pipelines de machine Learning/scoring avec
SAS VIYA
NOVEMBRE 2018 – AUJOURD’HUI
TRIMANE
CONSULTANT SAS ET DATA SCIENTIST
TRIMANE
Consultant Data Scientist
Mise en place d’un algorithme de Machine Learning avec Python
Compréhension du besoin
Analyse de l’existant
Spécifications fonctionnelles et techniques
Automatisation de l’extraction de jeux de données à partir d’une base de données MySQL avec Python
Analyse des données
Nettoyage et transformation des données avec Python
Visualisation des données avec MatplotLib et Seaborn de Python
Mise en place d’un modèle de régression (Random Forest) avec Python
Déploiement du résultat via un web service (API)
Rédaction de la documentation
Mise en place d’un algorithme de détection du paradoxe de Simpson avec Python
Compréhension du besoin
Analyse de l’existant
Automatisation de l’extraction de jeux de données à partir d’une base de données MySQL avec Python
Analyse des données
Nettoyage et transformation des données avec Python
Mise en place d’un algorithme avec Python
Tests unitaires et vérification des résultats obtenus
Déploiement du résultat via un web service (API)
Rédaction de la documentation
DATANEO
Développeur SAS
DataNeo est une entreprise française spécialisée dans la valorisation de données marketing stratégiques, traitant les données liées aux véhicules et leurs possesseurs à destination du secteur automotive mais aussi de la banque, l'assurance ... A partir des données du Système d’Immatriculation des Véhicules (SIV), Datanéo crée des outils marketing stratégiques au service des enjeux de fidélisation et de conquête de leurs clients.
Projet : Migration de campagnes Marketing de Batch vers SAS
Codage des étapes de réalisations des campagnes avec SAS :
Comprendre les différentes sources de données, opérations réalisées et livrables attendus
Coder sur SAS en les automatisant le plus possible (écriture de macros pour importation, envoi des mails, exportations des fichiers…)
Amélioration du process existant (ajout de contrôles supplémentaires, ajout de certaines opérations…)
Réalisation des livrables attendus et de la documentation :
Documenter chaque programme sas développé
Rédiger Process opérationnel & Documents explicatifs des programmes sas
Lancement et production de campagne pour les clients Datanéo
Rédaction d’une documentation sur les points de vigilance et améliorations des différentes campagnes.
Environnement technique : SAS Enterprise Guide, Excel, SQL
Durée : 4 mois
WFS (WORLDWIDE FLIGHT SERVICES)
Consultant Tableau Desktop
Réalisation de reporting pour WFS (Worldwide Flight Services)
Calcul des KPI sur Tableau Desktop :
Comprendre les sources de données et les champs
Data blending des données
Calculer les KPI
Mise en place de tableaux de bord sur Tableau Desktop :
Réalisation de tableaux de bord pour chaque KPI
Présentation des rapports
Environnement technique : Tableau Desktop
Durée : 1 mois
Réalisation de tests sur la migration des données
Contrôle de la cohérence des données migrées (Pré & Post traitement)
Environnement technique : Snowflake, Microsoft SQL Server Management Studio
Durée : environ 1 mois
TRIMANE
Consultant Data Scientist
Projet 1 : Amélioration de l’outil de reporting TOA (Trimane Open Analytics) développé en interne
Réflexion sur l’amélioration de la partie tableau de bord :
Comprendre les besoins en graphiques des utilisateurs
Rechercher des paramètres intervenant dans le choix des graphiques
Rédiger un rapport sur le projet
Mise en place d’un algorithme de Machine Learning de choix des graphiques
Rechercher le meilleur modèle : tests des modèles, comparaison des avantages et limites
Construire un API python pour stocker le modèle
Faire le lien avec TOA
Environnement technique : Python, Trimane Open Analytics (TOA), Machine Learning (réseaux de neurones, KNN, Naive Bayes, …)
Projet 2 : La Météo du Droit - Extraction d’informations sur les parties d’une affaire juridique à partir de données textuelles
Analyse des fichiers juridiques XML
Mise en place d’un algorithme d’extraction des données (NLP, Spacy, StanfordNLP…)
Environnement technique : Python, Spacy, StanfordNER
Environnement fonctionnel : Machine Learning (NLP, Word Embedding, …)
Projet 3 : Météo du Droit : Chaînage des décisions juridiques
Modèle de Classification :
Text mining des données textuelles : TF-IDF, …
Classification des décisions suivant le type d’affaire
Regroupement des décisions par affaire :
Nettoyage des données textuelles
Clustering sur les textes de décision
Environnement technique : Python, Text mining, NLP (Natural Langage Processing)
Projet 4 : Veille technologique sur SAS Visual Analytics
Création de Dashboard :
Représentation de données géographiques
Création de hiérarchie
Regroupement en classe, …
Manipulation des données :
Suppression, ajout, modification de variables
Recodage des valeurs de certaines variables, …
Réalisation de modèles :
Régression logistique
Arbres de décision, …
Environnement technique : SAS Visual Analytics
SEPTEMBRE 2017 – SEPTEMBRE 2018
MINISTÈRE DE L’ENSEIGNEMENT SUPERIEUR- DEPARTEMENT DE STATISTIQUES
Chargé d’études Statistiques en alternance
Projet 1 : Gestion et amélioration de la Base Centrale de Pilotage (BCP)
Participation à l’alimentation de l’entrepôt de données :
Collecter les données auprès des différents services et des utilisateurs
Traiter les données (avec SAS) : nettoyage, traitement des erreurs de saisie, valeurs manquantes, etc.
Vérifier la qualité des données reçues et des données mises à disposition des utilisateurs (avec SAS, SAP BO)
Rédiger le cahier des charges
Participer au chargement des données sur la plateforme avec le service informatique
Amélioration de la qualité de la base :
Collecte et analyse des besoins des utilisateurs
Compréhension des outils utilisés par le service informatique
Etudes sur la qualité des données disponibles
Application de corrections sur la base
Proposition d’améliorations
Rédaction de compte-rendu
Extraction de données sur demande :
Comprendre les besoins des utilisations
Reporting avec SAP BO
Livrer les données aux utilisateurs
Projet 2 : Projet d’alimentation de la plateforme ScanR
Récupération des données sur les différents sites web concernés,
Créer un programme scraper automatique. Outil utilisé : Python
Préparer les données et les exporter
Visualiser les données récoltées avec Tableau Software
Manipuler les données : importation, fusion et création de mesures
Visualiser : graphiques, représentation géographique,
Publier la data visualisation.
Environnement technique : Sas/Base, Sas/Macro, Tableau software, SQL, SAP/BO, Oracle/Postgresql
Durée : 12 mois
AVRIL 2015 – OCTOBRE 2015
PROGRAMME ACEFA – YAOUNDÉ (CAMEROUN)
Stage Chargé d'études économiques
Evaluation du programme ACEFA
Conception de questionnaires
Enquêtes auprès des différents acteurs
Analyse des données récoltées
Présentation des résultats aux responsables du programme et représentants du ministre.
Recommandations pour l’amélioration du programme.
Environnement technique : Excel
Durée : 5,5 mois
DECEMBRE 2013 – MAI 2014
CCLS IOAIC - TIARET (ALGÉRIE)
Stage Chargé d'études économiques
Etude économique des activités de stockage des céréales
Analyse des coûts de stockage,
Répartition des charges par atelier.
Environnement fonctionnel : Analyse de filières, Comptabilité analytique
Durée : 6 mois
PROJETS SCOLAIRES
2017 - 2018
Représentation des données avec SAS Visual Analytics & Scoring avec SAS Viya
SAS VA : Application sur des données (Cas Insight Toy Demo : 3,5 millions de lignes et 57 colonnes).
Scoring avec SAS Viya
2016 - 2017
Modélisation de la volatilité des prix de quelques actifs du CAC40 et prévision avec R
Modèle MEDAF : application et limites
Modélisation avec ARIMA
Prévision des prix d’actifs
Mémoire : Ecarts de patrimoine financier entre les hommes et les femmes avec SAS
Statistiques descriptives
Tests statistiques : Test de la moyenne, d’indépendance, …
Modèle économétrique : Modèle en 2 étapes de Heckmann
Analyse de la discrimination (Méthode d’Oaxaca Blinder)
ETUDES
Master 2 MASERATI (Méthodes Appliquées de la Statistique et de
l’Econométrie pour l’Analyse et le traitement de l’Information),
Université Paris-Est Créteil, 2020- 2021, Parcours Data Science,
Mention Bien
Matières: Data Mining, Programmation SAS, Python, R, Web scraping,
Machine Learning avec python, Création, déploiement et analyse de sites web,
Data Visualisation (Spotfire, Power BI), Gestion et requêtage avec SQL, Scoring
Master 1 MASERATI, UPEC, 2019-2020 – Mention Bien
Matières : Econométrie, Séries temporelles, Introduction à Python, SAS, VBA
Licence Economie, UNIVERSITE PARIS1 PANTHEON-SORBONNE, 2018 -
2019, Mention Bien
Matières : Commerce International, Banque et marchés, Statistiques,
Econométrie.
2017/2018 : Master 2 MASERATI Parcours Data Science, Université de Créteil
2016/2017 : Master1 Economie appliquée parcours économétrie, Université de Créteil
2015/2016 : Université de Montpellier 1, DU connaissances fondamentales en informatique et logiciels libres (CFI2L)
2014/2015 : Montpellier SUP AGRO, Master 2 Agriculture, alimentation et développement durable, Montpellier
2009/2014 : Ingénieur agronome, Université de Tiaret (ALGERIE), spécialité gestion des entreprises - Marketing. Comptabilité. Analyse financière
DOMAINE DE COMPÉTENCES
LANGAGES SQL, R, Python, VBA, HTML, Java (débutant)
SYSTÈMES Windows, Unix
BASES DE DONNÉES Mysql, Oracle, PostgreSQL
SAS SAS Base (certifié), MACRO, GRAPH, SAS Enterprise, SAS Visual Analytics
OUTILS LOGICIELS Google Analytics, STATA
REPORTING/DATAVIZ SAP BO, Tableau software, Spotfire
AUTRES COMPETENCES Machine Learning, Scoring, Web scraping, Web Analytics
Certifications
• Certification SAS BASE
• Certification SAS AVANCE
LANGUES
Anglais Notions (Lu et Ecrit)