Habibe - Data Analyst
Ref : 200519R002-
92200 NEUILLY-SUR-SEINE
-
Data Analyst, Data Scientist, Product Owner (28 ans)
-
Totalement mobile
-
En profession libérale
-
Data Analyst
Malakoff HumanisJan 2020 - Jan 2020• Industrialisation et maintenance du pipeline d’anonymisation sur le cloud
AWS et garant de la conformité RGPD. Orchestration des services AWS via la
librairie boto3 de Python : stockage des data sets sur S3, stockage des
paramétrages d’anonymisation sur DynamoDB , gestion des jobs Glue
d’anonymisation. Construction d’une interface d’aide à la détection des
Données à Caractère Personnel sur Excel
• Définition et mise en oeuvre de la data prep pour des use cases de Data
Science sur Dataiku, notamment sur des sujets de speech analytics et de churn -
Data scientist / Data Analyst
Freelance Olympique de Marseille :Jan 2020 - Jan 2020• Data analysis : Exploitation de Google Analytics pour la segmentation des
visiteurs du site web en vue de mieux les adresser
• Data Visualisation : Développement de dashboards Power BI d’aide à la
décision pour l’analyse des ventes de billets, abonnements et autres produits
• Base de données : Structuration et nettoyage des bases de données
• Initialisation du nouvel outil CRM (Dynamics)
• Référent technique Machine Learning -
Consultant Data & Analytics
EY La Défense, FranceJan 2019 - Jan 2019• FdJ : Analyse de comportement des parieurs par clustering pour un jeu donné.
Utilisation de plusieurs algorithmes d’agglomerative clustering pour la
segmentation des patterns de jeu, notamment l’agglomerative clustering.
Interprétation résultats et calibrage par dendogramme.
• Formation de collaborateurs au requêtage de bases graphes, conception d’un
démonstrateur Neo4j sur des données financières (détection de fraude) et
business (YELP dataset). Étude et application d’algorithmes de théorie des
graphes : centralité (PageRank), détection de communauté (Fast unfolding of
communities in large networks ), plus court chemin (Djikstra)..
• GGVIE : Conception de Dashboards Power BI alimentés par des bases de
données SQL Server, management des bases de données par scripts python
• EY Société d’Avocats : Développement d’une webapp Flask d’aide à la
décision pour la simulation et la comparaison de plans d’épargne retraite dans
le cadre de la loi PACTE. Cette webapp permettait le recueil des informations
du client, la simulation des plans d’épargne via un classeur excel et la
récupération des résultats pour une présentation optimale. -
Projet de recherche appliquée – implémentation d’AlphaGoZero Centrale Marseille2018 - aujourd'hui
• Compréhension de l’article de recherche "Mastering the game of Go without
human knowledge", création de contenu pédagogique sur les concepts clé des
réseaux de neurones convolutionnels, d’apprentissage par renforcement, de
l’algorithme AlphagoZero, et de la Monte Carlo Tree Search.
• Gestion de l’avancement du projet en mode agile et coordination des
développeurs -
Research assistant
HSE - UKM Malaisie, Russie2017 - 2018• Moscou : Etude du phénomène de concentration de la mesure et des
inégalités de concentration type Poincaré et log-Sobolev
Kuala Lumpur : Clustering sur les différents patterns de concentrations en
espèces chimiques nocives dans des rivières avoisinant Kuala Lumpur. Le but :
identifier les principaux acteurs de la pollution fluviale. Etude bibliographique
sur les méthodes existantes
-
Centrale Marseille – Machine learning
2015
Régression Logistique Forêts aléatoires
• Gestion de projet en méthode agile
• M2 Recherche Probabilités et Statistiques
Modèles markoviens / Temps de mélange Calcul d’Itô
Metropolis-Hastings Ondelettes Théorie minimax
Statistiques bayésiennes