Moufida - Data Scientist PYTHON
Ref : 191030A004-
95100 ARGENTEUIL
-
Data Scientist (38 ans)
-
Totalement mobile
-
Freelance
EXPÉRIENCES
Data Scientist / Machine learning en BIG DATA
TRADELAB - Depuis juin 2016 - CDI - PARIS
Objectif : Optimisation des campagnes publicitaires dans le domaine du RTB ( Real Time
Bidding) via le traitement de larges volumes de données.
Responsable de la conception, de la mise en production et du suivi des solutions
analytiques et prédictives.
Réaliser des études et analyses clients (analyse du comportement d'achat, Retargeting
des clients, prols clients, parcours clients, associations, …) dans un environnement Big
Data.
Travailler en partenariat avec les experts métier pour comprendre les problématiques
opérationnelles et les traduire en problématiques mathématiques.
Participer à la dénition des nouvelles fonctionnalités analytiques an d’augmenter la
valorisation des données disponibles dans une comité scientique dédiée animée par
l'équipe R&D.
Assistance technique et encadrement des stagiaires dans l’utilisation des modèles de
Machine Learning
Proposer et développer des solutions statistiques prédictives et prescriptives en mettant
en œuvre des techniques analytiques traditionnelles (scoring, segmentation…) ou
innovantes (machine learning)
Mettre en place une solution de Prospection des clients basée en Machine Learning:
Enchérir uniquement si la demande d’enchère va générer une conversion d’achat pour un
nouveau client ( une probabilité déduite)
Mettre en place une solution de "Retargeting" des clients basée en Machine Learning: :
Prédire les intentions d'achat des clients ayant déjà visité le site pour augmenter la
probabilité de conversions
Modélisation des modèles prédictifs basés sur Machine Learning dans le contexte Big
Data ( Spark.ML, Spark.MLLIB /python )
Présentation les solutions algorithmiques dans les événements organisés par Tradelab (
Tradelab ouvre le capot) à ses diérents clients du diérents secteurs ( automobile,
Télécom,…)
Outils : Mllib, ML de Spark ( Regression Logistique, arbre de decision, Random Forest,
PCA,..), PySpark , scikit learn (DBScan, Kmeans,..), Feature Engineering and Feature
Selection, google cloud Plateform, plateforme Appnexus.
Ingénieur R&D BIG DATA chez Viseo Group (thèse CIFRE)
VISEO Group - Septembre 2013 à avril 2016 - CDD - PARIS
Concevoir de nouvelles approches pour les algorithmes classiques du Machine Learning,
scalables sur des clusters Hadoop.
Maîtrise des enjeux du BigData avec les méthodes Machine Learning (régression linéaire,
réseaux neurones, méthodes d’ensemble « Bagging », « boosting »…).
Conception des modèles prédictifs de régression scalables sur des environnements
distribués (Cloud Amazon)
Evaluation des modèles prédictifs.
Analyse des tweets (Buzz émissions télé) : collecte, agrégation sur MongoDB.
Développement des algorithmes en R pour détection des évènements non saisonniers en
R comme Nouvel an chinois, pâques pour la prédiction de ventes.
Outils: Hadoop, MapReduce, Amazon Web Services: Elastic Map-Reduces, R.
Nettoyage des données : formatage, prétraitements, valeurs aberrantes…
Stage n d'étude Master 2 Qualité des données
Talend - Avril 2012 à septembre 2012 - Stage
Identier les problématiques liées à la qualité de données dans le processus d’intégration
de données hétérogènes
Développement les algorithmes conçus par un doctorant chez Talend dédié à la qualité
des données et nettoyage automatiques base de données (semi-doublons)
Outils : NetBeans (Java), Oracle 10G, sérialisation XML, performance des algorithmes de
similarités, reporting
Ingénieur Développement/DBA
SONATRACH (Ranerie - Alger) - Mars 2009 à mai 2011 - CDI - ALGER - Algérie
Administration des bases de données applicatives sous Oracle 8i + Migration vers Oracle
10g.
Développement et administration du projet IT-MANAGEMENT (1,5 années) : gestion du
parc informatique et suivi des incidents.
Rédaction de la documentation, recette et mise en production
Outils : Oracle 8i, Oracle 10g, Eclipse, PL/SQL Server
Stage de n d'étude ingénieur "E-commerce"
Algérie Télécom - Octobre 2007 à juin 2008 - Stage - ALGER - Algérie
Développement d’une application E-commerce adaptée aux PC et aux PDA.
Outils : NetBeans (coté client), Microsoft Visual Studio.Net : C# / MYSQL / HTML /
JavaScript
COMPÉTENCES
Technologies BigData
Hadoop/MapReduce
Spark : ML, Mllib
HDFS
Cloudera
R
Impala, Sqoop
Flume, Hcatalog
Pig, Hive
Scala
Machine Learning
Régression Linéaire/Logistique
Classication
Clustering
Deep Learning
Scikit Learn
Plateformes Cloud
Google Cloud
AWS (EMR, S3)
Appnexus (publicité web)
Développements
JAVA (NetBeans, Eclipse)
Python
Oracle/SQL
MongoDB
Cassandra
intellij
Langues
Anglais (formation anglais professionnel intensif dans le cadre du CPF en
cours)
FORMATIONS
Anglais
- En cours
Depuis décembre 2018
formation anglais professionnel intensif dans le cadre du CPF
Cloudera sur Spark avec Hadoop
Xebia Training
Avril 2016
Hadoop, MapReduce V2, Spark (Core & SQL), Hive, Impala, Sqoop, Flume, Hcatalog, Avro,
Parquet, cloudera distribution
Doctorat Informatique : Machine Learning & BigData
Université Paris 13
Septembre 2013 à avril 2016
En collaboration avec VISEO ( thèse CIFRE).
Master 2 : Programmation et Logiciels Sûrs (PLS)
Université PARIS 13, Sorbonne Paris Cité
Septembre 2012 à septembre 2013
Major de promotion
Ingénieur Informatique
Université des Sciences et de la Technologie Houari Boumediene (USTHB) - Alger
Septembre 2003 à juin 2008