Moufida - Data Scientist PYTHON

Ref : 191030A004
Photo de Moufida, Data Scientist PYTHON
Compétences
Expériences professionnelles
  • EXPÉRIENCES

    Data Scientist / Machine learning en BIG DATA
    TRADELAB - Depuis juin 2016 - CDI - PARIS
    Objectif : Optimisation des campagnes publicitaires dans le domaine du RTB ( Real Time
    Bidding) via le traitement de larges volumes de données.
    Responsable de la conception, de la mise en production et du suivi des solutions
    analytiques et prédictives.
    Réaliser des études et analyses clients (analyse du comportement d'achat, Retargeting
    des clients, prols clients, parcours clients, associations, …) dans un environnement Big
    Data.
    Travailler en partenariat avec les experts métier pour comprendre les problématiques
    opérationnelles et les traduire en problématiques mathématiques.
    Participer à la dénition des nouvelles fonctionnalités analytiques an d’augmenter la
    valorisation des données disponibles dans une comité scientique dédiée animée par
    l'équipe R&D.
    Assistance technique et encadrement des stagiaires dans l’utilisation des modèles de
    Machine Learning
    Proposer et développer des solutions statistiques prédictives et prescriptives en mettant
    en œuvre des techniques analytiques traditionnelles (scoring, segmentation…) ou
    innovantes (machine learning)
    Mettre en place une solution de Prospection des clients basée en Machine Learning:
    Enchérir uniquement si la demande d’enchère va générer une conversion d’achat pour un
    nouveau client ( une probabilité déduite)
    Mettre en place une solution de "Retargeting" des clients basée en Machine Learning: :
    Prédire les intentions d'achat des clients ayant déjà visité le site pour augmenter la
    probabilité de conversions
    Modélisation des modèles prédictifs basés sur Machine Learning dans le contexte Big
    Data ( Spark.ML, Spark.MLLIB /python )
    Présentation les solutions algorithmiques dans les événements organisés par Tradelab (
    Tradelab ouvre le capot) à ses diérents clients du diérents secteurs ( automobile,
    Télécom,…)
    Outils : Mllib, ML de Spark ( Regression Logistique, arbre de decision, Random Forest,
    PCA,..), PySpark , scikit learn (DBScan, Kmeans,..), Feature Engineering and Feature
    Selection, google cloud Plateform, plateforme Appnexus.

    Ingénieur R&D BIG DATA chez Viseo Group (thèse CIFRE)
    VISEO Group - Septembre 2013 à avril 2016 - CDD - PARIS
    Concevoir de nouvelles approches pour les algorithmes classiques du Machine Learning,
    scalables sur des clusters Hadoop.
    Maîtrise des enjeux du BigData avec les méthodes Machine Learning (régression linéaire,
    réseaux neurones, méthodes d’ensemble « Bagging », « boosting »…).
    Conception des modèles prédictifs de régression scalables sur des environnements
    distribués (Cloud Amazon)
    Evaluation des modèles prédictifs.
    Analyse des tweets (Buzz émissions télé) : collecte, agrégation sur MongoDB.
    Développement des algorithmes en R pour détection des évènements non saisonniers en
    R comme Nouvel an chinois, pâques pour la prédiction de ventes.
    Outils: Hadoop, MapReduce, Amazon Web Services: Elastic Map-Reduces, R.
    Nettoyage des données : formatage, prétraitements, valeurs aberrantes…

    Stage n d'étude Master 2 Qualité des données
    Talend - Avril 2012 à septembre 2012 - Stage
    Identier les problématiques liées à la qualité de données dans le processus d’intégration
    de données hétérogènes
    Développement les algorithmes conçus par un doctorant chez Talend dédié à la qualité
    des données et nettoyage automatiques base de données (semi-doublons)
    Outils : NetBeans (Java), Oracle 10G, sérialisation XML, performance des algorithmes de
    similarités, reporting

    Ingénieur Développement/DBA
    SONATRACH (Ranerie - Alger) - Mars 2009 à mai 2011 - CDI - ALGER - Algérie
    Administration des bases de données applicatives sous Oracle 8i + Migration vers Oracle
    10g.
    Développement et administration du projet IT-MANAGEMENT (1,5 années) : gestion du
    parc informatique et suivi des incidents.
    Rédaction de la documentation, recette et mise en production
    Outils : Oracle 8i, Oracle 10g, Eclipse, PL/SQL Server

    Stage de n d'étude ingénieur "E-commerce"
    Algérie Télécom - Octobre 2007 à juin 2008 - Stage - ALGER - Algérie
    Développement d’une application E-commerce adaptée aux PC et aux PDA.
    Outils : NetBeans (coté client), Microsoft Visual Studio.Net : C# / MYSQL / HTML /
    JavaScript

Études et formations
  • COMPÉTENCES
    Technologies BigData
    Hadoop/MapReduce
    Spark : ML, Mllib
    HDFS
    Cloudera
    R
    Impala, Sqoop
    Flume, Hcatalog
    Pig, Hive
    Scala

    Machine Learning
    Régression Linéaire/Logistique
    Classication
    Clustering
    Deep Learning
    Scikit Learn

    Plateformes Cloud
    Google Cloud
    AWS (EMR, S3)
    Appnexus (publicité web)

    Développements
    JAVA (NetBeans, Eclipse)
    Python
    Oracle/SQL
    MongoDB
    Cassandra
    intellij

    Langues
    Anglais (formation anglais professionnel intensif dans le cadre du CPF en
    cours)

    FORMATIONS

    Anglais
    - En cours
    Depuis décembre 2018
    formation anglais professionnel intensif dans le cadre du CPF

    Cloudera sur Spark avec Hadoop
    Xebia Training
    Avril 2016
    Hadoop, MapReduce V2, Spark (Core & SQL), Hive, Impala, Sqoop, Flume, Hcatalog, Avro,
    Parquet, cloudera distribution

    Doctorat Informatique : Machine Learning & BigData
    Université Paris 13
    Septembre 2013 à avril 2016
    En collaboration avec VISEO ( thèse CIFRE).
    Master 2 : Programmation et Logiciels Sûrs (PLS)
    Université PARIS 13, Sorbonne Paris Cité
    Septembre 2012 à septembre 2013
    Major de promotion

    Ingénieur Informatique
    Université des Sciences et de la Technologie Houari Boumediene (USTHB) - Alger
    Septembre 2003 à juin 2008

D'autres freelances
Data Scientist PYTHON

Ces profils pourraient vous intéresser !
CV Data Expert, PhD in Computer Science | Data Integration & Management, Semantic Web, ML and NLP
Raphaël

Data Expert, PhD in Computer Science | Data Integration & Management, Semantic Web, ML and NLP

  • NICE
PYTHON DATA BIG DATA Data science JAVA SQL EXCEL Apache NiFi
Disponible
CV Formateur PYTHON
Meryem

Formateur PYTHON

  • TOULOUSE
PYTHON JAVA SQL HTML WORDPRESS EXCEL CSS JAVASCRIPT VISUAL BASIC PHP
Disponible
CV Data Scientist
Akram

Data Scientist

  • MARSEILLE
Google Cloud Platform PYTHON DATA Data science EXCEL SQL BIG DATA
Bientôt disponible
CV Data Engineer/scientist
Narjes

Data Engineer/scientist

  • VILLIERS-SUR-MARNE
PYTHON DATA SQL APACHE SPARK Data science APACHE HADOOP Google Cloud Platform
Disponible
CV Data Analyst Microsoft Power BI
Elie

Data Analyst Microsoft Power BI

  • VILLEURBANNE
Microsoft Power BI PYTHON EXCEL JIRA SCRUM DATA SQL MICROSOFT POWER AUTOMATE
CV Senior Data Engineer and Scientist NLP
Stefano

Senior Data Engineer and Scientist NLP

  • ANTIBES
BIG DATA SQL APACHE SPARK DATA PYTHON SCALA JAVA
Disponible
CV Ingénieur IT Data/IA
Maël

Ingénieur IT Data/IA

  • BORDEAUX
SQL PYTHON DATA EXCEL Google Cloud Platform JAVASCRIPT
Disponible
CV Ingénieur en Data et IA
Joel

Ingénieur en Data et IA

  • CHAMPS-SUR-MARNE
PYTHON Microsoft Power BI SQL EXCEL AZURE PYSPARK JAVA C# PHP .NET
Disponible
CV Etudiant
Colince

Etudiant

  • CALAIS
JAVA PYTHON C R REACT.JS DATA WEBDEV INFORMATICA SQL MONGODB
Disponible
CV Data Scientist
Yanis

Data Scientist

  • PARIS
PYTHON SQL SCRUM DATA Microsoft Power BI AGILE DOCKER NODE.JS C# JIRA
Disponible