Raoui - Data Analyst BIG DATA

Ref : 200715B002
Email vérifié
Photo de Raoui, Data Analyst BIG DATA
Compétences
APACHE HIVE
APACHE HADOOP
DATAWAREHOUSE
BI
SQL
Expériences professionnelles
  • Expérience professionnelle

    Depuis Décembre 2021 Vidal Group (Leader mondial d’intelligence médicale)
    Senior Data Consultant Freelance, remotely
    Projet Ordo-Scan
    Conception, Développement et déploiement d’une API pour l’extraction et la structuration des données d’ordonnances
    Réalisations :
    ✓ Co-Prototypage et validation d’un ensemble de multi-classifieurs déterminant la classe d’une entrée médicale
    ✓ Conception d’un module de reconnaissance des médicaments avec des mesures de similarités composées
    ✓ Validation d’un modèle NER pour l’extraction d’entités pertinentes (dose, durée, …) à partir d’une posologie
    ✓ Orchestration des 3 modules en REST API pour l’extraction & la structuration d’informations des ordonnances
    Environnement Technique : Python, GCP, BigQuery, Fastapi, GitHub, Phoenix, VS Code, Jupyter, Streamlit
    Equipe : PO, ingénieur data, data scientist, expert fonctionnel


    Août 2018 à Décembre 2021 Orange Group (Leader européen des télécommunications)
    Core Data Analyste CDI, plein temps
    Projet Churn-ML
    Conception, Développement et déploiement d’une solution de prédiction de churn pour le département marketing
    Réalisations :
    ✓ Amélioration de la qualité des datamarts analytiques (fichiers manquants, fiabilité data, réconciliation)
    ✓ Automatisation de l’extraction et le nettoyage des données de plus de 4Mln abonnés et 30 variables clés
    ✓ Co-Prototypage d’un ensemble de classifieurs pour le churn prépayé mobile et validation du classifieur final
    ✓ Déploiement du classifieur prédisant 83% des churners et d’un model non supervisé identifiant les raisons
    Environnement Technique : Python, GCP, BigQuery, PostgreSQL, Airflow, Hive, Streamlit, Gitlab, Jupyter, VS code
    Equipe : ingénieur BI, ingénieur data, data scientist, expert technico-fonctionnelle

    Solution Business Monitoring
    Révision et mise à jour avec l’équipe front office du système de récompense des orange retail stores
    Réalisations :
    ✓ Recueil, analyse et étude des besoins fonctionnels et diagnostique de la qualité des données
    ✓ Segmentation d’Orange retail stores en se basant sur la performance, la quantité et la qualité de ventes
    ✓ Conception d’une nouvelle métrique évaluant chaque retailer et amélioration du système de récompense
    ✓ Test, Validation et déploiement de la nouvelle métrique en prod
    Environnement Technique : Python, GCP, BigQuery, Oracle, Jupyter Notebook, VS code, Gitlab

    Equipe : ingénieur BI, ingénieur data, expert technico-fonctionnelle
    Projet Covid-19
    Conception d’un module décisionnel axé sur le comportement Télco en collaboration avec le ministère de la santé
    Réalisations :
    ✓ Check de la qualité des données et ingénierie des KPIs adaptés des différents comportements clés
    ✓ Conception d’un DWH analytique traçant le trafic d’appels vers SAMU pendant le confinement national
    ✓ Automatisation du traçage d’abonnés avec un taux de trafic vers SAMU élevé et reporting à l’observatoire
    ✓ Prototypage d’un classifieur des porteurs du covid19 basé sur le comportement télécom pour l’observatoire
    Environnement Technique : Python, Hive, PostgreSQL, Airflow, Streamlit, Jupyter, VS code, Gitlab
    Equipe : ingénieur BI, data scientist, 2 biologistes

    Orange Tunis, Tunisie
    Core data scientiste Aout 2018-Present
    Conception, mise en production, monitoring et mise à jour de solutions analytiques de haute complexité notamment :
    Solution Churn :
     Amélioration de la qualité des datamarts analytiques (fichiers manquants, fiabilité data, réconciliation)
     Automatisation de l’extraction et le nettoyage des données de plus de 4Mln abonnés et 30 variables clés
     Prototypage d’un ensemble de classifieurs pour le churn prépayé mobile et validation du classifieur final
     Déploiement du classifieur prédisant 83% des churners et d’un model non supervisé identifiant les raisons
    Solution Business monitoring :
     Révision et évaluation avec l’équipe front office du système de récompense d’Orange retail stores
     Clustering d’Orange retail stores en se basant sur la performance, la quantité et la qualité de ventes
     Conception d’une nouvelle métrique évaluant chaque retailer et amélioration du système de récompense
    Projet Covid19 (en collaboration avec l’observatoire national des maladies nouvelles et émergentes) :
     Conception d’un data-warehouse analytique traçant le trafic d’appels vers SAMU pendant le confinement
     Traçage d’abonnés avec un taux de trafic vers SAMU élevé et reporting à l’observatoire
     Prototypage d’un classifieur des porteurs du covid19 basé sur le comportement telco pour l’observatoire

    SNCF-LGI2A Lille, France
    Ingénieur Machine Learning Aout 2017-Juillet 2018
     Evaluation de l’algorithme d’apprentissage des variables d’un simulateur de transportation multimodale
     Implémentation d’un banc de test de classification avec 8 modèles supervisés standard de classification
     Introduction et prototypage d’un classifieur basé sur la théorie d’évidence et validation contre le banc de test
     Ré-Optimisation et monitoring du classifieur final contre le système de classification existant en production
     Mise en production réussie du nouveau système de classification remplaçant l’existant : AUC perf 74% à 78%

    SNCF-LGI2A Lille, France
    Stagiaire Machine Learning février 2017-juillet 2017
     Clustering et extraction de segments de références d’une base de données théorique de simulations de trajets
     Clustering d’une base de données expérimentale et réduction de la taille des clusters résultants
     Identification et interprétation réussie de toutes les classes résultantes du clustering

    Banque de Tunisie Tunis, Tunisie
    Stagiaire Data Science Juin 2016-Aout 2016
     Mise en place avec l’équipe crédit d’un ensemble de variables pour la prédiction des scores de crédit
     Construction, tuning et optimisation d’un modèle supervisé de prédiction des scores de crédits
     Création d’un système de validation interne pour le modèle conçu basé sur un système de validation existant

    Amen Banque Tunis, Tunisie
    Stagiaire Data Analyste Juin 2015-Aout 2015
     Documentation du besoin commercial d’un outil d’estimation de performance des agences bancaires
     Co-développement d’une application de bureau pour répondre à ce besoin
     Augmentation de la précision de l’estimation commerciale de près de 0.125%

Études et formations
  • Education

    Diplôme National d’Ingénieur en Mathématiques Appliquées et Modélisation, ENSIT 2014 - 2017
     spécialité : statistiques avancées
    Diplôme d’études universitaires générales (DEUG), IPEIT 2012 - 2014
     spécialité : MPSI / MP*

    Compétences & Intérêts
     Langues : Arabe (courant), français (courant), anglais (courant), Allemand (débutant)
     Programmation : MATLAB, JAVA, C++, PYTHON, R
     Data science : Python, SQL, Jupyter, Qlik sense, Hive, Pyspark, SAS
     Personnel : Football (Ex arrière droit pro : ST, capitaine U15), Puzzles, paintball, randonnée

D'autres freelances
Data Analyst BIG DATA

Ces profils pourraient vous intéresser !
CV Data Scientist Data science
Adam

Data Scientist Data science

  • MARSEILLE
Data science PYTHON PANDAS DATAVIZ BIG DATA SQL LINUX ELK C++ Cloud AWS
CV Actuaire IA, Data Scientist Senior, Economiste
Gilles Kué

Actuaire IA, Data Scientist Senior, Economiste

  • CHAMBOURCY
DATA R SAS PYTHON Lean Six Sigma SQL AGILE Microsoft Power BI BIG DATA EXCEL
Disponible
CV Chef de projet
Khalil

Chef de projet

  • PARIS
SQL GOOGLE DATA STUDIO EXCEL PROJECT MANAGEMENT OFFICE Manufacturing & Supply Chain AGILE BIG DATA MS PROJECT
Disponible
CV Consultant Data
Ababacar

Consultant Data

  • PARIS
SQL APACHE SPARK PYTHON APACHE HADOOP BIG DATA DATA Microsoft Power BI AZURE SCALA
Bientôt disponible
CV Data Analyst | Ingénieur PLM
John Wilfred

Data Analyst | Ingénieur PLM

  • LE CHESNAY
PYTHON APACHE SPARK SQL Microsoft Power BI DATA APACHE HADOOP POSTGRESQL BIG DATA JAVA SCALA
Disponible
CV Data Analyst PYTHON
Joseph

Data Analyst PYTHON

  • NEUILLY-SUR-MARNE
SQL Microsoft Power BI DATA BI EXCEL SQL SERVER AZURE BIG DATA TALEND PYTHON
Disponible
CV Data Engineer
Moussa

Data Engineer

  • AUBERVILLIERS
PYTHON SQL CI/CD GIT BIG DATA PYSPARK AZURE DOCKER DATAWAREHOUSE SCRUM
Disponible
CV ingénieure analyste / Data scientist
Aya

ingénieure analyste / Data scientist

  • SURESNES
SQL PYTHON Microsoft Power BI Data science EXCEL Cloud AWS GRAFANA BIG DATA Google Cloud Platform SCALA
CV Data Scientist SAS
Yassir

Data Scientist SAS

  • STRASBOURG
SAS SQL PYTHON Microsoft Power BI DATA SCALA APACHE SPARK JAVA BIG DATA EXCEL
CV Data Scientist DATA
Lionel

Data Scientist DATA

  • VAL POMPADOUR
PYTHON SQL BIG DATA DATA BI Google Cloud Platform TABLEAU SOFTWARE BUSINESS OBJECTS AZURE