Hm Growth - Senior Data Engineer APACHE HADOOP APACHE SPARK SCALA APACHE KAFKA

Ref : 201014A002
Email vérifié
Photo de Hm Growth, Senior Data Engineer APACHE HADOOP APACHE SPARK SCALA APACHE KAFKA
Compétences
APACHE HADOOP
APACHE KAFKA
MONGODB
Expériences professionnelles
  • Data Scientist And Big Data

    Casablanca Engineer at ALTRAN MAROC
    Jan 2019 - aujourd'hui

    Nettoyage, Analyse et valorisation des données véhicule big data.
    Analyse et traitement des donnés issues du big data (Scala, Python,
    Apache spark, Hadoop, Pandas ...)
    Developpement des algorithmes de la data science, IA sur les
    donnés des roulages véhicule.
    Visualisation et analyse des résultats sous Tableau Et Power Bi.
    Compréhension et analyse des besoins métier/client afin d’apporter
    des solutions innovantes.
    Conception et développement des solutions algorithmiques /
    statistiques via (Python/Matlab/R).
    Elaboration des modèles prédictifs et identifier les comportements
    client à l'aide des algorithmes du Machine Learning / Deep Learning.
    Développement des scripts python pour transformer, Nettoyer,
    Filtrer, Structurer automatiquement les données non structurées et
    les préparer pour power BI.
    Configuration / Programmation des requêtes sous power BI afin de
    transformer les données.
    Automatisation des Traitements de fichiers massifs à l'aide de
    python & R.
    Développement des application VBA & MACRO.
    Développement des Bibliothèques métier pour l'analyse des
    TimeSeries sous Matlab.

  • Stage - Data Science

    PFE chez ALTRAN MAROC
    Jan 2019 - aujourd'hui

    Développement d’une plateforme web de deep learning, pour
    la reconnaissance des images /vidéos en python/Flask.
    Clustering des frames extrait à partir des videos pour la création de
    la dataset.
    Développement d’un outil d’annotation des images.
    Développement d’une interface friendly-user en python/Flask pour
    la création des modeles (Classification et detection des objets) de
    deep learning sous KERAS.
    Développement d’un module de mise en production des modeles
    deep learning creer dans la platforme.

    PROJETS

    Projet Big Data
    UNE APPLICATION BIG DATA D'ÉTUDE DES TEMPÉRATURES
    OBSERVÉES SUR TOUTE LA PLANÈTE
    - Création d’une interface web en PHP pour récupérer les
    paramètres transmis par le formulaire de l'internaute,
    - utilisation du HDFS (HADOOP Distributed file system ) pour
    stocker les données puis on va faire un import en
    MapReduce Dans HBase et ça sera HBase qui fera l'agrégation des données, pour mettre les résultats dans MySQL.
    MySQL sera alors interrogé par PHP pour faire les
    traitements et l'affichage graphique directement en web.

Études et formations
  • FORMATION

    2017-2019
    Casablanca
    Master Big Data et Cloud Computing
    Faculté des Sciences Ain Chock
    Université Hassan II Casablanca

    2014-2017
    Casablanca
    Licence fondamentale Mathématiques et Informatique option
    Base de données
    Faculté des Sciences Ain Chock
    Université Hassan II Casablanca

    2013-2014
    Casablanca
    Baccalauréat Sciences de la Vie et de la Terre (SVT)
    Lycée Ibn Rochd


    ÉDUCATION
    Education Ingénieur Informatique et Mathématiques
    appliquées
    Institut National Polytechnique -TOULOUSE ENSEEIHT 2017

    COMPÉTENCES

    Informatique Big Data - Data Engineering
    Spark Scala / Spark Streaming,
    Apache Kafka / Kafka Streaming
    Apache Nifi, ElasticSearch, Cassandra
    HDFS, Scalatra / Scala
    Amazon AWS
    Data Science
    Natural Language processing ( Python Scikit-learn, NLTK )
    Spark MLlib ( Scala / Python )
    Intégration continue
    Docker, Ansible, Git, Jenkins, Rundeck, Mesos, Marathon,
    Azkaban
    Organisation et méthode
    Travail en équipe, méthode agile, montée en compétence rapide

    Ecosystème de Big Data: Hadoop (HDFS - Yarn -
    MapReduce) - Pig Latin - Hive - Spark / Spark
    MLlib - kafka - storm - Oozie - NoSQL (Cassandra - mongodb - Hbase) - Sqoop/Flume ...
    Languages de programmation: Python, R,
    Matlab, Java, Scala, C, C#, C++, Query
    Languages (SQL/PL-SQL, DAX, MDX ...)
    Cloud et virtualisation: KVM - Libvirt - Docker -
    configuration management tools (Ansible -
    Puppet - Chef - Vagrant), Jenkins, kubernetes,
    Xen, Snort, Nagios, Consul, SaltStack ...
    Méthodes statistiques, Analyses de données,
    Algorithmes de Machine Learning,
    Algorithmes d’optimisations: Algorithmes
    évolutionnaires
    Deep Learning ( CLASSIFICATION - OBJECT
    DETECTION - SEGMENTATION - NLP ) :
    Artificial, Convolutional and Recursive neural
    network, MLP ...
    Deep Learning Tools : keras - tensorflow -
    PyTorch - Theano - OPENCV ...
    Techniques de stockages: DAS, NAS (NFS), SAN
    (iSCSI), Raid
    Systèmes d’exploitation: Linux, Windows, OS X
    Solution BI: Suite Pentaho - Power BI - Tableau
    Dévelopement web: PHP (Laravel - Zend) -
    JS(ReactJS - AngularJS - VueJS ) - Html5/Css3/JQuery/Bootstrap - Django/Flask - WordPress ...

    LANGUES
    Arabe
    français
    Anglais

Autres compétences
FORMATION

2017-2019
Casablanca
Master Big Data et Cloud Computing
Faculté des Sciences Ain Chock
Université Hassan II Casablanca

2014-2017
Casablanca
Licence fondamentale Mathématiques et Informatique option
Base de données
Faculté des Sciences Ain Chock
Université Hassan II Casablanca

2013-2014
Casablanca
Baccalauréat Sciences de la Vie et de la Terre (SVT)
Lycée Ibn Rochd


ÉDUCATION
Education Ingénieur Informatique et Mathématiques
appliquées
Institut National Polytechnique -TOULOUSE ENSEEIHT 2017

COMPÉTENCES

Informatique Big Data - Data Engineering
Spark Scala / Spark Streaming,
Apache Kafka / Kafka Streaming
Apache Nifi, ElasticSearch, Cassandra
HDFS, Scalatra / Scala
Amazon AWS
Data Science
Natural Language processing ( Python Scikit-learn, NLTK )
Spark MLlib ( Scala / Python )
Intégration continue
Docker, Ansible, Git, Jenkins, Rundeck, Mesos, Marathon,
Azkaban
Organisation et méthode
Travail en équipe, méthode agile, montée en compétence rapide

Ecosystème de Big Data: Hadoop (HDFS - Yarn -
MapReduce) - Pig Latin - Hive - Spark / Spark
MLlib - kafka - storm - Oozie - NoSQL (Cassandra - mongodb - Hbase) - Sqoop/Flume ...
Languages de programmation: Python, R,
Matlab, Java, Scala, C, C#, C++, Query
Languages (SQL/PL-SQL, DAX, MDX ...)
Cloud et virtualisation: KVM - Libvirt - Docker -
configuration management tools (Ansible -
Puppet - Chef - Vagrant), Jenkins, kubernetes,
Xen, Snort, Nagios, Consul, SaltStack ...
Méthodes statistiques, Analyses de données,
Algorithmes de Machine Learning,
Algorithmes d’optimisations: Algorithmes
évolutionnaires
Deep Learning ( CLASSIFICATION - OBJECT
DETECTION - SEGMENTATION - NLP ) :
Artificial, Convolutional and Recursive neural
network, MLP ...
Deep Learning Tools : keras - tensorflow -
PyTorch - Theano - OPENCV ...
Techniques de stockages: DAS, NAS (NFS), SAN
(iSCSI), Raid
Systèmes d’exploitation: Linux, Windows, OS X
Solution BI: Suite Pentaho - Power BI - Tableau
Dévelopement web: PHP (Laravel - Zend) -
JS(ReactJS - AngularJS - VueJS ) - Html5/Css3/JQuery/Bootstrap - Django/Flask - WordPress ...

LANGUES
Arabe
français
Anglais

D'autres freelances
Data Scientist PYTHON

Ces profils pourraient vous intéresser !
CV Data Scientist
Khalid

Data Scientist

  • TOULOUSE
PYTHON DATA SQL BIG DATA DATAVIZ BI APACHE HADOOP Cloud AWS Microsoft Power BI APACHE SPARK
Disponible
CV Expert data et Business Intelligence / data transformation - data science - data analysis - BI
Esther

Expert data et Business Intelligence / data transformation - data science - data analysis - BI

  • IVRY-SUR-SEINE
DATA SQL Qlik DATAVIZ TABLEAU SOFTWARE Microsoft Power BI SAS ENTERPRISE GUIDE R Data science PYTHON
CV Data Analyst | Data Scientist
Youssef

Data Analyst | Data Scientist

  • PARIS
PYTHON
Disponible
CV Data Engineer
Koua Wilfried

Data Engineer

  • BOIS-COLOMBES
SQL PYTHON SAS Microsoft Power BI Google Cloud Platform LINUX
Disponible
CV Data Scientist Google Cloud Platform
Ndèye Ndiémé

Data Scientist Google Cloud Platform

  • DRANCY
Google Cloud Platform PYTHON SQL DATA BIG DATA CONFLUENCE Microsoft Power BI HASHICORP TERRAFORM EXCEL Data science
Disponible
CV Data Scientist PYTHON
Lewis

Data Scientist PYTHON

  • VERSAILLES
PYTHON SQL R DATA Microsoft Power BI EXCEL AMAZON AWS APACHE HADOOP
Disponible
CV Data Engineer PYTHON
Mor

Data Engineer PYTHON

  • PARIS
PYTHON BIG DATA Cloud AWS AZURE PYSPARK CI/CD SQL
Disponible
CV Data Scientist / Développeur Web
Magaye

Data Scientist / Développeur Web

  • TALENCE
SQL PYTHON MYSQL DJANGO Vue.js PANDAS JAVA PHP C# C++
Disponible
CV Senior Data Scientist
Chemseddine

Senior Data Scientist

  • COURBEVOIE
DATA PYTHON
Bientôt disponible
CV Data Scientist
Malick

Data Scientist

  • PARIS
PYTHON Data science SQL Dataiku Microsoft Power BI TABLEAU SOFTWARE
Bientôt disponible