Hm Growth - Senior Data Engineer APACHE HADOOP APACHE SPARK SCALA APACHE KAFKA

Ref : 201014A002
Email vérifié
Photo de Hm Growth, Senior Data Engineer APACHE HADOOP APACHE SPARK SCALA APACHE KAFKA
Compétences
APACHE HADOOP
APACHE KAFKA
MONGODB
Expériences professionnelles
  • Data Scientist And Big Data

    Casablanca Engineer at ALTRAN MAROC
    Jan 2019 - aujourd'hui

    Nettoyage, Analyse et valorisation des données véhicule big data.
    Analyse et traitement des donnés issues du big data (Scala, Python,
    Apache spark, Hadoop, Pandas ...)
    Developpement des algorithmes de la data science, IA sur les
    donnés des roulages véhicule.
    Visualisation et analyse des résultats sous Tableau Et Power Bi.
    Compréhension et analyse des besoins métier/client afin d’apporter
    des solutions innovantes.
    Conception et développement des solutions algorithmiques /
    statistiques via (Python/Matlab/R).
    Elaboration des modèles prédictifs et identifier les comportements
    client à l'aide des algorithmes du Machine Learning / Deep Learning.
    Développement des scripts python pour transformer, Nettoyer,
    Filtrer, Structurer automatiquement les données non structurées et
    les préparer pour power BI.
    Configuration / Programmation des requêtes sous power BI afin de
    transformer les données.
    Automatisation des Traitements de fichiers massifs à l'aide de
    python & R.
    Développement des application VBA & MACRO.
    Développement des Bibliothèques métier pour l'analyse des
    TimeSeries sous Matlab.

  • Stage - Data Science

    PFE chez ALTRAN MAROC
    Jan 2019 - aujourd'hui

    Développement d’une plateforme web de deep learning, pour
    la reconnaissance des images /vidéos en python/Flask.
    Clustering des frames extrait à partir des videos pour la création de
    la dataset.
    Développement d’un outil d’annotation des images.
    Développement d’une interface friendly-user en python/Flask pour
    la création des modeles (Classification et detection des objets) de
    deep learning sous KERAS.
    Développement d’un module de mise en production des modeles
    deep learning creer dans la platforme.

    PROJETS

    Projet Big Data
    UNE APPLICATION BIG DATA D'ÉTUDE DES TEMPÉRATURES
    OBSERVÉES SUR TOUTE LA PLANÈTE
    - Création d’une interface web en PHP pour récupérer les
    paramètres transmis par le formulaire de l'internaute,
    - utilisation du HDFS (HADOOP Distributed file system ) pour
    stocker les données puis on va faire un import en
    MapReduce Dans HBase et ça sera HBase qui fera l'agrégation des données, pour mettre les résultats dans MySQL.
    MySQL sera alors interrogé par PHP pour faire les
    traitements et l'affichage graphique directement en web.

Études et formations
  • FORMATION

    2017-2019
    Casablanca
    Master Big Data et Cloud Computing
    Faculté des Sciences Ain Chock
    Université Hassan II Casablanca

    2014-2017
    Casablanca
    Licence fondamentale Mathématiques et Informatique option
    Base de données
    Faculté des Sciences Ain Chock
    Université Hassan II Casablanca

    2013-2014
    Casablanca
    Baccalauréat Sciences de la Vie et de la Terre (SVT)
    Lycée Ibn Rochd


    ÉDUCATION
    Education Ingénieur Informatique et Mathématiques
    appliquées
    Institut National Polytechnique -TOULOUSE ENSEEIHT 2017

    COMPÉTENCES

    Informatique Big Data - Data Engineering
    Spark Scala / Spark Streaming,
    Apache Kafka / Kafka Streaming
    Apache Nifi, ElasticSearch, Cassandra
    HDFS, Scalatra / Scala
    Amazon AWS
    Data Science
    Natural Language processing ( Python Scikit-learn, NLTK )
    Spark MLlib ( Scala / Python )
    Intégration continue
    Docker, Ansible, Git, Jenkins, Rundeck, Mesos, Marathon,
    Azkaban
    Organisation et méthode
    Travail en équipe, méthode agile, montée en compétence rapide

    Ecosystème de Big Data: Hadoop (HDFS - Yarn -
    MapReduce) - Pig Latin - Hive - Spark / Spark
    MLlib - kafka - storm - Oozie - NoSQL (Cassandra - mongodb - Hbase) - Sqoop/Flume ...
    Languages de programmation: Python, R,
    Matlab, Java, Scala, C, C#, C++, Query
    Languages (SQL/PL-SQL, DAX, MDX ...)
    Cloud et virtualisation: KVM - Libvirt - Docker -
    configuration management tools (Ansible -
    Puppet - Chef - Vagrant), Jenkins, kubernetes,
    Xen, Snort, Nagios, Consul, SaltStack ...
    Méthodes statistiques, Analyses de données,
    Algorithmes de Machine Learning,
    Algorithmes d’optimisations: Algorithmes
    évolutionnaires
    Deep Learning ( CLASSIFICATION - OBJECT
    DETECTION - SEGMENTATION - NLP ) :
    Artificial, Convolutional and Recursive neural
    network, MLP ...
    Deep Learning Tools : keras - tensorflow -
    PyTorch - Theano - OPENCV ...
    Techniques de stockages: DAS, NAS (NFS), SAN
    (iSCSI), Raid
    Systèmes d’exploitation: Linux, Windows, OS X
    Solution BI: Suite Pentaho - Power BI - Tableau
    Dévelopement web: PHP (Laravel - Zend) -
    JS(ReactJS - AngularJS - VueJS ) - Html5/Css3/JQuery/Bootstrap - Django/Flask - WordPress ...

    LANGUES
    Arabe
    français
    Anglais

Autres compétences
FORMATION

2017-2019
Casablanca
Master Big Data et Cloud Computing
Faculté des Sciences Ain Chock
Université Hassan II Casablanca

2014-2017
Casablanca
Licence fondamentale Mathématiques et Informatique option
Base de données
Faculté des Sciences Ain Chock
Université Hassan II Casablanca

2013-2014
Casablanca
Baccalauréat Sciences de la Vie et de la Terre (SVT)
Lycée Ibn Rochd


ÉDUCATION
Education Ingénieur Informatique et Mathématiques
appliquées
Institut National Polytechnique -TOULOUSE ENSEEIHT 2017

COMPÉTENCES

Informatique Big Data - Data Engineering
Spark Scala / Spark Streaming,
Apache Kafka / Kafka Streaming
Apache Nifi, ElasticSearch, Cassandra
HDFS, Scalatra / Scala
Amazon AWS
Data Science
Natural Language processing ( Python Scikit-learn, NLTK )
Spark MLlib ( Scala / Python )
Intégration continue
Docker, Ansible, Git, Jenkins, Rundeck, Mesos, Marathon,
Azkaban
Organisation et méthode
Travail en équipe, méthode agile, montée en compétence rapide

Ecosystème de Big Data: Hadoop (HDFS - Yarn -
MapReduce) - Pig Latin - Hive - Spark / Spark
MLlib - kafka - storm - Oozie - NoSQL (Cassandra - mongodb - Hbase) - Sqoop/Flume ...
Languages de programmation: Python, R,
Matlab, Java, Scala, C, C#, C++, Query
Languages (SQL/PL-SQL, DAX, MDX ...)
Cloud et virtualisation: KVM - Libvirt - Docker -
configuration management tools (Ansible -
Puppet - Chef - Vagrant), Jenkins, kubernetes,
Xen, Snort, Nagios, Consul, SaltStack ...
Méthodes statistiques, Analyses de données,
Algorithmes de Machine Learning,
Algorithmes d’optimisations: Algorithmes
évolutionnaires
Deep Learning ( CLASSIFICATION - OBJECT
DETECTION - SEGMENTATION - NLP ) :
Artificial, Convolutional and Recursive neural
network, MLP ...
Deep Learning Tools : keras - tensorflow -
PyTorch - Theano - OPENCV ...
Techniques de stockages: DAS, NAS (NFS), SAN
(iSCSI), Raid
Systèmes d’exploitation: Linux, Windows, OS X
Solution BI: Suite Pentaho - Power BI - Tableau
Dévelopement web: PHP (Laravel - Zend) -
JS(ReactJS - AngularJS - VueJS ) - Html5/Css3/JQuery/Bootstrap - Django/Flask - WordPress ...

LANGUES
Arabe
français
Anglais

D'autres freelances
Data Scientist PYTHON

Ces profils pourraient vous intéresser !
CV Data Scientist SQL
Armand Willy

Data Scientist SQL

  • ARGENTEUIL
Alteryx SQL PYTHON BIG DATA R SAS APACHE HADOOP Dataiku Snowflake
Bientôt disponible
CV Data Scientist
Abdelmutalib

Data Scientist

  • CAEN
SQL PYTHON EXCEL DATA Data science
Disponible
CV Data Scientist/ Formatrice PYTHON
Rania

Data Scientist/ Formatrice PYTHON

  • MONTREUIL
DATA POWERPOINT WORD PYTHON EXCEL SQL JAVA Microsoft Power BI BIG DATA SHAREPOINT
Disponible
CV Data Scientist PYTHON
Maximilien

Data Scientist PYTHON

  • PARIS
PANDAS PYTHON SQL
Disponible
CV Data Scientist DATA
Nguyen

Data Scientist DATA

  • BLOIS
DATA PYTHON
Disponible
CV Data Scientist - PhD - Formateur
Sylvain

Data Scientist - PhD - Formateur

  • PARIS
PYTHON SQL DATA Data science Microsoft Power BI AZURE Cloud AWS Google Cloud Platform
Disponible
CV Data Scientist SQL
Tezeghdenti

Data Scientist SQL

  • ARBLADE-LE-HAUT
PYTHON SQL
Disponible
CV Formateur en Informatique
Myriam

Formateur en Informatique

  • AULNAY-SOUS-BOIS
PYTHON JAVA SQL MYSQL C# .NET MS OFFICE UML NoSQL ORACLE
Disponible
CV Data Scientist / Engineer & Développeur Flutter / Python
Jaber

Data Scientist / Engineer & Développeur Flutter / Python

  • PARIS
SQL JAVASCRIPT DATA PYTHON FLUTTER NoSQL Dataiku R
Disponible
CV Data Analyst / Data product owner
Eraste

Data Analyst / Data product owner

  • CERGY
AGILE Microsoft Power BI SCRUM BI PYTHON AZURE APACHE SPARK BIG DATA APACHE HADOOP SQL
Disponible