Youness - Data Scientist APACHE SPARK

Ref : 200204H003
Photo de Youness, Data Scientist APACHE SPARK
Compétences
APACHE HBASE
APACHE HIVE
HDFS
GIT
Expériences professionnelles
  • EXPERIENCES PROFESSIONNELLES

    Analyste Développeur Big Data (Novembre 2017- Poste actuel) – BPCE SA :
    - Mise en place du datalake de BPCE SA – HORTONWORKS
    - Mise en place d’un Framework d’ingestion de données from scratch (Java 8, Spring,
    Spark, Hive, Hbase, HDFS)
    - Administration des services de la distribution Big Data HortonWorks :
    - Gestion du stockage HDFS
    - Gestion du gestionnaire de ressources YARN (queues …)
    - Spark Tuning
    - Integration d’Ambari avec LDAP
    - Configuration de la haute disponibilité, kerberisation du cluster
    - Configuration des « policies » Ranger (HDFS, Hive), configuration du cryptage KMS
    - Configuration du gateway Knox
    - …
    - Alimentation des différents flux métiers (risques et finances) au sein de BPCE SA en
    suivant un design de couches sur HIVE (RAW (données brutes), ENHANCED (données
    préparées), EXPOSITION (données à exposer)) (Spark, Hive, Scala, PySpark)
    - Implémentation des tests de non-régression pour des flux de données (risques et
    finances) entre différentes dates d’arrêtés (Spark, scala)

    Stage de fin d’études (Mars-Août 2017) – ORANGE Labs Lannion :
    Développement d’un outil d’analyse de traces média LTE (voix-vidéo) (Java 8) :
    - Conception de la solution en suivant les spécifications techniques et
    fonctionnelles
    - Design da la solution (RUP)
    - Implémentation de la solution (Java 8, JnetPcap)

    Projet de fin d’études (Novembre 2016- Février 2017) – INRIA SOPHIA ANTIPOLIS :
    Amélioration de la politique de cache (LRU, «eviction policy») dans Spark1.6 (Scala) :
    - Etude de l’algorithme implémenté dans Spark1.6 et Benchmark de sa performance
    - Etude des algorithmes proposés dans autres publications (Memtune Paper & DAG-Aware Cache
    Management paper)
    - Implémentation d’un nouvel algorithme de cache et étude de sa performance

Études et formations
  • FORMATION
    2016/2017 : Master IFI (Informatique fondements et ingénierie) - Polytech Nice-Sophia
    2014/2017 : Ingénieur en Informatique - Institut National des Postes et
    Télécommunications (INPT), Maroc
    2012/2014 : Classes préparatoires aux grandes écoles des ingénieurs (CPGE), Filière MPSI/MP
    (Mathématiques et physique) lycée Ibn Abdoune, Maroc
    2012/2013 : Baccalauréat Sciences Mathématiques, mention Très Bien, lycée Ibn Abdoune, Maroc

    COMPÉTENCES TECHNIQUES
    Informatique:
    - Administration de la distribution Hortonworks
    - Outils Big Data: Spark, Hive, Hbase, HDFS, Yarn, Ranger, Knox
    - DevOps: Git, Maven, Jenkins, Nexus, XL Deploy
    - Machine Learning : Algorithme de regression, classification, SVM et clustering
    - Langages de programmation : Scala, Java, Python (pandas, numpy,sklearn...), Shell, Spark SQL, HQL
    - Bases de données : Hbase, SQL (MySql, psql)
    - Virtualization et cloud computing: KVM, Docker
    - Outils et méthodes de développement logiciel : Scrum, RUP

    Réseaux et Télécommunications :
    - Administration réseaux : TCP/IP, IPV4/v6, MPLS, ATM, SDN, NFV
    - Sécurité Réseaux : OpenSSL, RADIUS, Nessus, IPsec
    - LTE, Wifi, VoLTE, VoWifi, SIP, RTP

    LANGUES
    Français : Bilingue (Lu, écrit et parlé)
    Anglais : Bilingue (Lu, écrit et parlé)
    Arabe : Bilingue (Lu, écrit et parlé)

D'autres freelances
Data Scientist APACHE SPARK

Ces profils pourraient vous intéresser !
CV Data Engineer/scientist
Narjes

Data Engineer/scientist

  • VILLIERS-SUR-MARNE
PYTHON DATA SQL APACHE SPARK Data science APACHE HADOOP Google Cloud Platform
Disponible
CV Senior Data Engineer and Scientist NLP
Stefano

Senior Data Engineer and Scientist NLP

  • ANTIBES
BIG DATA SQL APACHE SPARK DATA PYTHON SCALA JAVA
Disponible
CV Consultant Data
Ababacar

Consultant Data

  • PARIS
SQL APACHE SPARK PYTHON APACHE HADOOP BIG DATA DATA Microsoft Power BI AZURE SCALA
Bientôt disponible
CV Data Analyst | Ingénieur PLM
John Wilfred

Data Analyst | Ingénieur PLM

  • LE CHESNAY
PYTHON APACHE SPARK SQL Microsoft Power BI DATA APACHE HADOOP POSTGRESQL BIG DATA JAVA SCALA
Disponible
CV Data engineer
Alain

Data engineer

  • PARIS
SQL PYTHON Google Cloud Platform APACHE SPARK TALEND SSIS APACHE HADOOP HASHICORP TERRAFORM ANSIBLE BIG DATA
Disponible
CV Data Scientist APACHE SPARK
Meher

Data Scientist APACHE SPARK

  • CHEVILLY-LARUE
APACHE SPARK APACHE KAFKA
Disponible
CV Data engineer IA
Nathan

Data engineer IA

  • PARIS
APACHE HADOOP PYTHON SQL APACHE SPARK BIG DATA DATA Data science AMAZON AWS AMAZON EC2 REACT.JS
Disponible
CV Data Scientist | Analyste | ML Ingenieur PYTHON
Mohamed

Data Scientist | Analyste | ML Ingenieur PYTHON

  • MONTREUIL
PYTHON SQL DATA Microsoft Power BI EXCEL APACHE SPARK Google Cloud Platform UML APACHE HADOOP
CV Data Engineer cloud/ Big data
Aubain

Data Engineer cloud/ Big data

  • NOISY-LE-GRAND
SQL PYTHON DATA APACHE HADOOP AZURE Google Cloud Platform BIG DATA SCALA Microsoft Power BI APACHE SPARK
CV Data engineer / Data scientist
Alae

Data engineer / Data scientist

  • TOULOUSE
Data science PYTHON APACHE SPARK SQL Cloud AWS APACHE KAFKA POSTGRESQL