Youness - Data Scientist APACHE SPARK

Ref : 200204H003

75009 PARIS
Data Scientist, Data Analyst (30 ans)
Totalement mobile
Freelance

Compétences

APACHE SPARK

APACHE HBASE

JAVA

SPRING

SCALA

APACHE HIVE

HDFS

PYTHON

GIT

JENKINS

Expériences professionnelles

EXPERIENCES PROFESSIONNELLES

Analyste Développeur Big Data (Novembre 2017- Poste actuel) – BPCE SA :
- Mise en place du datalake de BPCE SA – HORTONWORKS
- Mise en place d’un Framework d’ingestion de données from scratch (Java 8, Spring,
Spark, Hive, Hbase, HDFS)
- Administration des services de la distribution Big Data HortonWorks :
- Gestion du stockage HDFS
- Gestion du gestionnaire de ressources YARN (queues …)
- Spark Tuning
- Integration d’Ambari avec LDAP
- Configuration de la haute disponibilité, kerberisation du cluster
- Configuration des « policies » Ranger (HDFS, Hive), configuration du cryptage KMS
- Configuration du gateway Knox
- …
- Alimentation des différents flux métiers (risques et finances) au sein de BPCE SA en
suivant un design de couches sur HIVE (RAW (données brutes), ENHANCED (données
préparées), EXPOSITION (données à exposer)) (Spark, Hive, Scala, PySpark)
- Implémentation des tests de non-régression pour des flux de données (risques et
finances) entre différentes dates d’arrêtés (Spark, scala)

Stage de fin d’études (Mars-Août 2017) – ORANGE Labs Lannion :
Développement d’un outil d’analyse de traces média LTE (voix-vidéo) (Java 8) :
- Conception de la solution en suivant les spécifications techniques et
fonctionnelles
- Design da la solution (RUP)
- Implémentation de la solution (Java 8, JnetPcap)

Projet de fin d’études (Novembre 2016- Février 2017) – INRIA SOPHIA ANTIPOLIS :
Amélioration de la politique de cache (LRU, «eviction policy») dans Spark1.6 (Scala) :
- Etude de l’algorithme implémenté dans Spark1.6 et Benchmark de sa performance
- Etude des algorithmes proposés dans autres publications (Memtune Paper & DAG-Aware Cache
Management paper)
- Implémentation d’un nouvel algorithme de cache et étude de sa performance

Études et formations

FORMATION
2016/2017 : Master IFI (Informatique fondements et ingénierie) - Polytech Nice-Sophia
2014/2017 : Ingénieur en Informatique - Institut National des Postes et
Télécommunications (INPT), Maroc
2012/2014 : Classes préparatoires aux grandes écoles des ingénieurs (CPGE), Filière MPSI/MP
(Mathématiques et physique) lycée Ibn Abdoune, Maroc
2012/2013 : Baccalauréat Sciences Mathématiques, mention Très Bien, lycée Ibn Abdoune, Maroc

COMPÉTENCES TECHNIQUES
Informatique:
- Administration de la distribution Hortonworks
- Outils Big Data: Spark, Hive, Hbase, HDFS, Yarn, Ranger, Knox
- DevOps: Git, Maven, Jenkins, Nexus, XL Deploy
- Machine Learning : Algorithme de regression, classification, SVM et clustering
- Langages de programmation : Scala, Java, Python (pandas, numpy,sklearn...), Shell, Spark SQL, HQL
- Bases de données : Hbase, SQL (MySql, psql)
- Virtualization et cloud computing: KVM, Docker
- Outils et méthodes de développement logiciel : Scrum, RUP

Réseaux et Télécommunications :
- Administration réseaux : TCP/IP, IPV4/v6, MPLS, ATM, SDN, NFV
- Sécurité Réseaux : OpenSSL, RADIUS, Nessus, IPsec
- LTE, Wifi, VoLTE, VoWifi, SIP, RTP

LANGUES
Français : Bilingue (Lu, écrit et parlé)
Anglais : Bilingue (Lu, écrit et parlé)
Arabe : Bilingue (Lu, écrit et parlé)