Youness - Data Scientist APACHE SPARK
Ref : 200204H003-
75009 PARIS
-
Data Scientist, Data Analyst (30 ans)
-
Totalement mobile
-
Freelance
EXPERIENCES PROFESSIONNELLES
Analyste Développeur Big Data (Novembre 2017- Poste actuel) – BPCE SA :
- Mise en place du datalake de BPCE SA – HORTONWORKS
- Mise en place d’un Framework d’ingestion de données from scratch (Java 8, Spring,
Spark, Hive, Hbase, HDFS)
- Administration des services de la distribution Big Data HortonWorks :
- Gestion du stockage HDFS
- Gestion du gestionnaire de ressources YARN (queues …)
- Spark Tuning
- Integration d’Ambari avec LDAP
- Configuration de la haute disponibilité, kerberisation du cluster
- Configuration des « policies » Ranger (HDFS, Hive), configuration du cryptage KMS
- Configuration du gateway Knox
- …
- Alimentation des différents flux métiers (risques et finances) au sein de BPCE SA en
suivant un design de couches sur HIVE (RAW (données brutes), ENHANCED (données
préparées), EXPOSITION (données à exposer)) (Spark, Hive, Scala, PySpark)
- Implémentation des tests de non-régression pour des flux de données (risques et
finances) entre différentes dates d’arrêtés (Spark, scala)
Stage de fin d’études (Mars-Août 2017) – ORANGE Labs Lannion :
Développement d’un outil d’analyse de traces média LTE (voix-vidéo) (Java 8) :
- Conception de la solution en suivant les spécifications techniques et
fonctionnelles
- Design da la solution (RUP)
- Implémentation de la solution (Java 8, JnetPcap)
Projet de fin d’études (Novembre 2016- Février 2017) – INRIA SOPHIA ANTIPOLIS :
Amélioration de la politique de cache (LRU, «eviction policy») dans Spark1.6 (Scala) :
- Etude de l’algorithme implémenté dans Spark1.6 et Benchmark de sa performance
- Etude des algorithmes proposés dans autres publications (Memtune Paper & DAG-Aware Cache
Management paper)
- Implémentation d’un nouvel algorithme de cache et étude de sa performance
FORMATION
2016/2017 : Master IFI (Informatique fondements et ingénierie) - Polytech Nice-Sophia
2014/2017 : Ingénieur en Informatique - Institut National des Postes et
Télécommunications (INPT), Maroc
2012/2014 : Classes préparatoires aux grandes écoles des ingénieurs (CPGE), Filière MPSI/MP
(Mathématiques et physique) lycée Ibn Abdoune, Maroc
2012/2013 : Baccalauréat Sciences Mathématiques, mention Très Bien, lycée Ibn Abdoune, Maroc
COMPÉTENCES TECHNIQUES
Informatique:
- Administration de la distribution Hortonworks
- Outils Big Data: Spark, Hive, Hbase, HDFS, Yarn, Ranger, Knox
- DevOps: Git, Maven, Jenkins, Nexus, XL Deploy
- Machine Learning : Algorithme de regression, classification, SVM et clustering
- Langages de programmation : Scala, Java, Python (pandas, numpy,sklearn...), Shell, Spark SQL, HQL
- Bases de données : Hbase, SQL (MySql, psql)
- Virtualization et cloud computing: KVM, Docker
- Outils et méthodes de développement logiciel : Scrum, RUP
Réseaux et Télécommunications :
- Administration réseaux : TCP/IP, IPV4/v6, MPLS, ATM, SDN, NFV
- Sécurité Réseaux : OpenSSL, RADIUS, Nessus, IPsec
- LTE, Wifi, VoLTE, VoWifi, SIP, RTP
LANGUES
Français : Bilingue (Lu, écrit et parlé)
Anglais : Bilingue (Lu, écrit et parlé)
Arabe : Bilingue (Lu, écrit et parlé)