Hamza - Data Analyst LINUX

Ref : 200522H001

31100 TOULOUSE
Data Analyst, Data Scientist, DevOps (31 ans)
Totalement mobile
Bientôt freelance

Compétences

LINUX

PYTHON

NoSQL

ELK

BIG DATA

Data lake

Expériences professionnelles

EXPERIENCES PROFESSIONNELLES

03/2020 à 04/2020
Société
Projet
CLS TOULOUSE
Mettre en place un environnement d’analyse opérationnel des logs ELK
Rôle Ingénieur Big data
Activités réalisées  ingestion les mesures de performances et de disponibilités de l’instance
établies dans le contrat avec le client (KPI) en exploitant les logs de
l’application avec logstash
 Intégrer ces mesures dans un rapport mensuel exploitable et automatisé
avec KIBANA
Environnement LINUX, CloudS(infrastructure OpenStack), Docker, elasticsearch, logstsash, Kibana

05/2019 à 01/2020
Société Databiz filière d’Autobiz France
Projet Autobiz, Crawler et analyser les sites SELOGER, IMMO, VO
Rôle Ingénieur Big data
Activités réalisées
 Crawler les sites des annonces dans des fichier JSON
 Nettoyage et transformation des données et extraire les statistiques avec
Apache Spark puis envoyer les statistiques aux analystes
 Stocker et interroger les données dans MongoDB
 Stocker les données textuelles des annonces dans Elasticsearch et faire la
visualisation avec Kibana
 Créer un outil qui permet de chercher un mot dans tous les pages et les
sous pages d’un site avec scrapy et Django
Environnement LINUX, SCRAPY, SELENIUM, APACHE SPARK, PYTHON, ELK, MONGODB, GITLAB,
REDMINE, DJANGO, script shell, Docker
.
11/2018 à 03/2019
Société SDI
Rôle Ingénieure Big Data
Activités réalisées  Crawler les pages Facebook (poste, comment, nombre de j’aime et de
partage), les jobs sur LinkedIn, les produits sur AliExpress, Amazon, les
bibliographies des artistes (NRJ, FNAC)
Environnement LINUX, API graphe, SCRAPY, SELENIUM, APACHE SPARK, R, PYTHON, ELK,
MONGODB, GITLAB, REDMINE, DJANGO

02/2017 à 10/2018
Société TADA
Rôle
Ingènieure Big Data
Projet PLATEFORME DE RECOMMANDATION COMMERCIAL
Activités réalisées  Développement d’un package de classification hiérarchique avec les
algorithmes génétiques
 Développement d'une application web back office pour l'analyse et la
prédiction des comportements clients et la génération des rapports
d’analyse
Environnement RSTUDIO, RMARKDOWN, APACHE SPARK ET APACHE CASSANDRA

Projet TADA, CREER UN GENERATEUR DE PAYSAGE 3D
Activités réalisées  Implémenter des algorithmes de génération de paysage 3D exploitant les
algorithmes génétiques.
Environnement RSTUDIO, R, APACHE SPARK

Projet TADA, DETECTION DES OBJETS
Activités réalisées  Développer un module de détection des visages et des objets.
 Développer un module de reconnaissance des visages.
 Développer un module d’analyse des mouvements et suivi des objets
Environnement PYTHON, OPENCV, APPRENTISSAGE APPROFONDI, MONGODB
Projet BIN PACKING 3D
Activités réalisées  Résolution du problème complexe de Bin packing 3D
 Modélisation d’une soution avec WPF.
Environnement Visual Studio, C#, WPF
Projet PICKUP AND DELIVERY TEMPS REEL
Activités réalisées  Résolution du problème complexe de réception de plusieurs demandes de
livraison. Le service développé permet au transporteur d’organiser ces
clients et de répondre aux nouvelles demandes en acceptant ou refusant
tout en prenant en considération le facteur date limite de livraison et la date
approximatif nécessaire pour la livraison calculer par le service tout en
prenant en considération les livraisons déjà acceptés.
Environnement RSHINY, R, RESTFUL API, PLUMBER LIBRARY, MAP API GGMAP LIBRARY

Études et formations

DIPLOMES & FORMATIONS

2017 Mastère Professionnel en Génie logiciel

COMPETENCES TECHNIQUES

Technologies : Machine learning , Deep learning , Apache Spark ,
Python , R , C# , java , Scala , DepOps , ELK
(elasticsearch, logstash , beats , kibana) , Apache
kafka , JAVA , GITLab , Jenkins , Vagran , Docker ,
kubernetes
Outils Sublime , Visual Studio , Eclipse , intellij , Rstudio ,
Spyder , Jupyter notebook , Linux
Gestion Projet Agile scrum

FORMATIONS & CERTIFICATIONS
 2020, Data stream development via spark kafka and spring-boot
 2020, Real-time-credit card fraud detection using spark scala
 2020, Python Spark et machine learning
 2020, Deep Learning (ANN , CNN , RNN , LSTM , Cartes auto-adaptives (SOM) , Machines de
Boltzmann , autoencoder)
 2020, apprendre-la-data-science-par-la-pratique-avec-python
 2019, DevOps training ( vagran , ansible , docker , Jenkins , kubernets , ELK)
 2019, Machine learning
 2019, Big Data Apache Hadoop
 2018, Analyse de données
 2018, Formateur java
 2017 data science and computational intelligence
 2016 knowledge discovery and R software

RESUME DES COMPETENCES
 Crawler les données, stocker les données , data pre- processing
 Data visualisation
 Mettre en place d’une solution ELK
 Implémenter des modèles du machine learning et deep learning
 Computer vision
 Résoudre des problèmes d’intelligence artificielle
 Tests et mise en recette des solutions.
 Rédaction des documents techniques.