Hamza - Data Analyst LINUX
Ref : 200522H001-
31100 TOULOUSE
-
Data Analyst, Data Scientist, DevOps (31 ans)
-
Totalement mobile
-
Bientôt freelance
EXPERIENCES PROFESSIONNELLES
03/2020 à 04/2020
Société
Projet
CLS TOULOUSE
Mettre en place un environnement d’analyse opérationnel des logs ELK
Rôle Ingénieur Big data
Activités réalisées ingestion les mesures de performances et de disponibilités de l’instance
établies dans le contrat avec le client (KPI) en exploitant les logs de
l’application avec logstash
Intégrer ces mesures dans un rapport mensuel exploitable et automatisé
avec KIBANA
Environnement LINUX, CloudS(infrastructure OpenStack), Docker, elasticsearch, logstsash, Kibana
05/2019 à 01/2020
Société Databiz filière d’Autobiz France
Projet Autobiz, Crawler et analyser les sites SELOGER, IMMO, VO
Rôle Ingénieur Big data
Activités réalisées
Crawler les sites des annonces dans des fichier JSON
Nettoyage et transformation des données et extraire les statistiques avec
Apache Spark puis envoyer les statistiques aux analystes
Stocker et interroger les données dans MongoDB
Stocker les données textuelles des annonces dans Elasticsearch et faire la
visualisation avec Kibana
Créer un outil qui permet de chercher un mot dans tous les pages et les
sous pages d’un site avec scrapy et Django
Environnement LINUX, SCRAPY, SELENIUM, APACHE SPARK, PYTHON, ELK, MONGODB, GITLAB,
REDMINE, DJANGO, script shell, Docker
.
11/2018 à 03/2019
Société SDI
Rôle Ingénieure Big Data
Activités réalisées Crawler les pages Facebook (poste, comment, nombre de j’aime et de
partage), les jobs sur LinkedIn, les produits sur AliExpress, Amazon, les
bibliographies des artistes (NRJ, FNAC)
Environnement LINUX, API graphe, SCRAPY, SELENIUM, APACHE SPARK, R, PYTHON, ELK,
MONGODB, GITLAB, REDMINE, DJANGO
02/2017 à 10/2018
Société TADA
Rôle
Ingènieure Big Data
Projet PLATEFORME DE RECOMMANDATION COMMERCIAL
Activités réalisées Développement d’un package de classification hiérarchique avec les
algorithmes génétiques
Développement d'une application web back office pour l'analyse et la
prédiction des comportements clients et la génération des rapports
d’analyse
Environnement RSTUDIO, RMARKDOWN, APACHE SPARK ET APACHE CASSANDRA
Projet TADA, CREER UN GENERATEUR DE PAYSAGE 3D
Activités réalisées Implémenter des algorithmes de génération de paysage 3D exploitant les
algorithmes génétiques.
Environnement RSTUDIO, R, APACHE SPARK
Projet TADA, DETECTION DES OBJETS
Activités réalisées Développer un module de détection des visages et des objets.
Développer un module de reconnaissance des visages.
Développer un module d’analyse des mouvements et suivi des objets
Environnement PYTHON, OPENCV, APPRENTISSAGE APPROFONDI, MONGODB
Projet BIN PACKING 3D
Activités réalisées Résolution du problème complexe de Bin packing 3D
Modélisation d’une soution avec WPF.
Environnement Visual Studio, C#, WPF
Projet PICKUP AND DELIVERY TEMPS REEL
Activités réalisées Résolution du problème complexe de réception de plusieurs demandes de
livraison. Le service développé permet au transporteur d’organiser ces
clients et de répondre aux nouvelles demandes en acceptant ou refusant
tout en prenant en considération le facteur date limite de livraison et la date
approximatif nécessaire pour la livraison calculer par le service tout en
prenant en considération les livraisons déjà acceptés.
Environnement RSHINY, R, RESTFUL API, PLUMBER LIBRARY, MAP API GGMAP LIBRARY
DIPLOMES & FORMATIONS
2017 Mastère Professionnel en Génie logiciel
COMPETENCES TECHNIQUES
Technologies : Machine learning , Deep learning , Apache Spark ,
Python , R , C# , java , Scala , DepOps , ELK
(elasticsearch, logstash , beats , kibana) , Apache
kafka , JAVA , GITLab , Jenkins , Vagran , Docker ,
kubernetes
Outils Sublime , Visual Studio , Eclipse , intellij , Rstudio ,
Spyder , Jupyter notebook , Linux
Gestion Projet Agile scrum
FORMATIONS & CERTIFICATIONS
2020, Data stream development via spark kafka and spring-boot
2020, Real-time-credit card fraud detection using spark scala
2020, Python Spark et machine learning
2020, Deep Learning (ANN , CNN , RNN , LSTM , Cartes auto-adaptives (SOM) , Machines de
Boltzmann , autoencoder)
2020, apprendre-la-data-science-par-la-pratique-avec-python
2019, DevOps training ( vagran , ansible , docker , Jenkins , kubernets , ELK)
2019, Machine learning
2019, Big Data Apache Hadoop
2018, Analyse de données
2018, Formateur java
2017 data science and computational intelligence
2016 knowledge discovery and R software
RESUME DES COMPETENCES
Crawler les données, stocker les données , data pre- processing
Data visualisation
Mettre en place d’une solution ELK
Implémenter des modèles du machine learning et deep learning
Computer vision
Résoudre des problèmes d’intelligence artificielle
Tests et mise en recette des solutions.
Rédaction des documents techniques.