Chiheb - Data Scientist PYTHON

Ref : 190628K001

Compétences

JAVA

PYTHON

APACHE HADOOP

HDFS

SCALA

TABLEAU SOFTWARE

APACHE SPARK

APACHE KAFKA

Microsoft Power BI

Expériences professionnelles

OCT 2018 – AVRIL 2019
DATA SCIENTIST & BIGDATA DEV.
SMART TECHNOLOGY
 Développement d’un outil de Web Scrapping des profils de consultants
 Chargement des données dans une base de données SQL
 Environnements : Python3.6, BeautifulSoup, Selenium, MySQL
 Développement d’un Workflow d’extraction des tweets en temps réel
 Analyse sentimental des tweets
 Développement d’une Application de Dashboarding R Shiny
 Conteneurisation de l’application avec Docker
 Environnements : R, shiny, Python3.6, MongoDB, Docker, DockerHub
 Configuration et développement d’un Workflow de Streaming Environnements : Apache Kafka, Docker, DockerHub
 Prototypage d’un système de recommandation des achats
 Environnements : Python3.6, apriori, redis

MAR 2018 – SEP 2018
DATA SCIENTIST
ADSERVIO
 Création d’un système de recommandation des consultants à des missions
 Développement d’un système proactif de proposition de formation
 Développement d’un modèle de proposition d’un plan de recrutement.
 Migration des données de SQL à la base neo4j (orienté document)
avec des interfaces de visualisation en temps réel.
 Environnements: Python3.6, plotly Dash, Flask, pandas, nltk, tf-idf, text-mining, LSA, SVD.

JAN 2018 – FEV 2018 JUNIOR DATA SCIENTIST
RATP
 Preuves de concept (POC)
 Détermination des itinéraires principaux des bus depuis les données de géolocalisation.
 Identification des itinéraires d’aller/retour.
 Identification des itinéraires déviés.
 Détermination des chemins principaux des bus.
 Lissage spatio-temporel des itinéraires en cas des captures manquantes.

DEC 2017 – JAN 2018
JUNIOR DATA SCIENTIST
KAGGLE
 Prédiction des prix de ventes des produits sur Mercari (entreprise japonaise) en se basant sur la description du produit.
 Analyse sentimental des descriptions des produits et études des corrélations avec la cible.
 Environnements : Python3.6, pandas, nltk, text-mining, Régression.

JANV 2017 – DEC 2017
JUNIOR DATA SCIENTIST
BARAC
 Création d’un modèle de prédiction, RandomForest, des cyber-attaques en se basant sur les métadonnées de l’entête IP enregistrés sur HBase via Apache Phoenix avec une précision de 99.97%.
 Détection des anomalies de flux HTTP et HTTPS.
 Création d’un modèle de détection des masquarades sur le système avec les chaines de markov.
 Déploiement des modèles sur Horton Works (Microsoft Azure) pour des
prédictions en temps réel dans l’environnement : Kafka, Storm, Rsyslog, Phoenix, HBase
 Analyse Comportementale des hackers.
 Test et maintenance du modèle sur l’architecture HortonWorks

 Environnements : Python2.7, pandas, numpy, sklearn, Random Forest,
HortonWorks, Redis, HBase, Apache Kafka, Apache Phoenix, Apache
Storm, Rsyslog, Hidden Markov Chain, Apache Ambari

JUIN 2016 – SEP 2016
JUNIOR DATA ANALYST
TARGA CONSULT
 Conception du Data Warehouse
 Création d’un ETL à partir des données existantes vers PostgreSQL avec Talend Data Integration.
 Création d’un Cube d’analyse sur icCube Server
 Réalisation du Tableau de bord sur Tableau Software
 Prédiction des chiffres futur de l’Entreprise
 Environnements : R , PostgreSQL, Tableau Software, Talend DI, icCube Server

Études et formations

Profil
2.5 ans d’expérience
Développeur Data Science, Big Data,
R, Python, NoSQL, Ecosystème Hadoop, Scala, Spark, ...

Compétences fonctionnelles
- NLP, Text Mining, Sequence Mining.
- Création des systèmes de recommandation.
- Analyse statistiques des données.
- Reporting.
- Conception DataLake.
- Prédiction/Classification/Segmentation/Analyse Factorielle.
- Real-Time Data Engineering.

Compétences techniques
DÉVELOPPEMENT
Python 2.7/3.6 (pandas, numpy, scipy, sklearn, matplotlib, plotly, Dash, Flask, re, networkX)
R (shiny, dplyr, ggplot2, FactoMineR, …)
Java 8, Scala 2

BASE DE DONNÉES
SQL : Oracle, MySQL, Postgresql, MS SQL Server
NoSQL : HBase, Neo4j, Redis, MongoDB, Hive

BIG DATA
Eco-système Hadoop : Apache (Kafka, Storm, Spark, Sqoop, Hive, Pig, Phoenix),
Management : Cloudera Manager, Apache Ambari
HDFS 2
YARN 2
Distributions : Cloudera, Hortonworks

BI
Microsoft BI : SSIS, SSAS, SSRS
PowerBI
Talend
Tableau Software
SAP Crystal Reports

CONTENEURISATION/VIRTUALISATION
Docker
Vmware, VirtualBox

Formations
Certification (en cours) CCA Spark and Hadoop Developer (CCA175)

DIPLÔME D’INGENIEUR | ESPRIT | 2014 – 2018 - BI/Data Science
Diplôme d’ingénieur en informatique spécialité BI/DataScience à l’École supérieure privée d'ingénierie et de technologie.

ÉCOLE PREPARATOIRE MP | IPEIEM |2011- 2014 – Mathématiques – Physique
Concours d’accès aux écoles d’ingénieurs

Langues
Anglais : bon niveau, technique

D'autres freelances
Data Scientist PYTHON

Ces profils pourraient vous intéresser !

Formateur PYTHON

TOULOUSE

PYTHON JAVA SQL HTML WORDPRESS EXCEL CSS JAVASCRIPT VISUAL BASIC PHP

Disponible

Data Scientist

MARSEILLE

Google Cloud Platform PYTHON DATA Data science EXCEL SQL BIG DATA

Bientôt disponible

Data Engineer/scientist

VILLIERS-SUR-MARNE

PYTHON DATA SQL APACHE SPARK Data science APACHE HADOOP Google Cloud Platform

Disponible

Data Analyst Microsoft Power BI

VILLEURBANNE

Microsoft Power BI PYTHON EXCEL JIRA SCRUM DATA SQL MICROSOFT POWER AUTOMATE

Senior Data Engineer and Scientist NLP

ANTIBES

BIG DATA SQL APACHE SPARK DATA PYTHON SCALA JAVA

Disponible

Ingénieur IT Data/IA

BORDEAUX

SQL PYTHON DATA EXCEL Google Cloud Platform JAVASCRIPT

Disponible

Ingénieur en Data et IA

CHAMPS-SUR-MARNE

PYTHON Microsoft Power BI SQL EXCEL AZURE PYSPARK JAVA C# PHP .NET

Disponible

Etudiant

CALAIS

JAVA PYTHON C R REACT.JS DATA WEBDEV INFORMATICA SQL MONGODB

Disponible

Data Scientist

PARIS

PYTHON SQL SCRUM DATA Microsoft Power BI AGILE DOCKER NODE.JS C# JIRA

Disponible

Machine learning engineer

PALAISEAU

PYTHON DATA C++

Disponible

Mme

Prénom ^*

Nom ^*

Email ^*

Téléphone ^*

Ville ^*

Avez-vous trouvé une mission ? ^*

J'accepte d'être contacté par nos partenaires, experts en portage salarial

Domaines d'expertise liés

CV en rapport

Chiheb - Data Scientist PYTHON

78290 CROISSY SUR SEINE

Data Scientist (31 ans)