Soufyane - Data Scientist SPLUNK
Ref : 200729I001-
95100 ARGENTEUIL
-
Data Scientist, Consultant (33 ans)
-
Freelance
EXPÉRIENCES PROFESSIONNELLES
Data Scientist
Juillet 2020-Février 2021 ½ La Défense
• Comprendre le contexte fonctionnel et métier du cas d’usage
• Identifier, analyser et modéliser les données
• Préparer les données (data engineer), statistiques descriptives,
machine learning.
• Documenter les choix de méthode et l’implémentation du modèle de
machine learning.
• Assurer le transfert de connaissances vers les équipes de
développement des use cases Big Data.
Consultant Splunk/Data Scientist
Avril 2018 – Décembre 2019 ½ Paris, France
• Développement de Dashboards,rapports et alertes.
• Déploiement de l’infrastructure de collecte des logs.
• Machine learning : développement d’algorithme pour la classification
des incidents.
• Conduite des workshops fonctionnels et techniques.
• Accompganement à l’exploitation des solutions.
Architecte Splunk/Data Scientist
BNP PARIBAS PARTNERS FOR INNOVATION
Avril 2018 – Aujourd’hui ½ Paris, France
Contexte projet: Machine learning : Développement d’algorithme pour
la classification des incidents. - Développement de rapports,alertes et
Dashboard. - Déploiement de l’infrastructure de collecte des logs -
L’industrialisation et évolution des services Splunk vers un service
serious
Mots clés: Splunk,Python, SPL,Unix, Admin SYS, BigFix, Oracle, SQL,
Prod, ansible, Git
Consultant Splunk
Orange
Janvier – Avril 2018 ½ Paris, France
Sujet: — Compréhension et reformulation
des besoins métiers pour proposition
d’analyses — Manipulation et préparation
des données pour la mise en oeuvre des
analyses statistiques avec création
d’indicateurs en langage SPL. — Réalisation
de Rapports et Tableaux de Bord. —
Recommandations de nouveaux KPI.
Mots clés: Splunk,Dashboard,
Rapport,statistques,Data,SPL,KPI
Thèse professionnelle: Data Scientist
INSA
Juin–Novembre2017½ Rouen. France
Sujet: Etude et mise en place de la méthode
du Gradient Boosting dans un cadre de
régression supervisé.— Prédire le type de
couverture forestière du parc national
Roosevelt en USA. — Comparer la méthode
du Gradient Boosting (gbm) avec les forets
aléatoires, les SVM et Deep Learning.
Mots clés: Machine learning,SVM, réseau de
neurones, Python, R, forêts aléatoires,
Régression Supervisé , Statistiques
FORMATION
Mastère spécialisé en Data Science
Institut National des Sciences Appliquées de Rouen (INSA)
2016 – 2017 ½ Rouen,France
Cours : Machine learning – Optimisation – Statistiques – Big Data
Master 2 Mathématiques et Applications parcours
probabilités et statistiques des nouvelles données
Université de Marne-la-Vallée
2015 –2016 ½ Champs-sur-Marne, France
Master 1 en Actuariat et Ingénierie Mathématique en
Assurance et Finance
Université de Rouen
2015 –2016 ½ Rouen, France
Cours : Gestion de portefeuille – Diagnostique financier – Gestion de
risque.
Master 1 Mathématiques. Faculté des Sciences et
Technologies
Université de Créteil
2013 – 2015 ½ Créteil, France
Licence Fondamentale en Mathématiques Appliquées
Université Ibn Zohr
2009 –2013 ½ Agadir, Maroc
Baccalauréat Sciences Mathématiques
Lycéen Ibn Zohr
2008 –2009 ½ Agadir, Maroc
Arabe: Maternelle
Français: Bilingue
Anglais: Intermédiaire + formation Wall
Street English (en cours)
Langages :Python, R, SQL, SPL
Big data :Splunk, Hadoop, MongoDB, Talend
CERTFICATIONS
• Certification Architecte Splunk.
• Certification Data admin Splunk.
• Python, programmation Objet (Orsys).
• Machine Learning, Méthodes et Solutions
avec Python (Orsys).
COMPÉTENCES TECHNIQUES
Machine learning Big Data
Statistques Data engineering
Splunk R Python SQL LINUX
LANGUAGES
Français ○ ○ ○ ○ ○
Anglais ○ ○ ○ ○ ○
arabe ○ ○ ○ ○ ○