Takoua - Data Scientist TALEND
Ref : 200709K001-
94140 ALFORTVILLE
-
Data Scientist (37 ans)
-
Totalement mobile
-
En portage salarial
EXPERIENCES PROFESSIONNELLES
Aout 2018 – Jan 2020 GED
Rôle Data Engineer/Data Scientist
Projet Big Data Smart storage Tiering
Réalisations
- Mise en place d'un flux de données scalable (Spark-Cassandra -Connector)
- Traitement des données en Batch (spark-core/spark sql)
- Indexation et visualisation (ElasticSearch/kibana).
- Valorisation des données en proposant une approche de Prédiction/classification Hot/Cold
des données via du machine Learning ( multi-modeling Réseaux de Neurones Récurrents)
-
Environnement technique : Spark 2.3.2 (sql, mllib), Scala2.11, Cassandra2.1.2 , ElasticSearch6.4.0,
Kibana6.4.0
Mars 2018 – Juil 2018 SEPHORA
Rôle Data Engineer/Architecte
Projet Vision 360
Réalisations
- Mise en place d'une architecture Big data scalable (Lambda, Hortonworks).
- Intégration des données (Filebeat, Logstash, Kafka, Talend).
- Traitement des données en Batch (Spark et Talend) et en temps réel (Spark streaming).
- Croisement et Enrichissement des données dans HDFS (Talend BD).
- Indexation et recherche (ElasticSearch).
- Agrégation et Analyse des données (Hive, Hbase).
- Data Visualization (Tableau Software, Kibana).
- Dimensionnement du cluster.
Environnement technique : Hortonworks (Ambari), Spark, Talend
Jan 2016 – Déc 2017 ICM
Rôle Ingénieur R&D Data Analyst - Data scientist
Projet Croisement des données hétérogènes dans un contexte clinique.
Réalisations
- Recalage et mise en correspondance des données
- Détection automatique
- Classification automatique des données
Environnement technique : Linux : Centos, shell, C++ (itk, vtk), imageJ
Septembre 2012 – Décembre 2015 CATI
Rôle Doctorante en Neuro-Informatique
Projet Détection automatique et analyse des micro saignements cérébraux :
application à larges données multicentriques.
Réalisations
- Développement d’un nouvel outil de caractérisation des micro-saignements cérébraux sur
des images de phase IRM.
- Développement d’une nouvelle méthode de segmentation automatique utilisant des
algorithmes de « machine Learning ».
- Encadrement : stage M2, Evaluation des méthodes de résolution d’un problème inverse
dans le contexte d’imagerie quantitative.
- Rédaction des rapports scientifiques et des articles de journaux(2) et de congrès
internationaux avec comité de lecture (4).
Environnement technique : Linux, Ubuntu, R, shell, python, matlab SPM, FSL, Brainvisa, Anatomist.
Sept 2012 – Sept 2014 IFTLM
Rôle Enseignante principale de physique
Projet TP/TD et cours de physique fondamentale
Réalisations
- Instruments de mesure. Précisions. Calculs d’erreurs.
- Etats de la matière.
- États gazeux. Gaz parfaits. Gaz réel
- Statique fluide
- Dynamisme fluide parfait
- Dynamique fluide réel
- Réflexion, miroir, réfraction
- Optique
- Lentilles, œil, microscope
- Nature de la lumière
- Polarisation
Avr 2012 – Sept 2012 ARAMIS-ICM
Rôle Stagiaire
Projet La fonction de symétrie radiale pour la segmentation automatique des
lésions sphérique cérébraux
Réalisations
- Extraction des descripteurs de formes et d’intensité
- Prétraitement des données
Environnement technique : Shell, Matlab, Anatomist.
Fév 2011 – Juil 2011 IR4M/ UPsud 11
Rôle Stagiaire
Projet La quantification de l’eau au niveau de l’os cortical
Réalisations
- Segmentation de l’os cortical
- Quantification de l’eau
Environnement technique : Matlab
Mars 2010 – Juil 2010 Centre TEP Purpan Toulouse
Rôle Stagiaire
Projet Etude statistique sur les doses reçues lors des interventions sur le cyclotron et les
différentes phases de production des molécules marquées au fluor 18.
DOMAINES DE COMPETENCES
Outil de programmation Spark scala, Shell, C++, ITK/ VTK, Qt, CMAKE, Matlab,
Python, Image J
Méthode AGILE Scrum, Trello
DevOps Ansible, Gitlab, Jenkins, Maven, Nexus
Ecosystem HADOOP HDFS, Hortonworks (Hive, Ambari, Ranger), Cloudera
(Hive, Hue)
Ecosystem SPARK Spark, Spark streaming
Data integration Talend, Logstash, sqoop
Broker KAFKA Producer, Topic, Consumer
Base de données NoSQL Hbase
Ecosystem ELASTIC ELK (Filebeat, Logstash, Elasticsearch, Kibana)
Data visualization Tableau Software, Kibana
Analyse Neuro-informatique SPM, FSL, Brainvisa, Anatomist
Outils d’analyse statistique R, Statistica, Matlab
FORMATIONS et CERTIFICATIONS
2018 Formation Big Data
FITEC
2012-2015 Docteur en Neuroinformatique
Université Pierre et Marie
Curie
2014 Certification statistique en R
UPMC
2011-2012 Master 2 - Recherche
Informatique, traitement
d’image
Télécom Paris Tech
2010-2011 Master 2 - Recherche
Physique
Université Paris Descartes
2008-2010 Ingénierie Diagnostic,
instrumentation et mesure
Université Paul Sabatier
2005-2008 Licence appliquée en Imagerie
École Supérieure des Sciences -
Tunis.
2005 Baccalauréat Sciences
Lycée El Wafa - Tunis