Loucif - Data Analyst APACHE SPARK

Ref : 200312M001
Photo de Loucif, Data Analyst APACHE SPARK
Compétences
Expériences professionnelles
  • EXPÉRIENCES PROFESSIONNELLES

    Data Analyst
    Enedis
    Janvier 2019 - Aujourd'hui
    Conception et développement d'une solution BI sur une plateforme Big Data pour le calcul
    d'indicateurs de suivi d'activité d'Enedis
    Analyse des besoins fonctionnels
    Participation aux choix d'architecture technico-fonctionnelle
    Création d'un socle projet (GIT, Suivi des traitements applicatifs)
    Développement d'un moteur de calcul d'indicateurs paramétrable
    Développement d'un moteur de contrôle pour vérifier la qualité des flux
    Moteur d'ingestion pour ingérer tous types de sources du datalake (streaming/batch,
    avro/csv/json), ainsi que transformer/nettoyer les données
    Développement d'extractions depuis des bases de données relationnelles vers le datalake
    Développement d'un producer Kafka pour transmission d'un flux en temps réel
    Développement d'un consumer Kafka pour ingestion d'un flux en temps réel
    Pilotage et monitoring des flux
    Technos : PySpark, Kafka, Shell, SQL, Sqoop, Hbase, Hive

    Data Scientist
    RTE
    Avril 2018 - Septembre 2018
    Développement d'algorithmes de machine learning et training en distribué via sparkML dans
    le but de détecter de la rouille à partir d'images de pylônes électriques
    Utilisation d'algorithmes de machine learning de façon distribuée
    Prétraitements avec Spark
    Travail en autonomie
    Évaluation des modèles en distribué
    Rédaction de compte-rendus d'analyse
    Expérimentations sur les réseaux neuronaux (CNN,LSTM)
    Technos : PySpark, Scala (SparkML), Cloudera, Python

    Data Miner
    Télécom Nancy pour myXtramile
    Novembre 2017 (une semaine)
    Optimisation budgétaire et qualitative de la diffusion d’offres d’emploi pour les campagnes de
    recrutement. Sujet ouvert, méthode de résolution choisie en trois étapes : segmentation des
    offres d'emploi, détermination des meilleurs canaux de diffusion pour chaque segment et
    enfin calcul d'une métrique pour évaluer le coût par clic d'une offre

    Force de proposition sur un sujet ouvert
    Travail en groupe de 3 sur une semaine intense
    Utilisation d'algorithmes de clustering (K-means, HAC, HDBScan)
    Prétraitements sur des données textuelles (n-grams, tf-idf,pos_tagger, stemmer)
    Développement d'algorithme de calcul du coût par clic
    Esprit critique sur le travail réalisé et proposition de pistes d'amélioration
    Technos : Python

    Data Engineer
    Télécom Nancy
    Avril 2017 - Septembre 2017
    Développement d'un système d'intégration de données biomédicales à partir de sources
    hétérogènes (MySQL, Orphadata, HPO, OMIM, SIDER) dans le but de proposer à un utilisateur
    de rechercher une maladie ou des symptômes et d'obtenir les traitements associés ainsi que
    les effets secondaires.

    Analyse des bases hétérogènes
    Création d'un mapping entre toutes les sources
    Développement d'un algorithme intégrateur suivant le mapping
    Optimisation des temps de traitement sur les requêtes (indexation, parallélisation)
    Création d'une interface graphique utilisateur
    Technos : Java


Études et formations
  • COMPÉTENCES
    Big data : Spark, Kafka, écosystème Hadoop (HDFS, YARN, Sqoop, Hive, Hbase, Pig... )
    Plateforme big data : Hortonworks, Cloudera
    Langages : Python, Scala, Java, R, SQL, Shell
    Gestion de version : Git, Gitlab
    Machine Learning : Supervisé (Random Forest, xgboost...), Non supervisé (KNN, K-means...)
    Deep Learning : CNN, RNN, LSTM
    Méthodologies : Scrum, Agile

    FORMATION
    2016-2017 : École d'ingénieur informatique - Télécom Nancy
    2014-2015 : Classe préparatoire MPSI/MP - Lycée Dupuy de Lôme à Lorient
    2013 : Bac S mention très bien

D'autres freelances
Data Analyst APACHE SPARK

Ces profils pourraient vous intéresser !
CV Data Engineer APACHE SPARK
Kayetan

Data Engineer APACHE SPARK

  • CHOISY-LE-ROI
APACHE SPARK SCALA SQL MAVEN PYTHON Cloud AWS DEVOPS DOCKER Github APACHE HIVE
Disponible
CV Consultant Data
Ababacar

Consultant Data

  • PARIS
SQL APACHE SPARK PYTHON APACHE HADOOP BIG DATA DATA Microsoft Power BI AZURE SCALA
Bientôt disponible
CV Data Analyst | Ingénieur PLM
John Wilfred

Data Analyst | Ingénieur PLM

  • LE CHESNAY
PYTHON APACHE SPARK SQL Microsoft Power BI DATA APACHE HADOOP POSTGRESQL BIG DATA JAVA SCALA
Disponible
CV Data Analyst & Data Engineer
Ali

Data Analyst & Data Engineer

  • FRANCONVILLE
Microsoft Power BI SQL SQL SERVER DATA AZURE APACHE SPARK PYTHON SSAS TABLEAU SOFTWARE BUSINESS OBJECTS
Disponible
CV Data Scientist APACHE SPARK
Meher

Data Scientist APACHE SPARK

  • CHEVILLY-LARUE
APACHE SPARK APACHE KAFKA
Disponible
CV Data Scientist | Analyste | ML Ingenieur PYTHON
Mohamed

Data Scientist | Analyste | ML Ingenieur PYTHON

  • MONTREUIL
PYTHON SQL DATA Microsoft Power BI EXCEL APACHE SPARK Google Cloud Platform UML APACHE HADOOP
Disponible
CV Consultant Data
Boubaker

Consultant Data

  • PARIS
PYTHON APACHE HADOOP APACHE SPARK APACHE KAFKA JAVA SQL Cloud AWS LINUX SCALA Data science
Disponible
CV Data Scientist SAS
Yassir

Data Scientist SAS

  • STRASBOURG
SAS SQL PYTHON Microsoft Power BI DATA SCALA APACHE SPARK JAVA BIG DATA EXCEL
CV Data Scientist DATA
Ahlem

Data Scientist DATA

  • LA PLAINE-SAINT-DENIS
PYTHON EXCEL DATA SQL Microsoft Power BI APACHE SPARK SAS BI AZURE TALEND
Disponible
CV Data Analyst , Data Ingénieur,Data Architecte
Gnankoye

Data Analyst , Data Ingénieur,Data Architecte

  • MONTREUIL
AZURE Cloudera PYSPARK APACHE SPARK PYTHON SQL SERVER POSTGRESQL APACHE HADOOP SQL MYSQL
Disponible