Sanjiev - Développeur APACHE SPARK

Ref : 200619S001
Photo de Sanjiev, Développeur APACHE SPARK
Compétences
APACHE KAFKA
APACHE HADOOP
Expériences professionnelles
  • EXPERIENCES PROFESIONNELLES

    BNP Paribas– Data Engineer — (Depuis le 08/2018)
    Construire un Data Hub permettant l’acquisition de flux et de stocker de bout en bout toutes
    les données relatives aux transactions bancaires : virements domestiques, virements
    internationaux, prélèvement, monétique, transactions.
    Participation dans différentes phases du projet depuis la définition de l’architecture technique,
    la qualification des exigences techniques basées sur des User Stories, à la réalisation ainsi
    qu’au suivi de développements de l’équipe.
    • Caractériser des solutions techniques à la fois transverse et propres aux users stories.
    • Prédéfinir l’architecture de la gestion des flux de données.
    • Conceptions et développements d’une application de type Extract-transform-load
    (ETL), gérant principalement les processus d’ingestion, manipulation (Spark), mises en
    correspondances (mappage) des données et exposition des données.
    • Ingestion de données (Serveur de collecte, MQSeries, Kafka Connect, Kafka)
    • Enrichissement des données (Flink)
    • Indexation des données (Elasticsearch)
    • Exposition des données (Topic Kafka, Hive, Kibana, Angular)
    • Stockages et extraction des données (Cassandra, HDFS, Spark)
    • Revue de code et vérification des métriques (Jenkins, Sonar) afin d’assurer la qualité
    du code.
    • Mise en place de documents techniques et de bonnes pratiques en ligne, à disposition
    des équipes et nouveaux arrivants (Confluence).
    Environnement technique : JAVA 8, Maven 3.6.3, Jenkins, sonarQube, Jira, Git, GitLab, Nexus
    repository, Distribution Hortonworks d’Hadoop, MQSeries, Kafka,
    Kafka Connect, Spark, Flink, ElasticSearch, Kibana, Swagger, Mokito,
    JUnit.

    Bosch– Data Analyst — (Janvier 2018 – Juin 2018)
    Au sein du pôle IoT Analytics, suite à la mise en place des fonctionnalités contrôle moteur des
    véhicules automobiles, différents rapports de qualité du code sont générés. Ce projet avait
    pour but d’analyser ces rapports issus de la chaîne d’intégration continue afin de détecter les
    erreurs de codage en amont.
    ● Conception et déploiement d’une architecture distribuée de traitement de données Big Data
    (Hadoop, Sqoop, Spark, R/RStudio)
    ● Analyse des Rapports de Qualité du code (R, Spark)
    ● Visualisation des données (Power BI)
    Environnement technique : Python, Hadoop, MySQL, Sqoop, Spark, R/RStudio, Power BI

    • UNIVERSITY OF NEVADA, Las Vegas, États-Unis – Data Mining — (Mai 2017 – Août 2017)
    Au sein du Centre de Développement et Recherche de l’University of Nevada, analyser des
    habitudes de vie, les moyens de transport utilisés par les habitants de Los Angeles & les causes
    des accidents de la route.
    ● Ingestion de données et nettoyage des données (CSV),
    ● Réalisation des analyses descriptives et prédictives (R/RStudio Server)
    ● Machine Learning : segmentation, clustering, modèles de régressions logistiques dans le but
    de prédire le temps de travail des Angelenos
    ● Visualisation des données (ggplot2)
    Environnement technique : R/RStudio Server, ggplot2

Études et formations
  • COMPETENCES

    Compétences techniques
    Systèmes Windows, Linux, Unix
    Programmation Java (JDK 1.8), Python, SQL, HQL, CQL,
    Bash
    Serveurs Red Hat Enterprise Linux 8.0,
    WebSphere 8.1
    Big Data Spark, Hadoop, HDFS, Kafka, Flink,
    Elasticsearch
    Méthodologie AGILE, SCRUM, KANBAN, JIRA
    SGBD/NoSQL MySQL, PostgreSQL, MongoDB
    Intégration Continue Jenkins, sonarQube
    Versionning GIT, GitLab, Nexus repository,
    Confluence
    IDE IntelliJ, Eclipse, Jupyter Notebook,
    RStudio
    Monitoring Kibana
    Middleware IBM MQSeries 8.0
    Banque Bonne connaissance de SWIFT, SEPA et
    moyens de paiements (SCT/SDD)
    Autre Bonne connaissance des formats de
    données
    (Cobol, SWIFT MT Message, Xml, Flat File, Csv,
    Json, Avro)

    Compétences

    Programmations : JAVA, Python, R
    Soft Skills : Prise de décision, la communication, la gestion du
    stress, le sens du collectif, la curiosité, la vision
    Environnement technique
    Hadoop, Kibana, Elasticsearch, Spark, Flink, Kafka
    Secteurs d’activités
    Banque – Cash Management: BNP
    Industrie: Bosch
    Université - R&D: UNIVERSITY OF NEVADA, Las Vegas, États-Unis
    Langues
    Anglais : niveau professionnel
    Français : langue maternelle
    Tamoul : Langue maternelle

    FORMATIONS ET CERTIFICATIONS
    2018 ESIEE PARIS - Ingénieur Big Data, Réseaux et Internet des Objets
    (Noisy-Le-Grand)
    2014 Lycée Paul Eluard - CPGE ATS Ingénierie Industrielle (Seine-SaintDenis)
    • Certificat « High Advanced II », Juin 2016 Canada
    • Certificat Voltaire, Décembre 2016
    • TOEIC 790/ 990, Janvier 2017

D'autres freelances
Développeur APACHE SPARK

Ces profils pourraient vous intéresser !
CV Senior Data Engineer and Scientist NLP
Stefano

Senior Data Engineer and Scientist NLP

  • ANTIBES
BIG DATA SQL APACHE SPARK DATA PYTHON SCALA JAVA
Disponible
CV Data engineer senior | certified gcp
Ousmane

Data engineer senior | certified gcp

  • BRY-SUR-MARNE
APACHE SPARK APACHE HADOOP Google Cloud Platform
Disponible
CV Data Engineer | Developpeur Big Data
Mounir

Data Engineer | Developpeur Big Data

  • CHÂTENAY-MALABRY
APACHE SPARK SQL BIG DATA APACHE HADOOP SCALA JAVA PYTHON APACHE KAFKA NoSQL Cloudera
Disponible
CV Ingénieur de développement JAVA et BIG DATA
Hakim

Ingénieur de développement JAVA et BIG DATA

  • SAINT-GERMAIN-EN-LAYE
JAVA APACHE SPARK SQL Kubernetes DOCKER SPRING BIG DATA APACHE KAFKA Microservices SCALA
Disponible
CV Consultant QA / INTÉGRATION
Patrick

Consultant QA / INTÉGRATION

  • LIMEIL-BRÉVANNES
SCRIPT SHELL JIRA CASH MANAGEMENT JENKINS GIT APACHE SPARK APACHE KAFKA Cloud AWS TEST DIRECTOR CASSANDRA
CV Data Engineer
Arfang

Data Engineer

  • PARIS
APACHE SPARK PYSPARK APACHE HIVE Cloudera BASH POSTGRESQL JENKINS Cloud AWS AZURE DOCKER
CV Data Engineer / DevOps
F

Data Engineer / DevOps

  • PARIS
JAVA SCALA ELASTICSEARCH APACHE SPARK AZURE REDHAT OPENSHIFT
CV Data Scientist DATA
Ahlem

Data Scientist DATA

  • LA PLAINE-SAINT-DENIS
PYTHON EXCEL DATA SQL Microsoft Power BI APACHE SPARK SAS BI AZURE TALEND
Disponible
CV Consultant  Data engineer & Backend
Diakaridia

Consultant Data engineer & Backend

  • VERTOU
APACHE SPARK APACHE KAFKA BIG DATA Kotlin SCALA JAVA AGILE Spring Boot AMAZON EMR SPRING WEBFLUX
CV Ingénieur de développement SPARK
Abderrahmane

Ingénieur de développement SPARK

  • MASSY
SQL APACHE SPARK PYSPARK SCALA APACHE HIVE APACHE KAFKA APACHE SOLR JAVA