Sanjiev - Développeur APACHE SPARK

Ref : 200619S001

93260 LES LILAS
Développeur, Data Analyst, Architecte (31 ans)
Totalement mobile
Bientôt freelance

Photo de Sanjiev, Développeur APACHE SPARK

Compétences

JAVA

APACHE SPARK

APACHE KAFKA

APACHE HADOOP

PYTHON

Expériences professionnelles

EXPERIENCES PROFESIONNELLES

BNP Paribas– Data Engineer — (Depuis le 08/2018)
Construire un Data Hub permettant l’acquisition de flux et de stocker de bout en bout toutes
les données relatives aux transactions bancaires : virements domestiques, virements
internationaux, prélèvement, monétique, transactions.
Participation dans différentes phases du projet depuis la définition de l’architecture technique,
la qualification des exigences techniques basées sur des User Stories, à la réalisation ainsi
qu’au suivi de développements de l’équipe.
• Caractériser des solutions techniques à la fois transverse et propres aux users stories.
• Prédéfinir l’architecture de la gestion des flux de données.
• Conceptions et développements d’une application de type Extract-transform-load
(ETL), gérant principalement les processus d’ingestion, manipulation (Spark), mises en
correspondances (mappage) des données et exposition des données.
• Ingestion de données (Serveur de collecte, MQSeries, Kafka Connect, Kafka)
• Enrichissement des données (Flink)
• Indexation des données (Elasticsearch)
• Exposition des données (Topic Kafka, Hive, Kibana, Angular)
• Stockages et extraction des données (Cassandra, HDFS, Spark)
• Revue de code et vérification des métriques (Jenkins, Sonar) afin d’assurer la qualité
du code.
• Mise en place de documents techniques et de bonnes pratiques en ligne, à disposition
des équipes et nouveaux arrivants (Confluence).
Environnement technique : JAVA 8, Maven 3.6.3, Jenkins, sonarQube, Jira, Git, GitLab, Nexus
repository, Distribution Hortonworks d’Hadoop, MQSeries, Kafka,
Kafka Connect, Spark, Flink, ElasticSearch, Kibana, Swagger, Mokito,
JUnit.

Bosch– Data Analyst — (Janvier 2018 – Juin 2018)
Au sein du pôle IoT Analytics, suite à la mise en place des fonctionnalités contrôle moteur des
véhicules automobiles, différents rapports de qualité du code sont générés. Ce projet avait
pour but d’analyser ces rapports issus de la chaîne d’intégration continue afin de détecter les
erreurs de codage en amont.
● Conception et déploiement d’une architecture distribuée de traitement de données Big Data
(Hadoop, Sqoop, Spark, R/RStudio)
● Analyse des Rapports de Qualité du code (R, Spark)
● Visualisation des données (Power BI)
Environnement technique : Python, Hadoop, MySQL, Sqoop, Spark, R/RStudio, Power BI

• UNIVERSITY OF NEVADA, Las Vegas, États-Unis – Data Mining — (Mai 2017 – Août 2017)
Au sein du Centre de Développement et Recherche de l’University of Nevada, analyser des
habitudes de vie, les moyens de transport utilisés par les habitants de Los Angeles & les causes
des accidents de la route.
● Ingestion de données et nettoyage des données (CSV),
● Réalisation des analyses descriptives et prédictives (R/RStudio Server)
● Machine Learning : segmentation, clustering, modèles de régressions logistiques dans le but
de prédire le temps de travail des Angelenos
● Visualisation des données (ggplot2)
Environnement technique : R/RStudio Server, ggplot2

Études et formations

COMPETENCES

Compétences techniques
Systèmes Windows, Linux, Unix
Programmation Java (JDK 1.8), Python, SQL, HQL, CQL,
Bash
Serveurs Red Hat Enterprise Linux 8.0,
WebSphere 8.1
Big Data Spark, Hadoop, HDFS, Kafka, Flink,
Elasticsearch
Méthodologie AGILE, SCRUM, KANBAN, JIRA
SGBD/NoSQL MySQL, PostgreSQL, MongoDB
Intégration Continue Jenkins, sonarQube
Versionning GIT, GitLab, Nexus repository,
Confluence
IDE IntelliJ, Eclipse, Jupyter Notebook,
RStudio
Monitoring Kibana
Middleware IBM MQSeries 8.0
Banque Bonne connaissance de SWIFT, SEPA et
moyens de paiements (SCT/SDD)
Autre Bonne connaissance des formats de
données
(Cobol, SWIFT MT Message, Xml, Flat File, Csv,
Json, Avro)

Compétences

Programmations : JAVA, Python, R
Soft Skills : Prise de décision, la communication, la gestion du
stress, le sens du collectif, la curiosité, la vision
Environnement technique
Hadoop, Kibana, Elasticsearch, Spark, Flink, Kafka
Secteurs d’activités
Banque – Cash Management: BNP
Industrie: Bosch
Université - R&D: UNIVERSITY OF NEVADA, Las Vegas, États-Unis
Langues
Anglais : niveau professionnel
Français : langue maternelle
Tamoul : Langue maternelle

FORMATIONS ET CERTIFICATIONS
2018 ESIEE PARIS - Ingénieur Big Data, Réseaux et Internet des Objets
(Noisy-Le-Grand)
2014 Lycée Paul Eluard - CPGE ATS Ingénierie Industrielle (Seine-SaintDenis)
• Certificat « High Advanced II », Juin 2016 Canada
• Certificat Voltaire, Décembre 2016
• TOEIC 790/ 990, Janvier 2017