Fares - Data Engineer

Ref : 221020S002

Profil

Data Analyst (30 ans)
Domicile

94320 THIAIS (Tunisie)
Tarif Journalier Moyen
Voir le tarif

Compétences

Apache Spark

Scala

Azure

Cloudera

Apache Kafka

SQL

Apache Hadoop

Expériences professionnelles

Ingénieur Big Data

Boursorama
juin 2021 - aujourd'hui
Contexte du projet : Développement des jobs temps réel et des tests unitaires et la
mise en place des scénarios métier ainsi que la Conception et la migration des
scénarios de conformité métier.
Tâches effectuées :
• Benchmarking et application de l’allocation dynamique sur Zeppelin pour
optimiser l’utilisation des ressources.
• Développement d’un job temps réel afin de valoriser des données Kafka dans des
tables Cassandra après traitements.
• Développement des tests unitaires.
• Développement d’un job Spark en Python afin d’appliquer les règles métier et le
déployer sur Jenkins.
• Migration des scénarios de conformité afin d’optimiser la qualité des alertes par
une méthode intelligente Machine Learning.
• Conception des tables et la solution à appliquer (les tables référentiels, tables
agrégations …).
• Compréhension des règles métiers et les sources des données à utiliser.
• Développement d’un job Spark en scala générique configurable pour les 23
scénarios métier.
• Réalisation d’une phase recette avec les métiers.
• Participation à la création d’un process NIFI pour envoyer les alertes générées à
Oxygéné.
• Documentation des règles métier et les choix technique sur Confluence.
• Participation à la création des taches Jira.
Environnement technique : Hadoop, Kafka, Spark, Scala, Pyspark, Hive, Cassandra, Nifi, Intellij (SBT), Jenkins
Ingénieur Big Data – Azure Cloud

Orange
janvier 2019 - juin 2021
Contexte du projet : Migration d’une base de données oracle ainsi que plus de 30 jobs
et 100 rapports de sending vers une plateforme Big data Azure.
Tâches effectuées :
• Etude et compréhension des différentes problématiques relatives aux différents use
cases, compréhension et mesure des enjeux métier.
• Benchmarking des différentes solutions relatives à chaque use case.
• Développement de jobs (Processor Group) de collection de données par Nifi en
les stockant dans Datalake Storage GEN2.
• Traitements des flux des données en déployant un job Template Spark sur
Databricks (Scala).
• Développement de jobs Spark Scala sur Databricks afin de migrer les différents
rapports de sending à partir de l’ancienne solution.
• Optimisation de code spark afin de garantir des performances optimales.
• Définition du dimensionnement adéquat à chaque job selon les différentes
ressources demandées.
• Développement d’un Job spark scala en temps réel afin de valoriser les données
gestionner via Event Hub dans une base de données Cosmos
• Réalisation d’une phase de recette des différents jobs via des requêtes SQL en
effectuant une étude comparative avec l’ancienne solution afin de vérifier
l’intégrité des données.
• Planification et ordonnancement des services avec Data Factory.
• Pilotage des opérations de maintenance corrective et évolutive et Monitoring
des différents jobs via des alertes et envoi de mails.
Environnement technique : Azure, Spark Databricks, Scala, Cosmos, Data Factory, Nifi, Event Hub,Datalake Storage Gen2.
Ingénieur Data

Sofrecom
juin 2018 - janvier 2019
Contexte du projet : Mis en place d’un système de prédiction permettant d’anticiper
la saturation d’appels dans un centre de contact et garantir une expérience client
optimale.
Tâches effectuées :
• Animation de workshops avec l’équipe métier pour le recueil des besoins et la
rédaction des spécifications fonctionnelles.
• Recueil du besoin technique et étude des choix technologiques possibles.
• Définition des différents KPIs et indicateurs en se basant sur une étude statistique
unidimensionnelle et bidimensionnelle et validation avec les managers.
• Extraction de la donnée d’une base de données SQL vers l’infrastructure Hadoop
via Sqoop.
• Nettoyage, analyse et exploration des données afin de construire un modèle
optimal
• Réalisation d’études statistiques unidimensionnelles et bidimensionnelles afin de
définir la distribution des datasets
• Benchmarking et évaluation des performances de 3 modèles de régression
(arbre de décision, foret aléatoire, XGBoost)
• Définition des différentes classes de tenant FCC « Clustering ».
• Prédiction du nombre d’appel par service (Régression) afin d’anticiper une
éventuelle saturation et afin de garantir une expérience client optimale
• Développement des différents dashboards sous PowerBI Afin de mettre en valeur
les résultats obtenus.
Environnement technique : VMware (Cloudera), Spark, Pyspark ,HDFS, SQLserver, Sqoop, PowerBI, Clustering (Kmeans), Régression (arbre de décision, foret aléatoire, XGBoost)

Études et formations

Diplôme d'ingénieur en Big Data –

ESC (membre institut mine Télécoms)
2018
Diplôme d’étude universitaire du premier cycle

39/1500 (Diplôme des classes préparatoires).
2015

Autres compétences

Expertise technique
â Big DATA: Hadoop, Spark (Scala & Python), Spark Structured Streaming, Spark
Streaming, Kafka, Nifi, HDFS, Event Hub, Databricks, Hive, Cosmos, Datalake
Storage Gen2, HUE.
â Langages de Programmation : Scala, Python.
â Outils de développement : Intellij(SBT,Maven),Spyder, Jupyter…
â Méthodologies : Méthodes Agiles, Scrum,Jira.
â Base de données : Hbase, SQL,Oracle, Datalake Storage Gen2, Cosmos.

Recommandations reçues

Recommander Fares

Fares n'a pas encore reçu de recommandations.

D'autres freelances
Data Analyst Apache Spark

Ces profils pourraient vous intéresser !

Expert data

MONTLIGNON

SQL Data DataStage TIBCO Spotfire Apache Spark Java Python DB2 UDB

Bientôt disponible

Data Engineer

LIVRY-GARGAN

Python SQL Jira Shell Unix Apache Spark Airflow GitLab Apache Kafka Snowflake

Data Engineer Python

CLICHY

Python Data SQL Apache Spark Snowflake Cloud AWS Azure Microsoft Power BI Tableau Software Google Cloud Platform

Disponible

Data Analytics Engineer | Python | SQL | BI

NEUILLY-SUR-MARNE

Excel Microsoft Power BI Azure Snowflake Business Objects Python Apache Spark Git SQL SAS

Disponible

Data Engineer PySpark

SAVIGNY-SUR-ORGE

Apache Spark PySpark SQL Python Data Big Data Power BI Microsoft Power BI Snowflake SAS

Bientôt disponible

Data Scientist/Data Engineer

LILLE

SQL Server Data Science Python Microsoft Power BI Google Cloud Platform LLM SQL Talend Docker Apache Spark

Disponible

Data & AI Professional

LILLE

Big Data SQL Python Microsoft Power BI Apache Spark Excel SQL Server SAS Azure

Data Analyst Power BI

SAINT-OUEN

SQL Microsoft Power BI Data Excel Python Azure SQL Server BI Talend Apache Spark

Data Scientist Deep Learning

TOULOUSE

Deep Learning Python Microsoft Power BI SQL Tableau IA Générative Excel Apache Spark Google Cloud Platform

Disponible

Data Scientist/analyst

ORLY

Python SQL Dataiku Power BI Qlik Sense SAS Apache Spark

Mme

Prénom ^*

Nom ^*

Email ^*

Téléphone ^*

Ville ^*

Avez-vous trouvé une mission ? ^*

J'accepte d'être contacté par nos partenaires, experts en portage salarial et j'accepte la politique de confidentialité du site www.freelance-informatique.fr

Domaines d'expertise liés

Fares - Data Engineer

Data Analyst (30 ans)

94320 THIAIS (Tunisie)

Ingénieur Big Data

Ingénieur Big Data – Azure Cloud

Ingénieur Data

Diplôme d'ingénieur en Big Data –

Diplôme d’étude universitaire du premier cycle

D'autres freelances Data Analyst Apache Spark

Expert data

Data Engineer

Data Engineer Python

Data Analytics Engineer | Python | SQL | BI

Data Engineer PySpark

Data Scientist/Data Engineer

Data & AI Professional

Data Analyst Power BI

Data Scientist Deep Learning

Data Scientist/analyst

D'autres freelances
Data Analyst Apache Spark