• Mise en place et maintenance des services qui constituent
l’application.
• Restructuration de la base de données.
• Optimisation des performances des Apis et de la Base de Données.
• Création de Drivers de collecte de données d’un Google Workspace
sous forme de Package Python.
• Mise en place d’une Pipeline de Déploiement Automatique des Packages sur le PYPI de l’entreprise.
• Création de Script SSH d’Initialisation de la Base.
• Mise en place d’une communication Kafka entre les différents Services.
• Django | Docker | Apache Kafka | Git | Minio | PostgreSQL | MongoDB |
Swagger | Python | SSH
• Participation à des réunions métiers pour analyser et formaliser les
fonctionnalités.
• Rédaction des US techniques.
• Mise en place des Sources de Données.
• Mise en place d’un Serveur de Replication et un autre de Backup de
PostgreSQL.
• Mise en place de Hive comme point d’entrée du Data Lake.
• Realisation de la communication entre les Sources de données et
Hive.
• Mise en place de DAG Airflow.
• Nettoyage et Exploitation des données avec Spark.
• Docker | GitLab | Hadoop | Apache Hive | PostgreSQL | MongoDB |
HDFS | Spark| Airflow | Python
• Réalisation d’un driver de Collecte et Nettoyage de données du site
AirBnb.
• Export du drivers sous forme d’un package python.
• Création d’une Pipeline de Déploiement Automatique sur le Pypi de
l’entreprise.
• Création d’une Api pour la consommation des données à partir de la
base.
• Mise en place d’un script d’Analyse Sentimentale des commentaires.
• Scrapy | Selenium | Python | Pandas | PostgreSQL | Random Forest | Git |
GitLab | Pypi
• Analyse, Visualisation et Nettoyage de données
• Mise en Place des données d’entrainement et de test.
• Test des différents modèles possibles.
• Optimisation des Hyperparamètres.
• Export du modèle sous forme d’un fichier pickle et la mise en place
d’une API pour sa consommation.
• Mise en place d’une Pipeline MLFLOW.
• Random Forrest | Logistic Regression | XGBOOST | Kmeans | Numpy |
Pandas | Matplotlib | MLOPS | MLFLOW | FastAPI | Python