Mission : Intégration, support et mise à jour de clusters Kubernetes hébergés sur AWS, FLEXIBLE ENGINE, MS AZURE & GCP pour les clients internes et externes d’Orange.
Réalisations :
• Garantir la continuité des services sur les différents clusters kubernetes déployés sur les plateformes AWS, FE,GCP
• Assurer le suivi et le traitement des demandes et incidents via l’outil JIRA.
• Participer aux évolutions techniques de la plateforme avec les équipes NIVEAU 3.
• Déploiement et mise à jour des services hébergés sur les clusters Kubernetes via Ansible et Terraform
• Mise à jour des tests fonctionnels lancés par pipelines Concourse.
• Evolution et développement de l’offre MULTICLOUD et PAAS / CAAS.
• Rédaction et mise à jour des procédures techniques
• Assurer les astreintes en HNO
Equipe: « Design, build & Run » d’infrastructures SaaS
Mission : Accompagner les équipes techniques de clients éditeurs afin de garantir la stabilité, scalabilité et sécurité de leurs plateformes.
Réalisations :
Automatisation des déploiements avec Chef, ansible et Terraform
Administration, optimisation et fiabilisation des plateformes clients
Supervision et maintien en conditions opérationnelles des plateformes Clients sur les cloud Public (AWS, GCP) ainsi que sur les clusters kubernetes.
Investigation afin d’identifier les Roots cause de problémes de Performance & stabilité.
Résolution des incidents techniques
Documentation des procédures d’exploitation
Environnement :
Debian, Ansible, Chef, Terraform, Centreon, Grafana, Datadog, Commvault, Centreon, GitlabCI,Kubernetes, AWS, GCP
Mission : Exploitation de la Platform ERABLE (écosystème basé sur les technologies opensource qui hébergent plusieurs services mobiles « Orange et moi, OTVP, Malivebox »).
Réalisations :
BUILD :
Déploiement des livrables applicatifs avec la chaine CI/CD
Mise en place des environnements du développement, recette, pré-production et Production.
Support technique aux équipes de développement et recette
Amélioration continue de l’exploitabilité et de la qualité de service.
Garant des engagements contractuels (respect SLA, qualité, pénalités).
RUN :
Assurer le maintien en conditions opérationnelles (N2 & N3)
Piloter le traitement des incidents complexes et animer les réunions d’analyse d’incidents majeurs.
Assurer le bon déroulement des opérations de maintenance (corrective ou évolutive) à réaliser sur les plateformes.
Mission : assurer la maintenance, la gestion et le maintien en conditions opérationnelles des plateformes.
Réalisations :
Administration systèmes et réseaux :
Maintenir l'état opérationnel des systèmes et de l'infrastructure réseau
Gérer à distance les serveurs IMR sur deux Datacenters (Paris et Amsterdam plus que 200 serveurs)
Détecter, diagnostiquer et résoudre les problèmes survenus sur l'infrastructure : services, clusters, serveurs et hyperviseur.
Maintenir l’infrastructure réseau (TCP / IP, DNS, DHCP, FTP, commutateurs, passerelles, etc.)
Installer et configurer les composants icinga2, icingaweb2, mysql.
Développer un module Puppet pour automatiser l’installation de icinga-agent sur plus que 200 serveurs.
Configuration des métriques de supervisions (cpu, mémoire, ssh, ping, disk)
Intégration des scripts pour superviser des services haadoop cluster, postgres db, RabbitMQ.
Développer des scripts bash pour superviser des services spécifiques avec icinga2.
Configurer les alertes et la notification par mail et slack.
Support :
Support interne et externe: résoudre les problèmes détectés par le contrôle qualité, analyser les anomalies
Identifier les problèmes d'archivage web et travailler sur l'amélioration de la qualité des crawls
Implémentation d’une solution de sauvegarde (bacula) :
Préparer l’étude et l’architecture de la solution de sauvegarde
Installer et configurer les composants bacula.
Analyse et résolution des problèmes.
Assurer la restauration des serveurs.
Gérer les taches de sauvegarde et les taches de restauration.
Configuré une interface web avec la solution de sauvegardé.
Sauvegarde des données sur AWS (Cloud) :
Configuration de service Amazon, glacier.
Installation et configuration des outils Amazon.
Développement de scripts pour sauvegarder automatiquement les données ajoutées de hdfs vers Amazon glacier.
Intégration des scripts développés avec Slack