Synthèse : Calcule des audiences en temps réel à partir des données de plus de 6 millions de
devices (décodeur, ConnectTV, OTT, Web, ..)
Mesure d'exposition aux publicités et aux émissions
Réalisation :
&bull Développement et maintenance d&rsquoune application de calcule d&rsquoaudience en
temps réel, solution unique en France
&bull Mise en place de nouveaux projets de mesure d&rsquoexposition aux publicités et aux
émissions [plusieurs dizaines de Teraoctets de données] (ETL pipelines)
&bull Optimisation de l&rsquoarchitecture technique
&bull Mise en place un système de monitoring et d&rsquoalerting
&bull Conception d&rsquoune nouvelle architecture et migration de la plateforme
Synthèse : Développement d&rsquoun système permettant l&rsquoextraction automatique d&rsquoun ensemble
important de données issues de plusieurs sources, les structurer et les harmoniser de
manière à faciliter leur accès par un grand nombre de collaborateur, dans le respect
des confidentialités qui y sont attachées
Réalisation :
&bull Développement des scripts SQL (PyODBC).
&bull Développement des jobs d'intégrations ETL par Python/Pandas et historisation.
&bull Analyses complexes de données à grande échelle à l&rsquoaide des jobs PySpark
(Croisement, rapprochement, &hellip)
&bull Mise en production des Jobs sur des serveurs locaux
&bull Animation de workshops avec autres services, recueil de besoin
&bull Maintien de la documentation (document de spécifications, cahier des tests,
&bull document du mode d&rsquoemploi d&rsquoinstallation et d&rsquoexploitation...)
Synthèse : Réponse aux besoins des clients au niveau de l&rsquoacquisition et la collecte de données
de façon automatisé. Contourner les restrions des serveurs en utilisant des stratégies :
rotation proxy, user agents, outils d&rsquoautomatisation et autres
Réalisation :
&bull Développement des scripts de collecte de données, stockage et export.
&bull Développement des robots d&rsquoindexation (web crawler)
&bull Contourner les restrictions des serveurs comme Leboncoin, Seloger, PAP et autres
&bull Développement des scripts d&rsquoalimentation de contenu pour Facebook, Instagram,
Linkedin et autres
&bull Data Scraping avec des outils d&rsquoautomatisation comme Selenium
&bull Rédaction des documents : cahier des tests, manuel d&rsquoutilisation
Synthèse : Réalisation d&rsquoune application Web pour la gestion du matériel, recueil des bugs
et des modifications souhaitées pour la réalisation de nouvelles fonctionnalités
Réalisation :
Poursuivre les améliorations en rendant la gestion du matériel : Intuitive et
pratique en créant un système de recherche par mot-clé, aussi bien avec
d&rsquoautres fonctionnalités adaptées aux exigences des techniciens du laboratoire.
&bull Recueille des besoins.
&bull Développement avec Python/Django.
&bull Ajout de fonctionnalités / correction de bugs.
&bull Recettes et mise en production.