Data scientist
Ref : 180323I003-
ASAP
-
Charenton le Pont
-
3 jours ouvrés
-
Consultant, Data Scientist
-
Banque et Finance
Compétences requises
Description de la mission
Nous recherchons pour l'un de nos clients un Data scientist sur Charenton le Pont.
La prestation a pour objectif la construction d’un « datalake » Finance & Risque. Ce datalake s’appuiera sur la distribution Hadoop HortonWorks.
Dans le cadre de cette prestation, le client mettra à disposition son infrastructure existante BigData : Cluster Hadoop basé sur la plateforme HDP HortonWorks
Les différents aspects de la prestation seront :
• Connaissance des méthodes et technologies de développement BigData pour les éléments Alimentation et Transformation de la donnée. En premier lieu une connaissance du moteur SPARK (avec implémentation Scala ou Python)
• Capacité de modélisation via la technologie Hive (notion de partitionnement, tables externes ou managées, etc …)
• Compétence pour implémenter une solution propriétaire Web de monitoring et audit des flux de données (DashBoard Kibana/Graphana, ou par Angular, ou autres techno Web)
• Capacité à faire un benchmark des outils marchés de Data Vizualisation (ex : Tableau, Spotfire) ou Data Wrangling (ex : Trifacta).
La prestation a pour objectif la construction d’un « datalake » Finance & Risque. Ce datalake s’appuiera sur la distribution Hadoop HortonWorks.
Dans le cadre de cette prestation, le client mettra à disposition son infrastructure existante BigData : Cluster Hadoop basé sur la plateforme HDP HortonWorks
Les différents aspects de la prestation seront :
• Connaissance des méthodes et technologies de développement BigData pour les éléments Alimentation et Transformation de la donnée. En premier lieu une connaissance du moteur SPARK (avec implémentation Scala ou Python)
• Capacité de modélisation via la technologie Hive (notion de partitionnement, tables externes ou managées, etc …)
• Compétence pour implémenter une solution propriétaire Web de monitoring et audit des flux de données (DashBoard Kibana/Graphana, ou par Angular, ou autres techno Web)
• Capacité à faire un benchmark des outils marchés de Data Vizualisation (ex : Tableau, Spotfire) ou Data Wrangling (ex : Trifacta).