Michal - Architecte DATA

Ref : 060808M001
Email vérifié
Photo de Michal, Architecte DATA
Compétences
Expériences professionnelles
  • Expérience Professionnelle

    Depuis 01/2021
    (en cours)
    Lead Data Engineer/Architecte Data – Internet
    Responsabilités: Mise de pipelines Data vers plusieurs Cloud à l'aide de l'orchestrateur
    Airow.

     Architecture Data
    Mise en place de pipelines data vers les clouds Amazon AWS, Google Cloud et Snowake à
    l'aide de l'orchestrateur Airow

    Construction de processus de déploielment automatisées CI/CD à l'ade de containers
    Docker

    Lead Data Engineer/Architecte Data – Internet/Telecommunications
    Responsabilités: Mise en place de la stratégie de colecte, du traitement et de la valorisation
    des données.

     Gestion de projet
     Gestion de sous traitants oshore
     Méthodologie agile Kanban
     Architecture Data et Data Science
    Valorisation des données au travers de plusieurs projets de reporting à destination des
    équipes métier dans un rôle de Product Owner

    Veille technologique et choix des technologies à utiliser pour répondre au besoins métier:
    PostgreSQL, Tableau, Vertica, PipelineDB, ClickHouse, Airow.

     Rédaction de dossiers CIR/CII
     Mise en place du Data lake central de l’entreprise. Création de l’architecture data en partant
    de zéro.
    Développement de plusieurs modéles IA/ML notamment pour détecter la fraude dans le
    processus d’enregistrement. Création d'outils de décision statistiques sur la période COVID19 avec des modéles basés sur l’inférence bayésienne. Détéction de cellules de fraude à
    l’aide de clustering. Auteur de l’implémentation Perl de l’algorithme DBSCAN disponible sur
    CPAN. Prédiction du renouvellement d’un nom de domaine.

    Modélisation ML/IA avec les librairies standard de Python. Développement de certains
    algorithmes an C/C++ pour parallelisation massive. Etude de l'opportunité de porter certains
    des algorithmes sur carte graphique en C CUDA

     Mise en place de pipelines data avec l’outil d’orchestration Airow
     DBA PostgreSQL de plusieurs serveurs du département
     Administration de serveurs Linux (Centos, RHEL, OpenSuse)
    Projet BigData avec Apache Hadoop. Intégration de logs de protocoles réseau dans une
    base Hadoop et calcul d'indicateurs à partir des données brutes

    Projet BI avec Talend + Pentaho. Intégration de résultats de tests techniques à grande
    échelle dans un datawarehause.

     Avant-vente
     Accompagnement des équipes commerciales pour présenter et valoriser l'ore Data.
     Développement logiciel
     Membre actif du projet collaboratif open source Zonemaster (Perl, Angular, Github)
     Développement des scripts pour les pipelines Data (Perl, Python, Shell)
    Logiciel pour exécutuion massivement parallélisée d'algorithmes pour le calcul d'indicateurs
    spéciques (détection de fraude, clustering) en utilisant le C/C++ pour les serveurs Linux et
    le C CUDA pour les cartes graphiques Nvidia.

    Depuis le 01/05/2013
    Lead Developer

    Poste: Lead developer Perl
    Projet: Responsable du développement de nouveaux produits et services basés sur l'exploitation des données.

    Développement d'un service de reporting sur la qualité technique DNS d'un portefeuille de dons de domaines.
    Mise en place d'une base de mesures permettant d'évaluer l'usage des noms de domaines. Mesure de la validité de la configuration DNS, de présence de services associés au nom de domaine comme le mail et les serveurs web.
    Intégration des données récoltées par le système de mesure de l'usage des noms de domaines dans un datawarehause et intégration dans une offre Business Intelligence globale.


    Environnement technique : Perl, DNS, PostgreSQL, Talend.

    WebMining Systems De 01/01/2009 à 31/03/2009
    R&D : Architecte
    Projet : Mise en place d'une architecture de serveurs Linux de datamining synchronisés.
    Synchronisation du code et scripts exécutés sur les serveurs (synchronisation avec le système de contrôle de versions git). Développement de plateformes web de monitoring du fonctionnement des serveurs (Perl, Apache, Javascript (dojo)).

    Environnement Technique :
    • PERL, MySQL, Apache, Javascript (dojo), git

    Environnement Fonctionnel :
    • Datamining, WEB

    Calyon De 05/2007 à 31/12/2008
    INFINITY Front: Ingénieur développement
    Projet: MOE Système front office INFINITY (Produits dérivés exotiques, pricing, calculs de risque sur un cluster)

    I - Mise en place d’un système simulation de conditions de marchés futures sur 40 ans. Pricing de du stock géré par Infinity sur 500 hypothèses d’évolution des données de marché.
    II - Automatisation en PERL d'une procédure de test de non régression
    III - Import de deals vanille à partir de la base du progiciel SUMMIT à l'aide d'un module C++ SUMMIT.
    IV - Développement d'un indicateur de risque proche du delta: le delta cumulatif
    V - MOE sur l’application principale de gestion des produits dérivés exotiques (évolutions fonctionnelles, maintenance technique).

    Environnement Technique :
    • C/C++ (HP Unix 11), Sybase (ASE 12.5), PERL, Scripts Shell, Aide à l’exploitation des serveurs HP de l’application.

    Environnement Fonctionnel :
    • Front Office, Dérivés de taux exotiques

    Calyon De 11/2006 à 05/2007
    GV Collat: Ingénieur développement
    Projet: MOE Application de Gestion du risque Collatéral (Dérivés et Repo)
    Intégration progressive de l'amortissement des marges commerciales dans le mark to market des deals.
    MOE sur l’application de gestion du risque collatéral de Calyon. Application assurant le traitement des données front office, le calcul des appels de marge, et l’export des données vers le back office. En contact direct avec la MOA.

    Environnement Technique :
    • C/C++ (HP Unix 11), Sybase (ASE 12.5), PERL, Scripts Shell, Aide à l’exploitation des serveurs HP de l’application.

    Environnement Fonctionnel :
    • Gestion du risque collatéral

    WebMining Systems De 04/2006 à 10/2006
    R&D: Architecte
    Projet: Développement de l’offre WebMining Systems
    Création d'un progiciel de veille et de gestion d'information Internet.

    Environnement Technique :
    • PERL, JAVA, MySQL, Apache, Administration de serveurs Linux, Javascript, PHP, HTML, Script shell

    Environnement Fonctionnel :
    • Datamining, WEB

    Ingenico De 05/2005 à 03/2006
    R&D: Chef de projet
    Portage de l'intégralité de la solution d'encaissement bancaire Ingenico vers une plate-forme 32Bit.

    Environnement Technique :
    • C/C++ sous Eclipse, Bancaire B0' et EMV.

    Environnement Fonctionnel :
    • Monétique, Logiciel Embarqué

    eVoucher Algerie De 03/2005 à 04/2005
    R&D : Chef de projet
    Projet: Prototype pour un serveur de distribution de recharges pour téléphones portables sur terminaux de paiement.

    Environnement Technique :
    • C# Visual Studio .NET, Microsoft SQL Serveur

    Environnement Fonctionnel :
    • Télecom

    ABM Technologies De 02/2005 à 02/2005
    R&D: Chef de projet
    Projet: Mission d’expertise sur la connectivité aux NAC Hypercom sur les terminaux bancaires VeriFone de la gamme 37xx
    Création d’une libraire permettant la connectivité de terminaux de la gamme Omni 3750 de VeriFone à des Network Access Controllers de Hypercom.

    Environnement Technique :
    • C++ sous Visual Studio 6

    Environnement Fonctionnel :
    • Monétique, Logiciel Embarqué

    Schlumberger De 08/1999 à 01/2004
    R&D: Ingénieur
    Développement et maintenance du système d’exploitation pour les terminaux de paiement Schlumberger.

    Projet: GSM/GPRS (4 mois)
    Intégration du module dans le système

    Projet: DECT + Si2414 (6 mois)
    Intégration du module dans le système de la partie portable du terminal
    Création du mini système d’exploitation pour la base.
    Application du cycle en V et de la chaîne documentaire standard de l’entreprise

    Projet: MCTS (MagIC Communications Test System) (4 mois)
    Création d’un système de test pour toute la gamme des terminaux de payement.
    A l’aide d’un langage de script adapté, ce système permet l’exécution d’APIS embarqués sur le terminal ce qui permet de passer des batteries de tests très importantes (des milliers de connections modem) ce qui auparavant était impossible.
    Gestion de projet en tant que chef de projet (responsable du stagiaire en charge de la réalisation du projet)

    Projet: ARDIS (Réseau Sans fil Nord-Américain) (4 mois)
    Portage du projet Mobitex vers les protocoles dur réseau Canadien ARDIS (DataTAC).

    Projet: Stack TCP/IP
    Avec le modem V32bis la connectivité Internet devient possible même sur un terminal de payement.
    Etude de faisabilité ayant pour objectif de faire un choix entre toutes les stack TCP/IP sur le marché.
    Le résultat a été le choix d'une stack freeware portée de FreeBSD et déjà un peu adaptée pour l'embarqué.

    Projet: MBM (Memory Block Manager) (12 mois)
    Ce projet avait pour résultat un gestionnaire mémoire qui permettait la gestion par des APIs identiques la gestion d'aussi bien de la mémoire Flash que de la RAM du terminal.
    Ce gestionnaire assure la défragmentation de la mémoire aussi bien que la création de zones continues pour l'exécution de logiciels directement dans la mémoire Flash.
    Objectif: optimisation de l'utilisation de l'espace logique du 8086 de 1 Mo.
    Espace entièrement virtuellement construit à partir d'un espace physique d'un maximum de 8 Mo de mémoire Flash ou RAM.
    Réalisation d’un système de tests systématique du gestionnaire de la mémoire.

    Projet: E-Gate (1 mois)
    Étudede faisabilité d'un système permettant d'utiliser les terminaux de payement portables aux livreurs de colis en association avec lecteur de codes barres.

    Projet: MOBITEX (Réseau Sans fil Nord-américain) / Simulateur du réseau MOBITEX (9 mois)
    Étude de faisabilité, choix de la solution la mieux adaptée, conception et réalisation du système d'interconnexion entre les terminaux communiquant par le réseau radio américain Mobitex et le serveur de maintenance des terminaux Schlumberger.
    Réalisation d’un simulateur du réseau Mobitex.

    Projet: SDLC / Système de test (6 mois)
    Implémentation de la couche LLC du driver modem pour supporter la connexion synchrone avec le protocole SDLC
    Conception et réalisation d'un environnement de test unitaires de la couche SDLC (simulateur d'un serveur simplifie utilisant un modem synchrone)
    Conception et réalisation d'un gateway expérimental de traduction de protocole permettant d'utiliser un Network Access Controller comme modem.

    Projet: Participation à l’étude de faisabilité de la plateforme 32bit sous ARM/eCos (3 semaines)
    Etude de faisabilité
    Evaluation du système eCos pour la future plateforme 32 bit pour les terminaux de paiement

    Projet : Modem Rockwell RP144D (2 mois)
    Prise en charge du suivi de la sous-traitance du driver modem pour le nouveau chip Rockwell RP144D.

    Projet : Modem TDK
    Description-Maintenance du driver modem pour chip modem TDK.

    Projet: PinPad
    Description-Implémentation dans le système d'exploitation du support de la connexion d'un PinPad sur le terminal.

    Environnement Technique :
    • C++ sous Visual Studio 5 et 6, C++ Sous Borland C++, Pascal Objet Sous Delphi, Réseaux TCP/IP, dirveurs Modem, Temps Réel, Assembleur 8086, AVR, SDLC/HDLC

    Environnement Fonctionnel :
    • Monétique, Logiciel Embarqué

    ATYS Médical
    Stage de fin d'études
    Conception et réalisation d’un système d'acquisition et traitement de données provenant de machines d'acquisition médicales.
    Conception OMT/UML

    Environnement Technique :
    • Visual C++ 5

    Environnement Fonctionnel :
    • Industrie, Médical

    Schlumberger
    Stage de fin d'études
    • Etude de faisabilité sur la réalisation en JAVA/JDBC du projet de visualisation a travers d'Internet des mesures remontant toutes les secondes des puits de pétrole.

    Environnement Technique :
    • JAVA, JDBC, Oracle, AWT

    Environnement Fonctionnel :
    • Industrie, Médical

Études et formations
  • Objectifs

    Utiliser mon expertise sur toute la chaîne de la donnée afin de maximiser la valeur qu'elle peut
    apporter à l'entreprise. Mon expertise sur la data va:
     De la collecte, à l'aide d'outils d'automatisation
     En passant par le stockage, à l'aide d'architectures data et big data haute performance
     Le traitement, à l'aide d'orchestrateurs avancés
     Jusqu'à l'analyse, à l'aide de méthodologies IA/ML et statistiques

    Compétences
     Organisation projet:
     Gestion de sous traitants offshore
     Gestion agile avec les outils Kanban (Trello, Jira)
     Interface avec les équipe métier pour recueillir et formaliser les besoins fonctionnels

     Architecture Data:
     Mise en place d’un datalake
    Maîtrise des problématiques de performances et des limites des différents systèmes de
    base de données (relationnels, analytiques, streaming)

     Data Science:
     Modélisation avec les outils IA/ML standard de Python.
     Programmation probabiliste et modélisation avec l’inférence bayésienne.
    éveloppement de modèles IA/ML sur des environnements haute performance Nvidia
    CUDA, C, C++ pour des environnements big data.
     Maitrise des problématiques liées à la mise en production de modèles IA/ML.

    Base de données: PostgreSQL (niveau DBA), Vertica, ClickHouse, SQLServer, MySQL, Oracle, Sybase
     Orchestration: Apache Airflow
     Gestion de configuration: git
     Outils de restitution: Tableau
    Langages de programmation: Perl , Python, C/C++, JAVA, scripts shell, SQL, PHP, Javascript, divers Assembleurs
    Systèmes: Linux niveau administration système (RHEL, CENTOS, OpenSuse, Ubuntu, Debian),
    Windows (7, XP, NT, 98), UNIX (HP UX 11), plusieurs OS temps réel embarqués
     Réseau: DNS, BGP, Stack TCP/IP

    Langues
     Anglais: Courrant
     Slovaque, Français: Bilingue
     Russe: Compréhension de l'écrit et à l'oral
     Tchèque: Courrant

D'autres freelances
Architecte DATA

Ces profils pourraient vous intéresser !
CV Consultant Boomi
Yacine

Consultant Boomi

  • PARIS
Boomi INFORMATICA SQL API RESTful SOAP DATA EAI ESB ORACLE SQL SERVER CONTROL M
Disponible
CV Data engineer / Devops
Ghislain Brice

Data engineer / Devops

  • PARIS
PYTHON BIG DATA DATA REDHAT OPENSHIFT Kubernetes HASHICORP TERRAFORM GITLAB JAVASCRIPT TypeScript AMAZON AWS
Disponible
CV Senior Data Engineer and Scientist NLP
Stefano

Senior Data Engineer and Scientist NLP

  • ANTIBES
BIG DATA SQL APACHE SPARK DATA PYTHON SCALA JAVA
Disponible
CV Data Scientist SQL
Julien

Data Scientist SQL

  • RENNES
SQL DATA MICROSOFT BI SQL SERVER Microsoft Power BI
CV Architecte DATA/AZURE/DATA ENGINEER
Irving

Architecte DATA/AZURE/DATA ENGINEER

  • COURBEVOIE
DATA AZURE BIG DATA Dataiku Data lake APACHE KAFKA Cloudera Cloud AWS Snowflake
CV Architecte AZURE
Anouar

Architecte AZURE

  • LA PLAINE-SAINT-DENIS
AZURE DATAWAREHOUSE DATA
CV Directeur Technique (CTO) / Big Data architect
Nassim

Directeur Technique (CTO) / Big Data architect

  • PARIS
DATA
CV Tech lead/Architect Data
Mourougan

Tech lead/Architect Data

  • LOGNES
PYTHON DATA DEVOPS SQL MONGODB APACHE SPARK RabbitMQ GO Cloud AWS Kubernetes
Bientôt disponible
CV Manager & Architecte Digital / BLOCKCHAIN
Tarek

Manager & Architecte Digital / BLOCKCHAIN

  • PARIS
JAVASCRIPT REACT.JS React Native HYPERLEDGER BLOCKCHAIN ETHEREUM DATA
Disponible
CV Architecte DATA
Hamza

Architecte DATA

  • CARRIÈRES-SUR-SEINE
DATA CRM BIGQUERY