Michal - Architecte DATA
Ref : 060808M001-
90290 CHATENAY MALABRY
-
Architecte (47 ans)
-
Freelance
Expérience Professionnelle
Depuis 01/2021
(en cours)
Lead Data Engineer/Architecte Data – Internet
Responsabilités: Mise de pipelines Data vers plusieurs Cloud à l'aide de l'orchestrateur
Airow.
Architecture Data
Mise en place de pipelines data vers les clouds Amazon AWS, Google Cloud et Snowake à
l'aide de l'orchestrateur Airow
Construction de processus de déploielment automatisées CI/CD à l'ade de containers
Docker
Lead Data Engineer/Architecte Data – Internet/Telecommunications
Responsabilités: Mise en place de la stratégie de colecte, du traitement et de la valorisation
des données.
Gestion de projet
Gestion de sous traitants oshore
Méthodologie agile Kanban
Architecture Data et Data Science
Valorisation des données au travers de plusieurs projets de reporting à destination des
équipes métier dans un rôle de Product Owner
Veille technologique et choix des technologies à utiliser pour répondre au besoins métier:
PostgreSQL, Tableau, Vertica, PipelineDB, ClickHouse, Airow.
Rédaction de dossiers CIR/CII
Mise en place du Data lake central de l’entreprise. Création de l’architecture data en partant
de zéro.
Développement de plusieurs modéles IA/ML notamment pour détecter la fraude dans le
processus d’enregistrement. Création d'outils de décision statistiques sur la période COVID19 avec des modéles basés sur l’inférence bayésienne. Détéction de cellules de fraude à
l’aide de clustering. Auteur de l’implémentation Perl de l’algorithme DBSCAN disponible sur
CPAN. Prédiction du renouvellement d’un nom de domaine.
Modélisation ML/IA avec les librairies standard de Python. Développement de certains
algorithmes an C/C++ pour parallelisation massive. Etude de l'opportunité de porter certains
des algorithmes sur carte graphique en C CUDA
Mise en place de pipelines data avec l’outil d’orchestration Airow
DBA PostgreSQL de plusieurs serveurs du département
Administration de serveurs Linux (Centos, RHEL, OpenSuse)
Projet BigData avec Apache Hadoop. Intégration de logs de protocoles réseau dans une
base Hadoop et calcul d'indicateurs à partir des données brutes
Projet BI avec Talend + Pentaho. Intégration de résultats de tests techniques à grande
échelle dans un datawarehause.
Avant-vente
Accompagnement des équipes commerciales pour présenter et valoriser l'ore Data.
Développement logiciel
Membre actif du projet collaboratif open source Zonemaster (Perl, Angular, Github)
Développement des scripts pour les pipelines Data (Perl, Python, Shell)
Logiciel pour exécutuion massivement parallélisée d'algorithmes pour le calcul d'indicateurs
spéciques (détection de fraude, clustering) en utilisant le C/C++ pour les serveurs Linux et
le C CUDA pour les cartes graphiques Nvidia.
Depuis le 01/05/2013
Lead Developer
Poste: Lead developer Perl
Projet: Responsable du développement de nouveaux produits et services basés sur l'exploitation des données.
Développement d'un service de reporting sur la qualité technique DNS d'un portefeuille de dons de domaines.
Mise en place d'une base de mesures permettant d'évaluer l'usage des noms de domaines. Mesure de la validité de la configuration DNS, de présence de services associés au nom de domaine comme le mail et les serveurs web.
Intégration des données récoltées par le système de mesure de l'usage des noms de domaines dans un datawarehause et intégration dans une offre Business Intelligence globale.
Environnement technique : Perl, DNS, PostgreSQL, Talend.
WebMining Systems De 01/01/2009 à 31/03/2009
R&D : Architecte
Projet : Mise en place d'une architecture de serveurs Linux de datamining synchronisés.
Synchronisation du code et scripts exécutés sur les serveurs (synchronisation avec le système de contrôle de versions git). Développement de plateformes web de monitoring du fonctionnement des serveurs (Perl, Apache, Javascript (dojo)).
Environnement Technique :
• PERL, MySQL, Apache, Javascript (dojo), git
Environnement Fonctionnel :
• Datamining, WEB
Calyon De 05/2007 à 31/12/2008
INFINITY Front: Ingénieur développement
Projet: MOE Système front office INFINITY (Produits dérivés exotiques, pricing, calculs de risque sur un cluster)
I - Mise en place d’un système simulation de conditions de marchés futures sur 40 ans. Pricing de du stock géré par Infinity sur 500 hypothèses d’évolution des données de marché.
II - Automatisation en PERL d'une procédure de test de non régression
III - Import de deals vanille à partir de la base du progiciel SUMMIT à l'aide d'un module C++ SUMMIT.
IV - Développement d'un indicateur de risque proche du delta: le delta cumulatif
V - MOE sur l’application principale de gestion des produits dérivés exotiques (évolutions fonctionnelles, maintenance technique).
Environnement Technique :
• C/C++ (HP Unix 11), Sybase (ASE 12.5), PERL, Scripts Shell, Aide à l’exploitation des serveurs HP de l’application.
Environnement Fonctionnel :
• Front Office, Dérivés de taux exotiques
Calyon De 11/2006 à 05/2007
GV Collat: Ingénieur développement
Projet: MOE Application de Gestion du risque Collatéral (Dérivés et Repo)
Intégration progressive de l'amortissement des marges commerciales dans le mark to market des deals.
MOE sur l’application de gestion du risque collatéral de Calyon. Application assurant le traitement des données front office, le calcul des appels de marge, et l’export des données vers le back office. En contact direct avec la MOA.
Environnement Technique :
• C/C++ (HP Unix 11), Sybase (ASE 12.5), PERL, Scripts Shell, Aide à l’exploitation des serveurs HP de l’application.
Environnement Fonctionnel :
• Gestion du risque collatéral
WebMining Systems De 04/2006 à 10/2006
R&D: Architecte
Projet: Développement de l’offre WebMining Systems
Création d'un progiciel de veille et de gestion d'information Internet.
Environnement Technique :
• PERL, JAVA, MySQL, Apache, Administration de serveurs Linux, Javascript, PHP, HTML, Script shell
Environnement Fonctionnel :
• Datamining, WEB
Ingenico De 05/2005 à 03/2006
R&D: Chef de projet
Portage de l'intégralité de la solution d'encaissement bancaire Ingenico vers une plate-forme 32Bit.
Environnement Technique :
• C/C++ sous Eclipse, Bancaire B0' et EMV.
Environnement Fonctionnel :
• Monétique, Logiciel Embarqué
eVoucher Algerie De 03/2005 à 04/2005
R&D : Chef de projet
Projet: Prototype pour un serveur de distribution de recharges pour téléphones portables sur terminaux de paiement.
Environnement Technique :
• C# Visual Studio .NET, Microsoft SQL Serveur
Environnement Fonctionnel :
• Télecom
ABM Technologies De 02/2005 à 02/2005
R&D: Chef de projet
Projet: Mission d’expertise sur la connectivité aux NAC Hypercom sur les terminaux bancaires VeriFone de la gamme 37xx
Création d’une libraire permettant la connectivité de terminaux de la gamme Omni 3750 de VeriFone à des Network Access Controllers de Hypercom.
Environnement Technique :
• C++ sous Visual Studio 6
Environnement Fonctionnel :
• Monétique, Logiciel Embarqué
Schlumberger De 08/1999 à 01/2004
R&D: Ingénieur
Développement et maintenance du système d’exploitation pour les terminaux de paiement Schlumberger.
Projet: GSM/GPRS (4 mois)
Intégration du module dans le système
Projet: DECT + Si2414 (6 mois)
Intégration du module dans le système de la partie portable du terminal
Création du mini système d’exploitation pour la base.
Application du cycle en V et de la chaîne documentaire standard de l’entreprise
Projet: MCTS (MagIC Communications Test System) (4 mois)
Création d’un système de test pour toute la gamme des terminaux de payement.
A l’aide d’un langage de script adapté, ce système permet l’exécution d’APIS embarqués sur le terminal ce qui permet de passer des batteries de tests très importantes (des milliers de connections modem) ce qui auparavant était impossible.
Gestion de projet en tant que chef de projet (responsable du stagiaire en charge de la réalisation du projet)
Projet: ARDIS (Réseau Sans fil Nord-Américain) (4 mois)
Portage du projet Mobitex vers les protocoles dur réseau Canadien ARDIS (DataTAC).
Projet: Stack TCP/IP
Avec le modem V32bis la connectivité Internet devient possible même sur un terminal de payement.
Etude de faisabilité ayant pour objectif de faire un choix entre toutes les stack TCP/IP sur le marché.
Le résultat a été le choix d'une stack freeware portée de FreeBSD et déjà un peu adaptée pour l'embarqué.
Projet: MBM (Memory Block Manager) (12 mois)
Ce projet avait pour résultat un gestionnaire mémoire qui permettait la gestion par des APIs identiques la gestion d'aussi bien de la mémoire Flash que de la RAM du terminal.
Ce gestionnaire assure la défragmentation de la mémoire aussi bien que la création de zones continues pour l'exécution de logiciels directement dans la mémoire Flash.
Objectif: optimisation de l'utilisation de l'espace logique du 8086 de 1 Mo.
Espace entièrement virtuellement construit à partir d'un espace physique d'un maximum de 8 Mo de mémoire Flash ou RAM.
Réalisation d’un système de tests systématique du gestionnaire de la mémoire.
Projet: E-Gate (1 mois)
Étudede faisabilité d'un système permettant d'utiliser les terminaux de payement portables aux livreurs de colis en association avec lecteur de codes barres.
Projet: MOBITEX (Réseau Sans fil Nord-américain) / Simulateur du réseau MOBITEX (9 mois)
Étude de faisabilité, choix de la solution la mieux adaptée, conception et réalisation du système d'interconnexion entre les terminaux communiquant par le réseau radio américain Mobitex et le serveur de maintenance des terminaux Schlumberger.
Réalisation d’un simulateur du réseau Mobitex.
Projet: SDLC / Système de test (6 mois)
Implémentation de la couche LLC du driver modem pour supporter la connexion synchrone avec le protocole SDLC
Conception et réalisation d'un environnement de test unitaires de la couche SDLC (simulateur d'un serveur simplifie utilisant un modem synchrone)
Conception et réalisation d'un gateway expérimental de traduction de protocole permettant d'utiliser un Network Access Controller comme modem.
Projet: Participation à l’étude de faisabilité de la plateforme 32bit sous ARM/eCos (3 semaines)
Etude de faisabilité
Evaluation du système eCos pour la future plateforme 32 bit pour les terminaux de paiement
Projet : Modem Rockwell RP144D (2 mois)
Prise en charge du suivi de la sous-traitance du driver modem pour le nouveau chip Rockwell RP144D.
Projet : Modem TDK
Description-Maintenance du driver modem pour chip modem TDK.
Projet: PinPad
Description-Implémentation dans le système d'exploitation du support de la connexion d'un PinPad sur le terminal.
Environnement Technique :
• C++ sous Visual Studio 5 et 6, C++ Sous Borland C++, Pascal Objet Sous Delphi, Réseaux TCP/IP, dirveurs Modem, Temps Réel, Assembleur 8086, AVR, SDLC/HDLC
Environnement Fonctionnel :
• Monétique, Logiciel Embarqué
ATYS Médical
Stage de fin d'études
Conception et réalisation d’un système d'acquisition et traitement de données provenant de machines d'acquisition médicales.
Conception OMT/UML
Environnement Technique :
• Visual C++ 5
Environnement Fonctionnel :
• Industrie, Médical
Schlumberger
Stage de fin d'études
• Etude de faisabilité sur la réalisation en JAVA/JDBC du projet de visualisation a travers d'Internet des mesures remontant toutes les secondes des puits de pétrole.
Environnement Technique :
• JAVA, JDBC, Oracle, AWT
Environnement Fonctionnel :
• Industrie, Médical
Objectifs
Utiliser mon expertise sur toute la chaîne de la donnée afin de maximiser la valeur qu'elle peut
apporter à l'entreprise. Mon expertise sur la data va:
De la collecte, à l'aide d'outils d'automatisation
En passant par le stockage, à l'aide d'architectures data et big data haute performance
Le traitement, à l'aide d'orchestrateurs avancés
Jusqu'à l'analyse, à l'aide de méthodologies IA/ML et statistiques
Compétences
Organisation projet:
Gestion de sous traitants offshore
Gestion agile avec les outils Kanban (Trello, Jira)
Interface avec les équipe métier pour recueillir et formaliser les besoins fonctionnels
Architecture Data:
Mise en place d’un datalake
Maîtrise des problématiques de performances et des limites des différents systèmes de
base de données (relationnels, analytiques, streaming)
Data Science:
Modélisation avec les outils IA/ML standard de Python.
Programmation probabiliste et modélisation avec l’inférence bayésienne.
éveloppement de modèles IA/ML sur des environnements haute performance Nvidia
CUDA, C, C++ pour des environnements big data.
Maitrise des problématiques liées à la mise en production de modèles IA/ML.
Base de données: PostgreSQL (niveau DBA), Vertica, ClickHouse, SQLServer, MySQL, Oracle, Sybase
Orchestration: Apache Airflow
Gestion de configuration: git
Outils de restitution: Tableau
Langages de programmation: Perl , Python, C/C++, JAVA, scripts shell, SQL, PHP, Javascript, divers Assembleurs
Systèmes: Linux niveau administration système (RHEL, CENTOS, OpenSuse, Ubuntu, Debian),
Windows (7, XP, NT, 98), UNIX (HP UX 11), plusieurs OS temps réel embarqués
Réseau: DNS, BGP, Stack TCP/IP
Langues
Anglais: Courrant
Slovaque, Français: Bilingue
Russe: Compréhension de l'écrit et à l'oral
Tchèque: Courrant