Senior AI/ML Scientist
Pillar Science
mars 2025 - décembre 2025
Conception et mise en production d’un système de recommandation CatBoost pour le matching chercheurs𠄾ntreprises, appuyé par des pipelines SQL modulaires, de l’orchestration Apache Airflow et des mécanismes de réconciliation d𠆞ntités, en collaboration avec les équipes produit et ingénierie.
Python
Machine Learning
Modèles de recommandation
CatBoost
Ingénierie des caractéristiques (feature engineering)
Échantillonnage négatif (negative sampling)
SQL avancé
Pipelines de données
Orchestration de workflows
Responsable Data Science
Index Web Marketing
octobre 2022 - mars 2025
Conception et mise en production de plateformes d𠆚utomatisation IA et GenAI pour le SEO et l𠆞nrichissement de contenus, basées sur des agents LLM orchestrés. Développement de pipelines de génération, d𠆞xécution et de validation de code, déployés sur une architecture serverless GCP, avec un fort accent sur la robustesse, la scalabilité et la qualité des sorties.
Intelligence artificielle générative
Agents LLM
LangChain
LangGraph
Prompt engineering
Validation de sorties LLM
AI-as-a-Judge
Génération et vérification de code
Python
Pipelines IA
Automatisation de workflows
Données à forte cardinalité
Tests automatisés
Exécution sandboxée
Navigation headless
Google Cloud Platform (GCP)
Cloud Functions
App Engine
Pub/Sub
BigQuery
Architectures serverless
Déploiement applicatif
Chercheur stagiaire
Polytechnique Montreal
juillet 2020 - décembre 2020
Projet de recherche visant à accélérer des simulations numériques de supraconducteurs haute température par l’utilisation de modèles de Machine Learning. Réalisation de simulations électro-thermiques non linéaires sous COMSOL, automatisation des calculs et de l𠆞xtraction des données via MATLAB, et intégration de modèles prédictifs pour la prévision de séries temporelles 3D, en collaboration avec le CNRC.
Recherche & IA
Intelligence artificielle appliquée
Machine Learning
Modélisation prédictive
Accélération de calculs
Simulation & calcul scientifique
Simulation numérique
COMSOL Multiphysics
Modélisation électro-thermique
Systèmes non linéaires
Phénomènes de quench
Traitement des données & automatisation
MATLAB
Automatisation de simulations
Extraction et traitement de données
Séries temporelles 3D
Méthodologie scientifique
Recherche appliquée
Validation scientifique
Data Scientist
Index Web Marketing
septembre 2019 - octobre 2022
Conception et mise en production de systèmes de recommandation à grande échelle sur des données marketing, incluant l’implémentation de modèles NCF en PyTorch, l’utilisation d𠆞mbeddings sémantiques pour le transfert d𠆚pprentissage et la recherche vectorielle. Déploiement de modèles ML via API et pipelines serverless sur GCP, avec un fort accent sur la performance, l’optimisation mémoire et la scalabilité.
Machine Learning & recommandation
Machine Learning
Systèmes de recommandation
Neural Collaborative Filtering (NCF)
PyTorch
Optimisation de modèles
Performance et optimisation mémoire
NLP & recherche sémantique
Embeddings sémantiques
Transfer learning
Recherche vectorielle
Similarité sémantique
Data & ingénierie logicielle
Python
Pipelines de données
APIs REST
Flask
Cloud & déploiement
Google Cloud Platform (GCP)
Cloud Functions
Architectures serverless