Passionné par les mathématiques, et les technologies de données, je suis actuellement à la recherche d'une opportunité professionnelle en tant que Data Scientist, MLOps Engineer ou une autre opportunité dans le domaine de la data correspondant à mon profil pour débuter mon parcours professionnel.
Mon parcours académique en Mathématiques (Pures et Appliquées) m'a naturellement conduit vers la data, un domaine où je peux combiner ma passion pour l'analyse statistique, la modélisation mathématique et l'innovation technologique. J'ai découvert que transformer des données complexes en solutions concrètes est bien plus qu'un métier : c'est une opportunité de résoudre des problèmes stratégiques de manière créative.
⚡ Mon arsenal technique :
🔸 Code : Python, R pour dompter les données
🔸 Data base : PySpark, SQL, NoSQL pour les exploiter
🔸 Cloud : Databricks, AWS, Git, MLflow pour scaler
🔸 Viz : PowerBI, Matplotlib, Seaborn pour raconter leur histoire
💫 Ce qui me distingue :
🔸Formation pointue en Mathématiques et Machine Learning
🔸Esprit critique et analytique
🔸Capacité à apprendre rapidement
🔸Passionné par les dernières technologies MLOps et solutions cloud
🔸Passion pour l'innovation data-driven
🔸Esprit d'équipe
🔸Autonomie § Curiosité
Disponible, rigoureux, adaptable et animé par un désir constant d'apprendre, je serais ravi de mettre mes compétences au service d'une équipe innovante. Votre entreprise sera ma priorité numéro 1.
🚀 Prêt à démarrer immédiatement
📧 [email protected]
📱 +33 7 52 07 68 61
Situation: Face à l’augmentation des coûts cloud et à la multiplication des bases de données, Stellantis devait relever des défis de gouvernance des données pour identifier les redondances et optimiser l’utilisation des ressources.
Tâches:
- Concevoir et développer un Framework innovant pour détecter les similitudes entre tables de données
- Assurer la scalabilité et la performance de la solution dans un environnement Big Data.
- Optimiser l'architecture de l'ontologie Stellantis pour améliorer l'efficacité opérationnelle
Actions:
- Piloté le projet en méthodologie Agile avec des sprints hebdomadaires et des stand-ups quotidiens
- Développé des algorithmes hybrides combinant méthodes classiques (distances, Word2Vec, MinHash,) et Deep Learning (réseaux siamois, CNN, LSTM) avec mécanismes d'attention
- Implémenté des pipelines de traitement massif sur Databricks via PySpark pour une mise à l'échelle optimale
- Établi une connexion sécurisée avec Palantir Foundry pour l'extraction des données d'ontologie
- Créé des visualisations interactives avec Plotly pour analyser les similitudes entre tables et la structure ontologique
Résultats:
- Développé un jeu de données synthétique pour l'entraînement et la validation du Framework avec des scores de similarité connus, atteignant une précision de 84% sur ce jeu de données.
- Optimisé l'efficacité opérationnelle via l’optimisation de la structure ontologique, conduisant à une meilleure organisation et gouvernance des données
- Création d'une documentation technique exhaustive garantissant la maintenance et l'évolution du Framework
Technologies: Databricks, Pyspark, SQL, Snowflake, Git, Deep Learning