Description du Poste
Vous êtes passionné par la data science et vous recherchez une expérience en stage enrichissante ? Ne cherchez plus, nous avons l'opportunité qu'il vous faut ! Au sein de la direction AXA Life and Health international, nous recherchons un stagiaire motivé et passionné. Dans un environnement international et innovant, vous contribuerez à la conception, au développement et à l’industrialisation de solutions Data Science, Machine Learning et GenAI appliquées au secteur de la santé. Vous travaillerez sur des cas d’usage concrets à fort impact business, au sein d’équipes pluridisciplinaires (métiers, data, IT).
Sous la responsabilité de votre tuteur, vous interviendrez sur l’ensemble du cycle de vie des projets data :
Cadrage & compréhension métier
Collaborer avec les équipes métiers pour formaliser les cas d’usage
Accompagner à la définition des objectifs, métriques de performance, contraintes techniques et critères d’acceptation
Data engineering & préparation des données
Collecter, préparer et qualifier les données (ingestion multi-format, nettoyage, normalisation, qualité des données)
Gérer les données manquantes, incohérences et problématiques de structuration
Mettre en place des pipelines de données reproductibles
Modélisation & Machine Learning
Prototyper, entraîner et évaluer des modèles ML / NLP / OCR supervisé par le tuteur
Définir des baselines et benchmarks
Optimiser les performances (précision, rappel, F1, AUC, calibration, etc.)
Assurer la reproductibilité et la rigueur expérimentale
MLOps, monitoring & industrialisation
Documenter les modèles (model cards, limites, recommandations d’usage)
Intégrer des PoC dans les flux existants lorsque pertinent
GenAI & innovation
Explorer des cas d’usage GenAI (LLMs, RAG)
Restituer et vulgariser les résultats auprès d’un public technique et non technique
Exemples de projets
Vous pourrez notamment contribuer à :
Pipeline de traduction automatique de documents de santé (100+ pays)
détection de langue, glossaires médicaux, monitoring qualité, fallback
Extraction d’informations sur documents de sinistres
OCR + NLP/LLM (dates, montants, actes, identifiants)
Triage intelligent des sinistres
feature engineering, scoring, contraintes de latence/SLA
Détection de fraude, waste & abuse
scoring d’anomalies, incohérences, duplications, manipulations d’images
Vous êtes étudiant en Master 2 avec une spécialisation en data science, informatique, mathématiques appliquées, IA/Machine learning au sein d'une école d’ingénieur, université ou école de commerce. Vous recherchez un stage de fin d'études, de 6 mois à temps plein, à partir de février 2026.
Compétences techniques requises
Bon niveau en Python et écosystème data : pandas, numpy, scikit-learn
Bases en NLP et OCR : Prétraitement texte, tokenisation, embeddings
Évaluation ML : précision, rappel, F1, AUC/ROC, PR, validation croisée
Traitement de données : feature engineering, qualité des données, cohérence
A l'aise avec les bonnes pratiques de développement : Git, organisation de repo, documentation, tests basiques, reproductibilité
Capacité à concevoir des dashboards simples pour démontrer des résultats (Streamlit/Dash)
Anglais courant requis (contexte international)
Soft skills :
Communication claire et capacité de vulgarisation
Rigueur, esprit d’analyse et sens du détail
Curiosité, autonomie et esprit collaboratif
Si vous avez envie de participer à des projets innovants, rejoignez-nous !
#J-18808-Ljbffr