Aller au contenu principal

MOOVE-CHUV: une IA médicale qui apprend du terrain

Université de Lausanne

Face à l'intérêt croissant pour l'IA médicale, un défi majeur persiste: la plupart des grands modèles de langage (LLMs) sont entraînés et évalués à l’aide de métriques générales qui ne reflètent pas la complexité de la pratique clinique. Pour combler cette lacune, le CHUV a développé un nouveau cadre centré sur les clinicien-nes, plaçant les professionnel-les de santé au cœur de l’évaluation et de l’amélioration des modèles.

Dans cette initiative, 241 cliniciens issus de 22 spécialités ont créé plus de 3 700 vignettes cliniques réalistes et fourni plus de 12 500 évaluations d’expert-es. Cet ensemble vaste et diversifié de connaissances cliniques a permis d’aligner et d’évaluer un modèle de langage médical de 70 milliards de paramètres, aboutissant au développement de Llama‑3.1 Meditron‑3‑CHUV. Le modèle aligné a montré des améliorations significatives par rapport à sa version initiale sur 11 dimensions clés — notamment la sécurité, l’équité, la clarté et la pertinence contextuelle — atteignant des performances comparables à celles de systèmes propriétaires de pointe.

L’un des résultats centraux de ce travail est MOOVE‑CHUV, le plus grand ensemble de données de préférences cliniques jamais publié dans le domaine de l’IA médicale. Cette ressource permet aux hôpitaux, aux chercheurs et aux développeurs d’évaluer et d’affiner les modèles médicaux LLM en fonction d’attentes cliniques réelles plutôt que d’indicateurs abstraits.

Cette approche marque une évolution majeure dans la manière de concevoir l’IA médicale: les clinicien-nes ne sont plus seulement des utilisateurs finaux, mais des collaborateur-trices essentiel-les dans la création des systèmes. En intégrant directement l’expertise humaine dans le cycle de développement, les institutions de santé peuvent construire des outils d’IA plus sûrs, plus fiables et mieux adaptés aux contextes cliniques — tout en préservant la protection des données et en facilitant un déploiement local. Ce travail offre ainsi une voie scalable pour développer des technologies qui répondent véritablement aux besoins des clinicien-nes et des patient-es.

  • (ouvre une nouvelle fenêtre)