Santé des femmes : les chatbots d’IA encore trop peu fiables pour repérer les urgences

De plus en plus utilisées comme premier réflexe face à des symptômes, les intelligences artificielles conversationnelles peinent encore à identifier correctement les situations médicales urgentes chez les femmes. Une étude internationale récente montre des taux d’échec élevés, y compris pour les modèles les plus avancés.

© Avanti Santé

Publiée sur arXiv et relayée par SciencePresse et Egora, l’étude a évalué treize grands modèles d’IA à partir de plusieurs centaines de scénarios cliniques relevant notamment de la médecine d’urgence, de la gynécologie et de la neurologie.  Les réponses ont été analysées selon un critère central : la capacité du modèle à identifier un risque sérieux et à orienter clairement vers une consultation ou une prise en charge urgente. Des performances très contrastées selon les modèles Les résultats sont préoccupants : environ 60 % des réponses ne répondent pas aux exigences minimales d’un conseil médical fiable. Parmi les modèles testés, GPT-5 apparaît comme le plus performant, mais reste en échec dans 47 % des cas, ce qui souligne ses limites dans un rôle de triage clinique.Ministral 8B affiche les moins bons résultats, avec 73 % de réponses jugées insuffisantes. Les autres modèles se situent entre ces deux extrêmes, sans qu’aucun ne parvienne à un niveau jugé satisfaisant. Manque de data fiables sur la santé des femmes Les auteurs rappellent que leur objectif n’est pas de qualifier ces IA de dangereuses en soi, mais d’élaborer une norme d’évaluation clinique rigoureuse, volontairement conservatrice.Ces travaux rejoignent d’autres études montrant que l’IA tend à sous-évaluer ou mal contextualiser des symptômes féminins. « Sur les bases de données, il faut être certain que le critère du sexe a bien été identifié et avec tout ce qui va autour, c’est-à-dire le stade du cycle menstruel, etc., car cela peut avoir un impact sur la manière de fonctionner de médicaments ou sur les prises en charge. On commence à s’en rendre compte sur le traitement du diabète chez la femme », estime Juliette Mauro, PDG et cofondatrice de My S life, startup femtech. Selon Jean-Baptiste Hennequin chef de la mission Cité de l’innovation à Sorbonne Université, tant que les données ne seront pas suffisamment…

Ce contenu est réservé aux abonnés.
Je m’abonne
Déjà membre ? Connectez-vous ici