Clear Sky Science · fr

Comparaison des performances de l'intelligence artificielle et des professionnels de santé dans l'analyse vidéo chirurgicale et interventionnelle : une revue systématique et méta-analyse

· Retour à l’index

Des yeux plus intelligents au bloc opératoire

Chaque année, des centaines de millions de personnes subissent des opérations et des procédures peu invasives guidées par la vidéo — pensez aux coloscopies, à la chirurgie par clé de porte ou aux minuscules caméras introduites dans les vaisseaux sanguins. Dans ces moments, la capacité d’un médecin à repérer sur un écran des signes d’alerte subtils peut faire la différence entre détecter précocement un cancer ou le manquer. Cette étude pose une question qui compte pour tout patient : lorsque des vidéos chirurgicales et interventionnelles sont analysées, comment les systèmes d’intelligence artificielle se comportent-ils par rapport aux cliniciens humains, et que se passe-t-il lorsque les deux travaillent ensemble ?

Figure 1
Figure 1.

Mettre de l'ordre dans un flot de vidéos chirurgicales

La médecine moderne enregistre désormais d’énormes quantités de vidéos de procédures, des endoscopies digestives aux opérations assistées par robot. Ces enregistrements regorgent d’informations : de minuscules polypes dans le côlon, des tumeurs précoces dans l’estomac ou l’œsophage, des nerfs délicats à éviter, ou des étapes d’une opération complexe. Les chercheurs entraînent des systèmes d’IA à scruter ces images, signaler les zones suspectes et même reconnaître où se situe le chirurgien dans une intervention. Pourtant, jusqu’à présent, la plupart des études ont opposé l’IA aux médecins dans des concours artificiels en tête-à-tête, au lieu de s’interroger sur la manière dont la technologie pourrait être utilisée de façon réaliste — comme un aide au chevet du clinicien. Cette revue s’est donné pour objectif de recueillir et d’analyser systématiquement ces preuves dispersées à travers de nombreuses spécialités.

Ce que les chercheurs ont examiné

L’équipe a exploré les principales bases de données médicales et d’ingénierie et a commencé avec près de 38 000 articles. Après application de critères stricts — uniquement des études primaires utilisant l’IA sur de véritables vidéos chirurgicales ou interventionnelles et comparant directement ses performances à celles des professionnels de santé — 146 études sont restées. Celles-ci couvraient un large éventail de procédures, en particulier l’endoscopie gastro-intestinale, mais aussi des interventions pulmonaires, thyroïdiennes, cérébrales, cardiaques et urologiques. La plupart utilisaient des méthodes d’apprentissage profond modernes, comme les réseaux de neurones convolutionnels, entraînés à détecter des maladies, reconnaître l’anatomie, évaluer la propreté intestinale ou identifier les étapes d’une opération. Soixante-seize de ces études ont rapporté suffisamment de détails pour permettre aux auteurs de regrouper les résultats et de calculer la fréquence des bonnes et des mauvaises classifications par l’IA et par les humains.

L'IA seule contre les médecins, et l'IA comme coéquipière

Quand les chercheurs ont comparé l’IA aux cliniciens non assistés regardant les mêmes vidéos, les systèmes d’IA détectaient généralement plus de problèmes réels (sensibilité plus élevée) sans générer davantage de fausses alertes (spécificité similaire). Ce schéma se maintenait tant lorsque les modèles étaient testés sur des données familières que lorsqu’ils affrontaient de nouveaux jeux de données externes. Cependant, la constatation la plus pertinente cliniquement est survenue lorsque l’IA était utilisée comme assistante. Dans une large gamme de tâches, les cliniciens pouvant voir les suggestions de l’IA repéraient mieux les maladies et avaient moins tendance à classer à tort des tissus normaux comme pathologiques que ceux travaillant seuls. Ce gain était particulièrement marqué chez les non-spécialistes, comme les stagiaires, qui bénéficiaient le plus des conseils de l’IA. Pour les spécialistes chevronnés, l’assistance de l’IA et l’IA seule affichaient des niveaux de performance globalement proches, ce qui suggère que, entre des mains expertes, la combinaison humain–machine peut égaler les meilleurs algorithmes autonomes.

Un fossé entre conditions de laboratoire et réalité clinique

Malgré ces chiffres prometteurs, la revue met en évidence un écart entre la manière dont l’IA est actuellement testée et la façon dont elle doit fonctionner en situation clinique réelle. De nombreuses études ont nettoyé leurs données en éliminant des images floues ou de faible qualité, alors que les blocs opératoires et salles d’endoscopie réels traitent souvent précisément de ce type d’imperfections. D’autres ont analysé des instantanés isolés au lieu de vidéos continues, contournant ainsi le défi de suivre le mouvement et le timing. Peu d’études ont évalué l’IA en temps réel au chevet, et la plupart se sont appuyées sur du matériel haut de gamme qui peut ne pas être disponible dans des hôpitaux à ressources limitées. Les pratiques de rapport étaient également incohérentes : des détails clés sur la façon dont les modèles ont été ajustés et validés manquaient souvent, rendant difficile la reproduction ou une évaluation équitable par d’autres équipes.

Figure 2
Figure 2.

Construire des partenariats humain–IA dignes de confiance

Les auteurs soutiennent que l’IA en chirurgie et en médecine interventionnelle devrait être développée et testée dès le départ comme un partenaire des cliniciens, et non comme un remplaçant. Cela signifie concevoir des études qui reproduisent les conditions du monde réel, partager des jeux de vidéos diversifiés entre centres et adopter des normes claires de rapport afin que d’autres équipes puissent vérifier et améliorer les travaux publiés. Cela implique aussi de former les cliniciens à comprendre les forces et les biais de l’IA, plutôt que de faire une confiance aveugle ou de rejeter ses suggestions. Alors que la méta-analyse montre que l’IA peut déjà égaler ou surpasser la performance humaine non assistée dans de nombreuses tâches basées sur la vidéo, le bénéfice le plus significatif réside dans la façon dont elle peut affiner le jugement humain. Pour les patients, la conclusion n’est pas que des machines prendront le contrôle du bloc opératoire, mais que des équipes humain–IA soigneusement conçues pourraient rendre les procédures plus sûres, permettre des diagnostics plus précoces et améliorer les résultats.

Citation: Rafati Fard, A., Williams, S.C., Smith, K.J. et al. Comparing artificial intelligence and healthcare professional performance in surgical and interventional video analysis: a systematic review and meta-analysis. npj Digit. Med. 9, 323 (2026). https://doi.org/10.1038/s41746-026-02401-2

Mots-clés: IA vidéo chirurgicale, endoscopie assistée par ordinateur, collaboration humain–IA, analyse d'images médicales, support à la décision clinique