APA/APA/THEMENBILD/HELMUT FOHRINGER

KI liefert laut Studie keine Garantie gegen Fehldiagnosen

Künstliche Intelligenz (KI) liefert keine Garantie gegen Fehldiagnosen. Ein in einer Studie des Inselspitals in Bern getestetes KI-Diagnosesystem habe die hohen Erwartungen der Forschenden enttäuscht, teilte das Spital am Montag mit. Das System zeigte laut einer in der Fachzeitschrift "The Lancet Digital Health" veröffentlichten Studie keinen messbaren Vorteil gegenüber herkömmlichen diagnostischen Methoden.

Nach Angaben des Inselspitals handelt es sich um die weltweit erste Studie zu einem KI-basierten Diagnosesystem in der Akutmedizin. Für die Studie untersuchte das Forschungsteam um Wolf Hautz vom Inselspital Bern die Diagnosen von rund 1200 Patientinnen und Patienten, die mit unspezifischen Beschwerden wie Ohnmacht, Bauchschmerzen oder Fieber in den Notfallstationen des Inselspitals Bern, des Bürgerspitals Solothurn, des Spitals Tiefenau oder des Spitals Münsingen behandelt wurden. Bei einem Teil der Patienten ließen sich die Forschenden bei der Diagnosestellung vom KI-basierten System "Isabel Pro" unterstützen.

Die Qualität der Diagnose wurde daran gemessen, ob Patientinnen und Patienten innerhalb von zwei Wochen nach ihrer Behandlung ungeplante medizinische Nachsorge benötigten, die Diagnose im Nachhinein geändert wurden, eine unerwartete Intensivaufnahme erforderlich war oder ob es zu Todesfällen kam.

Sowohl unter den Patienten mit einer KI-Diagnose als auch unter jenen mit einer Diagnose ohne technische Hilfsmittel trat eines dieser Qualitätsprobleme bei 18 Prozent ein. Auch bezüglich schwerwiegenden unerwünschten Ereignissen und dem Ressourcenverbrauch, gemessen in Schweizer Franken, gab es keine Unterschiede zwischen den Gruppen.

KI trotzdem nicht zwingend unwirksam

"Es ist enttäuschend, die Ergebnisse einer negativen Studie zu lesen in einem Bereich, den wir seit 20 Jahren intensiv erforscht haben", schrieben die zwei nicht an der Studie beteiligten britischen Forschenden Olga Kostopoulou und Bendan Delaney in einem Kommentar zur Studie, der im gleichen Fachblatt erschienen ist. Ein einzelnes negatives Ergebnis einer klinischen Studie bedeute aber nicht dringend, dass KI-basierte Systeme für die medizinische Diagnostik unwirksam seien.

Laut dem Kommentar könnten mehrere Faktoren die Wirksamkeit des KI-Systems beeinflusst haben. So könnte das KI-System zu spät im diagnostischen Prozess eingesetzt worden sein, wie die Forschenden argumentierten. Auch psychologische Faktoren könnten demnach eine Rolle gespielt haben. Ärzte neigen laut den Forschenden dazu, ihre anfänglichen Diagnosen zu verteidigen und könnten daher Vorschläge des KI-Systems ignoriert haben, wenn diese ihren eigenen Einschätzungen widersprochen haben.

Fehldiagnosen ein Problem

Bis zu 15 Prozent aller Patientinnen und Patienten, die eine medizinische Behandlung in Anspruch nehmen, erhalten laut dem Inselspital eine Fehldiagnose. Fehldiagnosen gehören somit zu den häufigsten und kostspieligsten medizinischen Problemen weltweit.

Sogenannte computergestützte diagnostische Entscheidungshilfesysteme (auf Englisch "Computerized Diagnostic Decision Support Systems", kurz: CDDSS), sollen durch die Analyse von Symptomen und Befunden die diagnostische Genauigkeit erhöhen und das medizinische Fachpersonal bei der Diagnosestellung unterstützen.

Die Studienresultate verdeutlichen laut dem Studienleiter Hautz, dass computergestützte Diagnosesysteme, zumindest in ihrem aktuellen Entwicklungsstand, keinen erheblichen Einfluss auf die diagnostische Qualität in der Notfallmedizin haben."Wir müssen andere Lösungsansätze verfolgen, um die Diagnosequalität zu verbessern, und insbesondere die Forschung zu diesem Thema, die aktuell in den Kinderschuhen steckt, erheblich intensivieren", ließ er sich in der Mitteilung zitieren.

ribbon Zusammenfassung
  • Die Studie umfasste rund 1.200 Patienten in Notfallstationen, und es wurden keine Unterschiede im Ressourcenverbrauch zwischen den Gruppen festgestellt.
  • Fehldiagnosen betreffen bis zu 15 Prozent der Patienten weltweit. Trotz enttäuschender Ergebnisse schließt die Studie nicht aus, dass KI-Systeme in der Diagnostik zukünftig wirksam sein könnten.