The Great Reality Check Teil 4: Akute Bauchorgane
Lesen Sie die Ergebnisse unserer neuen Anwenderstudien – aktuell und transparent!
Zweck:
Ziel der Studie war es, die Performance eines AI-Assistenten bei akuten Bauchorganen prospektiv zu bestimmen, validiert mit den Akutbefunden von in der Notfallradiologie spezialisierten Radiologen sowie bildgebendem und klinischem Follow up.
Patienten, Material und Methoden:
Im Jahr 2025 wurden 200 Patienten (Alter: 18 bis 8 Jahre, Mittelwert: 55 Jahre, Standardabweichung: ± 15 Jahre), die mit dem Verdacht auf eine akute Erkrankung der Bauchorgane zur CT des Abdomen an ERS Emergency Radiology Schueller, einem Anbieter teleradiologischer Dienste überwiesen worden waren, über zehn aufeinanderfolgende Wochen randomisiert und prospektiv in die Studie aufgenommen. Die CT-Untersuchungen dieser Patienten wurden mit dem AI-Assistenten xAID (Dover, DE, USA) ausgewertet. Der AI-Assistent bot Beurteilungen für die akute Cholecystitis, akute Pankreatitis, akute Appendizitis und die akute Divertikulitis. Die Radiologen beurteilten die CT-Untersuchungen, ohne die AI-Ergebnisse im Vorfeld zu kennen, und verglichen die radiologischen Befunde in einem zweiten Schritt mit den AI-Ergebnissen. Als Goldstandard galten die radiologischen Befunde sowie das bildgebende und klinische Follow up. Bei Diskrepanzen zwischen den radiologischen Befunden und den AI-Ergebnissen wurden die CT-Untersuchungen spätestens innerhalb von 30 Minuten einer Zweitbefundung unterzogen.
Ergebnisse:
Von 200 Patienten konnten 54 AI-Ergebnisse nicht abgerufen werden. Für 146 Patienten diagnostizierten Radiologen und das klinische Follow 31 Patienten mit akuter Cholezystitis (21 %), 30 mit akuter Pankreatitis (20 %), 25 mit akuter Appendizitis (17 %) und 15 mit akuter Divertikulitis (10 %). Die Ergebnisse des AI-Assistenten sind für akute Cholezystitis in Tabelle A, für akute Pankreatitis in Tabelle B, für akute Appendizitis in Tabelle C und für akute Divertikulitis in Tabelle D aufgeführt; richtig positive (TP), falsch positive (FP), falsch negative (FN) und richtig negative (TN) Ergebnisse in absoluten Zahlen; Sensitivität, Spezifität, positiver Vorhersagewert (PPV) und negativer Vorhersagewert (NPV) in Prozent.
Bei der akuten Cholezystitis wurde ein FP bei einem chirurgisch und histologisch bestätigten, ausgeprägten Hydrops und einer Verdickung der Gallenblasenwand beobachtet.

Bei der akuten Pankreatitis wurde ein FP ohne jegliche positive CT-Zeichen beobachtet. Zwei FN traten bei Patienten mit den CT-Zeichen einer beginnenden akuten Pankreatitis auf.
Bei der akuten Appendizitis wurde ein FP in einem radiologisch und klinisch unauffälligen Patienten festgestellt. Die beiden FN wurden bei einem Patienten mit eindeutig positiven CT-Befunden und klinischen Symptome beobachtet.
Bei der akuten Divertikulitis traten zwei FP aufgrund einer Fehlinterpretation einer reaktiven Mesenteritis bei akuter Cholezystitis auf. Ein FN trat bei einem Patienten mit schwerer Pancolitis (entzündliche Darmerkrankung) auf, die sich klinisch, pathologisch, histologisch und radiologisch deutlich von einer Divertikulitis unterschied. Alle vier FN betrafen das linksseitige Colon.

Tabelle E zeigt das Gesamtergebnis des AI-Assistenten für alle akuten Pathologien.
Für Patienten in einer State-of-the-art-Teleradiologie gilt, dass die Wahrscheinlichkeit einer positiven CT-Untersuchung für eine akute Erkrankung der Bauchorgane üblicherweise hoch ist.
Daher wurde in einem zweiten Schritt die Komplexität des akuten Abdomen sowohl im klinischen Bild als auch in der CT-Bildgebung berücksichtigt. Die Ergebnisse des AI-Assistenten wurden hierbei nicht nur als Ja/Nein-Antworten, sondern als behandlungsrelevante Befunde betrachtet. Die Ergebnisse bezüglich aller kritischen falsch positiven oder falsch negativen Differenzialdiagnosen sind in den Tabellen F bis I dargestellt.
Insbesondere wurde ein FP bei einem Patienten mit akuter Blinddarmentzündung und zwei FP bei Patienten mit akuter Pankreatitis beobachtet.

Man sah zwei FP akute Appendizitiden.

Hier spielten FP keine so große Rolle, da diese Patienten ohnehin operiert wurden.

Man sah eine FP akute Appendizitis.

Durch die Kulmination der jeweiligen Organresultate entsteht das Gesamtergebnis in Tabelle J.
Diskussion:
Unseres Wissens ist unsere Studie die erste, die abdominale CT und AI im Kontext akuter Erkrankungen der Bauchorgane untersucht. Im Vergleich zu Ärzten verfolgen AI-Entwickler tendenziell einen pragmatischeren Ansatz bei der Mustererkennung, Segmentierung und Beschreibung von Bauchorganen. Dieser AI-Assistent unterteilt die Bauchhöhle primär anhand von vier Hauptkriterien. Während sich solche Algorithmen zur Berechnung einzelner Parameter, wie beispielsweise einzelner Organe, als geeignet erweisen können, wird der Mangel an menschlicher Sensibilität für das Gesamtbild, insbesondere beim akuten Abdomen, deutlich. Vor allem bei der akuten Cholezystitis und akuten Appendizitis verschlechtern sich die Ergebnisse, wenn der AI-Assistent auf Therapieoptionen stratifiziert werden soll. Bei der akuten Appendizitis können die Gründe auch in der oft ungewöhnlichen Lage der Appendix liegen, insbesondere bei komplizierten abdominalen Fällen, was der häufigsten Situation in der Teleradiologie entspricht. Wichtig zu beachten ist, dass ein AI-Assistent nicht in der Lage ist, den Verlauf eines akuten Abdomen abzubilden, da sich die CT-Muster von einer lokalen Entzündung über eine regionale Phlegmone bis hin zu einer diffusen Peritonitis und Perforation verändern können.
Zusammenfassend sind die Ergebnisse des AI-Assistenten vielversprechend. Diese Studie unterstreicht die dringende Notwendigkeit einer kontinuierlichen und kompetenten Zusammenarbeit zwischen Radiologen und Softwareentwicklern, um klinisch relevante und leistungsstarke AI-Assistenten zu entwickeln.
Gerd Schueller und das Team von Radailogy


