Zielsetzung
Evaluierung von Generative Pretrained Transformer 4 (GPT-4) zur Generierung von Differentialdiagnosen auf der Grundlage von Bildbefunden.
Material und Methoden
Jeweils drei Spezialisten für Neuroradiologie, Thoraxradiologie, abdominelle Radiologie und muskuloskelettale Radiologie legten im Konsens die fünf relevantesten Differentialdiagnosen für insgesamt vier Bildbefunde pro Spezialgebiet fest. Textbeschreibungen der Bildbefunde (z.B. „Singuläre, ringförmig kontrastmittelanreichernde zerebrale Läsion“) wurden in GPT-4 eingegeben, mit der Aufforderung, die fünf wichtigsten Differentialdiagnosen zu nennen. Die Ergebnisse aus GPT-4 wurden durch die Experten in binärer Form als akzeptabel oder inkorrekt eingestuft. Die Anzahl der zwischen GPT und Experten übereinstimmenden Differentialdiagnosen (Konkordanz) sowie die Anzahl der als akzeptabel erachteten, GPT-basierten Diagnosen wurde dokumentiert. Unterschiede in Konkordanz und Akzeptanz zwischen den radiologischen Fachbereichen wurden mit dem χ2-Test mit Bonferroni-Korrektur für multiple Vergleiche ermittelt.
Ergebnisse
Insgesamt wurden 80 Differentialdiagnosen sowohl von der Expertengruppe als auch von GPT-4 erstellt. Die Konkordanz zwischen den von der Expertengruppe und GPT-4 vorgeschlagenen Differentialdiagnosen betrug insgesamt 68,8 % (55/80). 93,8 % (75/80) der von GPT-4 vorgeschlagenen Diagnosen wurden als akzeptabel betrachtet. Signifikante Unterschiede zwischen den radiologischen Spezialgebieten in Bezug auf Konkordanz (P = .225) oder Akzeptanz (P = .503) bestanden nicht.
Schlussfolgerungen
Die durch GPT-4 erstellten Differentialdiagnosen zu Bildbefunden erreichten eine moderate Konkordanz und hohe Akzeptanz, was die Fähigkeit des Modells zur Integration komplexer Informationen zeigt. Ein möglicher Vorteil des untersuchten Ansatzes liegt in der Zeiteffizienz der Informationsgewinnung insbesondere in der Weiterbildungssituation, limitierend erscheint die aktuell noch fehlende Transparenz in Hinblick auf Referenzliteratur in den Trainingsdatensätzen des Modells.