KI-generierte Daten verbessern Bilddiagnostik signifikant
KI-generierte, synthetische Bilddaten können KI-Modelle in der bildgebenden Diagnostik erheblich verbessern. Zu diesem Schluss kommt eine internationale Studie eines Forschungsteams der MedUni Wien, die im Fachjournal „European Journal of Nuclear Medicine and Molecular Imaging" veröffentlicht wurde.1

Wie war das Studiendesign aufgebaut?
Dr. Clemens Spielvogel: Die Studie war in zwei Phasen gegliedert. Im ersten Schritt haben wir eine generative KI (GenAI) mit mehr als 9.000 Knochenscans von Patienten trainiert, die entweder eine kardiale Amyloidose, Knochenmetastasen oder keines der beiden aufwiesen, und daraus synthetische Datensätze generiert. Im nächsten Schritt haben wir diese Daten als Input verwendet, um ein Diagnose-KI-Modell zu trainieren. Anschließend wurde das System an vier unabhängigen Institutionen in Europa und Asien validiert.
Wie verhalten sich synthetische Knochenscans im Vergleich zu echten Patientendaten?
Dr. David Haberl: Wir haben uns verschiedene Szenarien angeschaut und die KI einerseits mit einem kleinen Datensatz aus echten Patientendaten trainiert und diese schrittweise mit synthetischen Daten ergänzt, andererseits nur synthetische Daten für das Training verwendet. Das schlechteste Ergebnis erzielten wir mit einem kleinen Datensatz mit echten Daten. Wurden synthetische Daten hinzugefügt, erhöhte sich sukzessive auch die Genauigkeit und Validität. Wir haben auch gezeigt, dass man diese Modelle auch mit rein synthetischen trainieren kann. Die Kombination aus synthetischen und echten Daten hat zwar am besten funktioniert. Aber der Unterschied zwischen einem rein synthetischen Datensatz und einem Mix aus synthetischen plus echten Daten war überraschend klein.
Das heißt, man könnte theoretisch auch nur mit synthetischen Daten eine KI trainieren?
Haberl: Ja, das funktioniert auf jeden Fall.
Spielvogel: Wobei uns wichtig ist festzuhalten, dass synthetische Daten nicht eine Allzwecklösung sind und auch nicht dafür gedacht sind, dass sie die realen Daten komplett ersetzen. Und das zeigen auch unsere Ergebnisse, dass die Kombination am besten ist aus den beiden.
Was ist der Vorteil von diesen künstlichen Datensätzen in der diagnostischen Praxis?
Spielvogel: Künstliche Daten können KI-Modelle, die nur wenige echte Trainingsdaten zur Verfügung haben, entscheidend verbessern. Denn man braucht eine gewisse Datenmenge, damit ein KI-Modell so trainiert werden kann, dass es valide Ergebnisse produziert. Diese Daten können – wie wir gezeigt haben – durchaus synthetisch generiert sein.
Haberl: Ein anderer Use-Case wäre auch, gezielt seltene Erkrankungen oder auch unterrepräsentierte Subgruppen besser im Datensatz abzubilden, sodass das resultierende diagnostische Modell besser funktioniert.
Spielvogel: Ein Vorteil ist darüber hinaus, dass künstliche Daten nicht mehr einer bestimmten Person zugeordnet sind und dadurch keinen Datenschutzbestimmungen unterliegen, weil das ja kein echter Patient ist. Damit können Forschende deutlich einfacher Daten mit anderen Zentren teilen.
Sprechen Sie auf den AI Act an – war dieser ein Beweggrund für die Studie?
Haberl: Uns ging es primär um die Effizienz von KI-Modellen. Aber klar spielt der AI Act und auch der Datenschutz eine große Rolle. Wobei man nicht vergessen darf, dass künstliche Daten zwar keine echten Patientendaten sind, aber dies plausibel dokumentiert und dargestellt werden muss. Wir haben tatsächlich neue Daten kreiert. Aber dadurch, dass unser Modell unendlich viele künstliche Daten erzeugen kann, könnte bei dem viermillionsten Bild vielleicht doch eine Kopie dabei sein. Deswegen ist es sehr wichtig sicherzustellen, dass es keine Kopien, sondern tatsächlich synthetisch erzeugte Daten sind.
Wie gehen Sie mit Bias um bzw. wie reduzieren Sie diese?
Spielvogel: Wir haben das in der Studie nicht primär fokussiert, nachdem es darum ging, zu zeigen, dass die synthetischen Daten an sich funktionieren, und weniger darum, dass diese diagnostischen Modelle jetzt wirklich unmittelbar klinisch anwendbar sind. Dennoch bietet aber unser Ansatz für die Zukunft potenziell auch Lösungen, um Bias zu reduzieren, weil künstliche Datensätze unterrepräsentierte Gruppen aufwerten können. Das trifft einerseits seltene Erkrankungen, aber auch natürlich auch Faktoren wie Herkunft, Alter oder andere.
Haberl: Eines der großen Probleme in dieser Medical Imaging und AI-Community ist, dass es total schwierig ist, den KI-Modellen beizubringen, über mehrere Zentren hinweg zu funktionieren. Und genau deswegen hat unser Modell hier wirklich die Möglichkeit, eine von diesen großen Challenges da in unserem Feld zu lösen oder abzuschwächen.
Klingt ja nach einem Durchbruch in diesem KI-Bereich. Wie wird es weitergehen?
Spielvogel: Auf jeden Fall. Also für uns selbst, aber hoffentlich auch für andere, ist das ein großer Durchbruch. Eine Limitierung ist natürlich, dass wir haben dieses Modell für Knochenszintigraphie entwickelt und getestet haben. Wie gut das für andere Bilddaten funktioniert, müssen wir uns in der Zukunft ansehen. Wir haben geplant, unmittelbar mit der Anwendung für diese Knochenszintigraphie eine prospektive Studie zu planen. Im Fokus soll dann kardiale Amyloidose stehen, weil diese Erkrankung besonders häufig unterdiagnostiziert bleibt.
Danke für das Gespräch!

Von links nach rechts: realer regulärer Scan/synthetischer regulärer Scan, realer Scan mit Verdacht auf Knochenmetastasen/synthetischer Scan mit Verdacht auf Knochenmetastasen, realer Scan mit Verdacht Kardiale Amyloidose/synthetischer Scan mit Verdacht auf Kardiale Amyloidose.