
Neues KI-System PanDerm: „Wir müssen mitentscheiden, wohin der Flug geht“
Ein internationales Team unter der Leitung der Monash University in Melbourne, der University of Queensland in Brisbane und der Medizinischen Universität Wien untersuchte die Leistungsfähigkeit des neu entwickelten KI-Systems "PanDerm" zur Diagnostik von Hauterkrankungen.
Die Ergebnisse der Studie wurden in Nature Medicine veröffentlicht. Koautor Univ.-Prof. Dr. Harald Kittler von der Universitätsklinik für Dermatologie und dem Comprehensive Center of AI in Medicine der MedUni Wien erklärt im Gespräch die Vor- und Nachteile von KI im dermatologischen Praxisalltag.
medonline: Was unterscheidet PanDerm von bisherigen KI-Ansätzen in der Dermatologie?

Univ.-Prof. Dr. Harald Kittler
Prof. Kittler: Bisherige KI-Modelle in der Dermatologie wurden in der Regel nur mit einer Bildmodalität trainiert; beispielsweise ausschließlich mit klinischen Nahaufnahmen, dermatoskopischen Bildern oder dermatopathologischen Aufnahmen. PanDerm hingegen kann verschiedene Bildmodalitäten gleichzeitig integrieren. Das ist ein entscheidender Fortschritt, da dermatologische Diagnosen oft auf multimodalen Bildinformationen basieren.
Ein weiterer wesentlicher Unterschied ist, dass PanDerm nicht auf klassischem, überwachtem Lernen, bei dem die Diagnose als Label während des Trainings zwingend notwendig ist, basiert. Stattdessen wurde PanDerm mit selbstüberwachtem Lernen trainiert. Dabei geht es nicht um die reine Klassifikation, sondern um das möglichst umfassende Verständnis der Bildinhalte. Das macht PanDerm vielseitig einsetzbar. Es kann für verschiedenste Aufgaben adaptiert werden, ohne dass es jedes Mal neu trainiert werden muss.
Welche Krankheitsbilder waren im Trainingsdatensatz vertreten bzw. wie wurde die Qualität sichergestellt?
Der Trainingsdatensatz umfasste ein breites Spektrum dermatologischer Erkrankungen, darunter Neoplasien, entzündliche und genetische Hautkrankheiten. Die Bilder stammten aus verschiedenen Quellen und wurden unter anderem hinsichtlich Bildqualität ausgewählt.
Bei PanDerm stand jedoch nicht die exakte Diagnose jedes Bildes im Vordergrund – anders als beim überwachten Lernen –, sondern die Vielfalt und Repräsentativität der Bilddaten. Unser Ziel war es, möglichst viele Beispiele von möglichst vielen Erkrankungen aus unterschiedlichen Populationen zu sammeln.
Das ist teilweise gelungen, etwa in Bezug auf Krankheitsvielfalt. Gleichzeitig gibt es noch Lücken – etwa bei der Repräsentation von Menschen mit dunkler Hautfarbe, was wir künftig verbessern wollen.
In welchen Bereichen zeigt PanDerm seine größte Stärke?
Die größte Stärke von PanDerm liegt in seiner Vielseitigkeit. Es handelt sich um ein generalistisches Modell, das für verschiedenste dermatologische Aufgaben eingesetzt werden kann und nicht nur für eine einzelne, wie es bei vielen bisherigen KI-Modellen der Fall war.
Wie könnte PanDerm konkret den Alltag in einer dermatologischen Praxis oder Klinik unterstützen?
PanDerm ist kein fertiges Produkt für den klinischen Alltag, sondern ein sogenanntes „Foundation Model“. Es bildet die technische Grundlage für verschiedenste Anwendungen, die darauf aufbauen können. Die konkreten Applikationen – etwa Tools zur Diagnostik oder Entscheidungsunterstützung – müssen erst entwickelt werden. Man kann sich PanDerm sinnbildlich wie eine leistungsstarke Turbine vorstellen. Sie kann viele verschiedene Flugzeuge antreiben, aber das Flugzeug muss erst noch gebaut werden. Und außerdem sollte man wissen, wo man eigentlich hinfliegen möchte.
Gibt es Empfehlungen, wie Ärztinnen und Ärzte am besten mit einem solchen KI-System zusammenarbeiten sollten?
Ärztinnen und Ärzte sollten konkrete klinische Fragestellungen formulieren und sich aktiv mit Entwicklerinnen und Entwicklern vernetzen, um gemeinsam Lösungen zu gestalten. PanDerm ist kein fertiges Produkt, sondern ein Werkzeug, das im Zusammenspiel zwischen Medizin und Informatik nutzbar gemacht werden muss. Die klinische Perspektive ist dabei unverzichtbar.
Wie verändert sich die Rolle der Dermatologin bzw. des Dermatologen durch Systeme wie PanDerm?
Es besteht die Gefahr, dass Ärztinnen und Ärzte durch KI-Anwendungen auf reine Nutzerinnen- und Nutzerrollen reduziert werden. Das wäre ein großer Verlust. PanDerm zeigt, dass wir als Gestaltende aktiv am Entwicklungsprozess teilhaben müssen, nicht nur als Anwendende. Wir müssen nicht nur mitfliegen, sondern mitentscheiden, wohin der Flug geht.
Werden sich klinische Entscheidungen durch die KI nicht nur verbessern, sondern auch verändern?
Ja, mit dem sinnvollen Einsatz von KI werden sich auch die Entscheidungsprozesse verändern, idealerweise in Richtung besserer Diagnostik und effizienterer Versorgung. Aber: Der Einsatz von KI garantiert nicht automatisch eine Verbesserung. Ein schlecht integriertes oder falsch verstandenes System kann auch zu Verschlechterungen führen. Deshalb ist ein verantwortungsvoller Umgang mit KI so wichtig.
Welche nächsten Schritte sind für PanDerm geplant – z. B. klinische Studien, Zulassungen oder Integration in bestehende Softwaresysteme?
Geplant ist, die Trainingsdaten weiter zu diversifizieren, insbesondere im Hinblick auf unterrepräsentierte Gruppen. Außerdem arbeiten wir daran, Textdaten mit Bilddaten zu kombinieren. Ein weiteres Ziel ist die Integration generativer KI-Elemente, um perspektivisch eine KI-gestützte Mensch-Maschine-Interaktion zu ermöglichen, wie man sie etwa von Chatbots kennt.
Gibt es Pläne, das System auch für andere Fachbereiche oder interdisziplinäre Fragestellungen weiterzuentwickeln?
PanDerm wurde speziell für die Dermatologie entwickelt, aber es gibt natürliche Schnittstellen, zum Beispiel in der Dermatopathologie. Entscheidend wird es sein, die richtige Balance zwischen Spezialisierung und Verallgemeinerung zu finden. Grundsätzlich lässt sich das Konzept aber auf andere Fachbereiche übertragen.
Wo sehen Sie KI-gestützte Systeme wie PanDerm in fünf bis zehn Jahren?
Solche Foundation-Modelle werden eine zentrale Rolle in vielen KI-gestützten Anwendungen im Gesundheitswesen spielen. Sie werden die Basis für intelligente, datengetriebene Werkzeuge sein – sowohl in der klinischen Praxis als auch in Forschung.
Was hat Sie bei den Ergebnissen der Studie selbst am meisten überrascht?
Die Vielseitigkeit des Modells, insbesondere, wie gut es sich auf sehr unterschiedliche Aufgaben anwenden lässt.
Was hat Sie persönlich an diesem Projekt besonders begeistert oder gefordert?
Besonders herausfordernd war es, gegen gängige Vorurteile und Missverständnisse gegenüber KI anzugehen. Viele erwarten vorgefertigte Lösungen, dabei funktioniert echte Innovation nur im Team. Es braucht die aktive Beteiligung von Ärztinnen und Ärzten bei der Entwicklung dieser Modelle. Nur wenn wir gemeinsam mit der Maschine arbeiten, können wir wirklich spürbare Verbesserungen für Patientinnen und Patienten und Gesundheitspersonal erreichen. Und genau das ist das lohnendste Ziel.
Flexibles Open Source System mit großem Potenzial
PanDerm gilt als erstes System seiner Art. Es ahmt auf Basis von über zwei Millionen unterschiedlichsten medizinischen Bildquellen die Komplexität der dermatologischen Praxis nach. Zu den Bildquellen gehören Nahaufnahmen, dermatoskopische Bilder, histopathologische Präparate und Ganzkörperaufnahmen. Dieser multimodale Ansatz ermöglicht es PanDerm, nicht nur Hautkrebs, sondern auch zahlreiche weitere Hauterkrankungen mit hoher Genauigkeit zu erkennen.
Breites Spektrum für mit hoher Präzision
Die Evaluation der Genauigkeit von PanDerm hat man anhand von 28 verschiedenen Benchmark-Tests bewertet. Dabei überzeugte die KI bei einer Vielzahl von Aufgaben, etwa bei:
- der Differenzialdiagnose von häufigen und seltenen Hauterkrankungen,
- der Früherkennung von Melanomen,
- der Einschätzung des Hautkrebsrisikos,
- der Beurteilung von Veränderungen in dermatoskopischen Bildern,
- sowie bei Abschätzungen von Prognosen – beispielsweise im Hinblick auf die Wahrscheinlichkeit von Metastasen.
„Das Modell erzielt exzellente Ergebnisse, selbst wenn es für neue Aufgaben nur mit einem Bruchteil der üblicherweise benötigten Daten gespeist ist“, so Prof. Kittler.
Wie die Studie zeigt, konnten Ärztinnen und Ärzte mit Unterstützung von PanDerm die Genauigkeit ihrer Diagnosen bei Hautkrebs um elf Prozent steigern – in der Primärversorgung sogar um 17 Prozent.
Besonders bemerkenswert: PanDerm erkannte Melanome im Frühstadium um zehn Prozent präziser als Fachärztinnen und -ärzte. Außerdem identifizierte es verdächtige Veränderungen der Haut, noch bevor sie dem menschlichen Auge auffielen.
PanDerm ist nicht als fertige Anwendung gedacht, sondern als frei verfügbares und adaptierbares Open Source Modell konzipiert, das sich für verschiedenste Aufgaben weiterentwickeln lässt.