In der medizinischen Praxis erleben wir einen Widerspruch, der auf den ersten Blick kaum zu glauben ist: Für häufige und vergleichsweise einfache Diagnosen wie Anämie stehen enorme Datenmengen zur Verfügung – während für komplexe oder seltene Krankheitsbilder oftmals genau das fehlt, was Künstliche Intelligenz (KI) dringend bräuchte: strukturierte, qualitativ hochwertige Daten. Dabei wäre gerade hier der Nutzen von KI besonders groß.
Für eine Anämie genügen häufig ein paar Laborwerte, etwa das Hämoglobin, um die Diagnose zu stellen. Diese Parameter sind Routine in der ärztlichen Versorgung, sie fallen massenhaft an und sind in vielen Krankenhäusern standardisiert dokumentiert. Das bietet eine ideale Grundlage für KI-Systeme, die auf diesen strukturierten Daten trainiert werden können – mit hoher Genauigkeit und auf breiter Datenbasis.
Anders sieht es bei komplexen Erkrankungen wie bestimmten Krebsarten oder seltenen Krankheitsbildern aus. Hier ist die Datenlage nicht nur dünn, sondern oft auch unübersichtlich. Komplexe Diagnosen beruhen auf zahlreichen Einflussfaktoren, benötigen interdisziplinäre Befunde, molekulare Daten, Bildgebung, Laborwerte und vieles mehr. Diese Daten stammen aus unterschiedlichen Quellen, sind oft nicht standardisiert oder nicht maschinenlesbar. Das macht sie für klassische Machine-Learning-Modelle schwer nutzbar – und limitiert den potenziellen Nutzen von KI ausgerechnet dort, wo sie besonders gebraucht wird.
Warum KI gerade bei komplexen Diagnosen besonders helfen kann
Ein weit verbreiteter Irrtum ist, dass KI besonders für einfache Aufgaben geeignet sei. Tatsächlich liegt das größte Potenzial der Technologie dort, wo menschliche Expert:innen an ihre kognitiven Grenzen stoßen: bei der Verarbeitung sehr vieler Informationen, bei komplexen Differentialdiagnosen oder bei seltenen Krankheitsverläufen.
Gerade bei Patient:innen mit unklaren Symptomen, multiplen Vorerkrankungen oder genetisch bedingten Risiken kann KI dabei helfen, Muster zu erkennen, die in der klassischen Diagnostik leicht übersehen werden. Ein intelligentes System, das auf viele tausend ähnliche Fallverläufe trainiert wurde, kann hier wertvolle Hinweise geben, Wahrscheinlichkeiten berechnen oder zusätzliche Hypothesen liefern.
Auch in der Onkologie eröffnen KI-gestützte Verfahren neue Möglichkeiten: etwa bei der Analyse genetischer Tumorprofile, bei der automatisierten Bildauswertung oder bei der Unterstützung komplexer Therapieentscheidungen. Doch damit solche Systeme zuverlässig arbeiten können, brauchen sie eine solide Datenbasis. Und genau hier liegt das Problem.
Datenmangel bremst Innovation
Der Einsatz von KI steht und fällt mit der Verfügbarkeit guter Daten. Gerade Machine-Learning-Modelle – und insbesondere Deep-Learning-Ansätze – benötigen viele, idealerweise qualitativ hochwertige und sauber gelabelte Beispiele, um verlässliche Vorhersagen treffen zu können. Fehlen diese Daten, werden die Modelle unsicher, unzuverlässig oder gar unbrauchbar.
Für seltene Erkrankungen ist dieses Problem besonders ausgeprägt. Wenn eine bestimmte Krankheit nur einige hundert Menschen in Europa betrifft, dann ist es extrem schwierig, ausreichende Trainingsdaten zu generieren – selbst wenn viele Kliniken beteiligt sind. Aber auch für hochspezialisierte Fragestellungen in der Onkologie oder bei seltenen Tumorsubtypen stößt man schnell an Grenzen.
Hinzu kommt: Viele der vorhandenen Daten liegen unstrukturiert vor – etwa als Freitext in Arztbriefen, in Bildformaten oder als individuelle Verlaufsdokumentation in lokalen Systemen. Sie lassen sich nicht ohne Weiteres für das Training von KI-Modellen verwenden. Das erschwert die Skalierung von KI-Anwendungen erheblich – und sorgt dafür, dass ihr Potenzial in komplexen Bereichen bislang kaum ausgeschöpft wird.
Was wir tun können: Drei Ansätze für bessere KI-Anwendungen
Trotz dieser Herausforderungen gibt es konkrete Wege, wie wir die Verfügbarkeit und Nutzbarkeit von Daten für KI verbessern können. Drei zentrale Ansätze sind besonders vielversprechend:
1. Daten harmonisieren und interoperabel machen
Daten sind nicht selten – sie sind nur häufig schlecht zugänglich. Unterschiedliche Dokumentationssysteme, uneinheitliche Formate und fehlende Schnittstellen erschweren es, Informationen sinnvoll zusammenzuführen. Genau hier setzen internationale Standards wie HL7 FHIR an: Sie helfen dabei, medizinische Informationen strukturiert, interoperabel und maschinenlesbar zu erfassen und zu teilen.
Wenn Diagnosen, Befunde und Laborwerte standardisiert kodiert sind, lassen sich Daten aus verschiedenen Quellen kombinieren – etwa aus mehreren Kliniken, Studien oder Systemen. So können auch seltene Erkrankungen oder komplexe Verläufe überregionale Fallzahlen erreichen, die für KI nutzbar sind.
2. Auf vorhandenem Wissen aufbauen
KI muss nicht immer bei Null anfangen. Es gibt viele vortrainierte Modelle, die auf allgemeinen medizinischen Daten oder Literatur beruhen. Diese Modelle bringen bereits ein fundiertes Vorwissen mit und lassen sich mit vergleichsweise wenig zusätzlichem Input für spezifische Fragestellungen anpassen.
Außerdem lässt sich medizinisches Expertenwissen in Form von Leitlinien, Ontologien oder Studienergebnissen in die Modellarchitektur einbauen. So lernt das System nicht allein aus Patientendaten, sondern auch aus medizinischen Zusammenhängen, die bereits gut belegt sind. Das spart nicht nur Daten, sondern erhöht auch die Qualität und Vertrauenswürdigkeit der Ergebnisse.
3. Kollaborative Netzwerke aufbauen und nutzen
Die zentrale Herausforderung bei seltenen und komplexen Erkrankungen ist die Verteilung der relevanten Informationen. Einzelne Häuser sehen oft nur wenige Fälle – aber gemeinsam lässt sich ein breites Bild erzeugen. Kollaborative Netzwerke wie die Medizininformatik-Initiative oder MEDICUS schaffen genau solche Plattformen, auf denen Daten sicher, anonymisiert und strukturiert geteilt werden können.
Durch die Beteiligung vieler Einrichtungen können so aus vereinzelten Daten echte Fallkohorten entstehen. Das erhöht nicht nur die Datenbasis für KI-Modelle, sondern fördert auch die gemeinsame Weiterentwicklung diagnostischer Standards – zum Beispiel durch Rückmeldungen aus dem klinischen Alltag oder durch gemeinsame Studien.
Fazit: Das Potenzial von KI nicht ungenutzt lassen
KI bietet enormes Potenzial, gerade für jene Bereiche der Medizin, in denen menschliche Expertise durch Komplexität, Unsicherheit oder Informationsflut an ihre Grenzen stößt. Es ist paradox, dass genau hier oft die nötigen Daten fehlen – doch es ist auch eine Chance.
Wenn wir Daten klüger strukturieren, vorhandenes Wissen einbeziehen und stärker zusammenarbeiten, können wir diese Kluft überbrücken. Bei medicalvalues setzen wir genau hier an: Wir helfen, medizinische Daten besser nutzbar zu machen, schaffen Standards für Interoperabilität und entwickeln KI-Modelle, die nicht nur häufige, sondern auch seltene und komplexe Fragestellungen adressieren.
Denn letztlich geht es um bessere Versorgung. Und dafür lohnt es sich, das Potenzial von KI auch dort zu heben, wo es heute noch zu oft ungenutzt bleibt.