Denn: Nicht jede Datenquelle ist ein Ersatz für kontrollierte klinische Forschung. Dabei ist das Versprechen bestechend: Überall im Gesundheitswesen entstehen tagtäglich Daten, bei Arztbesuchen, DiGA, Krankenhausaufenthalten oder durch Abrechnungen. Diese „Routinedaten“ (Routinely Collected Data, RCD) sind in großen Mengen verfügbar und kostengünstiger zu gewinnen als klassische, eigens für eine Forschungsfrage designte Studien. Doch in der Wissenschaft wächst die Sorge, dass der Wunsch nach schnellen Ergebnissen den Blick auf die methodische Qualität verstellt. Ein aktueller Beitrag im British Medical Journal (Juni 2026), an dem u.a. Tim Mathes vom IQWiG mitgewirkt hat, ordnet das Thema ein.
Doch zunächst: Was genau sind RWD und RCD?
- RWD (Real World Data): Es handelt sich um keinen wissenschaftlich standardisierten Begriff, sondern ein deskriptiver Oberbegriff für alle Daten, die außerhalb des kontrollierten Settings klinischer Studien (RCTs) generiert werden. Er ist sehr weit gefasst und wird von Fachgremien wie dem IQWiG aufgrund seiner Unschärfe und seines oft werblichen („marketinglastigen“) Gebrauchs kritisiert.
- RCD (Routinely Collected Data / Routinedaten): Das ist der wissenschaftlich präzisere Begriff. Er bezeichnet eine spezifische Untergruppe innerhalb der RWD. Das definierende Merkmal ist ihr Ursprung: Sie sind „Abfallprodukte“ administrativer Prozesse und klinischer Dokumentationspflichten.
Die Position des IQWiG: Methodische Exzellenz vor Datenfülle
Das IQWiG positioniert sich in der Debatte ganz klar: Beobachtungsstudien auf Basis von Routinedaten sind zwar eine notwendige Ergänzung (etwa für seltene Ereignisse oder Langzeiteffekte nach der Zulassung), sie können jedoch die randomisierte kontrollierte Studie (RCT) nicht ersetzen.
Der Grund ist methodischer Natur: In einem RCT sorgt die Randomisierung dafür, dass Patient:innen vergleichbar sind. Bei Routinedaten hingegen ist die Wahl einer Therapie meist zielgerichtet: Ein Arzt verschreibt ein Medikament bei bestimmten Symptomen oder Vorerkrankungen. Wenn man nun die Ergebnisse dieser Patienten vergleicht, misst man oft nicht die Wirksamkeit des Medikaments, sondern die Unterschiede in der Ausgangslage der Patientengruppen. Ohne aufwendige Korrekturverfahren führt dies zu massiven Verzerrungen, dem sogenannten „Bias“.
Die Rolle der KI im breiteren Kontext
Die Künstliche Intelligenz (KI) ist in der Rolle eines „Verstärkers“. Einerseits bietet Machine Learning Werkzeuge, um große, heterogene Datensätze zu bereinigen und komplexere, nicht-lineare Zusammenhänge in den Daten zu erkennen. Andererseits warnt die Forschung vor Risiken:
- Statistische „Shortcuts“: KI-Modelle neigen dazu, Korrelationen in den Daten zu finden, die auf administrativen Abläufen basieren (z. B. „In Krankenhäusern mit besserer Ausstattung wird häufiger getestet“), statt auf medizinischen Effekten.
- Black-Box-Problematik: Da viele Algorithmen ihre Entscheidungswege nicht offenlegen, bleiben methodische Fehler oder die Diskriminierung bestimmter Bevölkerungsgruppen oft unbemerkt.
- Überinterpretation: KI ersetzt kein Studiendesign. Ohne klinische Expertise, die den Kontext der Daten versteht, liefern Algorithmen zwar statistisch signifikante, aber klinisch irrelevante oder gar irreführende Ergebnisse.
Die Debatte ist kein „Entweder-oder“
Die Fachwelt, darunter auch Expert:innen des IQWiG, sieht die Lösung in einer Hybrid-Strategie:
- RCTs stärken: Man sollte stärker versuchen, klassische Studien im Versorgungsalltag einfacher, schneller und kostengünstiger durchzuführen.
- Evidenzlücken gezielt schließen: Routinedaten sollten vor allem dort genutzt werden, wo prospektive Studien kaum möglich sind (z. B. seltene Erkrankungen, Nutzenbewertung nach Markteintritt).
- Methodische Strenge: Analysen von Routinedaten erfordern eine interdisziplinäre Zusammenarbeit.
- Die methodische Hürde muss hoch bleiben, um Fehlentscheidungen in der Gesundheitsversorgung zu verhindern.
„Ob Statistikerinnen, Kliniker, Epidemiologinnen, HTA- oder KI-Experten – alle sind sich einig: Bei der Nutzung von Routinedaten stellen sich besondere Herausforderungen, und es braucht gezielte Strategien, um sie sinnvoll zu nutzen. Wir zeigen, dass in vielen Fällen die Durchführung einer RCT, die Routinedaten nutzt, der bessere Weg ist.“ — Tim Mathes, Leiter des IQWiG-Ressorts Gesundheitsökonomie
Wer mehr wissen möchte:
Die wichtigsten Aspekte im Überblick:
#Datenquelle: Routinedaten (RCD) sind administrative Nebenprodukte und keine primär für die Forschung erhobenen Daten.
#Methodisches Risiko: Das Hauptproblem ist der „Bias“ (systematische Verzerrung). Da keine Randomisierung vorliegt, sind Ergebnisse oft nicht kausal interpretierbar.
#IQWiG-Standpunkt: RCTs bleiben der Goldstandard. Routinedaten sind wertvolle Ergänzungen, aber kein Ersatz für eine methodisch saubere Evidenzgenerierung.
#KI als Werkzeug: KI kann Datenqualität verbessern und komplexe Muster finden, birgt aber die Gefahr, durch Black-Box-Entscheidungen klinisch unsinnige „Shortcuts“ zu nehmen.
#Interdisziplinarität: Eine fundierte Analyse von Routinedaten erfordert zwingend das Zusammenspiel von Epidemiologie, klinischer Erfahrung und Statistik. KI allein reicht als methodisches Fundament nicht aus.
RWD umfassen eine enorme Bandbreite an Datenquellen:
- Administrative Daten: Abrechnungsdaten von Krankenkassen, Entlassberichte, DRG-Daten.
- Elektronische Patientenakten (EHR): Dokumentationen aus der ambulanten und stationären Versorgung.
- Registerdaten: Spezifische Krankheitsregister, die Daten nach einem gewissen Protokoll sammeln.
- Patient-Generated Health Data (PGHD): Informationen von Wearables, Fitness-Trackern, Gesundheits-Apps (DiGA) oder Patient-Reported Outcome Measures (PROMs).
Die entscheidenden Charakteristika der RCD sind:
- Kein Forschungsdesign: Die Daten wurden nicht primär erhoben, um eine spezifische klinische Hypothese zu prüfen, sondern um die Versorgung abzubilden oder die Abrechnung sicherzustellen.
- Fehlende Standardisierung: Da sie für administrative Zwecke optimiert sind, fehlen oft die für die Forschung notwendigen kontrollierten Messbedingungen.
- Eingeschränkte Kontrolle: Forschende haben keinen Einfluss darauf, welche Variablen erhoben wurden, wie oft sie gemessen wurden oder wer die Daten nach welchen Kriterien kodiert hat.
Das Repräsentativitäts-Problem (Bias):
Routinedaten bilden die Bevölkerung verzerrt ab:
- Systematische Untererfassung: Minderheiten, einkommensschwache oder ländliche Bevölkerungsgruppen sind unterrepräsentiert und erhalten zudem seltener Diagnostik.
- Fragmentierung: Diese Gruppen nutzen oft verschiedene Institutionen, was zu lückenhaften, schwer zusammenführbaren Datensätzen führt.
- Risiken bei der Datenzusammenführung
- Falsche Vergleichbarkeit: Datensätze werden oft mit ungeeigneten Kontrollgruppen kombiniert (z. B. Kleinkinder als Kontrolle für allgemeine Patienten), was Vorhersagemodelle durch statistische Artefakte verfälscht.
BMJ-Publikation: Sabine Hoffmann et al. (2026). Using routinely collected data for research purposes: challenges and mitigation strategies. BMJ 2026;393:e087812. Published online June 2nd, 2026.