Bei der Tumorverlaufskontrolle von radiologischen Bilddaten ist die Freitextbefundung in der klinischen Routine der Regelfall, während im Rahmen klinischer Studien bereits häufig auf computergestützte Verlaufskontrolle gesetzt wird. Juliane Goebel, Julia Hoischen, Carolin Gramsch, Haemi P. Schemuth, Andreas‑Claudius Hoffmann, Lale Umutlu und Kai Nassenstein haben eine Studie1 durchgeführt, in der sie radiologische Patientenbilder anhand von RECIST 1.1 mit mint Lesion erneut befundet und die Ergebnisse mit den ursprünglichen Freitextbefunden verglichen haben. Sie stellten fest, dass zahlreiche Unterschiede in den abgeleiteten Timepoint-Response-Kategorien bestanden.
Goebel und ihre Forschungspartner wählten 100 Patienten aus, welche die Voraussetzungen für eine Therapieverlaufskontrolle anhand von RECIST 1.1 erfüllten und über CT-Untersuchungen mit einer Baseline und mindestens fünf Follow-up-Zeitpunkten verfügten. Alle Patientenbilder waren zuvor bereits von zwei Radiologen im Konsensverfahren (wovon mindestens einer über mehr als 6 Jahre Erfahrung in der Therapieverlaufskontrolle verfügte) in Form eines unstrukturierten Freitextbefundes befundet worden. Diese Befundberichte wurden daraufhin in die Therapieverlaufskategorien Complete Response (CR), Partial Response (PR), Stable Disease (SD) und Progressive Disease (PD) eingeordnet. In einem zweiten Schritt wurden dieselben Bilddaten und Untersuchungszeitpunkte in mint Lesion von zwei Radiologen im Konsensverfahren anhand der RECIST 1.1 Kriterien befundet, welche in die Software implementiert sind.
Unterschiede zwischen den Freitextbefunden und den von mint Lesion generierten Befundberichten in den fünf verschiedenen Follow-up-Zeitpunkten waren in 47%, 38%, 44%, 37% und 44% der Fälle festzustellen. Hierbei war SD in den Freitextbefunden unterrepräsentiert, PR und PD waren überrepräsentiert. Für diese Unterschiede gab es zwei Hauptgründe: Erstens gab es zahlreiche Fälle, in denen Follow-up-Untersuchungen bei der Freitextbefundung in die Kategorien PD oder PR eingeordnet wurden, obwohl sich die Tumorlast nur geringfügig verändert hatte, und zweitens wurden die Follow-up-Untersuchungen hier häufig zum vorherigen Zeitpunkt in Bezug gesetzt, und nicht, wie in RECIST 1.1 festgelegt, zur Baseline oder zum Nadir.
Die Forscher schlossen, dass diese Unterschiede im Freitextbefund völlig nachvollziehbar seien, da es für einen Radiologen in der klinischen Routine schlicht unmöglich sei, ohne Softwareunterstützung Änderungen in der Tumorlast zu messen oder den korrekten Referenzzeitpunkt (Baseline oder Nadir) zu finden. Da die Zuweisung eines Befundes in eine andere Tumorverlaufskategorie Einfluss auf die weitere Therapie des jeweiligen Patienten habe könnte, empfehlen die Autoren ausdrücklich die Nutzung einer entsprechenden Software wie mint Lesion zur strukturierten Befundung in der klinischen Routine.
Quelle: 1 Goebel J, Hoischen J, Gramsch C, Schemuth HP, Hoffmann AC, Umutlu L, Nassenstein K: Tumor response assessment: comparison between unstructured free text reporting in routine clinical workflow and computer-aided evaluation based on RECIST 1.1 criteria., in: Journal of Cancer Research and Clinical Oncology