Forschende der Uniklinik RWTH Aachen haben das erste Grundlegende Modell für die biomedizinische Bildgebung entwickelt
Einen Meilenstein in der biomedizinischen Forschung erreichten nun Wissenschaftlerinnen und Wissenschaftler um Professor Fabian Kießling vom Institut für Experimentelle Molekulare Bildgebung an der Uniklinik RWTH Aachen und Fraunhofer MEVIS sowie Dr. Johannes Lotz vom Fraunhofer MEVIS. Gemeinsam mit anderen Forschenden der RWTH, der Universität Regensburg und der Hannover Medical School entwickelten sie UMedPT, ein wichtiges Grundlegendes Modell für die biomedizinische Bildgebung. Seine Arbeit veröffentlichte das Team unter dem Titel „Overcoming data scarcity in biomedical imaging with a foundational multi-task model“ in Nature Computational Science.
Das Vortraining mit Vorläufermodellen, wie es auch in ChatGPT angewandt wird, kann die erforderliche Menge an Trainingsdaten durch Wiederverwendung von Wissen reduzieren. Jedoch müssen Grundlegende Modelle auf großen, umfassenden Datensätzen trainiert werden, die im biomedizinischen Bereich oft nicht verfügbar sind. Um dieses Hindernis zu überwinden, haben die Forschenden UMedPT entwickelt und anhand von Röntgenbildern sowie mikroskopischen und tomografischen Bildern umfassend validiert. UMedPT basiert auf einem eigens dafür entworfenen, neuartigen Multitasking-Lernalgorithmus, der auf einer vielfältig beschrifteten Sammlung kleiner bis mittelgroßer biomedizinischer Bildgebungsdatensätze trainiert werden kann.
„Unsere Ergebnisse zeigen, dass ein einzelnes Netzwerk klare Vorteile gegenüber dem Stand der Technik haben kann“, sagt Professor Fabian Kießling. „Im internationalen Wettbewerb SemiCOL übertraf UMedPT alle anderen Methoden bei der Klassifizierung von Darmkrebs“, so Professor Kießling weiter. Auch mit ImageNet-vortrainierte Modelle sowie die besten veröffentlichten Referenzergebnisse mit nur einem Prozent der ursprünglichen Trainingsdaten für Aufgaben mit verwandten Daten in der Pretraining-Datenbank erreichten nicht die Genauigkeit von UMedPT. Selbst bei Aufgaben ohne verwandte Daten in der Pretraining-Datenbank übertraf UMedPT die Leistung sowohl von ImageNet-vortrainierten Modellen als auch jene von den besten dokumentierten Ergebnissen auf diesem Gebiet mit 50 Prozent der ursprünglichen Trainingsdaten oder weniger.
Diese Fortschritte zeigten, dass UMedPT erhebliche Vorteile für Anwendungen biete, bei denen die Verfügbarkeit von Stichprobendaten begrenzt sei – ein häufiges Problem in der biomedizinischen Forschung, insbesondere bei seltenen Krankheiten, erklärt Professor Kießling.
Die Publikation finden Sie hier: Overcoming data scarcity in biomedical imaging with a foundational multi-task model | Nature Computational Science