Inhaltspezifische Aktionen

Forschungsschwerpunkte

Forschungsschwerpunkte des Instituts Predictive Deep Learning for Medicine and Healthcare der Justus-Liebig-Universität Gießen

Leverage the Unreachable - Föderiertes Lernen zur sicheren Generrierung globaler ML-Modelle in der Medizin

Sensible Patienteninformationen wie klinische Daten und Daten aus medizinischen Registern werden häufig in kritischen, über verschiedene Einrichtungen verteilten Gesundheitsinfrastrukturen gespeichert. Die Analyse solcher Daten birgt Risiken für den Schutz der Privatsphäre und fällt daher unter eine Reihe von Rechtsvorschriften wie die Allgemeine Datenschutzverordnung (GDPR), was die Anwendung herkömmlicher Algorithmen für maschinelles Lernen oft unmöglich macht. Vor allem der Datenaustausch zwischen Institutionen über das Internet stellt ein Hindernis für Big-Data-basierte medizinische Innovationen dar. Deshalb entwickeln wir Algorithmen für föderiertes Lernen, die einer Privacy-by-Design-Architektur folgen. FL-Techniken zielen darauf ab, die Hürde des Austauschs von Patientenrohdaten zu überwinden und eine groß angelegte medizinische Datengewinnung zu ermöglichen. Die Idee ist, ein verallgemeinertes globales Modell ohne Zugang zu einem gemeinsamen Datensatz zu erstellen, indem lokal trainierte Modelle, die das Wesen der Daten erfassen, zusammengeführt werden. Im Rahmen dieser Fokussierung werden wir in kürze das BMBF finanzierte FAIrPaCT Projekt starten (siehe Projekte). Maryam Moradpour ist seit kurzem Mitglied unserer Gruppe und wird sich auf die Entwicklung von föderierten Algorithmen für sich nicht teilweise überschneidende biomedizinische Datensätze konzentrieren.

Just-In-Time Prediction - Online und zeitkritische Ereignisprognosen

Der Großteil der gegenwärtigen klinischen und omics-Forschung beschränkt sich häufig auf die Untersuchung von Querschnittschnappschüssen bestimmter Krankheiten. Die meisten Krankheiten durchlaufen jedoch während ihrer Entwicklung verschiedene Stadien oder entwickeln sich in Abhängigkeit von Einflüssen wie Genetik, Umwelt oder Medikamenten zu unterschiedlichen Subtypen. Daher kann eine Analyse, die sich auf einen einzigen Zeitpunkt der Metaboliten- oder Proteinhäufigkeit des Patienten konzentriert, potenzielle Biomarker-Muster übersehen, insbesondere wenn es darum geht, Subtypen von Krankheiten zu identifizieren und die Behandlung zu optimieren. Neue Technologien ebnen den Weg für Längsschnittanalysen und die Online-Überwachung von schnell fortschreitenden Krankheiten oder sich ändernden Patientenwerten, zum Beispiel von Parametern der Lungenfunktion oder Metaboliten in der Ausatemluft. Unsere Gruppe entwickelt Methoden und Pakete wie das R-Paket LoBrA für lineare Längsschnitt-Spline-Analysen und fortschrittlichere rekurrente neuronale Netze zur Modellierung realer Längsschnittdaten. Zum Beispiel haben wir das LoBrA-Paket auf metabolische Atemdaten von Ratten angewandt, um das Potenzial der computergestützten metabolischen Atemanalyse als Frühwarnsystem für zeitkritische Krankheiten wie Sepsis zu beleuchten. Darüber hinaus werden wir unsere Methoden einsetzen, um klinische Variablen zu untersuchen, die während der mechanischen Beatmung erfasst werden, und das Fortschreiten des akuten Atemversagens zu modellieren. Dr. Zully Ritter und Stefan Rühlicke arbeiten derzeit im Ensure Projekt, dessen Ziel es ist ein klinisches Entscheidungsunterstützungssystem für die Diagnostik in der Notaufnahme zu implementieren und dessen Nutzen im Vergleich zu bisherigen Leitfäden zu evaluieren.

Leveraging the Vast Known - Trasferlernen zur Bewältigung der Herausforderungen von Datenheterogenität und -knappheit

Datenknappheit und Heterogenität sind zwei der größten Herausforderungen im Bereich der medizinischen Datenwissenschaft. Transferlernen ist ein potentieller Lösungsansatz für diese Probleme und wurde bereits erfolgreich in der medizinischen Bildgebung eingesetzt, indem vor-trainierte Modelle aus allgemeinen Bilddatenbanken wie ImageNet verwendet wurden, um z. B. Hautkrebs zu erkennen. Darüber hinaus kann es auch in der biomedizinischen Forschung von großem Nutzen sein, wo ein Mangel an ausreichenden Daten noch häufiger vorkommt. Die bedeutenden technologischen Fortschritte der “Next-Generation Sequencing” Technologien haben zu einer großen Anzahl spezieller Studien mit unterschiedlichen Zielsetzungen geführt, die oft auf eine große Anzahl von Datensätzen verteilt sind.

Die daraus folgende Heterogenität der Daten ist eine der großen Herausforderungen für die integrative Analyse, die eine Zusammenführung von Daten aus verschiedenen Entwicklungsbereichen erfordert und bisweilen dazu führt, dass die bestehenden Daten noch nicht vollumfänglich genutzt werden können. So erfordern beispielsweise verschiedene Datentypen eine unterschiedliche Verarbeitung, selbst wenn die Datensätze aus derselben Sequenzierungstechnik stammen. Darüber hinaus erschweren andere Herausforderungen wie Batch-Effekte und Rauschen oft die Analyse biomedizinischer Daten. In unserer Gruppe versuchen wir daher, Transfer-Learning-Methoden zu entwickeln, die diese Herausforderungen überwinden, indem wir große öffentliche Datensätze aus einem Bereich nutzen und diese übertragen, um Aufgaben in einem anderen Zielbereich mit kleineren Datensätzen zu verbessern und so aussagekräftige biomedizinische Erkenntnisse zu gewinnen. Kürzlich hat Youngjun Park eine Methode entwickelt, um Wissen zwischen Datensätzen aus verschiedenen Sequenzierungstechnologien zu übertragen um Batch-Effekte und Rauschen im Zielbereich zu metigieren. Derzeit entwickelt unser Team Methoden zur Domänenanpassung und zum Zero-Shot-Lernen, um Wissen auf eine andere biologische Domäne übertragen zu können.

Opening the Black Box - Modell- und Vorhersageinterpretierbarkeit durch erklärbare Methoden der künstlichen Intelligenz

Bei der Anwendung von maschinellen Lernverfahren in Bereichen wie der klinischen Entscheidungsunterstützungssystemen (CDSS) mangelt es typischerweise an Vertrauen in die sogenannten “Black-box” Lernmodelle, die es nicht erlauben, die Faktoren zurückzuverfolgen, die zu einer bestimmten Entscheidung führen. Der Bereich der eXplainable Artificial Intelligence (XAI) versucht, die Transparenz und Vertrauenswürdigkeit von KI-Modellen zu erhöhen und damit den Einsatz von KI-Modellen in CDSS zu steigern. Bislang ist ihre Nutzung jedoch hauptsächlich auf Data-Science-Experten beschränkt. In einem ihrer aktuellen Projekte entwickelt Frau Beinecke eine grafische Benutzeroberfläche (GUI) zur Visualisierung und Analyse von XAI-Faktorgewichtungen auf Graphdatensätzen wie Protein-Protein-Interaktionsnetzwerken, um Forschern aus anderen Bereichen ein tieferes Verständnis der zugrunde liegenden Modelle zu ermöglichen. Die GUI ist Teil einer Human-in-the-Loop-Plattform, die die Manipulation von Graphen auf der Grundlage der durch die XAI-Faktorgewichtungen gewonnenen Erkenntnisse ermöglichen wird. Darüber hinaus arbeitet sie an einer umfassenden Benchmarking-Studie, die sich auf die Vertrauenswürdigkeit von XAI-Methoden bei verschiedenen Arten und Größen von insbesondere biomedizinischen Daten konzentriert, um einen Leitfaden zu entwickeln, der die Akzeptanz von KI-Methoden als klinische Entscheidungsunterstützungssysteme (CDSS) fördern wird. Darüber hinaus nutzt Zully Ritter klassische Tools wie SHAP und LIME, um Informationen darüber zu erhalten, welche Parameter und deren Gewichtung in Bezug auf die richtige Vorhersage in den Entscheidungsprozess einfließen. Diese Methoden sind unerlässlich, um die Akzeptanz dieser CDSS zu erhöhen, insbesondere in der Intensiv- und postklinischen Versorgung, nicht nur, um das Verständnis der getroffenen Entscheidung zu ermöglichen, sondern vor allem, wenn sich die ML-Vorhersage von denen der Kliniker unterscheidet.

Klinische Entscheidungsunterstützung (CDSS) basierend auf maschinellen Lernmodellen

Modelle des maschinellen Lernens (ML) sind ein wesentliches Werkzeug, das, integriert in tragbare Geräte oder ein klinisches Setup, vom medizinischen Personal als klinische Entscheidungsunterstützung verwendet werden kann. Patientendaten, einschließlich Vitalzeichen, Symptome und Ergebnisdiagnose, werden häufig verwendet. Einige Überlegungen, wie physiologische Filter, sind für die Vorverarbeitung und Bereinigung von Datenschritten unerlässlich. Zully Ritter arbeitet an praktischen Anwendungen von maschinellen Lernmodellen, die die diagnostische Vorhersage bei Patienten in der Notaufnahme umfassen. In einem so spezifischen klinischen Umfeld ist die Beurteilung der Patientendiagnose ein zeitkritischer Prozess, um angemessene Behandlungsstrategien einzuleiten. Es stellt somit einen der wichtigsten Schritte in Bezug auf das Patientenergebnis in der Notfallversorgung dar. ML-Modelle sind zeitsparend und verwalten den klinischen Fall eines bestimmten Patienten unter Verwendung der zuvor gelernten Ergebnisse aus den analysierten Daten mehrerer Patienten in angemessener Zeit. In kritischen Fällen könnte es bei Notfallpatienten lebensrettend sein.