FOR 5363: KI-FOR Integration von Deep Learning und Statistik zum Verst?ndnis strukturierter biomedizinischer Daten

Auf einen Blick

Laufzeit
01/2023  – 01/2027
DFG-Fachsystematik

Elektrotechnik und Informationstechnik

Medizin

Sozialwissenschaften

F?rderung durch

DFG Forschungsgruppe DFG Forschungsgruppe

Projektbeschreibung

Hochdurchsatzmessungen in den biomedizinischen Wissenschaften wie z.B. Bilder, Genomsequenzen oder Zeitreihen stellen strukturierte Daten dar, die durch inh?rente Abh?ngigkeiten zwischen den Messungen, oft nicht-vektorielle Struktur und das Vorhandensein von St?rgr??en und Stichprobenverzerrung gekennzeichnet sind. So k?nnen z.B. die Populationsstruktur, systematische Messartefakte, nicht unabh?ngige Stichproben oder unterschiedliche Altersverteilungen in den Gruppen zu falschen Ergebnissen führen, wenn sie nicht berücksichtigt werden. Deep Learning (DL) zeichnet sich in vielen Anwendungen auf strukturierten Daten durch die F?higkeit aus, komplexe Abh?ngigkeiten innerhalb und zwischen Eingaben und Ausgaben zu erfassen, was eine genaue Pr?diktion erm?glicht. Trotz der jüngsten Fortschritte bei erkl?rbarer künstlicher Intelligenz und Bayesschen neuronalen Netzen gibt es beim DL immer noch Einschr?nkungen hinsichtlich der Unsicherheitsquantifizierung, Interpretierbarkeit und Validierung. Dies sind jedoch wichtige Komponenten, um über die Pr?diktion hinaus Verst?ndnis der zugrunde liegenden Biologie zu erlangen. Zu diesem Zweck wurde in den biomedizinischen Wissenschaften traditionell die Statistik verwendet, aufgrund der interpretierbaren Modellergebnisse und der statistischen Inferenz, die u.a. eine Quantifizierung der Unsicherheit, Adjustierung für St?rgr??en und Testen von Hypothesen mit statistischer Fehlerkontrolle erm?glicht. Methoden der klassischen Statistik sind jedoch begrenzt in ihrer Modellierungsflexibilit?t für strukturierte Daten und ihrer F?higkeit, komplexe Nichtlinearit?ten datengesteuert zu erfassen.In dieser Forschungsgruppe bringen wir Experten aus dem Bereich des maschinellen Lernens und der Statistik mit Erfahrung in biomedizinischen Anwendungen zusammen, um die folgenden übergreifenden Ziele zu erreichen:(O1) Integration von DL und Statistik zur Verbesserung der Interpretierbarkeit, Unsicherheitsquantifizierung und statistischen Inferenz für DL und zur Verbesserung der Modellierungsflexibilit?t statistischer Methoden für strukturierte Daten. Insbesondere werden wir Methoden entwickeln, die statistische Inferenz für strukturierte Daten durch Unsicherheitsquantifizierung, Testen von Hypothesen und Adjustierung für St?rgr??en erm?glichen, und die Erkl?rungen strukturierter Daten durch hybride statistische und Deep-Learning-Modelle, Erkl?rungen auf Populations- und Verteilungsebene und robuste dünnbesetzte Erkl?rungen verbessern. (O2) Schaffung einer Rückkopplungsschleife zwischen dieser Methodenentwicklung und biomedizinischen Anwendungen, wobei wir bei der Entwicklung neuer Methoden die Bedürfnisse bei der Analyse der Daten berücksichtigen und biomedizinische Erkenntnisse aus den Anwendungen der entwickelten Methoden auf die Daten gewinnen wollen. Zu den Anwendungen geh?ren die Analyse von MRT-, fMRT- und Mikroskopie-Bildern, Krankheitsverlaufsmodellierung, DNA-Sequenzanalysen und genetische Assoziationsstudien.

Projektwebsite ?ffnen

金贝棋牌

Medizin