FOR 5363: KI-FOR Integration von Deep Learning und Statistik zum Verst?ndnis strukturierter biomedizinischer Daten
Auf einen Blick
Elektrotechnik und Informationstechnik
Medizin
Sozialwissenschaften
DFG Forschungsgruppe
![]()
Projektbeschreibung
Hochdurchsatzmessungen in den biomedizinischen Wissenschaften wie z.B. Bilder, Genomsequenzen oder Zeitreihen stellen strukturierte Daten dar, die durch inh?rente Abh?ngigkeiten zwischen den Messungen, oft nicht-vektorielle Struktur und das Vorhandensein von St?rgr??en und Stichprobenverzerrung gekennzeichnet sind. So k?nnen z.B. die Populationsstruktur, systematische Messartefakte, nicht unabh?ngige Stichproben oder unterschiedliche Altersverteilungen in den Gruppen zu falschen Ergebnissen führen, wenn sie nicht berücksichtigt werden. Deep Learning (DL) zeichnet sich in vielen Anwendungen auf strukturierten Daten durch die F?higkeit aus, komplexe Abh?ngigkeiten innerhalb und zwischen Eingaben und Ausgaben zu erfassen, was eine genaue Pr?diktion erm?glicht. Trotz der jüngsten Fortschritte bei erkl?rbarer künstlicher Intelligenz und Bayesschen neuronalen Netzen gibt es beim DL immer noch Einschr?nkungen hinsichtlich der Unsicherheitsquantifizierung, Interpretierbarkeit und Validierung. Dies sind jedoch wichtige Komponenten, um über die Pr?diktion hinaus Verst?ndnis der zugrunde liegenden Biologie zu erlangen. Zu diesem Zweck wurde in den biomedizinischen Wissenschaften traditionell die Statistik verwendet, aufgrund der interpretierbaren Modellergebnisse und der statistischen Inferenz, die u.a. eine Quantifizierung der Unsicherheit, Adjustierung für St?rgr??en und Testen von Hypothesen mit statistischer Fehlerkontrolle erm?glicht. Methoden der klassischen Statistik sind jedoch begrenzt in ihrer Modellierungsflexibilit?t für strukturierte Daten und ihrer F?higkeit, komplexe Nichtlinearit?ten datengesteuert zu erfassen.In dieser Forschungsgruppe bringen wir Experten aus dem Bereich des maschinellen Lernens und der Statistik mit Erfahrung in biomedizinischen Anwendungen zusammen, um die folgenden übergreifenden Ziele zu erreichen:(O1) Integration von DL und Statistik zur Verbesserung der Interpretierbarkeit, Unsicherheitsquantifizierung und statistischen Inferenz für DL und zur Verbesserung der Modellierungsflexibilit?t statistischer Methoden für strukturierte Daten. Insbesondere werden wir Methoden entwickeln, die statistische Inferenz für strukturierte Daten durch Unsicherheitsquantifizierung, Testen von Hypothesen und Adjustierung für St?rgr??en erm?glichen, und die Erkl?rungen strukturierter Daten durch hybride statistische und Deep-Learning-Modelle, Erkl?rungen auf Populations- und Verteilungsebene und robuste dünnbesetzte Erkl?rungen verbessern. (O2) Schaffung einer Rückkopplungsschleife zwischen dieser Methodenentwicklung und biomedizinischen Anwendungen, wobei wir bei der Entwicklung neuer Methoden die Bedürfnisse bei der Analyse der Daten berücksichtigen und biomedizinische Erkenntnisse aus den Anwendungen der entwickelten Methoden auf die Daten gewinnen wollen. Zu den Anwendungen geh?ren die Analyse von MRT-, fMRT- und Mikroskopie-Bildern, Krankheitsverlaufsmodellierung, DNA-Sequenzanalysen und genetische Assoziationsstudien.
金贝棋牌
Projektsprecher*innen
Beteiligte Einrichtungen
Institut für Biologie
Anschrift
Institutsgeb?ude/Hauptgeb?ude, Invalidenstra?e 42 (Hauptgeb?ude), 10115 Berlin
weitere StandorteWirtschaftswissenschaftliche Fakult?t
Anschrift
Institutsgeb?ude, Spandauer Stra?e 1, 10178 Berlin
Kooperationspartner*innen
- KooperationspartnerUniversit?tDeutschland
Eberhard Karls Universit?t Tübingen
- KooperationspartnerForschungsinstitutDeutschland
Hasso-Plattner-Institut für Digital Engineering
- KooperationspartnerUniversit?tDeutschland
Karlsruher Institut für Technologie
- KooperationspartnerAu?eruniversit?re ForschungseinrichtungDeutschland
Max-Delbrück-Centrum für Molekulare Medizin
- KooperationspartnerUniversit?tDeutschland
Technische Universit?t Berlin
- Kooperationspartner金贝棋牌Deutschland
Universit?tsklinikum Tübingen