Flexible Dichteregressionsmethoden
Auf einen Blick
Statistik und ?konometrie
DFG Sachbeihilfe
![]()
![]()
![]()
![]()
Projektbeschreibung
Ziel dieses Projekts ist die Entwicklung eines einheitlichen Ansatzes zur flexiblen semiparametrischen Dichteregression. W?hrend die Beschr?nkungen der traditionellen mittelwertorientierten parametrischen Modellierung von (skalaren) Daten eine Vielzahl von Erweiterungen auf andere Verteilungsmerkmale (Quantile) oder mehrere Verteilungsparameter (Verteilungsregression) motiviert haben, wurden zuletzt erste Methoden in der funktionalen und Kompositions-Datenanalyse für Wahrscheinlichkeitsdichten als Objekte der statistischen Analyse entwickelt. Allerdings sind diese Gebiete der Regression mit flexiblen Verteilungen (Ans?tze auf Individualebene) und der statistischen Analyse von Verteilungen (Ans?tze auf Dichteebene) bisher unabh?ngig voneinander. Unser Ziel ist es, durch ihre Verbindung die methodischen Entwicklungen gegenseitig zu befruchten und voranzutreiben. Der Bedarf an flexiblen Dichteregressionsmethoden l?sst sich anhand eines Beispiels aus der Geschlechter?konomie illustrieren: Die Verteilung des Anteils der Frau am Arbeitseinkommen eines Paares ist eine gemischte Verteilung auf [0,1] mit positiver Wahrscheinlichkeitsmasse bei 0 und 1 (für Paare mit einem Einkommen) und einer stetigen - oft bimodalen - Dichte dazwischen (für Paare mit zwei Einkommen). Es ist von Interesse, Variablen zu untersuchen, die die Verteilung beeinflussen k?nnen, wie (Alter der) Kinder im Haushalt, Jahr oder Wohnregion. Deutliche Unterschiede gibt es beispielsweise zwischen Ost- und Westdeutschland. Die Dichte ist von besonderem Interesse, da sie Verschiebungen in der Wahrscheinlichkeitsmasse oder Bimodalit?ten aufgrund von Untergruppen leicht sichtbar macht und sich gut auf diskrete, stetige, gemischte oder bivariate Verteilungen übertragen l?sst. Solche Analysen erfordern Methoden, die die gesamte Verteilung in Abh?ngigkeit von Kovariablen flexibel mit linearen, nichtlinearen und zuf?lligen Effekten modellieren k?nnen, ohne parametrische Annahmen wie Normalit?t zu treffen. Wir werden daher geeignete Methoden zur Dichteregression entwickeln. Je nach Datensituation werden Dichteregressionsmethoden sowohl für dichtewertige Daten ben?tigt und entwickelt - z. B. wenn ein Histogramm zu Verwaltungsdaten bereitgestellt oder zur Zusammenfassung von sehr gro?en Daten verwendet wird - als auch für einzelne skalare Daten, wenn die Modellierung der bedingten Dichte in Abh?ngigkeit von Kovariablen von Interesse ist. In unserem vereinheitlichten Ansatz stellen diese beiden Szenarien zwei Seiten derselben Medaille dar, statt zweier verschiedener Zweige der Statistik. Wir werden Methoden für stetige Dichten (z. B. Einkommen), diskrete Dichten, d.h. Kompositionsdaten (z. B. Zeitverwendung in diskreten Kategorien), sowie gemischte Dichten (z. B. Anteil der Frau am Haushaltseinkommen) entwickeln und diese auf bivariate Dichten erweitern, z. B. bei der gemeinsamen Betrachtung eines Paares innerhalb eines Haushalts.