Devianz (Statistik)

aus Wikipedia, der freien Enzyklopädie

In der Statistik ist die Devianz (Abweichung vom Idealwert) ein zentrales Maß für die Bewertung der Anpassungsgüte von Schätzungen im linearen Modell und wird oft beim Testen von Hypothesen verwendet. Sie ist eine Verallgemeinerung des Konzepts der Residuenquadratsumme in der KQ-Regression auf Fälle, in denen die Modellanpassung durch eine Maximum-Likelihood-Schätzung erfolgt. Im Zusammenhang mit der Modellbildung entspricht die Devianz der Summe der Abweichungsquadrate (SQ) bei linearen Regressionsmodellen. Sie spielt eine große Rolle in verallgemeinerten linearen Modellen

Begriffsherkunft

Der Begriff Devianz hat seinen Ursprung der Soziologie und bezeichnet dort die Abweichung (von französisch dévier, deutsch abweichen) von allgemeinen Normen und Wertvorstellungen.[1]

Definition

Die Devianz ist eine Statistik die verwendet wird, um angeben zu können wie stark die Anpassung eines gerade betrachteten Modells von dem Modell abweicht, das eine perfekte Anpassung an die Daten liefert (sogenanntes gesättigtes Modell). Das gesättigte Modell erlaubt unterschiedliche Regressionsparameter für jedes Individuum. Die Devianz ist gegeben durch

,

wobei die maximierte partielle Likelihoodfunktion (auch Plausibilitätsfunktion genannt) unter dem aktuellen Modell ist und die maximierte partielle Likelihoodfunktion unter dem gesättigten Modell (Modell in dem genauso viele Parameter wie Beobachtungspaare auftreten) ist. Unter Verwendung der Logarithmengesetze lässt sich die Devianz auch mithilfe eines Likelihood-Quotienten bzw. Plausibilitätsquotienten ausdrücken[2]

.

Der Vorfaktor ist notwendig, um eine Größe zu erhalten die eine bekannte Verteilung besitzt und daher für Hypothesentests verwendet werden kann. Je kleiner der Wert der Devianz , desto besser das Modell. Für das gesättigte Modell ist die Devianz null. Die Devianz kann als eine Verallgemeinerung der Residuenquadratsumme, die bei normalverteilten Daten verwendet wird, (siehe Klassisches lineares Modell der Normalregression) aufgefasst werden hin zur Analyse von nichtnormalverteilen Daten in verallgemeinerten linearen Modellen. Zu beachten ist, dass ein Unterschied in der Devianz zwischen zwei alternativen Modellen dem Unterschied im Wert der Statistik entspricht.[3]

Siehe auch

Einzelnachweise

  1. Lothar Sachs, Jürgen Hedderich: Angewandte Statistik: Methodensammlung mit R. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/ Heidelberg 2018, ISBN 978-3-662-56657-2, S. 834
  2. Lothar Sachs, Jürgen Hedderich: Angewandte Statistik: Methodensammlung mit R. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/ Heidelberg 2018, ISBN 978-3-662-56657-2, S. 834
  3. David Collett: Modelling survival data in medical research. Chapman and Hall/CRC, 2015. S. 154 ff.