Varianz
Formelzeichen | |
---|---|
Mittelwert der Grundgesamtheit | |
Varianz der Grundgesamtheit | |
Anzahl der gegebenen Werte | |
Zufallsvariablen (Zufallsgrößen) | |
Stichprobe: beobachtete Werte der Zufallsvariablen | |
Stichprobenmittel / empirischer Mittelwert von | |
Stichprobenvarianz / empirische Varianz von | |
Stichprobenmittel (als Funktion der Zufallsvariablen) | |
Stichprobenvarianz (als Funktion der Zufallsvariablen) | |
Erwartungswert: Mittelwert, der sich aus der Verteilungsfunktion von X ergibt | |
Varianz (Stochastik): Varianz, die sich aus der Verteilungsfunktion von X ergibt |
Die Varianz ist in der beschreibenden Statistik ein Maß für die Streuung von einer endlichen Anzahl von reellen Werten um ihren Mittelwert.[1][2][3] Die Maßzahl kann auch als mittleres Abweichungsquadrat der Werte interpretiert werden. Sie wird in der beschreibenden Statistik auch als empirische („aus konkreten Daten berechnete“) Varianz bezeichnet. (→ Empirische Varianz). Die konkreten Daten ergeben sich häufig als Stichprobe aus einer Gesamtheit aller Daten (Population, Grundgesamtheit). Das führt zur alternativen Bezeichnung als Stichprobenvarianz.
Die Quadrierung der Abweichungen vom Mittelwert bewirkt bei einer endlichen Anzahl reeller Stichprobenwerte:
- Positive und negative Abweichungen vom Mittelwert heben sich nicht gegenseitig auf.
- Die Varianz einer Stichprobe ist immer positiv (oder Null).
- Eine größere Varianz entspricht einer größeren Unterschiedlichkeit der Werte.
- Wenige aber starke Ausreißer haben einen großen Einfluss auf das Ergebnis.
Die Varianz wird in der Stochastik (→ Varianz (Stochastik)) mathematisch allgemeiner behandelt. D.h. die empirische Varianz ist nur ein Spezialfall: Die Varianz basiert in der mathematischen Statistik auf Zufallsvariablen, also auf Funktionen, die dem Ergebnis eines Zufallsexperiments eine Größe zuordnen. Die Zufallsvariablen sind nicht begrenzt auf reelle Werte und die Anzahl der Werte zur Berechnung der Varianz kann auch unendlich sein. In der mathematischen Statistik ist die Varianz die erwartete quadratische Abweichung von Zufallsvariablen von ihrem Erwartungswert.[4][5][6] Sie wird daher zur Abgrenzung auch als theoretische Varianz bezeichnet.
Durch die Verallgemeinerung können besondere Fälle auftreten:
- Es gibt Zufallsvariablen, die auf Wahrscheinlichkeitsverteilungen basieren, für die die Varianz nicht definiert ist (z.B. Cauchy-Verteilung).
- Eine Varianz von Null zeigt nicht unbedingt an, dass alle Zufallsvariablen identische Werte haben.
Die Varianz wird in der Stochastik aus der Verteilung der Zufallsvariablen oder mit Hilfe von Schätzfunktionen bestimmt (→ Stichprobenvarianz (Schätzfunktion)).
Die Quadratwurzel aus der Varianz ist die Standardabweichung. Die Standardabweichung gehört ebenfalls zu den Streuungsmaßen. Die Varianz ist in weitergehenden Berechnungen oft praktischer als die Standardabweichung: So können beispielsweise Varianzbeiträge von mehreren unabhängigen Zufallseinflüssen einfach addiert werden. Umgekehrt lässt sich durch eine Varianzanalyse eine Gesamtvarianz oft auch in ihre Beiträge (Ursachen) zerlegen. Dennoch ist die Standardabweichung oft anschaulicher als die Varianz, da sie dieselbe Größenordnung hat wie die beobachteten Werte.
Die Bezeichnung „Varianz“ leitet sich von lateinisch variantia = „Verschiedenheit“ bzw. variare = „(ver)ändern, verschieden sein“ ab.
Empirische Varianz
Ausgangspunkt ist eine Stichprobe mit reellen Werten, die aus einer Grundgesamtheit ausgewählt (empirisch erhoben) wurden. Wir sprechen daher im Folgenden auch von der "Stichprobenvarianz". Im Grenzfall umfasst die Stichprobe die gesamte Grundgesamtheit.
Die empirische Varianz ist ein Spezialfall der Varianz in der mathematischen Statistik.
Stichprobe ist ein Teil einer Grundgesamtheit
Zur Ermittlung der Stichprobenvarianz werden zunächst die Abweichungen der beobachteten reellen Werte der Stichprobe von ihrem arithmetischen Mittel gebildet. Summierung ergibt die sogenannte Abweichungsquadratsumme .
Wenn die Abweichungsquadratsumme durch dividiert wird, erhält man das mittlere Abweichungsquadrat, bzw. die korrigierte Stichprobenvarianz oder korrigierte empirische Varianz:
(1)
| ||
Falls keine Verwechslungsgefahr mit Formel (2) besteht, wird oft auch nur die kürzere Bezeichnung Stichprobenvarianz oder empirische Varianz verwendet[7][8] . Der Vorsatz "korrigierte ..." in der ausführlichen Bezeichnung bezieht sich auf den Faktor Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 1/(n-1)} , der auch als Bessel-Korrektur[8] bezeichnet wird.
Die Idee dieser Formel (1) ist es, eine Aussage über die erwartete Varianz der Gesamtheit aller Daten zu machen. D.h. die Stichprobe wird verwendet, um die Varianz der Grundgesamtheit zu schätzen. Formel (1) stellt einen erwartungstreuen Schätzer dar. Das bedeutet in diesem Fall, dass der Schätzfehler immer kleiner wird und gegen Null strebt, wenn das Ergebnis über eine steigende Anzahl von Stichproben gemittelt wird. Diese Eigenschaft von Formel (1) lässt sich in der mathematischen Statistik beweisen.
Wenn die Abweichungsquadratsumme nur durch Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n} dividiert wird erhält man die unkorrigierte Stichprobenvarianz
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \tilde{s}^2=\tfrac1n \sum_{i=1}^n (x_i - \overline{x})^2}
|
(2)
| |
Die Idee dieser Formel (2) ist es, den Datensatz möglichst genau durch eine Normalverteilung zu beschreiben: D.h. die Parameter der Normalverteilung Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu} und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma} werden so bestimmt, dass der quadratische Fehler der gegebenen Daten relativ zur Verteilungsfunktion der Normalverteilung minimal ist.[9] Das ist der Fall für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu=\overline{x}} und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma=\tilde{s}} . Formel (2) liefert in diesem Sinne bessere Ergebnisse als Formel (1). Allerdings ist Formel (2) kein erwartungstreuer Schätzer: D.h. wenn das Ergebnis über viele Stichproben gemittelt wird, dann strebt das Ergebnis nicht gegen den wahren Wert für die Varianz der Grundgesamtheit. Formel (2) liefert im Mittel zu kleine Ergebnisse und wird daher seltener angewendet. Formel (2) wird in der mathematischen Statistik begründet, z.B. durch Anwendung der Maximum-Likelihood-Methode, oder der Momentenmethode.
Für den Sonderfall, dass der Mittelwert der Grundgesamtheit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu} bekannt ist, wird die Varianz mit folgender Formel berechnet:
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle {s^*}^2=\tfrac1n \sum_{i=1}^n (x_i - \mu)^2}
|
(3)
| |
Formel (3) und (1) unterscheiden sich darin, dass bei Formel (3) die Berechnung des arithmetischen Mittels entfällt, weil der Mittelwert der Grundgesamtheit bekannt ist. Auch diese Formel ist erwartungstreu im Sinne der mathematischen Statistik.
Die Verwendung und Abgrenzung der Bezeichnungen „Stichprobenvarianz“ und „empirische Varianz“ ist in der Literatur nicht einheitlich: Einige Autoren[10] bezeichnen Formel (1) als Stichprobenvarianz und Formel (2) als empirische Varianz.
Stichprobe beinhaltet alle Werte der Grundgesamtheit
Für den Sonderfall, dass die Stichprobe alle Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N} Werte der Grundgesamtheit beinhaltet (Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N=n} ), nennt man sie auch Vollerhebung. Der wahre Mittelwert der Grundgesamtheit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu} fällt mit dem arithmetischen Mittel Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \overline{x}} zusammen (Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu=\overline{x}} ) und berechnet sich aus allen Elementen der Grundgesamtheit als
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu = \tfrac1N \sum_{i=1}^N x_i = \tfrac1n \sum_{i=1}^n x_i = \overline{x}}
|
(4)
| |
Als Konsequenz fallen auch Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle {\tilde{s}}^2} und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle {s^*}^2} zusammen. Die Varianz der Grundgesamtheit (auch Populationsvarianz genannt) ist dann gleich wie die Stichprobenvarianz und wird berechnet durch
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2 = \tfrac1N \sum_{i=1}^N (x_i - \mu)^2}
|
(5)
| |
Varianz in der mathematischen Statistik
Die Varianz ist mathematisch allgemein folgendermaßen definiert:
Sei Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (\Omega,\Sigma,P)} ein Wahrscheinlichkeitsraum und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X:\Omega \to A} eine Zufallsvariable auf eine Menge Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A} , mit der Ergebnismenge Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Omega} , dem Ereignissystem Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Sigma} und dem Wahrscheinlichkeitsmaß Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle P} . Mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu:=\mathbb{E}[X]} bezeichnen wir den Erwartungswert der Zufallsvariable, so fern dieser existiert. Die Varianz ist dann definiert als erwartete mittlere quadratische Abweichung der Zufallsvariable von ihrem Erwartungswert:
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{Var}(X) := \mathbb{E}\left((X-\mu)^2\right)=\int_\Omega (X-\mu)^2 \,\mathrm{d}P}
|
(6)
| |
Berechnung basierend auf der Wahrscheinlichkeitsverteilung
Nicht jede Wahrscheinlichkeitsverteilung besitzt einen Erwartungswert und eine Varianz (z.B. Cauchy-Verteilung). Und damit ist nicht für jede Zufallsvariable die Varianz definiert.
Es wird unterschieden zwischen stetigen und diskreten Zufallsvariablen:
Stetige Zufallsvariablen
Falls die stetige Zufallsvariable Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} auf einer Menge Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A} eine Wahrscheinlichkeitsdichtefunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f_X} besitzt, dann lässt sich der Erwartungswert und die Varianz wie folgt berechnen:[11]
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu = \int_{A} x f_X(x) \, \mathrm{d}x}
|
(7)
| |
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{Var}(X) = \int_{A} (x-\mu)^2 f_X(x) \, \mathrm{d}x\quad}
|
(8)
| |
Diskrete Zufallsvariablen
Sei Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} eine diskrete Zufallsvariable auf einer Menge Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A} mit Wahrscheinlichkeitsfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p_X} . Dann lässt sich der Erwartungswert und die Varianz wie folgt berechnen:
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu = \sum\limits_{x_k\in A} x_k p_X(x_k)}
|
(9)
| |
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{Var}(X) = \sum\limits_{x_k\in A} (x_k - \mu)^2 p_X(x_k)}
|
(10)
| |
Berechnung basierend auf Stichprobenvariablen
Für diesen Fall werden in Formel (1)-(3) die Stichprobenwerte Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_1,\ldots, x_n} durch die Stichprobenvariablen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_1,\ldots, X_n} ersetzt. Die Stichprobenvariablen sind keine reellen Werte, sondern sie sind Zufallsvariablen: Jede Zufallsvariable Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} beschreibt die Wahrscheinlichkeit, mit der mögliche Beobachtungswerte Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x} auftreten.
Dies führt zur mathematisch allgemeineren Darstellung der Varianz als Funktion (genauer Stichprobenfunktion) von verschiedenen Zufallsvariablen. Auch hier unterscheidet man die korrigierte Stichprobenvarianz
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle S^2 = \tfrac1{n-1} \sum_{i=1}^n (X_i-\overline X )^2 }
|
(11)
| |
und die unkorrigierten Stichprobenvarianzen
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \tilde{S}^2 = \tfrac1n \sum_{i=1}^n (X_i-\overline X )^2 }
|
(12)
| |
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle {S^*}^2 = \tfrac1n \sum_{i=1}^n (X_i-\mu)^2 }
|
(13)
| |
Die Formeln (1)-(3) sind mathematisch gesehen ein Spezialfall der Formeln (11)–(13). Z.B. ist die empirische Varianz in der beschreibenden Statistik Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle s^2} der zur abstrakten Schätzfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle S^2} zugehörige Schätzwert.
In den Verfahren der mathematischen Statistik (Statistische Tests, Konfidenzintervalle etc.) fließt oft der Mittelwert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu} oder die Varianz der Grundgesamtheit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2} ein. In der Praxis sind Mittelwert und Varianz der Grundgesamtheit jedoch unbekannt, so dass sie geschätzt werden müssen. Die Formeln (11)–(13) dienen in der mathematischen Statistik also als Schätzfunktion, um die unbekannte Varianz Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2 =\operatorname{Var}(X)} einer Zufallsvariable Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} mit unbekannter Verteilung zu schätzen.
Literatur
- Beyer 1988 – Otfried Beyer, Horst Hackel, Volkmar Pieper, Jürgen Tiedge: Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. B. G. Teubner, Leipzig 1988, ISBN 3-322-00469-4.
- Bronstein 2020 – I. N. Bronstein, K. A. Semendjajew, G. Musiol, H. Mühlig: Taschenbuch der Mathematik. 11. Auflage. Verlag Europa-Lehrmittel Nourney, Vollmer GmbH & Co. KG, Haan-Gruiten 2020, ISBN 978-3-8085-5792-1.
- Duden 2020 – Harald Scheid: Duden: Rechnen und Mathematik. 6. Auflage. Bibliographisches Institut & F.A. Brockhaus AG, Mannheim 2020, ISBN 978-3-411-05346-9.
- Fahrmeir 2016 – Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer Verlag, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3.
- Hartung 2005 – Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik. Lehr- und Handbuch der angewandten Statistik. 14. Auflage. R. Oldenbourg Verlag, München / Wien 2005, ISBN 3-486-57890-1.
- Kabluchko 2017 – Zakhar Kabluchko: Mathematische Statistik - Skript zur Vorlesung. Münster 2017 (uni-muenster.de [PDF; abgerufen am 1. Februar 2022]).
Einzelnachweise
- ↑ Bronstein 2020, Kapitel 16.3.2: Beschreibende Statistik
- ↑ Fahrmeir 2016, Kapitel 2: Univariate Deskription und Exploration von Daten
- ↑ Hartung 2005, Kapitel I: Deskriptive Statistik
- ↑ Bronstein 2020, Kapitel 16.3.1.2: Stichprobenfunktionen
- ↑ Fahrmeir 2016, Kapitel 5: Diskrete Zufallsvariablen und Kapitel 6: Stetige Zufallsvariablen
- ↑ Hartung 2005, Kapitel II: Wahrscheinlichkeitsrechnung
- ↑ Beyer 1988
- ↑ a b Kabluchko 2017, Kapitel 1.4: Empirische Varianz
- ↑ Kunyu He: Statistics in ML: Why Sample Variance Divided by n Is Still a Good Estimator. 18. Mai 2020, abgerufen am 9. Mai 2022 (englisch).
- ↑ Fahrmeir 2016, S. 65
- ↑ Bronstein 2020: Kapitel 16.2.2.3 Erwartungswert und Streuung, S. 827, Formel 16.52.