Benutzer:Mbasti01/Konzept 01 b
2022-05-08
Formelzeichen | |
---|---|
Mittelwert der Grundgesamtheit | |
Varianz der Grundgesamtheit | |
Anzahl der gegebenen Werte | |
Zufallsvariablen (Zufallsgrößen) | |
Stichprobe: beobachtete Werte der Zufallsvariablen | |
Stichprobenmittel / empirischer Mittelwert von | |
Stichprobenvarianz / empirische Varianz von | |
Stichprobenmittel (als Funktion der Zufallsvariablen) | |
Stichprobenvarianz (als Funktion der Zufallsvariablen) | |
Erwartungswert: Mittelwert, der sich aus der Verteilungsfunktion von X ergibt | |
Varianz (Stochastik): Varianz, die sich aus der Verteilungsfunktion von X ergibt |
Die Varianz ist in der beschreibenden Statistik ein Maß für die Streuung von einer endlichen Anzahl von reellen Werten um ihren Mittelwert.[1][2][3] Die Maßzahl kann auch als mittleres Abweichungsquadrat der Werte interpretiert werden. Sie wird in der beschreibenden Statistik auch als empirische („aus konkreten Daten berechnete“) Varianz bezeichnet. (→ Empirische Varianz). Die konkreten Daten ergeben sich häufig als Stichprobe aus einer Gesamtheit aller Daten (Population, Grundgesamtheit). Das führt zur alternativen Bezeichnung als Stichprobenvarianz.
Die Quadrierung der Abweichungen vom Mittelwert bewirkt bei einer endlichen Anzahl reeller Stichprobenwerte:
- Positive und negative Abweichungen vom Mittelwert heben sich nicht gegenseitig auf.
- Die Varianz einer Stichprobe ist immer positiv (oder Null).
- Eine größere Varianz entspricht einer größeren Unterschiedlichkeit der Werte.
- Wenige aber starke Ausreißer haben einen großen Einfluss auf das Ergebnis.
Die Varianz wird in der Stochastik (→ Varianz (Stochastik)) mathematisch allgemeiner behandelt. D.h. die empirische Varianz ist nur ein Spezialfall: Die Varianz basiert in der mathematischen Statistik auf Zufallsvariablen, also auf Funktionen, die dem Ergebnis eines Zufallsexperiments eine Größe zuordnen. Die Zufallsvariablen sind nicht begrenzt auf reelle Werte und die Anzahl der Werte zur Berechnung der Varianz kann auch unendlich sein. In der mathematischen Statistik ist die Varianz die erwartete quadratische Abweichung von Zufallsvariablen von ihrem Erwartungswert.[4][5][6] Sie wird daher zur Abgrenzung auch als theoretische Varianz bezeichnet.
Durch die Verallgemeinerung können besondere Fälle auftreten:
- Es gibt Zufallsvariablen, die auf Wahrscheinlichkeitsverteilungen basieren, für die die Varianz nicht definiert ist (z.B. Cauchy-Verteilung).
- Eine Varianz von Null zeigt nicht unbedingt an, dass alle Zufallsvariablen identische Werte haben.
Die Varianz wird in der Stochastik aus der Verteilung der Zufallsvariablen oder mit Hilfe von Schätzfunktionen bestimmt (→ Stichprobenvarianz (Schätzfunktion)).
Die Quadratwurzel aus der Varianz ist die Standardabweichung. Die Standardabweichung gehört ebenfalls zu den Streuungsmaßen. Die Varianz ist in weitergehenden Berechnungen oft praktischer als die Standardabweichung: So können beispielsweise Varianzbeiträge von mehreren unabhängigen Zufallseinflüssen einfach addiert werden. Umgekehrt lässt sich durch eine Varianzanalyse eine Gesamtvarianz oft auch in ihre Beiträge (Ursachen) zerlegen. Dennoch ist die Standardabweichung oft anschaulicher als die Varianz, da sie dieselbe Größenordnung hat wie die beobachteten Werte.
Die Bezeichnung „Varianz“ leitet sich von lateinisch variantia = „Verschiedenheit“ bzw. variare = „(ver)ändern, verschieden sein“ ab.
Stichprobenvarianz
Stichprobe ist eine konkrete Stichprobe
Zur Ermittlung der Stichprobenvarianz werden zunächst die Abweichungen der beobachteten reellen Werte der Stichprobe von ihrem arithmetischen Mittel gebildet. Summiert man die Quadrate dieser Abweichungen erhält man die sogenannte Abweichungsquadratsumme .
Wenn die Abweichungsquadratsumme durch dividiert wird, erhält man die korrigierte Stichprobenvarianz oder korrigierte empirische Varianz:
(1)
| ||
Sie kann als „mittleres Abweichungsquadrat“ interpretiert werden.
Falls keine Verwechslungsgefahr mit Formel (2) besteht, wird oft auch nur die kürzere Bezeichnung Stichprobenvarianz oder empirische Varianz verwendet[7][8] . Der Vorsatz "korrigierte ..." in der ausführlichen Bezeichnung bezieht sich auf den Faktor , der auch als Bessel-Korrektur[8] bezeichnet wird.
Wenn die Abweichungsquadratsumme statt durch nur durch dividiert wird erhält man die unkorrigierte Stichprobenvarianz
(2)
| ||
Es ist bemerkenswert, dass es umfangreiche mathematische und statistische Handbücher[9][10][11] gibt, die die Formel (2) nicht erwähnen. Es ist umstritten,[12] ob Formel (2) auf Stichproben angewendet werden sollte, da es ja auch eine „korrigierte Stichprobenvarianz“ (1) gibt, die den Vorteil hat, dass sie im Sinne der schließenden Statistik erwartungstreu ist.
Für den Sonderfall, dass der Mittelwert der Grundgesamtheit bekannt ist, wird die Varianz mit folgender Formel berechnet:
(3)
| ||
Formel (3) und (1) unterscheiden sich darin, dass bei Formel (3) die Berechnung des arithmetischen Mittels entfällt, weil der Mittelwert der Grundgesamtheit bekannt ist. Auch diese Formel ist erwartungstreu im Sinne der schließenden Statistik. Da für Formel (3) kein arithmetisches Mittel berechnet wird geht kein Freiheitsgrad bei der Berechnung verloren und es wird nur durch n geteilt.
Die Verwendung und Abgrenzung der Bezeichnungen „Stichprobenvarianz“ und „empirische Varianz“ ist in der Literatur nicht einheitlich: Einige Autoren[13] bezeichnen Formel (1) als Stichprobenvarianz und Formel (2) als empirische Varianz unter anderem mit der Begründung, dass nur Formel (1) in der induktiven Statistik zur Schätzung der Varianz der Grundgesamtheit auf Basis einer Stichprobe herangezogen wird und nicht Formel (2), da diese Definition der Varianz gängige Qualitätskriterien nicht erfüllt (siehe #Varianz (im Sinne der induktiven Statistik)).
Stichprobe beinhaltet alle Werte der Grundgesamtheit
Für den Sonderfall, dass die Stichprobe alle Werte der Grundgesamtheit beinhaltet (), nennt man sie auch Vollerhebung. Der wahre Mittelwert der Grundgesamtheit fällt mit dem arithmetischen Mittel zusammen () und berechnet sich aus allen Elementen der Grundgesamtheit als
(4)
| ||
Als Konsequenz fallen auch und zusammen. Die Varianz der Grundgesamtheit (auch Populationsvarianz genannt) ist dann gleich wie die Stichprobenvarianz und wird berechnet durch
(5)
| ||
Stichprobe besteht aus Stichprobenvariablen
Für diesen Fall werden in Formel (1)-(3) die Stichprobenwerte durch die Stichprobenvariablen ersetzt. Die Stichprobenvariablen sind keine reellen Werte, sondern sie sind Zufallsvariablen: Jede Zufallsvariable beschreibt die Wahrscheinlichkeit, mit der mögliche Beobachtungswerte auftreten.
Dies führt zur mathematisch allgemeineren Darstellung der Varianz als Funktion (genauer Stichprobenfunktion) von verschiedenen Zufallsvariablen. Auch hier unterscheidet man die korrigierte Stichprobenvarianz
(6)
| ||
und die unkorrigierten Stichprobenvarianzen
(7)
| ||
(8)
| ||
Die Formeln (6)–(8) sind analog zur Stichprobenvarianz in der beschreibenden (deskriptiven) Statistik definiert und werden in der schließenden (induktiven) Statistik verwendet. In den Verfahren der schließenden Statistik (Statistische Tests, Konfidenzintervalle etc.) fließt oft die Varianz der Grundgesamtheit ein. In der Praxis ist die Varianz der Grundgesamtheit jedoch unbekannt, so dass sie geschätzt werden muss. Die Formeln (6)–(8) dienen in der induktiven Statistik also als Schätzfunktion, um die unbekannte Varianz Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2 =\operatorname{Var}(X)} einer Zufallsvariable Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} mit unbekannter Verteilung zu schätzen.
Wenn die Stichprobe eine Zufallsstichprobe Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_1,\ldots, X_n} ist, dann kann das Stichprobenmittel Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \overline X} als Schätzung des Mittelwerts der Grundgesamtheit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu} herangezogen werden (Schätzwert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat\mu = \overline X} ). Durch die Bildung des Stichprobenmittels wird eine Abhängigkeit zwischen den Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n} Summanden in Formel (6) hergestellt, d. h. ein Freiheitsgrad wird gebunden bzw. geht verloren[14]. Daher dividiert man in Formel (6) durch Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (n-1)} statt durch Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n} . Zusätzlich argumentiert die die schließende Statistik mit dem Erwartungswert beziehungsweise der Erwartungstreue (siehe #Varianz (im Sinne der schließenden Statistik)).
Formel (7) ergibt sich z.B. als (verzerrter) Schätzer durch Anwendung der Maximum-Likelihood-Methode, oder der Momentenmethode.
Formel (8) unterscheidet sich von Formel (6) in der Hinsicht, dass hier der Erwartungswert der Grundgesamtheit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu} bekannt ist und somit nicht durch das Stichprobenmittel Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \overline X} geschätzt werden muss. Damit ist die Normierung mittels der Anzahl der Freiheitsgrade Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (n-1)} bei Formel (8) im Gegensatz zu Formel (6) nicht erforderlich und es wird bei Formel (8) lediglich durch Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n} dividiert.
Varianz (im Sinne der schließenden Statistik)
Stichprobenvarianz (Schätzfunktion)
In der schließenden (induktiven) Statistik wird Formel (6) verwendet, um die unbekannte Varianz der Grundgesamtheit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2 = \operatorname{Var}(X)} zu schätzen. Dies geschieht meist durch einen einfachen Punktschätzer. Sei Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} eine Zufallsvariable mit unbekannter Verteilung und sei eine Zufallsstichprobe Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_1,\ldots, X_n} mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{E}(X_{i})= \mu} und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{Var}(X_{i})= \sigma^2} gegeben, dann ist eine Schätzfunktion für die unbekannte Varianz der Grundgesamtheit gegeben durch
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \widehat{\operatorname{Var}(X)} = S^2 =\tfrac1{n-1} \sum_{i=1}^n (X_i-\overline X )^2 }
|
(9)
| |
Der Grund warum Formel (6) anstatt Formel (7) zur Schätzung der Varianz der Grundgesamtheit herangezogen wird ist, dass die unkorrigierte Stichprobenvarianz (Formel (7)) unter den hier gegebenen Voraussetzungen gängige Qualitätskriterien für Punktschätzer nicht erfüllt. Formel (7) ist nicht erwartungstreu für die unbekannte Varianz der Grundgesamtheit, wohingegen die korrigierte Stichprobenvarianz (Formel (6)) erwartungstreu für die unbekannte Varianz der Grundgesamtheit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2} ist. Erwartungstreue bedeutet, dass die Schätzfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T} für den wahren Wert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \tau} keine systematische Verzerrung von Null aufweist, also diese Schätzfunktion „im Mittel“ dem wahren Wert entspricht, d. h. Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{E}(T) = \tau} . Für Formeln (6)–(8) lässt sich dies wie folgt zusammenfassen:
Zusammenfassung Erwartungstreue |
|
Man kann zeigen, dass gerade die Normierung Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 1/(n-1)} Formel (6) zu einer erwartungstreuen Schätzfunktion für die Varianz der Grundgesamtheit macht (siehe Stichprobenvarianz (Schätzfunktion)#Erwartungstreue).[15] Die Sicherstellung des Qualitätskriteriums der Erwartungstreue ist somit ein weiter Grund für den Korrekturfaktor Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 1/(n-1)} , der aus der induktiven Statistik stammt. Es ist allerdings anzumerken, dass auch Formel (8) erwartungstreu für die unbekannte Varianz der Grundgesamtheit ist. Daher wird im Rahmen der induktiven Statistik immer Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle S^2} , falls Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu} geschätzt werden muss, bzw. Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle {S^*}^2} , falls Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu} bekannt ist, verwendet. Die Beziehung zwischen den Formeln (1)–(3) und Gleichungen (6)–(8) ist die folgende: Die konkrete Stichprobe Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_1,\ldots, x_n} vom Umfang Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n} lässt sich als Realisierung der Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n} -dimensionalen Zufallsvariablen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \left(X_1,\ldots, X_n\right)} auffassen.
Die empirische Varianz in der deskriptiven Statistik Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle s^2} ist also der zur abstrakten Schätzfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle S^2} zugehörige Schätzwert.
Varianz (im Sinne der Wahrscheinlichkeitstheorie)
In der Stochastik ist die Varianz ein wichtiges Streuungsmaß der Verteilung einer Zufallsvariablen. Sofern der Erwartungswert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{E}(X)} existiert, ist in der Stochastik die Varianz definiert als erwarte quadratische Abweichung der Zufallsvariablen von ihrem Erwartungswert
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{Var}(X)= \operatorname{E}\left\{(X-\operatorname{E}(X))^2\right\}}
|
(10)
| |
Für diese Definition der Varianz gelten eine Vielzahl nützlicher Eigenschaften (siehe Varianz (Stochastik)#Rechenregeln und Eigenschaften).
Varianzberechnung basierend auf einer Verteilungsfunktion
Varianzberechnung basierend auf einer stetigen Verteilungsfunktion
Gegeben ist in diesem Fall eine stetige Zufallsvariable Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} mit einer Wahrscheinlichkeitsdichtefunktion (kurz: Dichte) Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle f(x)} , die eine Aussage trifft, wie wahrscheinlich das Auftreten von welchem Wert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x} ist. Dann ergeben sich Erwartungswert und Varianz der Grundgesamtheit aus den folgenden Formeln:[16]
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu = \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x}
|
(11)
| |
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2 = \int_{-\infty}^{\infty} (x-\mu)^2 f(x) \, \mathrm{d}x\quad}
|
(12)
| |
Varianzberechnung basierend auf einer diskreten Verteilungsfunktion
Im Unterschied zu den Formeln (10) und (11) kann die Zufallsvariable Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} in diesem Fall nur bestimmte (diskrete) Werte Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_k} annehmen. Die Verteilungsfunktion ist in diesem Fall gegeben als Wahrscheinlichkeiten Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle p_k} , mit denen der zugehörige Wert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_k} auftritt. Dies führt zu folgenden Formeln für Erwartungswert und Varianz der Grundgesamtheit:[16]
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mu = \sum_{k=1}^n x_k p_k}
|
(13)
| |
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2 = \sum_{k=1}^n (x_k - \mu)^2 p_k}
|
(14)
| |
Literatur
- Beyer 1988 – Otfried Beyer, Horst Hackel, Volkmar Pieper, Jürgen Tiedge: Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. B. G. Teubner, Leipzig 1988, ISBN 3-322-00469-4.
- Bronstein 2020 – I. N. Bronstein, K. A. Semendjajew, G. Musiol, H. Mühlig: Taschenbuch der Mathematik. 11. Auflage. Verlag Europa-Lehrmittel Nourney, Vollmer GmbH & Co. KG, Haan-Gruiten 2020, ISBN 978-3-8085-5792-1.
- Duden 2020 – Harald Scheid: Duden: Rechnen und Mathematik. 6. Auflage. Bibliographisches Institut & F.A. Brockhaus AG, Mannheim 2020, ISBN 978-3-411-05346-9.
- Fahrmeir 2016 – Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer Verlag, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3.
- Hartung 2005 – Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik. Lehr- und Handbuch der angewandten Statistik. 14. Auflage. R. Oldenbourg Verlag, München / Wien 2005, ISBN 3-486-57890-1.
- Kabluchko 2017 – Zakhar Kabluchko: Mathematische Statistik - Skript zur Vorlesung. Münster 2017 (uni-muenster.de [PDF; abgerufen am 1. Februar 2022]).
Einzelnachweise
- ↑ Bronstein 2020, Kapitel 16.3.2: Beschreibende Statistik
- ↑ Fahrmeir 2016, Kapitel 2: Univariate Deskription und Exploration von Daten
- ↑ Hartung 2005, Kapitel I: Deskriptive Statistik
- ↑ Bronstein 2020, Kapitel 16.3.1.2: Stichprobenfunktionen
- ↑ Fahrmeir 2016, Kapitel 5: Diskrete Zufallsvariablen und Kapitel 6: Stetige Zufallsvariablen
- ↑ Hartung 2005, Kapitel II: Wahrscheinlichkeitsrechnung
- ↑ Beyer 1988
- ↑ a b Kabluchko 2017, Kapitel 1.4: Empirische Varianz
- ↑ Bronstein 2020: Taschenbuch der Mathematik.
- ↑ Hartung 2005: Statistik.
- ↑ Duden 2020: Varianz
- ↑ FernUni Hagen 2020: Empirische vs Stichprobenvarianz. In: YouTube. FernUni Hagen: https://www.statstutor.de/, 19. April 2020, abgerufen am 1. Februar 2022.
- ↑ Fahrmeir 2016, S. 65
- ↑ Beyer 1988, Kapitel 2.3.8.3: Grundverteilungen der mathematischen Statistik
- ↑ Fahrmeir 2016, S. 341
- ↑ a b Bronstein 2020: Kapitel 16.2.2.3 Erwartungswert und Streuung, S. 827, Formel 16.52.