Benutzer Diskussion:Qwqchris/Zufälliger Fehler

aus Wikipedia, der freien Enzyklopädie

Aus dem Artikel

Ursachen

Ursachen der zufälligen Fehler sind zum Beispiel Fluktuationen von Ereignissen, die den Messprozess beeinflussen, jedoch nicht kontrollierbar sind, wie beispielsweise in der Physik thermisches Rauschen, atmosphärische Dichtefluktuationen oder auch Ablesefehler beim Messen.

Standardabweichung oder Standardfehler: Ein Maß für den Fehler, den man durch Stichprobenziehung bei der Mittelwertbestimmung des wahren Werts macht, ist die sogenannte Standardabweichung σ für den Mittelwert. Dieser geht aus der empirisch bestimmten Messunsicherheit hervor, die man bei jeder einzelnen Messung im Mittel macht. Der Fehler verringert sich bei einer N-maligen Messung auf das -fache. Der Faktor (N-1) wird hier verwendet, um die Standardabweichung zu einer erwartungstreuen Schätzung zu machen.

Die Unsicherheitsfaktoren sind Messwerte und besitzen somit ihrerseits einen Messfehler. Deswegen sollte man für typische Messungen den Fehler nur auf ein oder zwei geltende Ziffern angeben. Die Genauigkeit des Messwertes richtet sich nun nach dem bestimmten Fehler.

Störgröße und Residuum

Schätzgerade und Modellgerade
Anpassung von beobachteten y-Werten an eine logistische Funktion

Eine Störgröße (auch Störvariable oder latente Variable) aus der Grundgesamtheit entspricht dem Residuum (auch Residualvariable) aus der Stichprobe. Eine Störgröße ist der nichtbeobachtbare Teil einer Varianz. Empirische Beobachtungswerte unterscheiden sich von den theoretischen Werten um den Wert der

Störgröße

Da die Störgröße nicht beobachtbar ist, wird sie mit den Residuum geschätzt. Die Residuen sind die Abweichungen der Schätzwerte von den empirischen Beobachtungswerten. Die Residuen berechnen sich demnach als

Residuum

Die Residuen sind die Abweichungen der empirischen Werte von der Schätzgerade, die Störgrößen sind die Abweichungen von der Modellgerade. Die Schätzgerade soll der Modellgerade möglichst nahe kommen. Die häufig wichtige Varianz der Residuen nennt man Skedastizität.

Störgröße

Exogene (xi) und endogene Variablen (yi) sind beobachtete Werte. Die Störgrößen ui sind nicht beobachtbar. Sie werden als Zufallsvariablen betrachtet. Die Abhängigheit von yi und xi wird von der Störgröße überlagert. Gründe für solche Störungen sind:

  • weitere fehlende exogene (unabhängige) Variablen
  • Messfehler
  • unvorhersagbare Zufälligkeiten

Die Wahrscheinlichkeitsverteilung der Störgröße ui ist unbekannt. Es wird unterstellt, dass sie unabhängig von den Beobachtungswerten xi und Modellparametern ist. Außerdem sei die Störgröße paarweise unabhängig und normalverteilt.

Residuum

Residuen sind die „Restwerte“. Unter Residuum versteht man die Differenz zwischen geschätztem Wert (Wert, den das Modell liefert) und empirischen Wert. Das Residuum ist der Anteil der Variabilität (Varianz), der durch ein gegebenes Modell nicht erklärt werden kann. Residuen sind bei der Erstellung von Modellen sorgfältig zu prüfen. Sie geben Hinweise auf die Erfüllung der Voraussetzungen von Modellen. Residuen werden durch Subtrahieren der Modellschätzungen von den eigentlichen Daten berechnet. Ein Residuum ist im Gegensatz zum erklärten Teil der Streuung der nicht-erklärte Teil.

Bei der linearen Regression wird als Residuum e die Abweichnung zwischen der abhängigen Variable y und dem berechneten Wert abhängigen Variable y = a + bx, bezeichnet: ei = yi - y0i Mit Hilfe der Residuen können Aussagen über die Korrektheit des linearen Modells gemacht werden. Ist das Modell korrekt, müssen sich die Werte von ei im gesamten Bereich von y0i ohne erkennbare Struktur (Homoskedastizität) um 0 sammeln. Das Residuum ist die Abweichung des beobachteten y-Wertes vom geschätzten Wert, bei linearer Regression also die Differenz zur Ausgleichsgeraden.

Es werden folgende statistische Annahmen getroffen:

a) E(ei|X) = 0
b) Var(ei|X) = σ2 (Homoskedastizität)
c) E(eiej|X) = 0 für i ≠ j (keine Autokorrelation)
b) und c) lassen sich zusammenfassen zu
E(ee'|X) = σ2·I, wobei I die Einheitsmatrix darstellt.

Im Rahmen der Teststatistik und ML-Schätzung wird noch angenommen, dass ei bei gegebenem X normalverteilt ist (ei ≈ N(0,σ2·I)


Unterschied zwischen Residuum und statistischem Fehler

Ein Residuum ist eine messbare Schätzung eines nichtmessbaren Fehlers.

Beispiel: Es wird eine Zufallsstichprobe von n Menschen, deren Größe gemessen wird, gezogen. Der Stichprobendurchschnitt (x) wird zur Schätzung des Durchschnitts der Grundgesamtheit (Erwartungswert µ) genutzt, die nicht beobachtbar sei (was häufig der Fall ist). Das bedeutet:
Die Differenz zwischen der Größe eines einzelnen Menschen in der Stichprobe und dem Durchschnitt der nichtbeobachtbaren Grundgesamtheit ist der statistische Fehler
Die Differenz zwischen der Größe eines einzelnen Menschen in der Stichprobe und dem Durchschnitt der beobachtbaren Stichprobe ist das Residuum.

Residuen sind beobachtbar, statistische Fehler nicht. Die Summe der Residuen in einer Zufallsstichprobe ist zwingend Null, d. h. Residuen sind zwingend nicht-unabhängig. Die Summe der statistischen Fehler kann nicht Null sein, die Fehler sind unabhängige Zufallsvariablen, wenn die Individuen unabhängig aus der Grundgesamtheit gezogen wurden. Fehler sind häufig unabhängig voneinander.

Siehe auch

Weblinks

Kategorie:Statistik Kategorie:Messabweichung

en:Errors and residuals in statistics fi:Virhe it:Errore statistico pt:Teoria dos erros sv:Slumpfel