Vorhersagemodell

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Prognosefehler)

In der Statistik bezeichnet man als Prognosemodell oder Vorhersagemodell ein Modell, das eine Prognose der abhängigen Variablen y liefert und dazu einen funktionalen Zusammenhang verwendet, der durch ein Regressionsverfahren ermittelt wurde. Wenn zusätzliche x-Werte ohne zugehörigen y-Wert vorliegen, kann das angepasste Modell zur Vorhersage des Wertes von y verwendet werden.

Andere Vorhersagemodelle gibt es für Zeitreihen, siehe dazu z. B. unter Lineare Vorhersage.

Prognosemodell

In der multiplen linearen Regression ergibt sich das Prognosemodell durch

,

wobei

  • Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathbf y_0} den Vektor zukünftiger abhängiger Variablen darstellt und
  • Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathbf X_0} die Matrix der erklärenden Variablen zum Zeitpunkt Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T_0} .

Die Prognose wird dargestellt als Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat\mathbf y_0 = \mathbf X_0 \mathbf b} .

Prognosefehler

Aus o. g. Darstellung ergibt sich der Prognosefehler Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat\mathbf y_0 -\mathbf y_0 = \mathbf X_0( \mathbf b - \boldsymbol \beta) - \boldsymbol \varepsilon_0} mit folgenden Eigenschaften:

  • der Erwartungswert des Prognosefehlers ist im Mittel null: Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{E}(\hat\mathbf y_0 - \mathbf y_0) = \operatorname{E}(\mathbf X_0( \mathbf b - \boldsymbol \beta) - \boldsymbol \varepsilon_0) = \mathbf 0}
  • die Varianz-Kovarianzmatrix des Prognosefehlers lautet: Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{E}[(\hat\mathbf y_0 - \mathbf y_0 - \operatorname{E}(\hat\mathbf y_0 - \mathbf y_0))((\hat\mathbf y_0 - \mathbf y_0-\operatorname{E}(\hat\mathbf y_0 - \mathbf y_0))^{\top}] = \sigma^2[\mathbf X_0(\mathbf X^{\top}\mathbf X)^{-1}\mathbf X_0^{\top} + \mathbf I]} .

Oft ist man daran interessiert, für einen neuen Wert die Realisierung der endogenen (= abhängigen) Variablen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle y_0} zu schätzen. Beispielsweise könnte Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_0} der geplante Preis eines Produktes und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle y_0} der Absatz sein. In diesem Fall nimmt man ein einfaches Regressionsmodell an. Der prognostizierte Funktionswert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat{y}_0} der exogenen (= unabhängigen) Variablen ist dann gegeben durch

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat{y}_0 = b_0 +b_1 x_0}

Da man den Wert der endogenen Variablen nie genau vorhersehen kann, ergibt sich immer ein Schätzfehler. Dieser Fehler wird als Prognosefehler bezeichnet und ergibt sich aus

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle e_p:=\hat{y_0}-y_0 }

Ist die wahre Prognosegleichung unbekannt, so ist auch der Prognosefehler unbekannt. Trotzdem ist es möglich, eine Aussage über die Präzision des Prognosefehlers zu machen. Die Prognose gilt theoretisch als präzise, da der Fehler im Mittel 0 ist:

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname E(\hat{y}_0- y_0)= \operatorname E(x_{t1}\hat\beta_1 + x_{t2}\hat\beta_2 + \ldots + x_{tK}\hat \beta_K -(x_{t1}\beta_1 + x_{t2}\beta_2 + \ldots + x_{tK} \beta_K + \varepsilon_t ))=0} .

Die gemittelte Summe der Prognosefehler ergibt den mittleren absoluten Fehler.

Prognoseintervall

In der Inferenzstatistik ist ein Prognoseintervall, auch Vorhersageintervall oder Prädiktionsintervall genannt, ein Bereich, in dem der zu prognostizierende Wert mit einer bestimmten (hohen) Wahrscheinlichkeit ex ante zu vermuten ist.

Prognoseintervalle ähneln Konfidenzintervallen, sind jedoch aufgrund ihrer Eigenschaften nicht mit ihnen zu verwechseln.

Wichtig für die Berechnung eines Prognoseintervalls ist die Varianz des Prognosefehlers, welche die Variation des Prognosefehlers und somit die Zuverlässigkeit der Prognose wiedergibt. Sie ist in der linearen Einfachregression gegeben durch:

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \sigma^2_{0} = \operatorname{Var} ({\hat{y}}_0 - y_0) = \sigma^2\left(1 + \frac{1}{n} + \frac {(x_0 - \bar x)^2} {\sum\limits_{i=1}^n (x_i - \bar x)^2 }\right)} .

Mithilfe der Varianz des Prognosefehlers erhält man dann als Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (1- \alpha)} -Prognoseintervall für den prognostizierten Wert von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle y_0} [1][2]

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle {\hat{y}}_0 \pm t_{(1 - \alpha/2, n - 2)} \cdot \sqrt { \hat{\sigma}^2\left(1 + \frac{1}{n} + \frac {(x_0 - \bar x)^2} {\sum\limits_{i=1}^n (x_i - \bar x)^2 }\right)}} .

Einzelnachweise

  1. Von Auer: Ökonometrie. Eine Einführung. 6. Auflage, S. 135.
  2. L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 448.