Vorhersagemodell
In der Statistik bezeichnet man als Prognosemodell oder Vorhersagemodell ein Modell, das eine Prognose der abhängigen Variablen y liefert und dazu einen funktionalen Zusammenhang verwendet, der durch ein Regressionsverfahren ermittelt wurde. Wenn zusätzliche x-Werte ohne zugehörigen y-Wert vorliegen, kann das angepasste Modell zur Vorhersage des Wertes von y verwendet werden.
Andere Vorhersagemodelle gibt es für Zeitreihen, siehe dazu z. B. unter Lineare Vorhersage.
Prognosemodell
In der multiplen linearen Regression ergibt sich das Prognosemodell durch
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathbf y_0 = \mathbf X_0 \boldsymbol \beta + \boldsymbol \varepsilon_0} ,
wobei
- den Vektor zukünftiger abhängiger Variablen darstellt und
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathbf X_0} die Matrix der erklärenden Variablen zum Zeitpunkt Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle T_0} .
Die Prognose wird dargestellt als Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat\mathbf y_0 = \mathbf X_0 \mathbf b} .
Prognosefehler
Aus o. g. Darstellung ergibt sich der Prognosefehler Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat\mathbf y_0 -\mathbf y_0 = \mathbf X_0( \mathbf b - \boldsymbol \beta) - \boldsymbol \varepsilon_0} mit folgenden Eigenschaften:
- der Erwartungswert des Prognosefehlers ist im Mittel null: Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{E}(\hat\mathbf y_0 - \mathbf y_0) = \operatorname{E}(\mathbf X_0( \mathbf b - \boldsymbol \beta) - \boldsymbol \varepsilon_0) = \mathbf 0}
- die Varianz-Kovarianzmatrix des Prognosefehlers lautet: Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{E}[(\hat\mathbf y_0 - \mathbf y_0 - \operatorname{E}(\hat\mathbf y_0 - \mathbf y_0))((\hat\mathbf y_0 - \mathbf y_0-\operatorname{E}(\hat\mathbf y_0 - \mathbf y_0))^{\top}] = \sigma^2[\mathbf X_0(\mathbf X^{\top}\mathbf X)^{-1}\mathbf X_0^{\top} + \mathbf I]} .
Oft ist man daran interessiert, für einen neuen Wert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_0} die Realisierung der endogenen (= abhängigen) Variablen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle y_0} zu schätzen. Beispielsweise könnte Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_0} der geplante Preis eines Produktes und der Absatz sein. In diesem Fall nimmt man ein einfaches Regressionsmodell an. Der prognostizierte Funktionswert der exogenen (= unabhängigen) Variablen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_0} ist dann gegeben durch
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat{y}_0 = b_0 +b_1 x_0}
Da man den Wert der endogenen Variablen nie genau vorhersehen kann, ergibt sich immer ein Schätzfehler. Dieser Fehler wird als Prognosefehler bezeichnet und ergibt sich aus
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle e_p:=\hat{y_0}-y_0 }
Ist die wahre Prognosegleichung unbekannt, so ist auch der Prognosefehler unbekannt. Trotzdem ist es möglich, eine Aussage über die Präzision des Prognosefehlers zu machen. Die Prognose gilt theoretisch als präzise, da der Fehler im Mittel 0 ist:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname E(\hat{y}_0- y_0)= \operatorname E(x_{t1}\hat\beta_1 + x_{t2}\hat\beta_2 + \ldots + x_{tK}\hat \beta_K -(x_{t1}\beta_1 + x_{t2}\beta_2 + \ldots + x_{tK} \beta_K + \varepsilon_t ))=0} .
Die gemittelte Summe der Prognosefehler ergibt den mittleren absoluten Fehler.
Prognoseintervall
In der Inferenzstatistik ist ein Prognoseintervall, auch Vorhersageintervall oder Prädiktionsintervall genannt, ein Bereich, in dem der zu prognostizierende Wert mit einer bestimmten (hohen) Wahrscheinlichkeit ex ante zu vermuten ist.
Prognoseintervalle ähneln Konfidenzintervallen, sind jedoch aufgrund ihrer Eigenschaften nicht mit ihnen zu verwechseln.
Wichtig für die Berechnung eines Prognoseintervalls ist die Varianz des Prognosefehlers, welche die Variation des Prognosefehlers und somit die Zuverlässigkeit der Prognose wiedergibt. Sie ist in der linearen Einfachregression gegeben durch:
- Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle \sigma _{0}^{2}=\operatorname {Var} ({\hat {y}}_{0}-y_{0})=\sigma ^{2}\left(1+{\frac {1}{n}}+{\frac {(x_{0}-{\bar {x}})^{2}}{\sum \limits _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}}\right)} .
Mithilfe der Varianz des Prognosefehlers erhält man dann als Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (1- \alpha)} -Prognoseintervall für den prognostizierten Wert von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle y_0} [1][2]
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle {\hat{y}}_0 \pm t_{(1 - \alpha/2, n - 2)} \cdot \sqrt { \hat{\sigma}^2\left(1 + \frac{1}{n} + \frac {(x_0 - \bar x)^2} {\sum\limits_{i=1}^n (x_i - \bar x)^2 }\right)}} .