Wahres Modell
In der Statistik ist das zugrundeliegende wahre Modell das eigentliche Modell in der Grundgesamtheit, welches die Antwortvariable und die relevanten unabhängigen Variablen in Beziehung zueinander setzt. Diese Beziehung wird durch eine additive Störgröße überlagert, für die angenommen wird, dass sie einen Erwartungswert von Null aufweist.[1] Die grundlegende Annahme des Modells ist, dass es linear in den Parametern ist.
Multiple lineare Regression
Gegeben sei das folgende multiple lineare Regressionsmodell:
(1)
| ||
Hierbei ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle k+1 =: p} die Anzahl der zu schätzenden unbekannten (wahren) Parameter Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \beta_0, \beta_1, \beta_2, \dotsc , \beta_k} . Die Regressionsparameter Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \beta_0, \beta_1, \beta_2 ,\dotsc , \beta_k} sind unbekannte, konstante Parameter des Interesses (sie gilt es zu schätzen) und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \varepsilon_i } ist eine unbeobachtbare Zufallsvariable, die Störgröße oder Fehlerterm genannt wird. Selbst wenn man die wahre Regressionsfunktion der Grundgesamtheit kennen würde, dann würde sich der beobachtete Wert der Zielgröße Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle y_i} immer noch vom vorhergesagten Wert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat y_i} durch ein gewisses Ausmaß unterscheiden, was der Störgröße entspricht.
Formal handelt es sich bei der obigen Gleichung um das Modell in der Grundgesamtheit bzw. das Populationsmodell. Dies wird manchmal wahres Modell genannt, da mit der Annahme eines wahren Modells sichergestellt wird, dass man ein Modell schätzt, was sich von (1) unterscheidet.[2]
Man könnte beispielsweise redundante unabhängige Variablen hinzufügen. Allerdings muss das Einbeziehen von redundanten unabhängigen Variablen nicht immer ein Spezifikationsfehler darstellen (von einem Spezifikationsfehler spricht man, wenn die Annahme, dass der Erwartungswert der Störgröße gleich Null ist verletzt ist). Beispielsweise könnte das zugrundeliegende wahre Modell gegeben sein durch Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle y_i = \beta_0 + x_{i1} \beta_1 +x_{i2}\beta_2+ \varepsilon_i} . Das gewählte (spezifizierte) Modell (mit der irrelevanten unabhängigen Variablen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_{i3}} ) könnte folgendes Modell sein: Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle y_i = \beta_0 + x_{i1} \beta_1 +x_{i2}\beta_2+ x_{i3}\beta_3+ \varepsilon^{*}_i} . Dass die Variable als irrelevant angenommen wird bedeutet, dass der wahre Wert von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \beta_3} gleich Null ist (Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \beta_3 = 0} ). Aus diesem Grund gilt: Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{E}(\varepsilon^{*}_i) = \operatorname{E}(\varepsilon_i - x_{i3}\beta_3) = 0} . In diesem Fall sind die KQ-Schätzer immer noch erwartungstreu für die wahren Werte und es liegt kein Spezifikationsfehler vor.
Einzelnachweise
- ↑ Jeffrey Marc Wooldridge: Introductory econometrics: A modern approach. 5. Auflage. Nelson Education, 2015, S. 859.
- ↑ Jeffrey Marc Wooldridge: Introductory econometrics: A modern approach. 5. Auflage. Nelson Education, 2015, S. 83.