Statistisches Modell

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Skalenmodell)

Ein statistisches Modell, manchmal auch statistischer Raum genannt, ist ein Begriff aus der mathematischen Statistik, dem Teilbereich der Statistik, der sich der Methoden der Stochastik und Wahrscheinlichkeitstheorie bedient. Anschaulich fasst ein statistisches Modell alle Ausgangsinformationen zusammen: Welche Werte können die Daten annehmen, welchen Mengen von Werten soll eine Wahrscheinlichkeit zugeordnet werden und welche Wahrscheinlichkeitsmaße sind möglich beziehungsweise sollen in Betracht gezogen werden?

Definition

Ein statistisches Modell Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal E } ist ein Tripel Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal E= (\mathcal X, \mathcal A, \mathcal P) } bestehend aus

  • einer Grundmenge Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal X } , die alle möglichen Ergebnisse eines Zufallsexperiments oder einer Stichprobenziehung enthält,
  • einer σ-Algebra Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal A } auf der Grundmenge Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal X } und
  • einer Menge Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal P } von Wahrscheinlichkeitsmaßen auf Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (\mathcal X, \mathcal A ) }

Oftmals ist es handlicher, die Menge von Wahrscheinlichkeitsmaßen als Familie (mit beliebiger Indexmenge) zu notieren, um auf ausgewiesene Elemente leichter zugreifen zu können. Die Menge von Wahrscheinlichkeitsmaßen wird dann auch mit Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (P_\vartheta)_{\vartheta \in \Theta} } notiert. Dies bedeutet nicht zwangsläufig, dass es sich um ein parametrisches Modell handelt.

Alternative Definitionen

Es existieren mehrere alternative Definitionen eines statistischen Modells, die sich in ihrer Detailliertheit unterscheiden.

Einerseits findet sich die Beschreibung eines statistischen Modells als eine Zufallsvariable Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X } , die Werte in dem Messraum Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (\mathcal X, \mathcal A ) } annimmt entsprechend den Verteilungen aus Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal P } [1]. Der zugrunde liegende Wahrscheinlichkeitsraum der Zufallsvariable wird nicht näher präzisiert, da er für die Verteilungen nicht relevant ist. Diese Beschreibung macht im Gegensatz zur obigen Beschreibung klarer, dass die Stichproben, also die Elemente aus Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal X } , als Realisierung einer Zufallsvariable mit unbekannter Verteilung zu sehen sind. Die Menge Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal X } heißt dann auch Stichprobenraum.

Andererseits findet sich auch die Beschreibung eines statistischen Modells lediglich als Familie oder Menge von Wahrscheinlichkeitsmaßen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal P } [2]. Der entsprechende Grundraum ergibt sich dann implizit aus den definierten Wahrscheinlichkeitsmaßen, die verwendete σ-Algebra ist entsprechend die kanonische Wahl (Potenzmenge im diskreten Fall, Borelsche σ-Algebra sonst).

Klassifikation statistischer Modelle

Parametrische und nichtparametrische Modelle

Lässt sich die Menge von Wahrscheinlichkeitsmaßen über eine Parametermenge, auch Parameterraum genannt, beschreiben, ist also

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal P = \{P_\vartheta \, | \, \vartheta \in \Theta \} }

für eine Parametermenge Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Theta \subset \R^n } , so spricht man von einem parametrischen Modell, ansonsten von einem nichtparametrischen Modell. Ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Theta \subset \R } , so spricht man von einem einparametrigen Modell.

Diskrete Modelle

Ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal X } endlich oder abzählbar unendlich und ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal A = 2^{\mathcal X} } die Potenzmenge, so spricht man von einem diskreten Modell. Die Wahrscheinlichkeitsmaße lassen sich dann durch Wahrscheinlichkeitsfunktionen beschreiben.

Stetige Modelle

Ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal X } eine Borel-Menge des Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \R^n } und ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal A } die Einschränkung der Borelschen σ-Algebra auf diese Menge, also Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal A = \mathcal B (\R^n)|_{\mathcal X} } und besitzt jedes der Wahrscheinlichkeitsmaße in Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal P } eine Wahrscheinlichkeitsdichte, so spricht man von einem stetigen Modell.

Standardmodelle

Handelt es sich um ein stetiges Modell oder um ein diskretes Modell, so spricht man von einem Standardmodell[3]. Bei Standardmodellen existiert also insbesondere eine Wahrscheinlichkeitsdichte oder eine Wahrscheinlichkeitsfunktion. Manche Autoren nennen diese Modelle auch reguläre Modelle[4].

Reguläre Modelle

Reguläre statistische Modelle sind einparametrige Standardmodelle, bei denen noch Anforderungen an die Existenz von Ableitungen der Dichtefunktion gestellt werden. Sie werden zur Formulierung der Cramér-Rao-Ungleichung benötigt.

Lokations- und Skalenmodelle

Statistische Modelle, deren Verteilungsklasse eine Lokationsklasse ist, also durch Verschiebung einer einzigen Wahrscheinlichkeitsverteilung entstehen, werden Lokationsmodelle genannt, ebenso werden statistische Modelle mit Skalenfamilien Skalenmodell genannt.

Produktmodelle

Produktmodelle entstehen, wenn man das mehrmalige Produkt eines statistischen Modells mit sich selbst bildet. Sie formalisieren die Vorstellung, dass man einen Versuch mehrmals hintereinander ausführt und die Ergebnisse der Einzelversuche sich nicht gegenseitig beeinflussen. Viele der gängigen Modelle wie das Normalverteilungsmodell sind Produktmodelle.

Beispiele

Ein Beispiel für ein statistisches Modell ist der Grundraum Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal X= \{0,1\}^{100} } versehen mit der σ-Algebra Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal A = 2^{\mathcal X} } und als Menge der Wahrscheinlichkeitsmaße die Menge

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal P = \{\operatorname{Bin}_{100,\vartheta}\, | \, \vartheta \in [0,1] \} }

aller Binomialverteilungen mit Parametern 100 und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \vartheta } . Dieses statistische Modell könnte man beispielsweise wählen, wenn man eine Münze 100-mal wirft und die Anzahl der Erfolge zählt. Diese ist binomialverteilt, aber zu einem unbekannten Parameter, da nicht klar ist, ob die Münze gefälscht ist oder nicht. Es handelt sich bei diesem Modell um ein einparametriges Modell, da Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \vartheta \in \Theta = [0,1] \subset \R } ist. Außerdem ist es ein diskretes Modell, da die Grundmenge endlich ist und die σ-Algebra durch die Potenzmenge definiert wird. Damit ist es auch automatisch ein Standardmodell. Die Menge von Wahrscheinlichkeitsmaßen

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal P = \{ P \, | \, P \text{ ist W-Maß auf } (\mathcal X, \mathcal A) \} } ,

ergibt hingegen ein nichtparametrisches Modell.

Literatur

  • Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, doi:10.1007/978-3-642-41997-3.
  • Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, doi:10.1515/9783110215274.

Einzelnachweise

  1. Rüschendorf: Mathematische Statistik. 2014, S. 18.
  2. Czado, Schmidt: Mathematische Statistik. 2011, S. 39.
  3. Georgii: Stochastik. 2009, S. 197.
  4. Claudia Czado, Thorsten Schmidt: Mathematische Statistik. Springer-Verlag, Berlin Heidelberg 2011, ISBN 978-3-642-17260-1, S. 41, doi:10.1007/978-3-642-17261-8.