Probit-Modell
Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen.
Bitte hilf mit, die Mängel dieses Artikels zu beseitigen, und beteilige dich bitte an der Diskussion! (Artikel eintragen) |
Das Probit-Modell ist in der Statistik, einem Teilgebiet der Mathematik, die Spezifikation eines verallgemeinerten linearen Modells. Probit ist dazu ein Kofferwort für prob(ability un)it, das aus den zwei englischen, überlappenden Wörtern für Wahrscheinlichkeit und Einheit (0 oder 1) entstanden ist.[1]
Die statistische Spezifikation bezeichnet denjenigen Prozess der Modellentwicklung, in dem ein statistisch schätzbares Modell (Schätzmodell) festgelegt wird. Verallgemeinerte lineare Modelle sind nichtlineare Erweiterungen der klassischen linearen Regression. Das Probit-Modell verwendet eine Probit-Kopplungsfunktion, die den Erwartungswert der Zielgröße in Beziehung zum linearen Prädiktor des Modells setzt. Probit-Modelle wurden von Chester Bliss eingeführt.
Anwendung
Die Probit-Modelle werden wie die Logit-Modelle dazu verwendet, binäre Zielgrößen in binären diskreten Entscheidungsmodellen abzubilden. Sie verwenden Zielgrößen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Y} , die nur zwei Werte annehmen können. Beispiele:
- „Lässt sich scheiden“ → Ja/Nein,
- „Kunde Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle i} hat Produkt A gekauft“ → Ja/Nein,
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} → Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Y} .
Als Stichprobe werden Kunden beim Ausgang befragt, ob sie das Produkt A gekauft haben. Das Probit-Modell kann erstens – analog zur Regression – berechnen, ob die gleichzeitig erhobenen Merkmale das Kaufverhalten Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Y} „gut“ erklären. Im positiven Fall ist eine Schätzung möglich, wie groß der Absatz ist, wenn Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} den ganzen Markt beschreibt.
Diese Modelle haben in der Anwendung eine sehr weite Verbreitung. Innerhalb der verallgemeinerten linearen Modelle liefert das Logit-Modell bessere Resultate bei extrem unabhängigen Variablenebenen. Umgekehrt ist das Probit-Modell im Allgemeinen besser bei Zufallseffekten mit Datensätzen mittlerer Größe.
Definition
Probit-Modelle sind ökonometrische, nichtlineare Modelle zur Erklärung von binären Zielgrößen mit der Kodierung: 0 = Ereignis tritt nicht ein, 1 = Ereignis tritt ein. Der Vektor der erklärenden Variablen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathbf{x}_i} steht für die verschiedenen Beobachtungen, welche über den Index Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle i} unterscheidbar sind. Er beeinflusst die Wahrscheinlichkeit, ob das Ereignis 0 oder 1 eintritt. Sei Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Y} die Zielgröße und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} die Einflussgröße.
Das Probit-Modell ist eine geschickte Definition bei der Modellentwicklung und lautet als Formel:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Pr(Y=1|X=x) = \Phi(\mathbf{x}_i'\boldsymbol\beta) \;\stackrel{\mathrm{def}}{=}\; \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\mathbf{x}_i'\boldsymbol\beta} \operatorname{exp}\left(-\frac{1}{2} t^2\right) \mathrm d \,t} ,
Notation:
- , gesprochen „Phi von x“, bezeichnet die Verteilungsfunktion einer Standardnormalverteilung mit der Wahrscheinlichkeit, dass die zugehörige Zufallsvariable Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X} einen Wert kleiner oder gleich Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x} annimmt.
- Die Normierungskonstante Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle {\tfrac {1}{\sqrt {2\pi }}}} gehört zum Integral von minus unendlich bis Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x} , geschrieben Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle \textstyle \int _{-\infty }^{x}\mathrm {d} \,t} über die Exponentialfunktion Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle \operatorname {exp} ()} , und ist eine gebundene Variable.
- Das nichtelementare Integral ist notwendig, um die Normalverteilungsdichte an der Wahrscheinlichkeitsdichte zu normieren. Es wurde 1782 von Pierre-Simon Laplace entwickelt.
Die Formel zum Probit-Modell heißt: Die auf die erklärenden Variablen bedingte Wahrscheinlichkeit „“, dass die Antwortvariable gleich ist, entspricht einer Funktion mit der Linearkombination der erklärenden Variablen . Der Parametervektor wird typischerweise mit der Maximum-Likelihood-Methode geschätzt. Bei dieser Methode der größten Dichte wird derjenige Vektor als Schätzung ausgewählt, gemäß dessen Verteilung die Realisierung der beobachteten Daten am plausibelsten erscheint.
Modell
Das Probit-Modell ist ein einfaches latentes Variablenmodell, das den Zusammenhang zwischen beobachtbaren (oder manifesten) Variablen und dahinter liegenden, latenten Variablen beschreibt. Der Term kann kleine Fehler haben. Darum wird er durch ersetzt:
- ,
wobei die Fehlerterme einer Normalverteilung folgen mit Fehler beim Parsen (Konvertierungsfehler. Der Server („https://wikimedia.org/api/rest_“) hat berichtet: „Cannot get mml. Server problem.“): {\displaystyle \varepsilon _{i}\sim {\mathcal {N}}(0,1)} . Sie sind ähnlich zur bekannten Gauß-Verteilung Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathcal{N}} mit dem Mittelwert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 0} und der Standardabweichung Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 1} . Zudem stellt Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Y} eine Dummy-Variable (ja-nein-Variable) dar, die ein Indikator dafür ist, ob die latente Variable positiv ist:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle Y\;\stackrel{\mathrm{def}}{=}\;1 \Leftrightarrow y^*>0} .
Dann kann man zeigen, dass folgende Gleichung für das Probit-Modell erfüllt ist:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \Pr(Y=1 | X=x) = \Phi(\mathbf{x}_i'\boldsymbol\beta)} .
Einzelnachweise
- ↑ Oxford English Dictionary, 3rd ed. s.v. probit (article dated June 2007): C. I. Bliss: The Method of Probits. In: Science. 79, Nr. 2037, 1934, S. 38–39. doi:10.1126/science.79.2037.38. PMID 17813446. „These arbitrary probability units have been called ‘probits’.“