Jackknife-Methode

aus Wikipedia, der freien Enzyklopädie

Die

Jackknife-Methode

(englisch ‚Taschenmesser‘) ist in der Statistik eine Methode des Resampling. Jackknife dient dazu, den zufälligen Fehler einer Schätzmethode und eine etwaige Verzerrung (engl.

bias

) zu schätzen.

Aus Überlegungen zur Verbesserung der Jackknife-Methode entstand das Bootstrapping-Verfahren. Die Methode wurde 1956 bzw. 1958 zuerst von M. H. Quenouille und John W. Tukey veröffentlicht[1][2]. Der Name soll die allgemeine Einsetzbarkeit der Methode für statistische Zwecke betonen.

Methode

Häufig wird Jackknife mit

delete-1 Jackknife

gleichgesetzt. Dabei wird aus der ursprünglichen Stichprobe Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_1 \dots x_N} jeweils ein Wert weggelassen und der Schätzer für diese reduzierte Stichprobe berechnet. Wird aus der ursprünglichen Stichprobe nicht nur ein Wert weggelassen, sondern d viele, so spricht man von delete-d Jackknife.

Durch das Weglassen von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle d} von insgesamt Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N} Werten, können Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \binom{N}{d}} unterschiedliche reduzierte Stichproben erzeugt werden, die Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N-d} viele Werte haben.

Der Stichprobenmittelwert der ursprünglichen Stichprobe sei . Im Folgenden wird die delete-1-Jackknife-Methode beschrieben. Der Mittelwert der reduzierten Jackknife-Stichprobe Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle i} , welche durch Streichen des Wertes Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_i} entsteht, sei:

Dann ist der Mittelwert über alle Jackknife-Stichproben gegeben durch:

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A_{(*)}:=\frac{1}{N}\sum_{i=1}^{N} A_{(i)}} .

Die Varianz des Stichprobenmittelwertes kann durch folgende Formel abgeschätzt werden:[3]

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{Var}(\overline{x})=\frac{N-1}{N}\sum_{i=1}^{N}\left( A_{(i)}-{A}_{(*)} \right)^2} .

Die Jackknife-Methode liefert für die Verzerrung der Schätzfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat{A}} den geschätzten Wert:

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \widehat{\text{bias}}_\mathrm{(A)}:= (N-1)({A}_{(*)}-\hat A)}

und somit ist der um die Verzerrung korrigierte Wert

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat{A}_{\text{jack}}=\hat{A} - \widehat{\text{bias}}_\mathrm{A}=N\hat{A} - (N-1)\hat{A}_\mathrm{(*)}}

Literatur

  • Joseph Lee Rodgers: The Bootstrap, the Jackknife, and the Randomization Test: A Sampling Taxonomy. Multivariate Behavioral Research, 34, Nr. 4 S. 441ff (1999)

Einzelnachweise

  1. M. H. Quenouille: Notes on bias in estimation. Biometrika, 43, S. 353ff (1956)
  2. J. W. Tukey: Bias and confidence in not quite large samples. Annls. Math. Stat. 29, S. 614 (1958)
  3. Bradley Efron, Charles Stein: The Jackknife Estimate of Variance. The Annals of Statistics, 9(3), S. 586–596 (1981)