Jackknife-Methode
Die
(englisch ‚Taschenmesser‘) ist in der Statistik eine Methode des Resampling. Jackknife dient dazu, den zufälligen Fehler einer Schätzmethode und eine etwaige Verzerrung (engl.
) zu schätzen.
Aus Überlegungen zur Verbesserung der Jackknife-Methode entstand das Bootstrapping-Verfahren. Die Methode wurde 1956 bzw. 1958 zuerst von M. H. Quenouille und John W. Tukey veröffentlicht[1][2]. Der Name soll die allgemeine Einsetzbarkeit der Methode für statistische Zwecke betonen.
Methode
Häufig wird Jackknife mit
gleichgesetzt. Dabei wird aus der ursprünglichen Stichprobe Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle x_1 \dots x_N} jeweils ein Wert weggelassen und der Schätzer für diese reduzierte Stichprobe berechnet. Wird aus der ursprünglichen Stichprobe nicht nur ein Wert weggelassen, sondern d viele, so spricht man von delete-d Jackknife.
Durch das Weglassen von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle d} von insgesamt Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N} Werten, können Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \binom{N}{d}} unterschiedliche reduzierte Stichproben erzeugt werden, die Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle N-d} viele Werte haben.
Der Stichprobenmittelwert der ursprünglichen Stichprobe sei . Im Folgenden wird die delete-1-Jackknife-Methode beschrieben. Der Mittelwert der reduzierten Jackknife-Stichprobe Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle i} , welche durch Streichen des Wertes Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_i} entsteht, sei:
Dann ist der Mittelwert über alle Jackknife-Stichproben gegeben durch:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle A_{(*)}:=\frac{1}{N}\sum_{i=1}^{N} A_{(i)}} .
Die Varianz des Stichprobenmittelwertes kann durch folgende Formel abgeschätzt werden:[3]
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \operatorname{Var}(\overline{x})=\frac{N-1}{N}\sum_{i=1}^{N}\left( A_{(i)}-{A}_{(*)} \right)^2} .
Die Jackknife-Methode liefert für die Verzerrung der Schätzfunktion Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat{A}} den geschätzten Wert:
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \widehat{\text{bias}}_\mathrm{(A)}:= (N-1)({A}_{(*)}-\hat A)}
und somit ist der um die Verzerrung korrigierte Wert
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat{A}_{\text{jack}}=\hat{A} - \widehat{\text{bias}}_\mathrm{A}=N\hat{A} - (N-1)\hat{A}_\mathrm{(*)}}
Literatur
- Joseph Lee Rodgers: The Bootstrap, the Jackknife, and the Randomization Test: A Sampling Taxonomy. Multivariate Behavioral Research, 34, Nr. 4 S. 441ff (1999)