Diskussion:Zweistichproben-t-Test

aus Wikipedia, der freien Enzyklopädie

Vorgeschichte

Der Inhalt dieses Artikel wurde 2011 aus dem Artikel t-Test ausgelagert, allerdings wurden die betreffenden Diskussionen nicht mitgeführt. Ältere Diskussionen bis 2011 finden sich daher auf der Seite Diskussion:T-Test.--Sigma^2 (Diskussion) 09:31, 24. Aug. 2021 (CEST)

Abhaengige Stichproben

MMn ist der Titel des Abschnitts "Zweistichproben-t-Test für abhängige Stichproben" falsch, und der Abschnitt gehoert nicht hier, Zwar handelt es sich um zwei Stichproben, aber der Test bezieht sich auf die eine Stichprobe der Differenzen. Nijdam 21:43, 12. Nov. 2011 (CET)

Was macht denn der Test für "abhängige Stichproben"? In beiden Fällen wird betrachtet; man könnte den Abschnitt für abhängige Stichproben auslagern, aber macht das Sinn? --Sigbert 15:13, 13. Nov. 2011 (CET)

Es handelt prinzipiell um dem T-Test fuer eine Stichprobe, naemlich die Stichprobe der Differenzen. MMn gehoert der Fall dort besprochen zu werden.Nijdam 20:23, 13. Nov. 2011 (CET)

Mir ist ein grober Fehler aufgefallen: Die Formel für die Berechung der Freiheitsgrade ist falsch. Dort wird mit sx und sy gerechnet. Richtig wäre aber jeweils die VARIANZ. (nicht signierter Beitrag von 89.13.15.58 (Diskussion) 13:43, 29. Nov. 2011 (CET))

Hast recht, habe es korrigiert. Nijdam 17:02, 29. Nov. 2011 (CET)

Ich zeigre noch auf meine Bemerkungen oben: der "Zweistichproben-t-Test für abhängige Stichproben" ist wesentlich nur ein Test für gepaarte Beobachtungen. Nijdam (Diskussion) 14:39, 19. Jun. 2012 (CEST)

Der Test für so genannte "abhängige Stichproben" muss entweder als t-Differenzentest einen eigenen Artikel bekommen, wie in der englischsprachigen Wikipedia (https://en.wikipedia.org/wiki/Paired_difference_test) oder er muss als Abschnitt in den Artikel Einstichproben-t-Test. Zwar wird in einigen Anwendungsbereichen von "abhängigen Stichproben" gesprochen, es handelt sich aber um e i n e Stichprobe aus e i n e r Grundgesamtheit, bei der z w e i Merkmale an denselben Einheiten beobachtet werden. Nijdam hat grundsätzlich recht, auch wenn in seiner ersten Äußerung falsch konzediert "handelt es sich um zwei Stichproben". Nein es handelt sich eben n i c h t um zwei Stichproben, sondern um e i n e (zweidimensionale) Stichprobe, weswegen die Differenzen gebildet werden können. Die aus dem Anwenderbereich kommende schlechte Begrifflichkeit "abhängige Stichproben" (ähnlich problematisch und üblich für denselben Sachverhalt: "gebundene Stichproben", "gepaarte Stichproben") führt dann dazu, dass der t-Differenzentest unter der Überschrift Zweistichproben-Test landet, wo er nichts zu suchen hat. --Sigma^2 (Diskussion) 18:15, 23. Aug. 2021 (CEST)

Beispiel 2

MMn soll es im Beispiel 2 um einen einseitigen Test handeln. Nijdam (Diskussion) 14:35, 19. Jun. 2012 (CEST)

Im Beispiel werden ja beide Varianten (ein- und zweiseitig) erwähnt. Denkst du, dass hier nur der einseitige sinnvoll ist? -- HilberTraum (Diskussion) 17:19, 19. Jun. 2012 (CEST)

Unbedingt, denn um eine neue Therapie zur Senkung des Cholesterinspiegels zu testen, möchte man nur sicher sein ob tatsächlich eine Senkung stattfindet. Also ist die alternative Hypothese einseitig. Nijdam (Diskussion) 12:53, 20. Jun. 2012 (CEST)

Das würde aber heißen, dass man eine mögliche Erhöhung des Cholesterinspiegels schon vor dem Test völlig ausschließt. Ich denke gerade bei Medikamenten schadet es nicht, wenn man da etwas vorsichtig ist, vgl. Paradoxe Reaktion. -- HilberTraum (Diskussion) 07:33, 21. Jun. 2012 (CEST)

Nein, nein, ich erwarte besseres von dir. Es ist nur die Frage was man "beweisen" möchte. Nijdam (Diskussion) 09:01, 21. Jun. 2012 (CEST)

Man findet sicher leicht noch bessere Quellen, aber auf die Schnelle mal hier etwas zu Einlesen. -- HilberTraum (Diskussion) 09:20, 21. Jun. 2012 (CEST)

Ich verstehe nicht worauf du deutest. Von einer neuen Therapie zur Senkung des Cholesterinspiegels mochte man doch versuchen zu zeigen das sie tatsächlich das Cholesterinspiegel senkt, oder? Die Nullhypothese ist also sie senkt den Cholesterinspiegel nicht. Sie wird nur abgelehnt wenn eine signifikante Senkung festgestellt wird. Nijdam (Diskussion) 23:28, 21. Jun. 2012 (CEST)

Man könnte mal im Medizin-Portal nachfragen, wie das in der Praxis gemacht wird, aber nach meinem (theoretischen) Wissen sind zweiseitige Tests bei Medikamenten absolut üblich (oder sogar vorgeschrieben?). Man testet, ob das neue Medikament überhaupt eine Wirkung hat und schaut dann erst auf die Richtung. Begründet wird das damit, dass das Medikament genauso gut auch eine verschlechternde Wirkung haben könnte. Mathematisch könnte man das gleiche natürlich auch mit einem einseitigen Test mit angepasstem machen, aber ich denke man will so mehr "Symmetrie" in die Interpretation bringen. -- HilberTraum (Diskussion) 09:04, 22. Jun. 2012 (CEST)

Notation

Die Notation in den Formeln finde ich einigermaßen irritierend. Folende Schreibweisen würde ich vorschlagen:

Stichproben

Fallzahl der ersten Stichprobe
Fallzahl der zweiten Stichprobe
Mittelwert der ersten Stichprobe
Mittelwert der zweiten Stichprobe
Standardabweichung der ersten Stichprobe
Standardabweichung der zweiten Stichprobe
Aus der ersten Stichprobe geschätzte Grundgesamtheitsvarianz
Aus der zweiten Stichprobe geschätzte Grundgesamtheitsvarianz
Aus beiden Stichproben geschätzte gemeinsame Grundgesamtheitsvarianz

Grundgesamtheiten

Mittelwert der Grundgesamtheit der ersten Stichprobe
Mittelwert der Grundgesamtheit der zweiten Stichprobe
Standardabweichung der Grundgesamtheit der ersten Stichprobe
Standardabweichung der Grundgesamtheit der zweiten Stichprobe
Varianz der Grundgesamtheit der ersten Stichprobe
Varianz der Grundgesamtheit der zweiten Stichprobe
Varianz der gemeinsamen Grundgesamtheit beider Stichproben

Sonstiges

Mittelwertdifferenz, auf die getestet wird. Normalerweise gleich null gesetzt. Kann deshalb auch weggelassen werden.
Freiheitsgrade

Dann sind:

Testgröße t bei gleichen Varianzen

bzw., was numerisch identisch ist:

mit Freiheitsgraden

Testgröße t bei ungleichen Varianzen (Welch-Korrektur)

mit

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \mathrm{df}=\frac{1}{{\displaystyle \frac{c^{2}}{n_{1}-1}+\frac{\left(1-c\right)^{2}}{n_{2}-2}}} }

Freiheitsgraden, wobei

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle c=\frac{{\displaystyle \frac{s_{1}^{2}}{n_{1}}}}{{\displaystyle \frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}} }

ist. Vergleiche dazu auch Clauß/Ebner (1968), 184-194 und Borz (2005), 140-143 sowie folgende Webseiten:

http://eswf.uni-koeln.de/lehre/stathome/statcalc/v2401.htm

Effektstärke

Viele Grüße --Jake2042 (Diskussion) 07:02, 25. Jul. 2012 (CEST)

Literatur

Borz,Jürgen, (6)2005: Statistik für Human- und Sozialwissenschaftler. Heidelberg: Springer

Clauß, Günter und Heinz Ebner, 1968: Grundlagen der Statistik für Psychologen, Pädagogen und Soziologen. Berlin: Volk und Wissen

Normalverteilungsnotation

Als Parameter der Normalverteilung werden normalerweise Erwartungswert und Varianz angegeben, also Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_i\sim N(\mu_X;\sigma^2)} . Im Artikel steht hingegen Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle X_i\sim N(\mu_X;\sigma)} . Absicht? Gleiches im Artikel Einstichproben-t-Test.--93.131.229.131 19:52, 22. Jun. 2015 (CEST)

Ja, ich denke auch, dass das überall auf Varianzen vereinheitlicht werden sollte. -- HilberTraum (d, m) 08:26, 24. Jun. 2015 (CEST)
Gleicher Meinung. Nijdam (Diskussion) 23:01, 25. Jun. 2015 (CEST)


Beispiel 1

Es wird vom 0.975-Quantil gesucht, aber von einer Konfidenz von 95% gesprochen. Ich vermute, hier ist ein Fehler, aber verfüge selbst nur über Halbwissen. Könnte das ein sachkundiger Benutzer ändern oder im Fall dass ich falsch liege in einem Halbsatz kurz erwähnen, warum die Zahlen verschieden sind? --80.146.228.74 10:23, 10. Aug. 2017 (CEST)

Das stimmt schon so, wie es im Beispiel steht: Das Signifikanzniveau Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \alpha = 5\,\%} wird zu gleichen Teilen auf die Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 2{,}5\,\%} „zu großen“ und die Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 2{,}5\,\%} „zu kleinen“ Werte verteilt. Darum heißt es auch „zweiseitiger“ Test. Grüße -- HilberTraum (d, m) 19:42, 10. Aug. 2017 (CEST)
Es ist problematisch, den Begriff "Konfidenz" im Zusammenhang mit statistischen Tests zu verwenden, da es ein Begriff aus dem Bereich der Intervallschätzung (Konfidenzintervalle und -bereiche) ist. Im Bereich der statistischen Test wird vom Signifikanzniveau und Signifikanz gesprochen. Das Ergebnis des Tests kann z.B. so zusammengefasst werden: "Die Düngemittel unterscheiden sich in ihrer Wirkung signifikant (bei einem vorgegebenen Signifikanzniveau von 5%)." --Sigma^2 (Diskussion) 09:59, 24. Aug. 2021 (CEST)

Notation "Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle {\mathrm t}(x,y)} " wird ohne Referenz oder Erklärung verwendet

Im Abschnitt "Zweistichproben-t-Test für unabhängige Stichproben" wird in einer Formel die Notation t(x, y) verwendet. Diese Funktion wird nicht eingeführt. Offensichtlich ist es was anderes als der weiter oben definierte t-Wert. Es wäre schön, wenn ein/e Wissende/r eine Erklärung ergänzen würde, so dass ich das Schritt für Schritt nachrechnen kann (idealerweise ohne Vorwissen über t-Tests, denn sonst müsste ich diesen Artikel ja nicht aufrufen). Nachdem ich den Wikipedia-Artikel "t-Verteilung" angesehen habe (der in einem anderen Kontext weiter oben verlinkt ist), vermute ich, es handelt sich um das x-Intervall einer t-Verteilung mit der Breite y (oder "Freiheitsgrade"???, was auch immer das ist). Die Notation dort ist aber t(x;y) (mit Semikolon!), daher bin ich verwirrt.

Der - leider unsignierte - Einwand ist bezogen auf die Notation richtig. Erstens sollte eine Notation bei der ersten Verwendung erklärt werden. Zweitens sollte sie im Artikel einheitlich verwendet werden (t(x,y) versus t(x;y)). Drittens sollte sie möglichst mit der Notation im Artikel t-Verteilung übereinstimmen oder es sollte wenigstens die Entsprechung der abweichenden Notationen erklärt werden, wenn diese Einheitlichkeit nicht möglich ist. --Sigma^2 (Diskussion) 10:41, 24. Aug. 2021 (CEST)
Erster Punkt ist erledigt. Dritter Punkt ist im Sinne des zweiten Halbsatzes erledigt. Der zweite Punkt ist noch schlimmer, da im Artikel neben Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle t(x,y)} und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle t(x;y)} auch noch die dritte Notation Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle t_{x;y}} verwendet wird. Viele Köche ... --Sigma^2 (Diskussion) 11:25, 24. Aug. 2021 (CEST)