Diskussion:Irrtumswahrscheinlichkeit

aus Wikipedia, der freien Enzyklopädie

Also in meinem Bortz (Statistik für Human- und Sozialwissenschaftler, 2005) ist die Irrtumswahrscheinlichkeit nur der Fehler 1. Art?


1. oder 2. Art oder beide?

Ich hab schon mal einen Artikel Fehler 1. und 2. Art geschrieben, der genau dieses Problem behandelt. Was dagegen, wenn ich diesen Artikel da mit rein mische und einen redirect drauf setze? -- Ben-Zin 15:45, 15. Okt 2002 (CEST)

irgendwie sollte man noch was über "screening von gesunden personen", oder "Interpretaion von medizin. Testergebnis" schreiben... vielleicht mischen, vielleicht untereinander verlinken. Mein Artikel hängt bis jetzt IMHO in der Luft -- nerd

Nach gründlichem Nachdenken (selten, kommt aber vor!) bin ich zu dem Schluss gekommen, der Hauptteil Deines Artikels ist eigentlich der Anfang für einen Beitrag zur Irrtumswahrscheinlichkeit. Darum habe ich ihn mal hierher verschoben. -- Ben-Zin 18:09, 15. Okt 2002 (CEST)


Schön ist worden!

Ich würde das ganze Beispiel (alternativ?) ganz ohne Wahrscheinlichkeit formieren wollen, aber wo soll ich das einbauen?:

  • "Von 100 000 sind 100 an eine seltenen Kankheit erkrankt (sog Grundanteil) Bei einem fällt ein spez.med. Test positiv aus, von den restlichen 99 900 fällt der Test dennoch fällt der Test bei 999 trotzdem positiv aus. Frage: Wieviele der Untersuchten mir positiven Ergebniss sind tatsächlich erkrankt?" nerd

"Irrtumswahrscheinlichkeit" ist ein feststehender Begriff, der heißt halt so. Da kommt man um die Wahrscheinlichkeit nicht so ganz herum. Aber das bunte Beispiel arbeitet ja mit absoluten Zahlen, insofern sollten es auch Nicht-Mathematiker verstehen. Aber verbesser den Artikel ruhig, dafür isses ja ein Wiki :) -- Ben-Zin 20:07, 15. Okt 2002 (CEST) ---

Eine Schwäche des Beispiels: "Von 100 000 sind 100 an eine seltenen Kankheit erkrankt (sog Grundanteil) " sind die Zahlenwerte, 100 von 100 ist IMHOk eine seltene Krankheit mehr.... hat jm richige Zahlen aus der Praxis. --nerd 13:30, 7. Mär 2003 (CET)


Ich habe gerade festgestellt, dass beide Weblinks nicht mehr existieren. Leider konnte ich nicht herausfinden, worauf die Links verweisen sollten, sonst hätte ich das gleich korrigiert. --WilliMuc 04:19, 14. Jul 2003 (CEST)

Mehr Zahlen?

Sollte man folgende Zahlen noch einbauen? Ich fände sie erhellend.

  • Wahrscheinlichkeit, dass der Test ein falsches Ergebnis liefert: 1% (1000/100.000)
  • Wahrscheinlichkeit, dass der Test ein falsches Ergebnis liefert, falls er an einem Kranken vorgenommen wird: 1% (1/100) (beta)
  • Wahrscheinlichkeit, dass der Test ein falsches Ergebnis liefert, falls er an einem Gesunden vorgenommen wird: 1% (999/99.900) (alpha)
  • Wahrscheinlichkeit, dass der Test ein falsches Ergebnis liefert, falls das Ergebnis positiv ist: 91% (999/1098)
  • Wahrscheinlichkeit, dass der Test ein falsches Ergebnis liefert, falls das Ergebnis negativ ist: 0,001% (1/98.902)

Damit wird klar, dass die hohe Irrtumswahrscheinlichkeit bei positiven Ergebnissen durch eine sehr geringe Irrtumswahrscheinlichkeit bei negativen Ergebnissen ausgeglichen wird. Aber wird dadurch die Zahlenflut zu groß? --Hob 16:46, 10. Jan 2006 (CET)

Noch was: "Bei der Berechnung mit alpha und beta handelt es sich um bedingte Wahrscheinlichkeiten!" Alpha und beta kommen vor diesem Satz nicht vor... --Hob 16:55, 10. Jan 2006 (CET)

Und noch was: Die oben mit (beta) markierte Wahrscheinlichkeit muss nicht unbedingt, wie in diesem Beispiel, gleich der Irrtumswahrscheinlichkeit (alpha) sein. Ist es geschickt, hier so zu tun, als wäre es so? --Hob 17:05, 10. Jan 2006 (CET)

Zusatzinformation

IMHO ist es wesentlich wichtiger zu wissen, mit welcher Wahrscheinlichkeit das untersuchte Ergebnis auftritt, als wie der Test ausgeht... --~ğħŵ 16:06, 29. Aug 2006 (CEST)

Welches untersuchte Ergebnis? Ich verstehe nicht ganz. Wie wär's, du sagst, auf welche der Zahlen 1, 99, 999 und 98901 sich das bezieht? --Hob 17:32, 29. Aug 2006 (CEST)
Ich bezog mich auf den Satz Das liegt daran, dass man nach dem Test zusätzlich die Information hat, wie der Test ausgegangen ist, und die Wahrscheinlichkeit der Richtigkeit je nach Ausgang des Tests verschieden ist. Der Knackpunkt ist jedoch, dass man ohne Kenntnis der Prävalenz keine brauchbare Aussage treffen kann. Die Prävalenz (oder A-priori Wahrscheinlichkeit) ist aber schon vor dem Test bekannt. --~ğħŵ 20:50, 29. Aug 2006 (CEST)
Ah, verstehe. OK... was ich meinte, war: vor dem Test weiß ich, dass der Test mit 99% richtig sein wird, und hinterher habe ich mehr Information und weiß entweder, dass er mit 9%, oder dass er mit 99,999% richtig ist. Du kannst den Satz natürlich gern abändern, wie du magst. Ich hänge nicht sehr an ihm. --Hob 21:15, 29. Aug 2006 (CEST)

Darstellungsfrage

Bei meiner Bildschirmdarstellung verrutscht die letzte Klammer des Ausdruckes "Person krank" "Befund positiv" (wiki-Quellcode: <math>P\,(</math> "Person krank" <math>\,|\,</math> "Befund positiv" <math>\,)</math> ) einzeln und alleine in die nächste Zeile. Und das sieht ziemlich uncool aus. Spricht etwas dagegen, die Wahrscheinlichkeiten einfach als P( „Person krank“ | „Befund positiv“ ) (mit geschützten Leerzeichen) zu schreiben? Oder trete ich da jemandem auf dem Fuß? Gruß, Kein Einstein 15:08, 5. Jun. 2010 (CEST)

Übernahme der Artikelinhalte in eine neue Version von "Beurteilung eines Klassifikators"

Hallo, ich habe auf meiner Benutzerseite eine neue Version des Artikels "Beurteilung eines Klassifikators erstellt, die die vielen Redundanzen unter anderem auch dieses Artikels (siehe Portal:Mathematik/Qualitätssicherung#Mutter_aller_Redundanzen:_Fehlerklassifikation) auflösen und darüber hinaus die verschiedenen Maße sowie ihr Bezug zur statistischen Testtheorie (bzw. auch die Abgrenzung dazu) besser darstellen soll. Über Feedback zu der neuen Version wäre ich dankbar, wenn keine größeren Bedenken geäußert werden, werde ich in den nächsten Tagen die neue Version schrittweise einstellen und diesen und die anderen Artikel in Weiterleitungen umgewandeln. Gruss --Darian 23:01, 22. Okt. 2010 (CEST)

Gefundener p-Wert ungleich Irrtumswahrscheinlichkeit

Ich weiß nicht, welcher User diesen Diskussionsbeitrag verfasst hat: "Also in meinem Bortz (Statistik für Human- und Sozialwissenschaftler, 2005) ist die Irrtumswahrscheinlichkeit nur der Fehler 1. Art?" Ich möchte diesen allerdings gerne aufgreifen, da ich denke, dass es elementar ist (deswegen auch der neue Abschnitt).

Mir ist das eben auch aufgefallen. Die Aussage, dass der gefundene p-Wert der Irrtumswahrscheinlichkeit entspricht, ist schlicht und ergreifend falsch. Da die Irrtumswahrscheinlichkeit die Wahrscheinlichkeit für einen Fehler der 1. Art angibt (wird vorher festgelegt) und der gefundene p-Wert die Wahrscheinlichkeit angibt, also auch wie glaubhaft es ist, dass die vorliegenden Daten auftreten, wenn die Nullhypothese stimmt (wird ermittelt und dann mit Alpha verglichen).

Das eine ist also eine Eigenschaft des Testes (Irrtumswahrscheinlichkeit) und das andere ein Produkt der Daten (vgl. Sedlmeier & Renkewitz (2008), Forschungsmethoden und Statistik in der Psychologie. München: PEARSON STUDIUM (S. 398)).

M.E. sollte dieser Teil der Begriffserklärung entfernt werden - oder ein "nicht" davor wäre sogar besser, damit man dem weit verbreiteten Irrtum etwas Einhalt gebietet. --SetsunaMeiou 14:07, 4. Feb. 2012 (CET)


SetsunaMeiou schreibt: "Die Aussage, dass der gefundene p-Wert der Irrtumswahrscheinlichkeit entspricht, ist schlicht und ergreifend falsch." Das ist nach meiner Meinung nicht ohne Weiteres der Fall. – Der User schreibt weiter: "Da die Irrtumswahrscheinlichkeit die Wahrscheinlichkeit für einen Fehler der 1. Art angibt (wird vorher festgelegt)..." Vorher festgelegt wird das Signifikanzniveau, welches die Irrtumswahrscheinlichkeit nach oben beschränken soll. Die Diskussion um die Begriffe Irrtumswahrscheinlichkeit, Signifikanzniveau, Signifikanz nimmt kein Ende, was auch daran liegen mag, dass verschiedene Werke und verschiedene Statistiksoftware diese Begriffe uneinheitlich verwenden und definieren. Ich argumentiere mal wie folgt:
Im Artikel steht unten der Satz "Die Irrtumswahrscheinlichkeit entspricht nicht dem berechneten -Wert bei der Durchführung eines Tests." Das ist aber nach meiner Auffassung nicht ohne weiteres richtig. Im vorliegenden Artikel wird die Irrtumswahrscheinlichkeit mit dem Signifikanzniveau gleichgesetzt. (Siehe hierzu die lange Diskussion auf der Diskussionsseite zum Thema Signifikanz.) Gehen wir aus von der Definition im ersten Satz: "Irrtumswahrscheinlichkeit ist ein Begriff aus der Statistik für die Wahrscheinlichkeit für den Fehler 1. Art bei einem Test."
Was ist das Signifikanzniveau? Was ist die Irrtumswahrscheinlichkeit (genauer: Irrtumswahrscheinlichkeit für den Fehler erster Art)? Wir stellen uns ein Testverfahren mit Testgröße vor, deren Wertebereich in R in einen Beibehaltungsbereich und einen Ablehnungsbereich zerlegt wird. Der Einfachheit halber nehmen wir eine einseitige Fragestellung an, sodass und durch einen einzigen kritischen Wert der Testgröße getrennt werden. Nehmen wir der Einfachheit halber außerdem an, dass der "links", der "rechts" liegt, dass also große Werte der gegen H0 sprechen. Die Wahrscheinlichkeit für den Fehler erster Art (bei diesem Test!), also die Irrtumswahrscheinlichkeit, ist dann die bedingte Wahrscheinlichkeit . Sie hängt offenbar von ab und kann durch Rechtsverschiebung (Linksverschiebung) von verkleinert (vergrößert) werden. Sie hängt also vom konstruierten Test ab. Ein klassischer Signifikanztest auf dem Signifikanzniveau ist so gestaltet, dass bzw. . Damit erweist sich der kritische Wert in diesem Fall als das übliche 95%-Quantil der Verteilung der unter H0, und die Irrtumswahrscheinlichkeit ist das Signifikanzniveau.
Betrachten wir jetzt das Statistikprogramm SPSS. Es weist uns bei der Durchführung obigen Tests den kritischen Wert der gar nicht aus, sondern den empirischen Wert der Testgröße, welcher aus den Daten berechnet wird, sowie den -Wert (auch Signifikanz (Sig.) oder Überschreitungswahrscheinlichkeit genannt). Wie wird dieser berechnet? Man stelle sich obigen Test vor, wobei man jetzt den Wert als kritischen Wert einsetzt. Man berechnet also die Wahrscheinlichkeit , womit in diesem Fall die Signifikanz (der -Wert) für diesen gedanklichen Test berechnet wurde. Man misst also erst , dann konstruiert man daraus im Nachhinein einen und berechnet, wie wahrscheinlich es im Vorhinein gewesen wäre, einen mindestens so extremen Wert der zu messen, wie es einer ist, sofern H0 gegolten hat. Die Irrtumswahrscheinlichkeit (für den Fehler erster Art) ist hier also die Signifikanz (der -Wert) für diesen gedanklichen Test. Es ist daher nicht falsch, in diesem Falle zu sagen: Der -Wert ist die Irrtumswahrscheinlichkeit, welche – wenn unterhalb des Signifikanzniveaus – zur Ablehnung der Nullhypothese führt.
Hier ergibt sich also eine gewisse Mehrdeutigkeit des Begriffes Irrtumswahrscheinlichkeit. Sie entsteht daraus, dass die verschiedenen Sprecher verschiedene Tests im Auge haben. Man sollte vielleicht so sagen:
  • Die Irrtumswahrscheinlichkeit für einen Test mit Testgröße , Beibehaltungsbereich und Ablehnungsbereich ist die bedingte Wahrscheinlichkeit . Sie wird üblicherweise bei Testverfahren durch gewisse konventionelle Werte nach oben beschränkt, das so genannte Signifikanzniveau .
  • Klassische Tests werden so konstruiert, dass ihre Irrtumswahrscheinlichkeit gleich dem Signifikanzniveau ist.
  • Der von Statistiksoftware ausgegeben -Wert ist die Irrtumswahrscheinlichkeit für einen Test, welcher fragt, wie wahrscheinlich es bei Gültigkeit der Nullhypothese war, einen mindestens so extremen Wert der zu erhalten, wie man ihn tatsächlich erhalten hat. Sie berechnen also die Irrtumswahrscheinlichkeit eines Tests, der erst nach Durchführung der Messung gedanklich konstruiert wird.
Wer äußert sich einmal hierzu? Viele Grüße, --Chth (Diskussion) 17:47, 17. Mai 2019 (CEST)
Bislang hat sich niemand geäußert. Ich schage vor, den letzten Satz des Artikels "Die Irrtumswahrscheinlichkeit entspricht nicht dem berechneten p-Wert bei der Durchführung eines Tests." durch den folgenden zu ersetzen: "Der p-Wert bei statistischen Softwarepaketen entspricht der Irrtumswahrscheinlichkeit eines Tests, bei dem für den kritische Wert der Testgröße der tatsächlich beobachtete Wert der Testgröße eingesetzt wird." Wenn sich hier wieder keiner äußert, dann mach ich das in einigen Tagen. --Chth (Diskussion) 08:15, 24. Nov. 2019 (CET)