Diskussion:Standardfehler

aus Wikipedia, der freien Enzyklopädie

Mathematischer Fehler im Text?

Es muss doch ganz sicher ganz am Ende des Akritkels anstatt

Exponentialverteilung: , wobei

heißen:


die Varianz geht doch immer, immer, immer mit der Wurzel aus n runter, oder???

Du hast vollkommen recht; habe die Fehler korrigiert (hoffentlich dabei keinen Fehler gemacht) und die Formel in der Einleitung rausgestellt.--Wickie1681 10:29, 15. Feb. 2009 (CET)

Fehlen hier die Voraussetzungen?

Hallo, bin mir nicht ganz sicher, aber müsste beim Beispiel nicht die Voraussetzung stehen, dass die Grundgesamtheit normalverteilt sein muss? --82.83.135.228 09:53, 28. Dez. 2007 (CET)

Sollte nicht noch ein Satz dazu da stehen, ob/dass die Abschaetzung der Standardabweichung aus der Stichprobenvarianz alle Messwerte aus allen gewonnenen Datensaetzen darstellt? Denn gerade die Berechnung der Stichprobenvarianz ist elementar wichtig und bleibt hier etwas wenig erwaehnt.

-- Hi ich weiss nicht, wo ich eine Anmerkung hinschreiben kann, deshalb bearbeite ich das hier mal. Also die Lichtgeschwindigkeit ist keine Naturkonstante mit Fehler, sie ist EXAKT. Dies ist meiner Meinung nach wichtig und deshalb sollte sie uas dem Artikel mit einer anderen normalverteilten Naturkonstanten ersetzt werden. Danke

Im Artikel geht es nicht um die Naturkonstanten selbst, sondern um die Messung von Naturkonstanten – und Messwerte können in der Regel als normalverteilt angenommen werden. Man nimmt dabei an, dass der Mittelwert der Verteilung der Messwerte der tatsächliche Wert der zu messenden Größe ist. Der Kehrwert des Standardfehlers entspricht in diesem Fall der Messgenauigkeit.--Wickie1681 11:15, 23. Okt. 2008 (CEST)

Standardfehler und Stichprobenfehler

In der englischen Wikipedia wird zwischen

unerschieden. Ist also eine Unterscheidung zwischen Standardfehler und Stichprobenfehler sinnvoll? --Chrisqwq 12:00, 5. Nov. 2006 (CET)

Abgrenzung

Stichprobenfehler: Wenn man zufällig n Personen aus der Bevölkerung auswählt und deren Durchschnittsalter bestimmt, dann ist nicht sichergestellt, daß dieser Wert dem Durchschnittsalter der Bevölkerung insgesamt entspricht. Das »arithmetische Mittel« kann in dieser und anderen möglichen Stichproben vom wahren Durchschnittswert der Grundgesamtheit zufällig abweichen.

Die Abweichungen vom Grundgesamtheitsparameter durch Stichprobenziehung bezeichnet man als Stichprobenfehler (engl.: sampling error). Wenn man alle möglichen Zufallsstichproben vom Umfang n betrachtet und jeweils das arithmetische Mittel notiert, erhält man einen Überblick über die Verteilung des arithmetischen Mittels, die man auch graphisch darstellen kann. Diese Darstellung vermittelt einen Eindruck davon, wie sehr das arithmetische Mittel in Stichproben schwanken kann, wie groß also der Stichprobenfehler ist. Die Streuung der arithmetischen Mittel über die verschiedenen Stichproben mißt man mit dem Standardfehler.

Standardfehler: Der Standardfehler (engl.: standard error) ist ein Maß für die Streuung eines Stichprobenparameters über alle möglichen Zufallsstichproben vom Umfang n aus der Grundgesamtheit. Er ist ein Maß für die durchschnittliche Größe des Stichprobenfehlers des Stichprobenparameters (z.B. des arithmetischen Mittels oder des Anteilswertes). Der Standardfehler einer Stichprobenstatistik hängt von verschiedenen Faktoren ab, je nachdem, um welchen Parameter es sich handelt. Ganz allgemein kann man jedoch sagen:

  • Der Standardfehler wird um so kleiner, je größer der Stichprobenumfang ist. Größere Stichproben erlauben präzisere Schätzungen, weil der Stichprobenfehler kleiner wird.

gute Abbildungen

Gute Abbildungen gibt es hier: [1] Was ich mich frage: Wie hängt die Größe der Stichprobe mit dem Standardfehler und der Effektstärke zusammen? Wird die dort dargestellte [2] Normalverteilungskurve schmaler wenn N steigt? Und wenn ja, warum?

Schätzfehler und Standarfehler

Mir wird aus den Wikipedia-Artikeln nicht klar, wo der Unterschied zwischen Schätzfehler und Standardfehler liegt, bzw. ob es einen Zusammenhang gibt. Antwort bitte auf Diskussion:Schätzfehler Dank schon mal --source 09:35, 2. Apr. 2008 (CEST)

Standardabweichung des Mittelwerts

Ich habe die laut (jeweils aktuellen) GUM (Guide to the expression of uncertainty) und VIM (Vocabulaire international de métrologie) "richtige" Bezeichnung "Standardabweichung des Mittelwerts" hinzugefügt. Im GUM steht weiter, manchmal würde fälschlicherweise auch die Bezeichnung "Standardfehler" benutzt. Sollte man darauf hinweisen oder sind das nur Spitzfindigkeiten von Metrologen?

Evtl. könnte man auch ergänzen: "'Standardabweichung des Mittelwerts' (im Gegensatz zu der Standardabweichung einer Einzelmessung)". (nicht signierter Beitrag von 192.53.103.101 (Diskussion | Beiträge) 11:12, 29. Jul 2009 (CEST))

Mir persönlich gefällt Standardabweichung des Mittelwerts (oder genauer: des arithmetischen Mittels) auch besser, weil Fehler eigentlich eine verkehrte Bezeichnung ist. Die Varianz bezeichnet ja keinen Fehler, sonder die Schwankung einer Zufallsvariablen. -- Philipendula 13:50, 29. Jul. 2009 (CEST)

Meiner Ansicht nach ist der Begriff Standardfehler viel zu eng gefasst. Wie oben bereits gesagt, ist der Standardfehler die Standardabweichung einer Schätz- oder Stichprobenfunktion. Für ist es natürlich , aber z.B. in SPSS wird bei der linearen Regression auch für die Regressionkoeffizienten ein Standardfehler ausgegeben, der natürlich ist. -- Sigbert 08:59, 11. Okt. 2009 (CEST)

Beipiele (Binomialverteilung), Korrekturen der Formel

Hier gab es offenbar schon seit längerem ein Missverständnis: man muss die Parameter der Binomialverteilung, z.B. N und p, und Stichprobenlänge n unterscheiden. In den bisherigen Korrekturen der Formel wurde manchmal von N=1 ausgegangen oder aber von N=n. Tatsächlich sind es aber verschiedene Parameter, oder? Der Wert N=1 wäre auch nachvollziehbar, dann hätte man aber eine Bernoulli-Verteilung, aus der man n-mal zieht. -- KurtSchwitters 14:03, 24. Nov. 2009 (CET)

Eiscreme-Beispiel - Fehlerbalken

Müßte man für die Berechnung des Konfidenzintervalls nicht die T-Verteilung zu Grunde legen? Der Faktor von 1,96 für ein beidseitiges 95%-Konfidenzintervall gilt ja strengenommen nur bei unendlich großer Stichprobengröße bzw. näherungsweise ab etwa 1000 Werten - und das ist hier bei weitem nicht gegeben. --Jogy sprich mit mir 17:13, 22. Feb. 2010 (CET)

Wie kommt man aus die Aussage "näherungsweise ab etwa 1000 Werten"? -- Da hätte ich aber gerne mal eine Quelle zu. -- Ich finde immer nur so etwas wie "ab ca. 35 Werten kann man die t-Verteilung approximativ mit der Normalverteilung ersetzen" ...
Norman Markgraf (Diskussion) 19:15, 14. Jun. 2020 (CEST)

Berechnung des Standardfehlers bei verschiedenen Standardabweichungen

Hey! im Abschnitt "Standardfehler des arithmetischen Mittels" sollte evtl. darauf hingewiesen werden, wie man den Standardfehler berechnet, wenn die Varianzen der einzelnen Messungen von einander abweichen. Denn bei n Stichproben von jeweils m Werten, werden die Varianzen der n Mittelwerte oft voneinander abweichen. So ist die so oft zitierte Formel , mit µ als den Mittelwert der Grundgesamtheit, nicht ohne weiteres anwendbar. Ich schlage daher vor: In der Herleitung darauf hinzuweisen, dass die einzelnen Varianzen der Stichproben als gleich angenommen werden und für abweichende Varianzen gilt:

(nicht signierter Beitrag von Xeltok (Diskussion | Beiträge) 11:18, 6. Jul 2010 (CEST))
Ich habe es ergänzt. Danke --Sigbert 08:14, 8. Jul. 2010 (CEST)

Unterschied(e) zu englischer Version

In der Deutschen Version dieses Artikels Standardfehler steht "Im Allgemeinen gilt: Für eine Halbierung des Standardfehlers ist eine Verdopplung des Stichprobenumfangs nötig." In der englischen Version des Artikels en:Standard_error_(statistics) steht "Decreasing the uncertainty in a mean value estimate by a factor of two requires acquiring four times as many observations in the sample." Ich bin kein Expoerte, kann das jemand erklären oder korrigieren? Riemenschneider 17:53, 20. Jun. 2011 (CEST)

"durchschnittliche Abweichung des geschätzten Parameterwertes "

"Der Standardfehler ist daher die durchschnittliche Abweichung des geschätzten Parameterwertes vom wahren Parameterwert."

Wenn man damit die durchschnittliche Differenz eines Wertes vom Mittelwert meint, stimmt das m.E. nicht. Die Werte -2,0,2 weichen im Schnitt um (|-2-0|+|0-0|+|2-0|)/3 = 4/3 = 1,333 vom Mittelwert 0 ab. Der Standardfehler beträgt nach der angegebenen Formel aber Sqrt(((-2-0)²+(0-0)²+(2-0)²)/3) = Sqrt(8/3) = 1.633. equa 21:10, 7. Aug. 2011 (CEST)

Standardabweichung des Absolutglieds der linearen Einfachregression

Es gab einen kleinen Editwar bei Standardfehler#Standardfehler_der_Regressionskoeffizienten. Richtig ist

oder

.

Bin mal auch so frei, bei linearer Einfachregression B0 und B1 in a und b umzutaufen. Die vorher verwendete Bezeichnungsweise bietet sich vor allem bei multipler Regression an, die hier aber vermieden wird. --Philipendula (Diskussion) 16:23, 8. Jul. 2012 (CEST)

Das + gehört nicht in die Formel. Zusätzlich zum Nachschlagen oder Herleiten der Formel kann man auch folgende Überlegung anstellen: Die Schätzwerte bei der Regression werden um so genauer, je mehr Meßwerte vorliegen (bei gleichem und etwa gleichen -Werten). Bei einer Verdopplung der Meßwerte verdoppeln sich sowohl also auch , der Quotient bleibt also etwa gleich. In der oberen, korrekten Formel wird wegen der Multiplikation mit die Standardabweichung kleiner. In der Formel
(so stand sie im Artikel) konvergiert mit wachsendem gegen einen Wert größer als 0, was den Formeln der Regression widerspricht (s. arithmetisches Mittel). .gs8 (Diskussion) 11:13, 9. Jul. 2012 (CEST)
Die von Dir angegebene Formel hat einen Fehler, weil im Zähler statt steht. Das ist speziell eine Umformung für Mediziner u.ä., die besser als verstehen. Es stimmt tatsächlich, ich habs nachgerechnet. Gruß --Philipendula (Diskussion) 11:46, 9. Jul. 2012 (CEST)
Ich hab die Formel aus der letzten Bearbeitung von Dakawo hierhin kopiert. Daß die Änderung in Deiner Formel oben eine beabsichtigte Korrektur ist, war mir nicht aufgefallen. Nach eigener Umformung komme ich auch zu dem Ergebnis, daß beide Formeln von Dir korrekt sind. Wegen des fehlenden Summenzeichens stimmt meine obige Überlegung auch wieder. Trotzdem ist die zweite Formel für mich gewöhnungsbedürftig. Gruß .gs8 (Diskussion) 12:28, 9. Jul. 2012 (CEST)
Ja, für mich auch. --Philipendula (Diskussion) 13:54, 9. Jul. 2012 (CEST)

Standardfehler -> Binomial / Anteilswerte

Zu

bzw

Ich glaube dennoch, die Formel ist falsch (Korrektur muss noch gesichtet werden). Das Statistikbuch (einzige zur Hand), Bortz, 1999, ist im Einklang mit Seiten aus dem Internet, die klar machen, dass das groß-N da nichts verloren hat, sondern bei Antweilswerten (komischerweise in anderssprachigen Wikis nicht aufgeführt) lautet:

(deswegen BREXIT fehlprognostiziert!?!? *scherzamrande*) 84.147.233.98 20:55, 3. Dez. 2016 (CET)

Das war wohl schon so gedacht: Es wird eine Stichprobe vom Umfang n aus binomialverteilten Zufallsvariablen mit Parameter N und p gezogen. Ist vielleicht ein etwas ungewöhnliches Szenario, aber warum nicht? -- HilberTraum (d, m) 16:12, 4. Dez. 2016 (CET)

Quadratwurzel ist immer positiv

Gleich im ersten Absatz gibt es einen Verständnisfehler, was Quadratwurzeln betrifft. Es ist zwar so, dass eine quadratische Gleichung wie zwei Lösungen fü x aufweist, nämlich 2 und –2. Aber:

Das Ergebnis einer Quadratwurzel ist immer positiv.

Genauer gesagt, ist das Ergebnis einer Quadratwurzel ein Betrag – und Beträge sind immer positiv, auch dann, wenn das, was zwischen den Betragsstrichen steht, ein negativer Wert ist. Vgl. dazu den Wikipedia-Artikel Quadratwurzel oder auch beispielsweise das folgende PDF-Dokument:

Eindeutigkeit der Wurzel ↔ 2 Lösungen bei quadratischen Gleichungen.

(Ein Blick in jede beliebige Formelsammlung tuts auch.) Korrekt wird die oben angegebene quadratische Gleichung also so gelöst:

(1) |Wurzel ziehen

(2) |Betrag auflösen

(3)

(4)

Viele Grüße

--Jake2042 (Diskussion) 03:17, 28. Sep. 2019 (CEST)

Wenn das der einzige Fehler dieses Grotten schlechten Beitrags wäre, könnte man darüber hinweg sehen. -- Aber das permanente Springen zwischen Zufallsvariabeln und Statistischen Variablen (aka Merkmale) und deren Werte (aka Merkmalsausprägungen) lässt einen an jeder Ecke schaudern. Hier gehört definitiv mal ein "Bitte dringend überarbeiten"- Schild an den Beitrag!
Norman Markgraf (Diskussion) 19:31, 14. Jun. 2020 (CEST)
Norman Markgraf: Welches springen von ZVen und Merkmalsausprägungen meinst du genau? Habe beim groben überfliegen nichts entdecken können. Zudem wird aus Gründen der Vereinfachung zwischen ZVen und Merkmalsausprägungen oft in der Notation nicht unterschieden (auch in der Fachliteratur). Ist daher nicht unbedingt ein Makel. Wenn aber schon unterschieden wird in der Notation, dann sollte die Unterscheidung natürlich durchgehend verwendet werden.--Jonski (Diskussion) 19:37, 14. Jun. 2020 (CEST)
Mal ein Beispiel. Im Text steht:
Für die Schätzfunktionen
und
ergibt sich dann
und .
Die Standardfehler der Regressionskoeffizienten ergeben sich zu
und
.
Was ist nun , die Zufallsvariable oder vielleicht doch deren Realisation , welche ich aus der Beobachtung/ Messung habe? -- Okay, macht keinen Unterschied, wenn ich die Regressionkoeffizenten kenne und auch das Residuum. -- Aber ... die kenne ich doch gar nicht...
Analog die Frage nach dem oder ist es doch eher als Mittelwert der Realisationen ?
Wie die Standardfehler nun genau sind, möge man mal mit den Kollegen von https://de.wikipedia.org/wiki/Standardfehler_des_Regressionskoeffizienten diskutieren. Die beiden Fassungen sind nämlich nicht äquivalent.
Norman Markgraf (Diskussion) 20:40, 14. Jun. 2020 (CEST)
Ich habe den von dir verlinkten Artikel geschrieben und auch die hiesige Formel eingefügt. und sind ZVen deswegen sind sie groß notiert. Konkret zu deiner Frage: ist die Zufallsvariable und ist kein Mittelwert von Realisierungen sondern von Zven. Wenn ich es richtig verstanden habe, dann verstehst du nicht genau wie man auf die rechte Seite der Gleichung kommt bei den jeweiligen Parameterschätzern?--Jonski (Diskussion) 20:54, 14. Jun. 2020 (CEST)
Dass wie von dir behauptet im Abschnitt #Standardfehler der Regressionskoeffizienten im einfachen Regressionsmodell angeblich rumgesprungen wird zwischen Zufallsvariabeln und statistischen Variablen entspricht schlicht nicht der Wahrheit.--Jonski (Diskussion) 21:33, 14. Jun. 2020 (CEST)

Standardfehler des arithmetischen Mittels

Hallo. Entschuldigt, falsch ich was falsch verstanden habe, aber der Standardfehler des Mittelwertes bezieht sich immer auf eine Stichprobe, nicht die Grundgesamtheit oder? Also müsste man dann nicht s statt sigma schreiben? (nicht signierter Beitrag von 195.37.187.155 (Diskussion) 17:16, 14. Okt. 2020 (CEST))