Diskussion:Lineare Einfachregression

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 22. Juli 2019 um 18:07 Uhr durch imported>JonskiC(1734805) (JonskiC verschob die Seite Diskussion:Einfache lineare Regression nach Diskussion:Lineare Einfachregression: +kommt in der Literatur häufiger vor).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Störgrößenvarianz

@Rainald62: Ja Störgrößenvarianz hat in der Tat wenig Treffer, das liegt aber daran, dass oft stattdessen der Begriff "Varianz der Störgrößen" benutzt wird. Kann man meinetwegen dahingehend ändern. Den Begriff "Störgrößen" habe ich gewählt, da es so konsistent mit dem Artikel Störgröße und Residuum ist. Diese Varianz wird auch Fehlervarianz, auch Restvarianz, Versuchsfehler, Störgrößenvarianz, Varianz der Störgrößen, nicht erklärte Varianz, oder unerklärte Varianz genannt; wobei Fehlervarianz nicht ganz geeignet ist, da "Fehler" nicht eindeutig ist (allerdings ist das die akkurate Übersetzung von "error variance" und häufigste Bezeichnung [1]). Residualvarianz ist ebenso nicht ganz geeignet, da öfters auch die erwartungstreue Schätzung so genannt wird und "Restvarianz" kommt sehr selten vor. Streubreite ist mE einfach Synonym zu Standardabweichung und daher vollkommen ungeeignet, da so nicht zum Ausdruck gebracht worauf sich sie bezieht und auch falsch, da es sich hier um die Varianz handelt.--Jonski (Diskussion) 23:23, 2. Apr. 2019 (CEST)

"Streubreite synonym zu Standardabweichung" – ja, aus genau diesem Grund ist dieses Wort geeignet. Du hast recht, dass "nicht zum Ausdruck gebracht [wird] worauf sich sie bezieht", aber das lässt sich heilen: "Streubreite um die Gerade" oder auch "Streubreite um die Gerade (Standardabweichung der Residuen)."
"da es sich hier um die Varianz handelt", ist kein valides Argument, denn die Wurzel von "es" ist an_schau_licher. Bitte an die Leser denken.--Rainald62 (Diskussion) 00:25, 3. Apr. 2019 (CEST)
Ja du hast bzgl. einiger Punkte im Artikel Recht, die kann man allgemeinverständlicher formulieren (fällt mir manchmal schwer). Aber ich denke wir sollten hier schon die Begriffe verwenden, die in der Literatur am häufigsten anzutreffen sind und das sind nun mal die Begriffe "Varianz der Störgrößen", "Fehlervarianz" oder "Varianz der Fehlerterme". Alles andere würde WP:KTF widersprechen.--Jonski (Diskussion) 00:29, 3. Apr. 2019 (CEST)
TF? Au weia! "Standardabweichung der Residuen" hat über 1000 Buchtreffer im Vgl. zu weniger als 100 für deine "Varianz der Störgrößen". "Varianz" ist ungeeignet für die Einleitung eines Artikels mit vielen Lesern omA, darf aber gerne im Hauptteil vorkommen, schon weil damit die Formeln einfacher aussehen.
"Fehler" ist dagegen keine Geschmacksfrage, sondern inhaltlich falsch (und nicht normgerecht seit 1983).
"Störgröße" ist ebenfalls oft unzutreffend, denn Quantenrauschen ist keine Größe im physikalischen Sinn: Wenn Du einen Strom von 50 Photoelektronen pro Sekunde misst, blockweise im Sekundentakt, und keine Störgrößen im Spiel sind, dann wirst Du eine Standardabweichung von 10/s erhalten. --Rainald62 (Diskussion) 01:02, 3. Apr. 2019 (CEST)
Bezüglich Quantenrauschen kenne ich mich nicht aus. Ich kenne mich aber mit der statistischen Terminologie aus und dort wird am häufigsten Störgröße oder Fehlerterm verwendet. Standardabweichung der Residuen ist aber nicht zutreffend. Damit ist häufig der Standardfehler der Regression, oder die verzerrte Variante gemeint. Nebenbei: Wo kann genau nachlesen, dass Fehler seit 1983 nicht mehr normgerecht ist?--Jonski (Diskussion) 01:07, 3. Apr. 2019 (CEST)
Vergleiche die Ausgaben der DIN 1319-3 von Januar 1972 und August 1983. --Rainald62 (Diskussion) 20:57, 4. Apr. 2019 (CEST)
Als Standardfehler der Residuen bezeichnet man i.A. diese Größe hier .--Jonski (Diskussion) 01:18, 3. Apr. 2019 (CEST)
Damit daraus ein Argument wird, müsstest Du begründen, was diese Größe ungeeignet für die Einleitung des Artikels macht. Der Grund sollte überzeugender sein als der Faktor ~20 zwischen den oben angeführten Trefferzahlen. --Rainald62 (Diskussion) 20:57, 4. Apr. 2019 (CEST)

Regressionsdiagnostik

Wieso wird die Regressionsdiagnostik hier im Artikel so breit dargelegt? Dies ist ja nicht nur ein Fall der Einfachregression. Ich schlage vor ein neues Lemma Regressionsdiagnostik anzulegen und den Abschnitt auszulagern.--Jonski (Diskussion) 19:42, 22. Mai 2019 (CEST)