Diskussion:Grundgesamtheit

aus Wikipedia, der freien Enzyklopädie

Repräsentativität

ich habe ein kleines Problem mit diesem Artikel: ständig wird von repräsentativen Stichproben gesprochen. Eine Stichprobe im eigentlichen Sinne ist aber niemals repräsentativ, weil sie zufällig ausgeführt wird. repräsentative Teilmengen werden über Quota-Verfahren gezogen, haben dann jedoch nichts mit einer Stichprobe (die in der Marktforschung einer Zufallsauswahl entspricht) zu tun. dies sollte überarbeitet werden, oder liege ich falsch? (nicht signierter Beitrag von 145.243.194.141 (Diskussion) 11:42, 12. Dez. 2007 (CET))

Nein, vollkommen korrekt. Ich habe mal die statistische Def. von Grundgesamtheit hinzugefügt. Nach meinem Geschmack taucht der Begriff Stichprobe zu oft in diesem Artikel auf, dazu gibt es einen separaten Eintrag in der Wikipedia. --Sigbert 16:41, 28. Mär. 2009 (CET)
Dankeschön. Diese Anmerkung hat mir etwas weitergeholfen. Allerdings finde ich das Beispiel mit der Wahlforschung verwirrend, da es von Stichproben spricht, die Verteilungen gewisser Merkmale in der Population widerspiegeln sollen: eine rein zufällig gezogene Stichprobe sollte theoretisch mit zunehmender Größe alle "Besonderheiten" der Population aufweisen (und damit repräsentativ sein?), hier scheint aber gemeint zu sein, dass die Stichprobe absichtlich nach gewissen Quoten gezogen wird (das angesprochene Quota-Verfahren) damit relevante Merkmale gleichsam in der Stichprobe wie auch in der Gesamtpopulation vertreten sind. Für mich wirft das folgende Frage auf: woher soll klar sein, welche Merkmale relevant sind bei einer Wahlumfrage? Das Beispiel spricht von "Alter, Geschlecht, Wohnsitz usw."; aber wieso soll die Augenfarbe nicht relevanter sein als das Geschlecht? Und woher stammt das Wissen über die Verteilung der relevanten Merkmale in der Population? (nicht signierter Beitrag von 131.173.35.93 (Diskussion) 12:02, 24. Mär. 2011 (CET))

erfassen vs. erheben

Ich lese mich gerade in das Thema ein und vermute, dass hier mit diesen Begriffen nicht differenziert genug umgegangen wird. So wie ich den Artikel zu "Datenerfassung" verstehe, müsste hier in den meisten Fällen im Zusammenhang der Stichproben korrekterweise von erfassten Daten (nicht erhobenen) die Rede sein. Oder irre ich mich?

Ich beziehe mich auf diesen Satz: "Die durch Befragung der Stichprobe erhobenen Daten werden mit Hilfe statistischer Verfahren auf die Grundgesamtheit hochgerechnet und ergeben so eine Wahlprognose."

-- Dr.Jayful 11:54, 12. Aug. 2011 (CEST)

Der zitierte Satz stimmt schon. Das Problem ist eher, dass der Satz eigentlich nichts im Artikel zur Grundgesamtheit zu suchen hat, denn es wird die Datenerhebung mittels Stichprobe beschrieben. Das ist aber eben gereade NICHT die Datenerfassung einer Grundgesamt, sondern eben aus einer Stichprobe! --Max schwalbe (Diskussion) 14:55, 30. Nov. 2017 (CET)

Einleitungssatz ??

Üblicherweise beginnen die WP-Artikel mit einem Einleitungssatz. Kann den mal jemand einpflegen? Ich fühle mich mit dem Thema überfordert. --JuTe CLZ (Diskussion) 23:12, 6. Mai 2012 (CEST)

Das habe auch ich mir gedacht und mich einmal daran versucht, den Artikel as is entsprechend umzustrukturieren. Was mir zumindest augenscheinlich auch recht elegant gelungen zu sein scheint, schließlich brauchte ich nicht einen einzigen Satz beisteuern. Da es sich hier aber definitiv nicht um meine Spezialität handelt, wäre letzteres auch kaum empfehlenswert. Aufgefallen ist allerdings selbst mir, dass sich der gesamte Inhalt zumindest grob auf (Grundgesamtheit qua) Statistik bezieht. Mehr noch, dass im Grunde der erste Absatz ohnehin ein Abriss all dessen, was folgt, ist. Sprich, es scheint hier eh nicht so sehr um Grundgesamtheiten zu gehen, sondern tatsächlich um die Grundgesamtheit. Nur eben in unterschiedlichen Kontexten, bzw. eigentlich ja sogar bloß in absteigendem Abstraktionsgrad?! Egal: Sollte das Ergebnis nicht genehm sein, bitte entsprechend abändern. Einen Einleitungssatz wollen wir aber haben.. und sei's nur der Kosmetik zuliebe. --Zero Thrust (Diskussion) 12:10, 31. Aug. 2012 (CEST)
Habs nur minimal - sprachlich - verbessert.2A02:8108:9640:AC3:E421:976C:4F36:ED05 07:31, 17. Mai 2021 (CEST)

Artikel überarbeiten

Wie schon aus den obigen Beiträgen hervorgeht, ist der Artikel zwar nicht falsch, aber sehr irreleitend geschrieben. In weiten Teilen wird gar nicht die statistische Datenerfassung aus einer Grundgesamtheit, sondern die empirische Datenerhebung aus einer Stichprobe beschrieben; DIE dann im Rahmen der Wahrscheinlichkeitsrechnung Rückschlüsse auf eine angenommene Grundgesamtheit erlaubt. Ich werde den Artikel mal umarbeiten. --Max schwalbe (Diskussion) 15:08, 30. Nov. 2017 (CET)

Anregungen für Beispiele und Einordnung

Meine Anmerkungen/Beobachtungen/Unklarheiten zu diesem Artikel/Begriff:

  • Zum Zusammenhang zwischen stetigen/diskreten Zufallsvariablen und endlichen/unendlichen Grundgesamtheiten: Wenn ich 10000 Glühbirnen eingekauft habe und deren erwartete Lebensdauer mittels einer Stichprobe schätzen möchte, kann ich die Lebensdauer von Glühbirnen durch eine stetige Zufallsvariable modellieren. Wenn ich ein auf dem Zentralen Grenzwertsatz beruhendes Verfahren anwende, brauche ich nicht einmal eine konkrete Verteilung anzunehmen. Obwohl hier in beiden Fällen nicht notwendigerweise von einer diskreten Verteilung ausgegangen wird, würde die "Grundgesamtheit" hier wohl die 10000 gekauften Glühbirnen bezeichnen. Der Ausschnitt "unendlich, wie z. B. bei stetigen Zufallsvariablen" (aus dem Artikel) ist also nicht selbsterklärend. Ein Beispiel einer unendlichen Grundgesamtheit wäre sicherlich hilfreich. Was wären die Merkmalsträger? Was heisst es, aus ihnen eine "zufällige" Stichprobe zu ziehen? Was ist der Vorteil der Populationsterminologie gegenüber derjenigen von i.i.d.-Zufallsvariablen?
  • Zur Rolle des Begriffs in der Herleitung statistischer Verfahren: In Büchern und Skripten für MathematikerInnen (nicht für AnwenderInnnen, wie mich) scheint die Herleitung der gängigen statistischen Verfahren ganz ohne den Begriff der Bevölkerung auszukommen. Mir scheint, die Begriffe "Grundgesamtheit"/"Zufallsstichprobe" werden arg strapaziert, wenn man die Herleitung aller Verfahren auf ihnen aufbauen möchte. Um zu beurteilen, ob eine Münze fair ist, kann ich ermitteln, ob die durchschnittliche Anzahl "Kopf"-Resultate signifikant von 1/2 abweicht. Kann/sollte dies mit "Grundgesamtheiten", "Merkmalsträgern" und "Zufallsstichproben" motiviert werden? Wie würde eine solche Argumentation aussehen? Bei der Regressionsanalyse werden die Betas von einigen Autoren als Populationsparameter bezeichnet. Diese haben erst eine Bedeutung, wenn ich der Untersuchung von vornherein ein lineares Modell zugrunde lege. Wäre hier das lineare Modell als Population zu bezeichnen?
  • Zum Oberbegriff: Wenn die Grundgesamtheit als "Menge aller statistischen Einheiten" definiert wird, sollte klargestellt werden, ob es sich bei dieser Verwendung von "Menge" um den mathematischen Begriff einer Menge handelt. Wenn wirklich unendliche Mengen eingeschlossen sein sollen, sollte klargestellt werden, wie/ob aus einer solchen Menge ein Erwartungswert (und andere "Populationsparameter" wie die Regressions-Betas) hergeleitet werden können.

Vielleicht würden sich noch andere Leute über die fundierte Klärung dieser Unklarheiten freuen.

Ja, bestimmt. Dann versuch doch bitte selbst mal, dieses langatmigen Gerede in kurzes klares Deutsch umzuformulieren. Aber mathematische Kompetenz ist leider allzu selten mit sprachlicher Kompetenz gepaart.2A02:8108:9640:AC3:E421:976C:4F36:ED05 07:36, 17. Mai 2021 (CEST)