Diskussion:Scheinkorrelation

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 30. Juni 2022 um 13:56 Uhr durch imported>Anonym~dewiki(31560) (Ich geb's auf. Formatierung bitte selbst im Geiste ergänzen.).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Selbst reingefallen?

Im Abschnitt Beispiel steht: "Tatsächlich gibt es aber einen kausalen Zusammenhang zu einer dritten (konfundierenden) Variable: der Ländlichkeit der Region. Je ländlicher eine Region ist, desto höher ist die Zahl der Kindergeburten und desto größer ist die Zahl der Storchenpaare." Aha, und wo ist die Kausalität zwischen ländlicher Region und Anzahl der Geburten? Korrelation, Vorurteil oder lässt sich das belegen? --Berthold Werner (Diskussion) 10:13, 2. Dez. 2015 (CET)

unsinniges Lemma

Dieses Lemma ist unsinnig. Es gibt keine Scheinkorrelation. Eine Korrelation bedeutet nie, dass es auch einen Kausalzusammenhang gibt. --2.246.94.81 19:56, 27. Mai 2017 (CEST)

Da sind wir glaube ich nicht die Einzigen, die den Begriff „Scheinkorrelation“ seltsam finden. Allerdings ist dies m.E. kein Wikipedia-Fehler, sondern wird schon in Hochschullehrbüchern so verbreitet. Soweit ich mich erinnere, wird dort aber bereits darauf hingewiesen, dass es sich zwar um eine Korrelation, aber eben um keine Kausalität handelt. Da traut sich wohl kaum jemand aus dem Hochschulbereich diesen Begriff zu korrigieren. Den Begriff Scheinkorrelation gibts ja auch schon recht lange in der deutschen Sprache. Hat jemand eine Quellenangabe für eine bessere Wortwahl für diesen Begriff ? Als Kandidat sehe ich hier z.B. ohnehin den Begriff „Scheinkausalität“. Mit dem Problem der Begriffswahl hat sich bestimmt schon mal jemand schriftlich auseinandergesetzt. --Wurzel (Diskussion) 07:53, 28. Mai 2017 (CEST)

Dem würde ich zustimmen wollen, eine Korrelation beschreibt lediglich einen als sinnvoll betrachteten Zusammenhang. So steht es auch im entsprechenden Wikipedia Artikel. Die Kausalität kommt doch wohl erst ins Spiel, wenn die scheinkorrelierenden Variablen eine gemeinsame Ursache haben. Die Aussage "Korrelation (statistisch betrachtet), keine Kausalität" ist somit zwar wahrscheinlich richtig, weil damit eine partielle Mediation ausgeschlossen wird, trotzdem aber eher eine Konsequenz oder meinetwegen eine Konkretisierung des eigentlichen Sachverhalts, aber nicht das zentrale Kriterium. -- 188.104.194.147 10:43, 23. Aug. 2017 (CEST)

Kausalität impliziert nicht Korrelation?

„Ohnehin ist eine Korrelation ein rein statistischer Begriff (der weder Kausalität impliziert, noch von ihr impliziert wird).“

Dass Korrelation nicht Kausalität impliziert, ist klar, aber was wäre ein Beispiel dafür, dass eine Kausalität ohne Korrelation vorliegt? Müssten kausal verknüpfte Größen nicht immer korrelieren? --95.112.128.173 22:42, 3. Jan. 2019 (CET)

Hallo 95.112.128.173, das ist aber ein interessanter Punkt. Ich hätte da einen Kandidaten für Kausalität ohne Korrelation. Sagen wir mal, ein Ereignis E kann durch zwei Ursachen A und B ausgelöst werden. Sowohl A als auch B können E kausal auslösen. Des Weiteren, sowohl A als auch B führen „messbare“ Aktionen aus (Bewegungen, bzw. Anschubsen eines Plastikbechers, der sich auf einem Tisch befindet, o.ä.). Allerdings löst immer nur B das Ereignis E tatsächlich aus, sagen wir mal das wiederholte vollendete Herunterwerfen „E“ eines einzigen Plastikbechers von einem Tisch, der dann aber immer wieder auf dem Tisch aufgestellt wird; während A den Becher eben nur etwas anschubst ohne das dieser Becher vom Tisch fällt. A kann dann zwar den Becher, kausal ausgelöst, herunterwerfen, aber nur die Bewegungen von B korrelieren mit dem Herunterwerfen E. Der Kernpunkt hierbei ist m.E.: A kann das Ereignis E kausal auslösen, allerdings B auch. Sowas hat bestimmt schon jemand untersucht. Also die Untersuchung eines ‚zwingend‘-kausalen Zusammenhangs oder eines ‚kann‘-kausalen Zusammenhangs. Oder auch einfach: zwei (mehrere) kausale Ursachen für ein Ereignis E. Quellenangabe gesucht. --Wurzel (Diskussion) 07:36, 4. Jan. 2019 (CET)
Obiges Beispiel zielt eher darauf ab, dass sich argumentieren läst, dass A kausal den Becher herunterwerfen kann, tatsächlich schubst er den Becher aber nur an, während B den Becher dann ‚kausal‘ herunterwirft. Im fogenden Beispiel lässt sich ‚versuchsweise‘ ein kausaler Zusammenhang darlegen, aber keine (messbare) Korrelation, weil von mir beispielhaft ein für die Korrelation zwar naheliegender aber ungeeigneter Parameter ausgewählt wurde: Person C pustet die kleine Menge einer schädlichen schnell flüchtigen Substanz in die Luft. C argumentiert dann, ihr habt das jetzt zwar alle gesehen: „Aber in der Luft könnt ihr ja nix nachweisen.“ Keine Korrelation deswegen, weil folgendes möglich ist: (a) Konzentration unterhalb der derzeitigen Nachweisgrenze, (b) Konzentrationsänderung nicht signifikant von natürlichen Konzentrationsschwankungen zu unterscheiden, (c) der kausale Zusammenhang wurde mit ‚in die Luft pusten‘ beschrieben, die Korrelationsprüfung bezieht sich jedoch auf ‚in der Luft messen‘. Direkt der Vorgang, ob C etwas in die Luft pustet, wäre zur Korrelationsmessung schon eher geeignet. Die spätere Messung der Konzentration in der Luft wäre dann eben zu spät.
Dieses Beispiel zielt vorrangig darauf ab, eine mögliche Korrelation ‚zu verschleiern‘. Evtl. hat jemand ein besseres Beispiel, wo eine Korrelation zwar möglich, aber die Werte der Messparameter eben unterhalb einer Nachweisgrenze liegen. Insgesamt schlage ich jedoch vor, nach einem Beweis für folgende Hypothese zu suchen (ähnlich zu 95.112.128.173): Kausal verknüpfte Größen bewirken immer eine Korrelation diese Größen. --Wurzel (Diskussion) 09:11, 5. Jan. 2019 (CET)
Ein (abstraktes) Beispiel, das aber sehr konstruiert und ziemlich pathologisch ist: Man wirft zwei unabhängige faire Münzen und vermerkt jeweils, ob sie Kopf oder Zahl zeigen; außerdem vermerkt man als dritte Größe, ob sie beide dasselbe gezeigt haben (also entweder beide Kopf oder beide Zahl). Dann ist diese dritte Größe sowohl vom Ausgang des ersten Münzwurfs als auch des zweiten Münzwurfs stochastisch unabhängig und insbesondere nicht korreliert, obwohl sie sogar kausal von beiden Würfen abhängt. Ein realistisches Beispiel fällt mir leider auch nicht ein. --Hufeisen69 (Diskussion) 17:12, 9. Jan. 2019 (CET)
Das scheint mir eigentlich ein sehr gutes Beispiel, lieber Hufeisen69.
Vielleicht könnte man es etwa in dieser Form versuchsweise in den Artikel einfügen:
"Man wirft zeitgleich zwei Münzen und notiert eine Eins, wenn beide Münzen zugleich Kopf oder Zahl zeigen und eine Null, wenn sie Kopf und Zahl zeigen. Betrachtet man eine einzelne Münze, so ist das Ergebnis direkt kausal davon abhängig, wie diese Münze fällt. Eine Korrelation zwischen dem Verhalten einer einzelnen Münze und dem Ergebnis besteht dennoch nicht (beide sind stochastisch unabhängig), da das Ergebnis vom Fall der zweiten Münze und somit vom Zufall abhängt."
Das klingt zwar ein bißchen nach Haarspalterei, da diese Darstellung davon abhängt, wie man die beiden Begriff genau definieren möchte.
Aber am Ende sind ja alle Fragen der Philosophie und zu einem guten Teil auch der Logik und sogar der Mathematik immer eine Frage der Definition.
Und wenn es nur das wäre, was dieses Beispiel zeigt, dann wäre ja vermutlich auch schon etwas gewonnen. Sollte ein Logiker vorbeikommen und das Beispiel für ungeeignet halten, dann hätten wir zumindest dabei etwas gelernt.
nette Grüße, Kai Kemmann (Diskussion) - Verbessern statt löschen: Enzyklopädie ist altgriechisch für "umfassend" - 16:01, 14. Jan. 2019 (CET)
Ja, die Frage ist aber, wo im Artikel man einen solchen Text unterbringen könnte. Einen eigenen Abschnitt zum Verhältnis von Kausalität und Korrelation gibt es ja (noch) nicht, die Anmerkung der IP oben bezieht sich auf einen Nebensatz in einer Klammer. Inhaltlich kann man den Vorwurf der Haarspalterei natürlich nicht ausräumen, aber wenn man eine faire Münze als Bernoulli-Verteilung mit modelliert und die übliche Definition stochastischer Unabhängigkeit heranzieht, gibt es wenigstens von mathematischer Seite am Beispiel wenig zu rütteln. Ein Logiker/Philosoph könnte sich allenfalls am Kausalitätsbegriff stoßen, der in der Stochastik nicht formalisiert ist (stochastische Abhängigkeit oder Unabhängigkeit ist erst einmal eine symmetrische Eigenschaft, bedingte Wahrscheinlichkeiten kann man für beide Richtungen aufstellen). – Diese Ausführungen würden dann aber einen eigenen Abschnitt benötigen (vielleicht in einem anderen Artikel?). --Hufeisen69 (Diskussion) 11:59, 15. Jan. 2019 (CET)
Die ursprüngliche Anfrage von IP 95.112.128.173 ist m.E. nach einem „Beispiel dafür, dass eine Kausalität ohne Korrelation vorliegt“. Sobald dazu ein gutes Beispiel mit Quelle gefunden wurde, schlage ich vor dies im Artikel „Kausalität“ als Abschnitt z.B. ‚Kausalität ohne Korrelation‘ unterzubringen. Der Artikel ‚Scheinkorrelation‘ beschäftigt sich eher mit Korrelation zweier Größen, bei der eben KEINE Kausalität vorliegt. Nichtsdestotroz kann man eine noch zu beweisende Hypothese m.E. zunächst vereinfachen zu: Genau zwei kausal verknüpfte Größen bewirken immer eine Korrelation diese Größen. (Oder es findet doch jemand ein Beispiel für das Gegenteil dieser Hypothese.) --Wurzel (Diskussion) 19:02, 15. Jan. 2019 (CET)
Ich habe diese Idee jetzt mal wie vorgeschlagen in Kausalität#Statistik eingefügt.
Mal sehen, ob es da eine Resonanz gibt ...
Kai Kemmann (Diskussion) - Verbessern statt löschen: Enzyklopädie ist altgriechisch für "umfassend" - 23:42, 21. Jan. 2019 (CET)
Ein Beispiel wie das von Hufeisen findet sich hier: [1], letzte Folie --134.100.17.122 11:46, 6. Feb. 2019 (CET)

Ergänzungsvorschlag: Beispiel 2: Scheinkorrelation = Piraten und Temperatur

https://www.pastafari.eu/wp-content/uploads/2018/11/global-warming-600x464.jpg

"Piraten sind notwendig, um das Erdklima zu regulieren. Was sich ebenfalls wissenschaftlich belegen lässt. Ein Grafik, auf der das Aussterben der Piraten ins Verhältnis mit dem Anstieg der Erderwärmung gesetzt wird, zeigt ganz deutlich, je weniger Piraten, um so höher die Temperatur."

https://de.wikipedia.org/wiki/Fliegendes_Spaghettimonster

https://de.wikipedia.org/wiki/Evangelium_des_Fliegenden_Spaghettimonsters

https://cdn.mdr.de/wissen/mensch-alltag/bild-103814-resimage_v-variantBig16x9_w-1280.jpg?version=10315

http://glücksarchitekt.com/wp-content/uploads/2017/04/angelo.jpg

Hat zwar nicht direkt zum Thema zu tun, aber ich kann einfach nicht widerstehen :-) https://www.youtube.com/watch?v=efvwJ7l_EI0 (nicht signierter Beitrag von 77.64.147.81 (Diskussion) 09:58, 29. Jul. 2021 (CEST))

Ergänzungsvorschlag: Beispiel 3 ( "Käsekonsum" und "Tod durch Bettlacken" )

Quelle 1 https://external-preview.redd.it/VnaCYQdRcFDwWSeN0LPvkbrZNJeD09Vksi-4WXI-otg.jpg?auto=webp&s=c4a65d330413e9579c4048cad427b35d6ce3d64a

Quelle 2 https://pbs.twimg.com/media/DAMzST-UIAArQ8r.jpg

Quelle 3 https://www.moonshot-factory.eu/wp-content/uploads/2020/02/abb6-17_de.jpg

Störchenpaar-Beispiel ???

Gegeben die Zahl der Frauen {\displaystyle X}, Zahl der Geburten von Babys {\displaystyle Y}, und die Zahl der Störche {\displaystyle Z}, so können die Raten {\displaystyle r_{1}=Y/X} und {\displaystyle r_{2}=Z/X} berechnet werden. Zieht man nun unabhängig verteilte Stichproben der Zufallsvariablen und korreliert die Raten {\displaystyle r_{1}} und {\displaystyle r_{2}} erhält man aufgrund des gemeinsamen Nenners eine Scheinkorrelation.

Ein Satz vorher wird der Zusammenhang gut erklärt: Ländliche Gegend als "Hidden Variable", daraus folgt a) mehr Storchenpaare und b) mehr Kinder pro Paar. Mit einem "gemeinsamen Nenner" hat das überhaupt nichts zu tun; eigentlich macht man sich damit eine weitere Folge der Region zunutze, daß in ländlichen Gegenden weniger Frauen zu leben pflegen als in städtischen.


Würde eine "Scheinkorrelation" nur durch den selben Nenner entstehen, wären sämtliche "per capita"-Werte Scheinkorreliert, weil hier per Definitionem etwas mit der Bevölkerungszahl in Verhältnis gesetzt wird.


Ebenso, man nehme die Bevölkerungszahl {\displaystyle Ⲝ} und bilde {\displaystye r{2}' = Z/Ⲝ}. Man hat nun den "gemeinsamen Nenner" naheliegend aufgelöst, indem man die Zahl der Storchen-Brutpaare - naheliegender - mit der Bevölkerung in's Verhältnis gesetzt hat.


Außer im Vatikan ist aber {\displaystyle 0,4\cdot Ⲝ ≤ X ≤ 0,6\cdot Ⲝ}, also bekommt man innerhalb der Toleranz 0,5±0,1 leicht unschärfere Werte, aber immer noch eine Scheinkorrelation.


Damit ist der Satz so wie er da steht mE unverständlich oder sogar falsch. --2003:C8:4718:BE00:E096:DA31:95D2:71AA 15:44, 30. Jun. 2022 (CEST)