Diskussion:Kolmogorow-Smirnow-Test
Gestern hatte ich einen Artikel zu diesem Thema geschrieben, nichtahnend, dass schon ein Artikel vorlag, der aber anders transkribiert war. Ich fasste dann heute die beiden Artikel zusammen. Jetzt wurde hier noch ein dritter Artikel kreiert, den ich noch ein bisschen integriert habe. Meine erste Version ist unter Kolmogoroff-Smirnow-Test dokumentiert, falls jemand die Zusammenfassung der Versionsgeschichte übernimmt. --Philipendula 00:03, 20. Jul 2004 (CEST)
bitte haltet euch an die in Wikipedia:Sonderzeichen beschriebenen mathematischen zeichen, das x ist zudem mal groß und mal klein, danke
Welches Zeichen stimmt denn wieder nicht, oh Unbekannter? Wenn X groß ist, handelt es sich um die Zufallsvariable in der Grundgesamtheit, wenn es klein ist, um eine konkrete Beobachtung dieser Zufallsvariablen. --Philipendula 11:06, 20. Jul 2004 (CEST)
tut mir ja leid, wenn ich dir zu nahe getreten bin, ich weiss du hast viel energie und zeit investiert um die 3 artikel zusammenzufügen. die sache mit dem x habe ich nicht richtig überschauen können, daher der kommentar, einfach weil ich zweifel hatte. ich habe mich wohl ein bisschen zuknapp gefasst. ich meinte rein das format, bloss das kursiv schreiben der variablen mehr nicht. PS: ich will doch auch bloss helfen
War meine Reaktion so schroff? Tut mir leid, war nicht so gemeint. Soo schlimm war das Zusammenfügen auch wieder nicht. Das mit dem Kursiv weiß ich, aber ich hasse es wie die Pest, weil es die Lesbarkeit einschränkt. Der Text ist mit Schrift und TeX sowieso schon so unruhig. Trotzdem könntest Du Dich mal irgendwie identifizieren lassen. --Philipendula 22:43, 20. Jul 2004 (CEST)
alles klar :), mit der identifizierung: zum rechtschreibfehler korrigieren hats bisher immer ohne account ausgereicht, habe eh nur noch 2 wochen festes internet und dann werde ich kaum irgend etwas machen ich bin nicht der meinung das ich activ genug für einen account bin aber wenns hilft kann ich ja die temporäre ip anzeigenlassen :) --194.95.177.102 08:15, 21. Jul 2004 (CEST)
Kritische Werte
Hallo Leute - ich habe versucht eine Tabelle mit kritischen Werten für die Teststatistik Dn zu bekommen - so gut wie unmöglich - und wenn dann nur für zu kleine Stichprobenumfänge - hat jemand von euch eine? - könnte er die reinstellen? - Murmillo
- Beispielsweise im Jochen Schwarze, Grundlagen der Statistik II. Gruß --Philipendula 23:38, 24. Mär 2005 (CET)
Hallo zu den kritischen Werten hab ich ne Fragen, sind die nicht abhängig von der Verteilung die man testet? Also unterschiedliche kritische Werte wenn man Normalverteilung testet oder Exponentialverteilung. Leider finde ich keinerlei kritische Werte für die Exponentialverteilung --Florsch 11:15, 17. Nov 2005 (CET)
- Die kritischen Werte sind nicht verteilungsgebunden, siehe auch [1]. Gruß --Philipendula 13:21, 17. Nov 2005 (CET)
Ich habe auch eine Frage zu den Werten: Kann mir jemand erklären, warum bei einem kleineren Konfidenzintervall - es ist also wahrscheinlicher, dass die untersuchten Verteilungen gleich sind - eine größere Differenz der Punkte erlaubt ist? Danke!
--oasis 05:02, 14. Aug 2006 (CEST)
Ach ja, noch eine Frage: Die Berechnung mit S(x-1) habe ich so nirgendwo anders gefunden... Welchen Sinn hat es, ein nicht zusammengehörendes Wetepaar miteinander zu vergleichen? Oder sehe ich hier schon wieder was falsch? Danke nochmal!
--oasis 05:07, 14. Aug 2006 (CEST)
Für diskrete Verteilungen ergibt die Berechnung mit doch gar keinen Sinn. Wenn ich die Dirac-Verteilung nehme, dann erhalte ich ja immer durch eine Differenz von 1, zumindest wenn ich mich an dem Zahlenbeispiel orientiere und offenbar setzen muss. Dann würde ich ja immer die Hypothese ablehnen. Hab ich was übersehen? Mich würde sowieso interessieren , wieso man die Berechnung mit einbezieht. (nicht signierter Beitrag von Wotan.Odin (Diskussion | Beiträge) 15:35, 27. Nov. 2012 (CET))
- Aber bei stetigem sollte es schon so stimmen. Setzt man im Allgemeinen für einen Kolmogorov-Smirnow-Test nicht sowieso eine stetige Verteilung voraus? -- HilberTraum (Diskussion) 21:05, 27. Nov. 2012 (CET)
- In den Eigenschaften wird aber gesagt, dass dieser auch bei diskreten Verteilungen anwendbar ist. Dies wäre meiner Meinung nach auch korrekt, wenn man weglässt. Dies dürfte man aus der Dvoretzky–Kiefer–Wolfowitz Ungleichung schlussfolgern können. (nicht signierter Beitrag von Wotan.Odin (Diskussion | Beiträge) 21:14, 27. Nov. 2012 (CET))
- Im stetigen Fall braucht man aber die schon, sonst stimmt's nicht, wie ja auch das ausgeführte Rechenbeispiel zeigt. Im diskreten Fall müsste man zusätzlich zu denn Stellen wohl auch noch die Unstetigkeitsstellen von prüfen, denn dort könnte doch das Maximum ebenfalls auftreten. -- HilberTraum (Diskussion) 21:22, 27. Nov. 2012 (CET)
- Aber nach der Dvoretzky–Kiefer–Wolfowitz Ungleichung sieht man ja, dass die empirische Verteilung gegen die "richtige" Verteilung in Wahrscheinlihckeit gleichmäßig konvergiert. Und dafür brauche ich keine Stetigkeit und auch nicht . (nicht signierter Beitrag von Wotan.Odin (Diskussion | Beiträge) 21:29, 27. Nov. 2012 (CET))
- Aber die Konvergenz bringt doch nichts für den Test. Da geht es doch um die Abweichung zwischen den beiden Funktionen bei festem endlichen n (also dem Stichprobenumfang, z.B. n=8, wie im Beispiel). -- HilberTraum (Diskussion) 21:38, 27. Nov. 2012 (CET)
- Mithilfe der Ungleichung kann ich ja das berechnen. Bei dem Test möchte ich ja sagen können, dass wenn die Verteilungsannahme richtig ist, dass nach n Beobachtungen die Empirische Verteilungsfunktion mit einer Wahrscheinlichkeit von nicht mehr als abweicht. Sonst lehne ich die Hypothese ab. Und genau das sagt die Ungleichung ja aus. Wenn man sich den Wikipediaartikel von der Ungleichung anschaut, entspricht genau dem . (nicht signierter Beitrag von Wotan.Odin (Diskussion | Beiträge) 21:47, 27. Nov. 2012 (CET))
- Ja, für den kritischen Wert stimmt das ja, aber in dem Textabschnitt geht es doch um die Berechnung der Teststatistik , die mit verglichen wird. Ich habe jetzt übrigens mal in der Statistik-Software R (Programmiersprache) geschaut: Dort wird z.B. für den KS-Test vorausgesetzt, dass die zu prüfende Verteilung stetig ist. -- HilberTraum (Diskussion) 22:08, 27. Nov. 2012 (CET)
- Vllt sollte man die Bemerkung ändern, dass dies auch für diskrete Verteilungen korrekt ist. (nicht signierter Beitrag von Wotan.Odin (Diskussion | Beiträge) 22:11, 27. Nov. 2012 (CET))
- Hab mal einen Satz dazu geschrieben. Für den diskreten Fall müsste man mal in die Literatur schauen, was das genau gemacht wird. -- HilberTraum (Diskussion) 22:23, 27. Nov. 2012 (CET)
- Vllt sollte man die Bemerkung ändern, dass dies auch für diskrete Verteilungen korrekt ist. (nicht signierter Beitrag von Wotan.Odin (Diskussion | Beiträge) 22:11, 27. Nov. 2012 (CET))
Hallo, der angegebene Werte für für ist nach Sachs. L.: "Angewandte Statistik. Methodensammlung mit R", Springer 2009 nicht sondern . Außerdem wird die Berechnungsformel ab , wie auch in der verlinkten Tabelle angegeben, verwendet.--Rufus Fledermaus (Diskussion) 14:59, 29. Jul. 2014 (CEST)
- Das stimmt, ich habe die Werte jetzt mal an die Quelle Sachs angepasst. Danke! -- HilberTraum ⟨d, m⟩ 21:02, 29. Jul. 2014 (CEST)
- Wenn mann allerdings die Formel zur Berechnung benutzt, war wohl eher der korrekte Wert und im Sachs ein Zahlendreher.--141.30.157.154 15:20, 31. Jul. 2014 (CEST)
- Das ist ja fies … ich habe jetzt mal auf 1,073 geändert, aber ich werde dazu morgen auch nochmal die Literatur checken. Danke nochmal für dein Engagement. -- HilberTraum ⟨d, m⟩ 20:18, 31. Jul. 2014 (CEST)
- Wenn mann allerdings die Formel zur Berechnung benutzt, war wohl eher der korrekte Wert und im Sachs ein Zahlendreher.--141.30.157.154 15:20, 31. Jul. 2014 (CEST)
Zahlenbeispiel
Beim kurzen Überfliegen fand ich die Tabelle im Zahlenbeispiel sehr verwirrend. Mir erscheinen die meisten der Werte in der fünften Spalte falsch.
Hier die Tabelle mit den Werten meiner Rechnung in der 6. Spalte:
i | xi | S(xi) | Fo(xi) | S(xi)-Fo(xi) | |
1 | 9,41 | 0,125 | 0,044 | 0,080 | 0,081 |
2 | 9,92 | 0,250 | 0,103 | -0,147 | 0,147 |
3 | 11,55 | 0,375 | 0,546 | 0,172 | 0,171 |
4 | 11,60 | 0,500 | 0,563 | 0,064 | 0,063 |
5 | 11,73 | 0,625 | 0,606 | -0,018 | 0,019 |
6 | 12,00 | 0,750 | 0,691 | -0,059 | 0,059 |
7 | 12,06 | 0,875 | 0,708 | -0,166 | 0,167 |
8 | 13,02 | 1,000 | 0,914 | -0,086 | 0,086 |
Es scheint kein gravierender Fehler zu sein, da ja letztendlich die absolut-Werte benutzt werden und Abweichungen in der letzten Stelle sind vermutlich einfach Rundungsfehler. Es verwirrt beim ersten Lesen und Überfliegen jedoch ganz gewaltig. -- Harald 217.13.79.130 15:15, 6. Feb 2006 (CET)
- Das Problem ist, dass irgendjemand in dem Artikel mehrfach rumgepfuscht hat. Ich stelle mal "meine" Version wieder her und hoffe, alle später erfolgten Ergänzungen einpflegen zu können. --Philipendula 23:22, 6. Feb 2006 (CET)
- Bitte das Zahlenbeispiel so belassen. Es ist ein Test, bei dem die Parameter der Verteilung gegeben sind und nicht geschätzt werden. --Philipendula 23:46, 6. Feb 2006 (CET)
Welchen Wert soll denn x0 haben? Sonst wäre ein Eintrag in der Tabelle nicht definiert. (nicht signierter Beitrag von Wotan.Odin (Diskussion | Beiträge) 15:15, 26. Nov. 2012 (CET))
Schlussfolgerung aus Zahlenbeispiel?
Welche Schlussfolgerung ergibt sich aus dem Zahlenbeispiel? Das ist wieder typisch für Mathematiker. Die Tabellen etc. sind allesamt korrekt, aber eine sinnvolle lexikalische Schlussfolgerung wird nicht gezogen. Dabei heisst es schon in der Schule, dass ein Antwortsatz zu formulieren ist! Also: leckt die Abfüllmaschine in diesem Beispiel oder sind die Abfüllmengenabweichungen noch im Rahmen einer statistischen Wahrscheinlichkeitsverteilung? Bitte bedenkt, dass ihr solche komplexen mathematischen Phänomene vor allem Nichtmathematikern erklären sollt! Am besten, Ihr versetzt Euch in die Lage eines Künstlers, der aus diesem Artikel auf Anhieb die Essenz herausziehen möchte. Von grossartigem Vorwissen kann nicht ausgegangen werden, also scrollt er gleich zum "Zahlenbeispiel". Die Abfüllanlage ist ja gar nicht verkehrt als Beispiel, nur was heisst die Schlussfolgerung daraus? --85.178.44.18 09:39, 16. Jun. 2007 (CEST)
falsche Grenzen
Die Grenze für D bei n=10 und alpha=5% von 0,454 stimmt nicht mit dem Wert in der verlinkten Tabelle ([2]) von .410 überein. Was paßt da nicht? --Thire 10:30, 21. Mär 2006 (CET)
- liegt das vielleicht an dem n=8? Gruß --Philipendula 13:20, 21. Mär 2006 (CET)
- Perfekt, stimmt. Zwar steht da in der tabelle noch 0.457 überein. Nicht schlimm, aber verwirrend. Wenn Du mir einen linktippgibst, dann verspreche ich, an dem Artikel etwas herumzuarbeiten. --Thire 13:55, 21. Mär 2006 (CET)
- Hab keinen Linktip, bin Toterbaumfan. Die kritischen Werte sind aus Jochen Schwarze, Grundlagen der Statistik II, ein Autor, den ich für sehr seriös halte. --Philipendula 14:16, 21. Mär 2006 (CET)
- Ich zweifle in keinster Weise an deinen Literaturquellen; Wenn ein Laie das nachvollziehen will (er hat ja so ein schönes Zahlenbeispiel von Dir), dann sollte er den kritischen Wert auchausfindig machen können. Die Tabelle in [3] weist zB genau Deine 0,454 aus. Super. Ich werde das auch verlinken. Ein Freund hat mir heute den Zusammenhang zur Brownsche Brücke erklärt. Ev baue ich das auch noch ein. :) Was ist ein Toterbaumfan? --Thire 18:49, 21. Mär 2006 (CET)
- Toterbaumfan = Bücherfan. --Philipendula 09:15, 22. Mär 2006 (CET)
- Okay, danke. :) ich finde man merkt noch etwas, dass der Artikel zusammengestückelt wurde. Ich will ih nun verbessern. Ev auch einen anderen Datensatz nehmen. Deiner scheint ja nur ein fiktives Beispiel zu sein, da wäre es vielleicht besser Daten wie zB in (okay, schlechtes Beispiel, da von mir) Bild:PartielleAutokorrelation.png zu nehmen (die Wasserstände des Huronsees). Was meinst Du? --Thire 10:01, 22. Mär 2006 (CET)
- Toterbaumfan = Bücherfan. --Philipendula 09:15, 22. Mär 2006 (CET)
- Ich zweifle in keinster Weise an deinen Literaturquellen; Wenn ein Laie das nachvollziehen will (er hat ja so ein schönes Zahlenbeispiel von Dir), dann sollte er den kritischen Wert auchausfindig machen können. Die Tabelle in [3] weist zB genau Deine 0,454 aus. Super. Ich werde das auch verlinken. Ein Freund hat mir heute den Zusammenhang zur Brownsche Brücke erklärt. Ev baue ich das auch noch ein. :) Was ist ein Toterbaumfan? --Thire 18:49, 21. Mär 2006 (CET)
- Hab keinen Linktip, bin Toterbaumfan. Die kritischen Werte sind aus Jochen Schwarze, Grundlagen der Statistik II, ein Autor, den ich für sehr seriös halte. --Philipendula 14:16, 21. Mär 2006 (CET)
- Perfekt, stimmt. Zwar steht da in der tabelle noch 0.457 überein. Nicht schlimm, aber verwirrend. Wenn Du mir einen linktippgibst, dann verspreche ich, an dem Artikel etwas herumzuarbeiten. --Thire 13:55, 21. Mär 2006 (CET)
Hallo! Ich sehe noch ein weiteres, grundlegenderes Problem mit den Grenzen. Eine normierte stetige Verteilungsfunktion sollte nahe der unteren Grenze des Definitionsbereichs nahe bei 0 und in der Nähe der oberen Grenze nahe bei 1 sein. Direkt an diesen Punkten sind nur 0 bzw. 1 zulässig, denn alle Stichproben liegen ja zwischen diesen beiden Grenzen. Wenn eine Verteilung nahe der unteren Definitionsbereichsgrenze die 95%-Vertrauens-Kurve erreicht, so ist die Verteilung in Wahrheit schon extrem "falsch". Daher müssten die Vertrauens-Kurven zu den Randpunkten hin auch gegen 0 bzw. 1 konvergieren. Ferner sollte die Definition und Bedeutung der Signifikanz in Bezug auf den K-S-Test besser erläutert werden (das geht aus dem Hauptartikel Statistische Signifikanz nicht hervor).--SiriusB
Da mein Beitrag im Artikel mit Hinweis auf die Diskussion gelöscht wurde, füge ich ihn hier mal ein. Ich lasse mich natürlich gerne belehren, dass er (mein Beitrag) falsch ist. Allerdings habe ich die Zahlen aus der KS-funktion direkt berechnet und ich könnte mir vorstellen, dass Rundungsartefakte der Grund für die Abweichungen sein könnten. Allerdings habe ich meine zugrunde liegenden Zahlen auf mehrere Stellen nach dem Komma berechnet.
Hinweis: Das Zahlenbeispiel ist unglücklich gewählt. Der kritische Wert bei α = 0,05 und n=8 ist der Betrag 0,481. Damit wäre der größte absolute Abweichler in der Tabelle von 0,459 kleiner als der kritische Wert und würde vom KS-Test akzeptiert! Der oben genannte Betrag von 0,454 käme bei einem n=8,974 zustande, ist also vermutlich von n=9 genommen. Es gibt aber nur 8 Messwerte im o.g. Beispiel.
Letztlich gilt aber erstmal Vielen Dank für den Artikel...Hat mir sehr weitergeholfen. Hab mich halt nur gewundert, dass ich alle die Zahlen aus der Tabelle reproduzieren konnte, nur den threshold nicht.
Kommentar weg
Ich habe mal den html-Kommentar war er doch hoffentlich? nach dem namen Wladimir Iwanowitsch Smirnow entfernt, da er auch in der französischen und italienischen wikipedia genannt wird. Falls jemand bedenken hat - bitte meldet Euch hier bzw bessert es aus! --Thire 19:08, 21. Mär 2006 (CET)
- Merkt doch eh niemand ;). --Philipendula 09:16, 22. Mär 2006 (CET)
- Genau deshalb hab' ich es hier rein geschrieben. Es sollte doch stimmen... --Thire 09:54, 22. Mär 2006 (CET)
besserer Datensatz
Ich hab's oben schon mal geschrieben:
Ev sollte man einen anderen Datensatz für das Zahlenbeispiel nehmen. Der aktuelle scheint ja nur ein fiktives Beispiel zu sein, da wäre es vielleicht besser Daten wie zB in (okay, schlechtes Beispiel, da von mir ;) ) Bild:Autokorrelation.png zu nehmen (die Wasserstände des Huronsees).
Ev kann man das auch mit dem Absatz 3 Anwendungsbeispiel verbinden und mit dem Standard C-Generator 8 Zufallszahlen ziehen. Oder habt ihr eine bessere Idee?
--Thire 15:25, 22. Mär 2006 (CET)
- Ein fiktives Beispiel ist meistens besser nachvollziehbar. Kann du nicht das andere Beispiel als zweites, praxisrelevantes reinbringen? --Philipendula 15:53, 22. Mär 2006 (CET)
- Wie meinst Du? Soll ich 11 Zufallszahlen ziehen und dann noch mal das alles durchrechnen? Zwei Beispiele in einer Enzyklopedie wären etwas zu viel... --Thire 16:30, 22. Mär 2006 (CET)
- Mir ist nicht so recht klar, was der Huronsee mit Zufallszahlen zu tun hat. Ich kann nur sagen, dass ich mir mit dieser Tabelle ziemlich viel Arbeit gemacht habe und dass es mich sehr begeistert, dass das für die Katz war. --Philipendula 17:59, 22. Mär 2006 (CET)
- Ich finde die Wasserstände des Hurronsees auch nicht so aufregend. Aber ich will den Artikel verbessern und war auf der Suche nach einem besseren Datensatz. Denn Deinen erdachten finde ich mit Verlaub etwas zu wenig aufregend... Das war mehr eine Anregung, ob Dir oder sonst jemandem was besseres einfällt. Eine Idee von mir war dann, die Sache mit den Zufallszahlen mit dem Zahlenbeispiel zu vereinen (aha, schon wieder merkt man, dass es mehrere Quellen gab) und ein Beispiel da zu verwenden. Oder eben einen besseren Datensatz.
- Ich vermute mal, dass Du in Deinem letzten Satz ein "nicht" ("mich nicht sehr begeistert") vergessen hast. Aber das ist weder Deine wikipedia noch Dein Artikel, er gehört uns allen (offen, frei). Wenn ich ihn verbessere (Argumente, warum der aktuelle Datensatz mich nicht besonders geil macht siehe oben), dann ist das doch nur gut, oder? Let's gettin' started... --Thire 10:45, 23. Mär 2006 (CET)
- Ich finde die Wasserstände des Hurronsees auch nicht so aufregend. Aber ich will den Artikel verbessern und war auf der Suche nach einem besseren Datensatz. Denn Deinen erdachten finde ich mit Verlaub etwas zu wenig aufregend... Das war mehr eine Anregung, ob Dir oder sonst jemandem was besseres einfällt. Eine Idee von mir war dann, die Sache mit den Zufallszahlen mit dem Zahlenbeispiel zu vereinen (aha, schon wieder merkt man, dass es mehrere Quellen gab) und ein Beispiel da zu verwenden. Oder eben einen besseren Datensatz.
- Mir ist nicht so recht klar, was der Huronsee mit Zufallszahlen zu tun hat. Ich kann nur sagen, dass ich mir mit dieser Tabelle ziemlich viel Arbeit gemacht habe und dass es mich sehr begeistert, dass das für die Katz war. --Philipendula 17:59, 22. Mär 2006 (CET)
- Wie meinst Du? Soll ich 11 Zufallszahlen ziehen und dann noch mal das alles durchrechnen? Zwei Beispiele in einer Enzyklopedie wären etwas zu viel... --Thire 16:30, 22. Mär 2006 (CET)
- Zum Einen: Es ist genau so wenig deine Wikipedia wie meine. Zum Anderen: Es ist IMHO nicht die Aufgabe des Datensatzes, aufregend zu sein. Mir ging es um ein einfaches, leicht nachvollziehbares Beispiel mit einem Sachverhalt, der einerseits eine gewisse praktische Relevanz hat und andererseits für jeden verständlich ist. Das Recht, die eigene Meinung durchzudrücken, nehme ich für mich genau so in Anspruch wie du für dich. --Philipendula 13:31, 23. Mär 2006 (CET)
- Ich finde Dein Beispiel ganz toll.
- Aber ich finde es ginge noch besser.
- Ich will nicht "meine Meinung durchdrücken". Ich versuche zu argumentieren, um der Sache (=Enzyklopädie=Wikipedia). Da steht jetzt mal "Ein fiktives Beispiel ist meistens besser nachvollziehbar." gegen "Ich suche einen besseren Datensatz, zB wie Huronsee oder C-Zufallszahlen (vereint geschickt zwei Absätze)".
- Sag's mir bitte, wenn Du das anders siehst. Ev ziehen wir eh am gleichen Strang (sogar in die selbe Richtung!), aber sind nur schlecht koordiniert.
- Auch habe ich nie behauptet, dass es meine wikipedia sei.
- Gibt es Argumente gegen meine Vorschläge? Hast Du andere konstruktive Ideen? Was spricht gegen einen neuen (=besseren) Datensatz? --Thire 13:51, 23. Mär 2006 (CET)
- Ich finde Dein Beispiel ganz toll.
Dann mach halt. --Philipendula 09:03, 24. Mär 2006 (CET)
- Werde ich auch und habe ich ja auch schon. Es wäre halt schön, wenn zB Du als Hauptschreiber des Artikels mit von der Partie bist!
- Ich habe paar kleinere Fehler im Bild entdeckt, ich erneuere es, wenn ich weiß, welche Daten dem Testbeispiel zu Grunde liegen sollen. --Thire 10:50, 24. Mär 2006 (CET)
- Was kann ich denn tun als mal abwarten ... --Philipendula 14:06, 24. Mär 2006 (CET)
- Das muss ich Dir jetzt sagen ;)
- Naja, wenn Du von Deinem eigenen Datensatz nicht mehr ganz überzeugt bist, könntest Du gemeinsam mit mir einen neuen, besseren suchen.
- Wenn Du an Deinem festhältst, könntest Du mich auf andere Gedanken bringen: Och Thomas, mach doch mal das mit der Brownsche Brücke, das interessiert mich jetzt, was das mit dem KS-Test zu tun hat...
- Oder sonst was...
- Wieder im Boot?
- --Thire 15:02, 24. Mär 2006 (CET)
- Was kann ich denn tun als mal abwarten ... --Philipendula 14:06, 24. Mär 2006 (CET)
- Witzbold. Natürlich bin ich von meinem Datensatz überzeugt. Aber was hab ich davon, wenn du auf einem anderen bestehst? Da muss ich halt abwarten, was du bringst. Was soll ich denn machen - auf einem Bein Tango tanzen? --Philipendula 17:52, 24. Mär 2006 (CET)
Verweise auf andere Verfahren fehlen
Für den Test auf Normalverteilung (eine sehr häufige Anwendung) gibt es bessere Tests als den hier besprochenen: :Anderson-Darling-Test
- Cramér-von-Mises-Kriterium
- Shapiro-Wilk-Test
In der englischen Version des Artikels werden die auch erwähnt, hier nicht. Gibt es dafür Gründe? Ich selbst scheue mich, an statistischen Artikeln herumzupfuschen: Dafür bin ich zu dumm. --Jan-Henner Wurmbach 11:55, 9. Jan. 2008 (CET) So dumm, dass ich immer meine Unterschrift vergesse
Einwand von 129.217.132.49
Aus dem Artikel [4] kopiert:
Kritik: ein einseitiger KS-Test ist ein KS-Test mit einem einseitigen Testproblem. fälschlicherweise wird hier ein KS-Test bei einer Stichprobe (also Anpassungstest) falsch formuliert. Bei dem KS-Test als Anpassungstest gibt es sowohl einseitige als auh zweiseitige Testprobleme.
Siehe Büning / Trenkler : Nichtparametrische Methoden, 2. Auflage, Seite 70
Falsche Zuordnung
Der Author des Artikels von 1939 über diesen Test war N. Smirnow, nicht W. I. Smirnow. Guido Germano 21:04, 21. Mär. 2009 (CET)
Sup
Warum die Bedeutung von sup erwähnt und nicht von und |. Usw. Nijdam 15:53, 31. Dez. 2009 (CET)
- Hallo, weil und | in der Regel für die meisten, die sich für den K-S-Test interessieren, aus der Schulmathematik bekannt sind, während "sup" keinem meiner "Testleser" geläufig war. Ich erkläre "sup" ja auch nicht, sondern gebe nur eine Hilfe für weitere Recherchen, falls der Operator nicht geläufig ist. Ich fände es aber auch nicht gänzlich verkehrt, wenn und | in einem kurzen Nebensatz namentlich genannt und auf die entsprechenden Wikipedia-Artikel verlinkt würde. Grüße, -- MM-Stat 23:22, 1. Jan. 2010 (CET)
Ziel
Was im Artikel geschrieben ist:
Mit seiner Hilfe kann anhand von Zufallsstichproben geprüft werden, ob
- zwei Zufallsvariablen die gleiche Verteilung besitzen oder
- eine Zufallsvariable einer zuvor angenommenen Wahrscheinlichkeitsverteilung folgt.
stimmt nicht, nur die alternative Hypothese kann statistisch geprüft werden. Ich schlage also etwas vor wie:
Mit seiner Hilfe kann anhand von Zufallsstichproben geprüft werden, ob
- die Verteilungen zweier Zufallsvariablen sich unterscheiden
- die Verteilung einer Zufallsvariable abweichend ist von einer zuvor angenommenen Wahrscheinlichkeitsverteilung.
Nijdam (Diskussion) 00:02, 26. Nov. 2012 (CET)
- Nun, es kann geprüft und falsifiziert, aber nicht verifiziert werden. Ist aber richtig, dass die Beschreibung leicht in die Irre führen kann. Deine hat allerdings das gleiche Problem - es kann geprüft werden ob sie sich unterschieden, aber das Testergebnis kann nur sein "ja, unterscheiden sich" oder "kann nicht festgestellt werden". Vielleicht etwas in Richtung "kann eine Abweichung zwischen [...] ermittelt werden"? --mfb (Diskussion) 00:18, 26. Nov. 2012 (CET)
Vielleicht mit Hinzufuegung von 'statistisch':
Mit seiner Hilfe kann anhand von Zufallsstichproben statistisch geprüft werden, ob
- die Verteilungen zweier Zufallsvariablen sich unterscheiden
- die Verteilung einer Zufallsvariable abweichend ist von einer zuvor angenommenen Wahrscheinlichkeitsverteilung.
Nijdam (Diskussion) 14:29, 29. Nov. 2012 (CET)
Vorgehensweise
Warum müssen die Daten sortiert sein!? Nijdam (Diskussion) 14:26, 29. Nov. 2012 (CET)
- Sonst funktioniert das mit doch nicht. Dazu müssen und unmittelbar aufeinanderfolgen. -- HilberTraum (Diskussion) 15:56, 29. Nov. 2012 (CET)
Schreibweise Titel
Meiner Meinung nach ist die Schreibweise hier falsch. In sämtlicher Statistik Fachliteratur die ich in meiner elektronischen Bibliothek habe, ist vom Kolmogorov-Smirnov-Test, also beides mal mit "v", die Rede[1] [2]. Ebenso im englischen Artikel dazu. Sucht man bei Google nach "Kolmogorow-Smirnow-Test" (mit "w") wird dies ebenfalls als Tippfehler gewertet und "Kolmogorov-Smirnov-Test" (mit "v") als Vorschlag gemacht.
Daher würde ich empfehlen den Artikel umzubenennen.
- Die hier verwendete Transkription entspricht Wikipedia:Namenskonventionen/Kyrillisch. Daher muss es mit W geschrieben werden. 90.184.23.200 20:12, 5. Jun. 2016 (CEST)
- ↑ Eckstein, Peter P.: Statistik für Wirtschaftswissenschaftler: Eine realdatenbasierte Einführung mit SPSS. 4., aktualisierte u. erw. Aufl. 2014. Wiesbaden: Springer Fachmedien Wiesbaden, 2014
- ↑ Weiß, Christel: Basiswissen Medizinische Statistik. 6., überarb. Aufl. Berlin Heidelberg: Springer, 2013 (Springer-Lehrbuch)