Benutzer Diskussion:Sigbert/Archiv/1

Der erste Eintrag :)

Hallo Sigbert! Es ist schön, dass Du für Wikipedia aktiv bist!

Weiterhin viel Freude in Wikipedia wünscht--Pittimann besuch mich 13:30, 4. Feb. 2009 (CET)

Portal:Statistik

Hallo, ich wuerde mich freuen wenn "Ihr" auch mal im Portal:Statistik reinschauen wuerdet. Eventuell kann man dort dann auch die Zusammenarbeit koordinieren. Mit freundlichen Gruessen --Meisterkoch 17:15, 2. Sep. 2009 (CEST)

Gelegentlich schaue ich da rein, insbesondere wg. Problemartikel. Eine Koordination wäre sicher sinnvoll. --Sigbert 15:34, 3. Sep. 2009 (CEST)

Sichtungsrechte

Hallo, ich habe sowohl fuer Sie und MM-Stat Sichterrechte beantragt, die auch gewaehrt wurden. Mit freundlichen Gruessen --Meisterkoch 12:22, 8. Sep. 2009 (CEST)

Danke für die Unterstützung --Sigbert 19:24, 8. Sep. 2009 (CEST)

Herzlich willkommen auch von den Mitarbeitern des Portal:Mathematik

Dank eines Hinweises von Meisterkoch ist das Portal:Mathematik (dahinter versteckt sich mehr oder weniger die Koordination der Autoren mathematischer Artikel auf Wikipedia) auf Ihr Projekt aufmerksam geworden. Wir begrüßen Ihr Vorhaben sehr. [1]

Da Sie sich offenbar bereits gut orientiert haben, nur ein Hinweis auf die wichtigsten Seiten zu unserer Koordination:

Wenn Sie auf überarbeitungsbedürftige Artikel stoßen, können Sie auf diese über die Qualitätssicherungsseite der Mathematik hinweisen, das ist ein guter Weg der Arbeitsteilung. Gelegentlich kommt es vor, dass die Diskussionsseite eines Artikels auf keiner Beobachtungsliste ist und Anmerkungen dort ungelesen bleiben; in diesem Fall ist es bei uns auch üblich, über die Qualitätssicherungsseite Kontakt zu anderen Autoren aufzunehmen.

Sollten Sie noch irgendwelche Fragen und Anregungen haben, sind diese auf der Diskussionsseite des Portals Mathematik stets willkommen.

Herzlich willkommen im Namen der Mathematik-Autoren, --Erzbischof 12:12, 15. Sep. 2009 (CEST)

Behobene Redundanz?

Hallo Sigbert, wie ich hier gesehen habe, hast du im Januar eine Redundanz behoben. Heißt dies, dass der Artikel Effektgröße nun gelöscht werden kann? (Oder vielleicht besser in eine Weiterleitung auf Effektstärke geändert werden kann)? Grüße, --Birger 00:48, 19. Sep. 2009 (CEST)

Ja. Ich hatte eigentlich noch auf eine Resonanz gewartet. --Sigbert 11:21, 19. Sep. 2009 (CEST)

Ich war so frei und habe eine Weiterleitung eingerichtet. --Erzbischof 12:27, 19. Sep. 2009 (CEST)

Danke an euch beide! Grüße, --Birger 13:16, 19. Sep. 2009 (CEST)

Wirtschafts- und Bevölkerungsstatistik

Merci, wollte gar nicht glauben, dass wir keinen Artikel dazu haben. Gruesse --Meisterkoch Rezepte bewerten! 22:47, 27. Jan. 2010 (CET)

Ich auch nicht ... -- Sigbert 13:08, 28. Jan. 2010 (CET)

Rangkorrelationskoeffizient

Kannst du auf meine Änderung in der Einleitung mal einen kritischen Blick werfen? Ich bin zugegebener Maßen Dilletant auf dem Gebiet:-). --Kricket 12:24, 31. Jan. 2010 (CET)

Bzw. trifft der bereits eingedampfte zweite Absatz im Artikel auf Spearmans Rangkorrelationskoeffizienten überhaupt zu? Ist das nicht nur für Kendalls Tau korrekt? --Kricket 12:28, 31. Jan. 2010 (CET) Ist nicht auch Beispiel 1 zu Spearmans Rho falsch? Es liegt doch keine Äquidistanz zwischen den Rängen vor? Und welchen Sinn hat der Koeffizient unter den Bedingungen überhaupt noch? --Kricket 12:32, 31. Jan. 2010 (CET)

Ich denke man muss sich mal genau überlegen, welches Skalenniveau haben die betrachteten Variablen? Ordinal, metrisch oder Likert-Skala. Haben wir ein metrisches Skalenniveau, dann kann man sowohl Spearman oder Kendall nehmen, die sind dann robuster. Haben wir ein ordinales Skaleniveau, dann ist Spearman eigentlich nicht anwendbar (siehe auch deinen eigenen Kommentar: Wenn Äquidistanz bei Spearmans Rho vorrausgesetzt wird, ist Ordinalskallierung doch nicht mehr ausreichend, oder???). Bei Likert-Skalen wird ja implizit angenommen, dass der Abstand der Ausprägungen Eins ist, d.h. auch hier dürften sowohl Spearman oder Kendall anwendbar sein. Evtl. wäre es gut, diese Diskussion in den ersten Abschnitt zu verlagern anstatt es in der Einleitung zu machen (Oma-Prinzip :)

Das Beispiel 1 ist okay, evtl. wäre noch Hinweis auf Ausreisser bzw. Nicht-Linearität gut. Grüsse -- Sigbert 13:06, 31. Jan. 2010 (CET)

Helferlein

Hallo Sigbert, hier noch ein kleines Helferlein, der die Links auf BKLs farblich hervorhebt (falls noch nicht aktiviert). Gruesse --MK ^P:W 20:51, 19. Feb. 2010 (CET)

War es noch nicht. Sehr nützlich. Danke -- Sigbert 21:45, 19. Feb. 2010 (CET)

{1} offen in Q?

gudn tach!
du hast das gesichtet. vielleicht magst du deshalb auf talk:Offene Menge#Menge {1} ist offen in ? antworten. -- seth 21:23, 4. Mai 2010 (CEST)

Habe ich gemacht, aber du hattest es ja auch schon korrigiert. -- Sigbert 20:34, 5. Mai 2010 (CEST)

Bedingte Wahrscheinlichkeit

Hallo Sigbert, danke für Deine Nachricht! Ich habe Dir auf meiner Benutzerdiskussionsseite geantwortet; weil ich nicht weiß, ob Du das beobachtest, schreib ich Dir sicherheitshalber noch mal hier einen Hinweis. Ich selbst bevorzuge es, Pingpong-Dialoge zu vermeiden -- das hier ist also nur als Benachrichtigung gedacht. Viele Grüße, Jonathan 16:53, 27. Mai 2010 (CEST)

Hotcat

Kennst du das Wikipedia:Helferlein/HotCat? Wenn man viel mit Kategorien arbeitet ist das manchmal eine Erleichterung. Gruß, --Erzbischof 14:22, 14. Jun. 2010 (CEST)

Inzwischen ja :) Danke. --Sigbert 17:38, 15. Jun. 2010 (CEST)

Bedingter Erwartungswert

Hallo Sigbert, im Artikel Bedinter Erwartungswert steht:

$P(A|X)$ ist gerade der Ausdruck, den man erhält, wenn man für $x$ den jeweils beobachteten Wert von $X$ einsetzt, d. h. $P(A|X)(\omega )=P(A|X=X(\omega ))$ für alle $\omega$ , oder kurz $P(A|X)=P(A|X=x)\,|_{x=X}$ .

Ich kenne die hier benutzte Kurzform $P(A|X)=P(A|X=x)\,|_{x=X}$ nicht, und sie kommt mir auch einigermassen dillettantisch vor. Jedenfalls ist sie mathematisch mindestens problematisch. Ist es eine uebliche Notation im deutschen Fachbereich? Nijdam 12:42, 14. Aug. 2010 (CEST)

Mir auch. Ich kenne nur

P(A|X)=P(A|X=x)

. Sorry für die späte Antwort, aber ich bin z.Zt. im Urlaub. Grüsse --Sigbert 19:53, 21. Aug. 2010 (CEST)

Die die „Auswertung an der Stelle x“ durch

\mid _{x=X}

betonende Schreibweise findet sich in Heinz Bauer: Wahrscheinlichkeitstheorie, S. 130. --Erzbischof 20:09, 21. Aug. 2010 (CEST)

T-Test‎

Hi Sigbert, du hattest in obigem Artikel die Bemerkung gelöscht, dass es den T-Test nicht gibt. Der Satz stammt von mir, ich hatte als altes Urgestein den Artikel damals angelegt. Und ich habe ihn nicht nur aus Jux und Tollerei eingefügt. Es ist nämlich so, dass speziell Mediziner nur einen t-Test kennen. "Die Statistikvorlesung war grausam, vor allem der blöde t-Test usw." Es war also als Hinweis für Menschen gedacht, die tatsächlich meinen, dass der liebe Gott nur einen t-Test in die Welt gesetzt hat. Viele Grüße --Philipendula 11:58, 13. Sep. 2010 (CEST)

Ist es nicht klar, wenn da steht er bezeichnet eine Gruppe von Hypothesentests, dass es mehr als einen Test gibt? Mir erschien der alte Text etwas doppelt gemoppelt und Conny hat recht mit dem Kommentar über die Einleitung. --Sigbert 21:37, 14. Sep. 2010 (CEST)

Naja, von mir aus. --Philipendula 13:30, 15. Sep. 2010 (CEST)

Validität

Hallo, Du scheinst Dich auszukennen. Ich habe ein paar Artikel neu verfasst: Konstruktvalidität, Inhaltsvalidität, Diskriminanzvalidität, Konvergenzvalidität und nomologische Validität. Würdest Du mal drüberschauen und ggf. optimieren? Besten Dank. 92.225.141.71 21:53, 28. Sep. 2010 (CEST)

Hi, kann ich gelegentlich mal machen; allerdings bin ich eher Statistiker und kein Experte, was ...validität angeht. Deswegen habe ich auch unter Durchschnittlich erfasste Varianz einen QS Eintrag gemacht statt selbst falsch rumzuändern. --Sigbert 07:36, 4. Okt. 2010 (CEST)

Wobei es ja bei den Validitäten durchaus Streit gibt zwischen jenen, die auf statistische Kenngrößen pochen (ein Konstrukt ist dann gut, wenn die Faktorenanalyse eindeutig ist und Cronbachs Alpha stimmt, egal was das Konstrukt da eigentlich misst --> rein quantitativ) und denen, die auf semantische, inhaltliche Nähe zwischen einer Definition eines Konstukts und dem Inhalt der Indikatoren pochen (ein Konstrukt ist dann gut, wenn es inhaltlich das Richtige misst, egal was die Kenngrößen wie Cronbachs Alpha sagen --> rein qualitativ). Meiner Ansicht nach muss beides simultan geprüft werden, somit auch die erste, statistische Seite der Medaille. 92.231.209.232 20:48, 4. Okt. 2010 (CEST)

K-Means-Algorithmus

Hi, [2]

... was genau wolltest du verlinken? Totale Variation? Jedenfalls war auch der zweite Link "red".

--Chire 21:59, 20. Nov. 2010 (CET)

Totale Varianz ist schon richtig. Kommt heute oder morgen Benutzer:Sigbert/Totale_Varianz in den ANR. --Sigbert 08:28, 21. Nov. 2010 (CET)

Ah, ok. Der Begriff machte ja auch Sinn; hatte aber auf die Schnelle eben den Zielartikel nicht gesehen. Danke für deine Arbeit bei WP! --Chire 14:28, 21. Nov. 2010 (CET)

Portal Statistik

Hallo Siegbert, das wusste ich leider nicht, aber danke für den hinweis. Ich werde es mir merken, wenn ich nochmal einen "fehlenden" Artikel schreibe. Grüße, --Maggus989 15:21, 12. Dez. 2010 (CET)

Diskussion:Durchschnittlich erfasste Varianz

Hallo! Du scheinst Dich mit dem Thema auszukennen. Kannst Du meine Frage auf der genannten Diskussionsseite beantworten? Vielen Dank im Voraus! 85.179.139.115 19:07, 8. Jan. 2011 (CET)

Linkage_Clustering / Clusteranalyse

Hallo Sigbert, Danke. Ich bin kein erfahrener Wikipedia-Nutzer, deswegen wusste ich nicht genau wie das "richtig" geht, mit dem Importwunsch. Kannst du da helfen?

Hierarchische Clusteranalyse ist irreführend, da es zahlreiche hierarchische Verfahren gibt (wie z.B. OPTICS) die nichts hiermit zu tun haben. Die Namen "*-linkage-clustering" sind aber geläufig. --87.174.99.136 21:45, 15. Jan. 2011 (CET)

Habe es schon beantragt und eine Schnelllöschantrag gestellt für Linkage Clustering (ich machs auch zum ersten Mal :). Was den Namen angeht, so ist dies der Sammelname, der in der Statistik für diese Verfahren gebräuchlich ist. "Linkage-Clustering" habe ich im Statistikbereich noch nie gehört. Wieviele weitere Verfahren gibt es denn noch (ausser OPTICS) die darunter fallen? --Sigbert 21:52, 15. Jan. 2011 (CET)

PS: Notfalls schieben wir es nach Hierarchische Clusteranalyse (Statistik) und machen unter Hierarchische Clusteranalyse eine Begriffklärungsseite. Gruss --Sigbert 22:01, 15. Jan. 2011 (CET)

Volkszählung

3800 vor Christus gab es kein Babylon, siehe englische Wikipedia, da ist vom Beginn des dritten Jahrtausends die Rede, es kann also nur die Landschaft bzw. Region gemeint sein, leider hat der Vermerk jedoch keine Quelle, er konnte in der alten Form allerdings auf keinen Fall richtig sein. Ich weiß auch ehrlich gesagt nicht, was da 3800 v.Chr. in der Region so los war. --Chricho ¹ 15:50, 5. Feb. 2011 (CET)

Habe mal bei deinem Baustein eingetragen, in welchen Versionen sich solche Behauptungen erstmals finden (die erste mit Japan, die zweite mit Japan), in Ordnung? Ordentliches Verlinken hat irgendwie nicht funktioniert. --Chricho ¹ 13:11, 18. Sep. 2011 (CEST)

Super, ich hatte schon überlegt, ob ich den Baustein rausnehmen soll. --Sigbert 13:16, 18. Sep. 2011 (CEST)

Die zweite mit Babylon. :D --Chricho ¹ 14:47, 18. Sep. 2011 (CEST)

Realisierung

Hallo,

kannst Du mir bitte weiterhelfen? Ich denke darüber nach, ob man aus diesem Artikel eine BKL machen kann. Nun wollte ich Dich fragen, ob der Satz zur Statistik in einem anderen Artikel schon besser untergebracht ist. Ich konnte bis jetzt nur Stochastischer_Prozess#Pfade finden. --Christian1985 (Diskussion) 18:51, 26. Jun. 2011 (CEST)

Also sicherlich können die Sätze zur Stochastik und zur Statistik vereinigt werden, beide reden von Zufallsvariablen. --Sigbert 19:03, 26. Jun. 2011 (CEST)

Der Link

Weblinks

- Erläuterung zur Absoluten Häufigkeit im Rahmen der Deskriptiven Statistik www.wiwiweb.de/statistik/haeufigkeit/unklassiert/haeufigabsol.html

ist doch super! ich lerne gerade Statistik damit.. (nicht signierter Beitrag von 78.35.169.238 (Diskussion) 02:21, 13. Jul. 2011 (CEST))

Es geht nicht in erster Linie um die Qualität, sondern um den Anbieter der Information. WP:WEB Punkt 4 sagt

4. Vermeide Websites, bei denen der kommerzielle Charakter im Vordergrund steht. Reine Webshops verbieten sich per se, während Websites ohne oder mit nur wenig Werbung bevorzugt werden sollten.

und es handelt sich hierbei ohne Zweifel um eine kommerziellen Anbieter. Das schliesst zwar nicht einen solchen Anbieter aus, aber ich halte die oben genannte Webseite für qualitativ nicht so hochwertig, dass es den Nachteil eines kommerziellen Anbieters aufwiegt.

Bei Verlinkung von Webseiten eines bestimmten kommerziellen Anbieters besteht immer auch der Verdacht, dass dieser von hohen Ranking der Wikipedia profitieren will.

Wenn der Inhalt deiner Meinung so gut ist, dann sollte er besser in die Wikipedia integriert werden. Wobei allerdings (mindestens) zwei Dinge zu beachten sind:

ein Copy-und-Paste des Textes stellt eine Urheberrechtsverletzung dar, d.h. man muss es in eigenen Worten darstellen und
die Wikipedia ist eine Enzyklopädie und kein Lehrbuch, z.B. der Exkurs: Summen und Summenzeichen hätte in einem Wikipedia-Artikel nichts zu suchen.

Ausserdem ist zum Lernen das eigene Formulieren eines Begriffes eine gute Methode um denselben richtig zu verstehen. --Sigbert 06:41, 13. Jul. 2011 (CEST)

Weiterbearbeitung?

Hallo Sigbert! Arbeitst du noch an Benutzer:Sigbert/Hierarchische Clusteranalyse weiter? Ich würde das gerne von WP:IU archivieren. Grüße, —DerHexer (Disk., Bew.) 12:55, 16. Jul. 2011 (CEST)

Hallo Sigbert! Ich finde den Artikel schon recht gut, und finde es schade dass er jetzt schon so lange hier nur als Entwurf "herumliegt". Warum ihn nicht langsam in den Hauptnamensraum verschieben lassen, dann finden sich vielleicht noch ein paar Nutzer die etwas beitragen können? Siehe z.B. Benutzer:FachueberM34 (vermutlich identisch mit Benutzer:ThorbenP - siehe [3]). Danke! --Chire 22:41, 16. Jul. 2011 (CEST)

Ja, sobald ich Zeit habe, lade ich die Beispielbilder noch hoch in Commons und verlinke sie. Wir können die Seite aber auch schon verschieben, damit andere ebenfalls daran arbeiten können. Eure Kommentare sind natürlich prompt am 1. Urlaubstag gekommen. --Sigbert 12:50, 8. Aug. 2011 (CEST)

OK, Artikel ist jetzt in den ANR verschoben. --Sigbert 08:41, 9. Aug. 2011 (CEST)

Omnibus-Test

Moin! Kannst Du den Artikel noch um Literaturangaben/Quellen ergänzen? Grüße – Guinsoo ^(Talk) 12:54, 9. Aug. 2011 (CEST)

Kovarianz

Hallo Sigbert, für verdoppelungen deutschsprachiger Artikel ist WP:IU in Zukunft der bessere Ort, auf WP:IMP können die Leute mit dem Antrag eigentlich nichts anfangen (weil sie nicht die nötigen Rechte haben). Dein Artikel liegt jetzt unter Benutzer:Sigbert/Empirische Kovarianz. Gruss --Port(u*o)s 10:34, 21. Aug. 2011 (CEST)

Deine Nachricht vom 15.01.2011

Deine Nachricht: Hi, du hast unter Rotationsverfahren (Statistik) eine Ergänzung gemacht, die aus meiner Sicht nur einen uninteressanten Spezialfall betrifft. Denn wenn ich eine Faktoranalyse mache, dann will ich doch eigentlich einen niedrigdimensionalen Raum haben. --Sigbert 22:44, 15. Jan. 2011 (CET)

Hi zurück, es gibt hier bei euch: http://de.wikipedia.org/wiki/Wikipedia:Sei_mutig

Du willst den niedrigdimensionalen Raum haben, aber ob Du ihn bekommst, ist nicht sicher. Hier bin ich ohnehin raus, da neues Wissen nicht entstehen kann, wenn man ständig für alles Nachweise braucht. Manches Neue entsteht auch durch Kreativität.

Zur Varimax-Drehung: Warum soll ich bei einem vollständigen Faktorenmodell rotieren? Es ist schon optimal. Erst das Reduzieren schafft Raum dafür. Ja, das kann ein Spezialfall sein. Was uninteressant ist, sollte nicht ein Einzelner entscheiden. Da es so ist, frage ich weshalb wikipedia Weltkulturerbe werden soll?

Hallo,

dann hättest du es gerne diskutieren können.
es geht in der Wikipedia nicht darum neues Wissen entstehen zu lassen, sondern gesichertes Wissen darzustellen.
Nachweise sind in der Statistik besonders wichtig, weil man alles Mögliche schreiben kann ohne das viele Leser in der Lage sind das als Unsinn zu erkennen.
Und bei "eigene Erfahrung" als Quelle kann niemand dies nachvollziehen.
Zur Varimax-Drehung: Da stimme ich zu; ich würde sowas in Faktoranalyse schreiben, weil da die Leser über Extraktion und Rotation lesen.

--Sigbert 07:38, 23. Aug. 2011 (CEST)

Re: Dezimalpunkt

Deine Nachricht: '... Und der Dezimalpunkt wird in Deutschland mit Komma und nicht mit Punkt dargestellt. ...'

Das stimmt m.E. nicht immer. Wenn ich die mir momentan zugänglichen deutschsprachigen Statistik-Lehrbücher anschaue (n=7) , finde ich 3 Bücher mit Dezimalpunkt und 4 Bücher mit dem Komma als Dezimaltrennzeichen.

Zudem finde ich dass ein Dezimalpunkt für bessere Lesbarkeit sorgt, insbesndere wenn die Zahl Teil eines Satzes ist:

Man erhält daher für $\theta =0.4$

ist in meinen Augen leichter lesbar als

Man erhält daher für $\theta =0,4$

--Bw234 21:01, 22. Sep. 2011 (CEST)

Da hast du sicher recht, allerdings gilt (ich glaube lt. Duden) Schreibweise_von_Zahlen#Dezimal-_und_Tausendertrennzeichen. Und egal wie wir es machen, wir sollten es einheitlich machen :) --Sigbert 13:20, 23. Sep. 2011 (CEST)

Da ich vermute, dass sich die Wikipedia in dieser Hinsicht an die DIN-Norm hält, fange ich mal zu ändern an... --Bw234 20:40, 27. Sep. 2011 (CEST)

Welche Norm des DIN schreibt Dezimalpunkte vor? Oder verstehe ich dich falsch. Ansonsten gilt Wikipedia:Schreibweise von Zahlen#Dezimal-_und_Tausendertrennzeichen. Die schwere Lesbarkeit ruehrt uebrigens von einer Latex-„Spezialitaet“ her. Kommata als Dezimaltrennzeichen muessen in Latex mit geschweiften Klammern geschuetzt werden, vergleiche

Man erhält daher für $\theta =0,4$

mit

Man erhält daher für $\theta =0{,}4$

also <math>\theta=0,4</math> vs. <math>\theta=0{,}4</math> . --Erzbischof 21:04, 27. Sep. 2011 (CEST)

Parallele Koordinaten

Hallo, ich habe deinen Artikel Parallele Koordinaten mal für die Seite Schon gewusst vorgeschlagen. Viele Grüße --Sinuhe20 18:20, 10. Okt. 2011 (CEST)

Clusteranalyse

Hallo, Für den englischen en:cluster analysis Artikel habe ich eine Handvoll Beispiele erzeugt. Siehe auch commons:Cluster analysis. Ich weiß noch nicht ob/wann ich dazu komme sie hier in den Artikel einzubauen, aber vielleicht magst du sie schon irgendwo verwenden. Ich habe aber keinen nicht-trivialen Beispieldatensatz den K-Means besser hinbekommt als die anderen... wenn k-means irgendwie gut klappt, müssen die Cluster halt gleich groß sein und klar voneinander getrennt... bin mit den K-Means-Bildern deswegen etwas unzufrieden, da sieht es immer so aus als ob der total bescheuert ist ... (aber ok, der eine Datensatz ist halt einfach dichtebasiert und damit ideal für DBSCAN, und der andere sind Gausscluster, das kann EM einfach viel besser ...). Spontan eine Idee wie man einen 2D-Datensatz baut, den k-Means besser kann? --Chire 10:18, 25. Okt. 2011 (CEST)

Hallo, die Struktur dürfte keine klare Trennung zwischen den Clustern besitzen, sonst sind dichtebasierte oder hierarchische Algorithmen besser. Die Cluster dürfen keine Normalverteilung entsprechen. Ich würde da mal an sowas denken: )( Allerdings müssten Maßstäbe in X- und Y-Richtung etwas unterschiedlich sein, damit das Clusterzentrum nicht nach oben oder unten rutscht. --Sigbert 18:25, 25. Okt. 2011 (CEST)

Ja, aber wenn ich eben keine klare Trennung mache, dann ist halt das Ergebnis meist auch nicht "einsichtig", im Sinne von "verständlich" für den Leser. --Chire 23:07, 25. Okt. 2011 (CEST)

Osmosekraftwerk

Hi Sigbert, erkläre doch bitte mal den Mehrwert Deines Edits in Osmosekraftwerk - ich kann nämlich nicht erkennen, welche Superinhalte in "Unter Uns" die Abweichung von der goldenen WP:WEB-Regel "Bitte sparsam und vom Feinsten" rechtfertigen - aber vielleicht habe ich ja irgendetwas übersehen? --Burkhard 20:22, 9. Nov. 2011 (CET)

Hallo, der Link war bereits im Artikel und ist ohne Kommentar entfernt worden [4]. Da der ursprünglich Link tot war, bin ich davon ausgegangen, dass es sich um die Entfernung eines toten Links handelt und habe die PDF-Datei unter www.hzg.de gesucht und gefunden und wieder eingefügt. Meinetwegen kann er auch wieder raus. --Sigbert 20:33, 9. Nov. 2011 (CET)

F-Test

Hallo Sigbert. Ich habe den Abschitt F-Test#Definition aufs neue geschrieben, aber noch im Konzept auf der Diskussionsseite. Weil ich kein Muttersprachler bin, bitte ich dich mir behilflich zu sein, selbstverstaendlich auch inhaltlich. Nijdam 11:45, 15. Nov. 2011 (CET)

Grundgesamtheit

Hallo, ist Definition der Grundgesamtheit im Bereich Statistik eine andere wie in der empirischen Forschung oder kann man die Abschnitte zusammenziehen? Gruß--Christian Stroppel 00:09, 18. Nov. 2011 (CET)

Könnte man auch zusammenziehen. Allerdings wird in den angewandten Wissenschaften auch mit Grundgesamtheiten gearbeitet, die nicht exakt definiert sind. Das bereitet mir als Statistiker etwas Bauchschmerzen... --Sigbert 09:18, 18. Nov. 2011 (CET)

Meinst du mit nicht exakt definierten Grundgesamtheiten was ich mit den "offenen Grundgesamtheiten" beschreiben wollte?: Wenn Unterschiede zwischen Männern und Frauen untersucht werden sollen, kann man die Grundgesamtheit aller Männer die in der Vergangenheit gelebt haben und die in der Zukunft noch leben nicht exakt definieren, weil die ja teils zum Untersuchungszeitpunkt nicht existieren. Man kann also keine zufällige Stichprobe daraus ziehen. Meinst du das? Wenn du das meinst würde ich es zusammenziehen und das Problem anhand einem ähnlichen Beispiel darstellen. Schöne Grüße --Christian Stroppel (Diskussion) 22:20, 7. Mai 2012 (CEST)

Im Prinzip ja, dein Beispiel ist sehr plakativ :) Ich denke an sowas, wie die "Internetbenutzer" oder die "Wohnbevölkerung Deutschlands". Immer wenn wir keine (exakten) Auswahlwahrscheinlichkeiten für ein Element der GG angeben können, dann wackelt ja die ganze induktive Statistik. Grüsse --Sigbert (Diskussion) 09:04, 8. Mai 2012 (CEST)

Definition Statistik

Meine Antwort auf: Diskussion:Statistik#Einleitung Gruß--Christian Stroppel 00:14, 13. Dez. 2011 (CET)

Zentroid

Hallo Sigbert,

ich bräuchte mal Deine Hilfe. In der Diskussion Portal:Mathematik/Qualitätssicherung#Geometrischer_Schwerpunkt kam die Frage auf, ob die Weiterleitung Zentroid zurecht auf den Artikel Geometrischer Schwerpunkt verlinkt. Nun meine Fragen an Dich. Gibt es den Begriff des Zentroids in der Statistik? Hat er etwas mit dem Schwerpunkt in Geometrischer Schwerpunkt zu tun? Hat er genug mit dem Thema zu tun, als dass man ihn dort abhandeln sollte. Vielleicht kannst Du in der QS-Diskussion etwas dazu sagen. Vielen Dank und viele Grüße --Christian1985 (Diskussion) 14:45, 16. Dez. 2011 (CET)

Wikipedia_Diskussion:Kategorien/Frühe_Neuzeit#Kategorie:Statistiker

Spät kam die Antwort, aber sie kam. :-) --Grand Tour 11:08, 26. Feb. 2012 (CET)

Grundgesamtheit

Hallo Sigbert, ich habe vor einiger Zeit mal Belge im Artikel hinzugefügt. Dabei ist mir nicht klar, wo der Unterchied in den Abschnitten Statistik und Empirie ist, die du vor langer Zeit einemal getrennt eingeführt hast [5]. Ist das nicht das selbe und könnte man die Abschnitte nicht einfach zusammenlegen? Ein schönes Wochenende wünscht dir --Christian Stroppel (Diskussion) 00:22, 14. Apr. 2012 (CEST)

Die beiden Ansätze unterscheiden sich in den Art und Weise wie die Stichprobe generiert wird. Statistik verlangt eine Zufallsauswahl, in der empirischen Praxis wird aber meist nur eine irgendwie geartete Repräsentativität der Stichprobe eingefordert, so dass induktive Statistik eigentlich nicht anwendbar ist (vgl. auch Zufallsstichprobe vs. „repräsentative“ Stichprobe). Ich habe mich damals, als Neuling, nicht getraut den Empirie-Abschnitt zu modifizieren. --Sigbert (Diskussion) 11:10, 15. Apr. 2012 (CEST)

Minitab

Hallo Sigbert, auf meiner Benutzerseite findest du einen Entwurf für die Überarbeitung des Minitab-Artikels. Kennst du noch jemand, der mit der Software arbeitet? Ich möchte meine Fassung nicht ohne eine zweite Meinung in den ANR setzen. Ist schließlich mein Erstling hier ;-)--Iltu (Diskussion) 09:17, 11. Mai 2012 (CEST)

Ich kenne leider niemanden der mit Minitab arbeite, aber ich bekomme immer die Werbung dafür :). Zwei Bemerkungen:

Minitab ist weniger komfortabel in der Bedienung als gängige Tabellenkalkulationsprogramme wie Microsoft Excel: Gibt es einen Beleg für diese Aussage?
Ist Six Sigma eigentlich der Schwerpunkt von Minitab? Sonst könnte man diesen Teil noch kürzen bzw. stärker überarbeiten/ergänzen.

Sei mutig und Grüsse --Sigbert (Diskussion) 09:36, 11. Mai 2012 (CEST)

http://de.wikipedia.org/wiki/Wikipedia:Redundanz/September_2011#Matching_.28Statistik.29_-_Datenfusion

Hi, falls du Lust hast dort weiter zu diskutieren. Gruß --Zulu55 (Diskussion) 16:59, 14. Aug. 2012 (CEST)

Mitglieder des House of Lords

Hättest du Interesse hier (Wikipedia:WikiProjekt Politiker/Aktionen/Mitglieder des House of Lords) mitzuwirken? Politik (Diskussion) 12:14, 23. Aug. 2012 (CEST)

Quelle zu Effektstärke

Hallo Sigbert,

ich arbeite gerade ein meiner Bachelorarbeit und mir gefällt die Definition aus Wikipedia im Artikel "Effektstärke" sehr gut. Leider ist nicht zugelassen aus Wikipedia zu zitieren. Statistical Power Analysis for the Behavioral Sciences von Cohen (1988), was bei den Quellenangaben (ohne Seitennummer) angegeben ist, habe ich vorliegen. Leider bin ich nicht erfolgreich dabei, eine konkrete Aussage drin zu finden. Kannst du mir dabei eventuell helfen? Dieser Teil des Artikels stammt meines Wissens nach von dir, deswegen frage ich. Eine (oder mehrere) Seitennummern würde mir sehr helfen.

Liebe Grüße, David(nicht signierter Beitrag von DaWittwer (Diskussion | Beiträge) 18:30, 4. Sep. 2012 (CEST))

Hallo, ich vermute mal du meinst die Aufzählung am Anfang des Artikel (Punkt 1-4). Steht so nicht direkt im Cohen, aber etwas ausgewalzt im ersten Kapitel "The concepts of power analysis"; das meiste vermutlich in Kapitel 1.4 (The effect size). Da könnte man vermutlich noch einige Punkte übernehmen :) Die konkreten Maßzahlen sind zumeist eine Übersetzung aus dem englischen Pedant mt Ergänzungen. Grüsse --Sigbert (Diskussion) 18:46, 4. Sep. 2012 (CEST)

Wikistudie

Hallo Sigbert,

ich bin Student der TU Berlin und ich erarbeite in Rahmen einer Vorlesung, eine neuartige Plattform für Open Education. Da Du Dich auf Wikipedia engagierst, wäre für mich interessant zu wissen, was Dich dazu motiviert.

Ich würde mich sehr über eine Antwort an wikistudie@gmx.de freuen.

Viele Grüße

--WikiStudie (Diskussion) 16:11, 11. Sep. 2012 (CEST)

Trendmodell

Hallo Sigbert,

Super, das du den Artikel ausgebaut hast.

Kannst du bitte eine Quelle oder eher ein (Standard-)Lehrbuch angeben, indem das auch nachzulesen wäre? Du weißt ja wie das ist...

In jedem Fall aber tolle Arbeit!!

PS: Anschließend können wir von mir aus auch den LA entfernen, da die ursprüngliche Begründung nicht mehr gegeben wäre.

Grüße -- Plankton314 (Diskussion) 23:56, 23. Sep. 2012 (CEST)

Hi, ich denke auch der LA kann da raus. Evtl. sollte man es verschieben nach Trend-Saison-Modell. Grüsse --Sigbert (Diskussion) 08:51, 24. Sep. 2012 (CEST)

LAE. Hab deinen Überarbeiten-Baustein gleich mitgekillt - oder willst du den stehen lassen?

Wenn die Bezeichnung Trend-Saison-Modell üblicher ist, verschieben wir das Ding noch. -- Plankton314 (Diskussion) 23:33, 26. Sep. 2012 (CEST)

Nö, der Überarbeiten-Baustein kann auch raus. Was ich bisher so gelesen habe ist Trend-Modell wohl eher üblich und Saisonbereinigung wird dann mit abgehandelt. Nur Eckstein nennt es offensichtlich Trend-Saison-Modell. Da muss ich mal noch die Einleitung etwas polieren. --Sigbert (Diskussion) 09:05, 27. Sep. 2012 (CEST)

Fehlerbalken

Hallo. Du hast irgendwann 2011 eine Sichtung beim Fehlerbalken-Artikel gemacht. Ich habe jetzt mehrfach nachgelesen, daß innerhalb der doppelten Standardabweichungen 68% der Meßwerte liegen sollten. Ich habe Prozentzahl wieder auf 68% zurückgesetzt. 95% wären es nur wenn die Breite vier Standardabweichungen wäre. Ich hoffe ein Statistiker gibt nicht die Breite gemessen von der Mitte an. --Schtone (Diskussion) 14:43, 19. Nov. 2012 (CET)

Danke!!--Schtone (Diskussion) 08:31, 22. Nov. 2012 (CET)

Zufallsstichprobe

Vielen Dank für deine zeitnahe, gelungene Überarbeitung! Viel besser, jetzt! --MarianneBirkholz (Diskussion) 19:43, 6. Jan. 2013 (CET)

[6]

Wieso multivariat? --Zulu55 (Diskussion) _{_Unwissen} 10:21, 19. Mär. 2013 (CET)

Kann gerne auch woanders hin, aber bitte nicht in die Kategorie:Statistik. --Sigbert (Diskussion) 12:27, 19. Mär. 2013 (CET)

OK, streiche es einfach. Gruß --Zulu55 (Diskussion) _{_Unwissen} 13:26, 19. Mär. 2013 (CET)

Dein Importwunsch

... ist eingetroffen. Du findest ihn unter:

Benutzer:Sigbert/Computational statistics

viel Spaß mit der Arbeit am Artikel. Viele Grüße --Itti Frühling lässt sein ... 22:47, 12. Apr. 2013 (CEST)

Danke. --Sigbert (Diskussion) 10:17, 13. Apr. 2013 (CEST)

Portal:Statistik/Charts

Hallo Sigbert. Der Bot hat offenbar Probleme, die Seite zu aktualisieren; ich vermute, sie ist zu groß. Kannst Du das evtl. aufteilen? Gruß… --Krd 08:32, 9. Mai 2013 (CEST)

Ok, habe es in Unterseiten verschoben. Wenn es noch Probleme gibt, dann bitte Bescheid sagen. Danke. --Sigbert (Diskussion) 14:51, 9. Mai 2013 (CEST)

Bitte um Prüfung

Hallo Sigbert, deine Änderung im Artikel Kontingenzkoeffizient hat eine defekte Weiterleitung Chi-Quadrat-Koeffizient erzeugt. Ich habe das auf die geänderte Überschrift angepasst, nur taucht leider der Begriff so im Artikeltext nicht auf. Könntest du das eventuell irgendwie laienverständlich dort mit unterbringen oder gegebenenfalls auf ein passenderes Ziel, eventuell in einem anderen Artikel, umleiten? Vielen Dank im Voraus. --Liebe Grüße, Lómelinde Diskussion 11:45, 7. Jun. 2013 (CEST)

Ok, ich habe es geändert und ergänzt. --Sigbert (Diskussion) 18:09, 8. Jun. 2013 (CEST)

Hallo Sigbert heute ist es der Artikel Korrelation dort sind durch deine Löschung zwei defekte Weiterleitungen zurückgeblieben. Korrelationsfehler (Software) und Korrelationsintegral. Diese bitte auf sinnvolle Ziele anpassen. Vielen Dank im Voraus. --Liebe Grüße, Lómelinde Diskussion 08:32, 12. Jun. 2013 (CEST)

OK, korrigiert; allerdings läuft Korrelationsfehler (Software) derzeit ins Leere. Den Artikel muss ich dann demnächst nochmal anlegen. --Sigbert (Diskussion) 08:43, 12. Jun. 2013 (CEST)

Dann würde ich lieber die Weiterleitung löschen lassen eine WL auf einen Rotlink ist nach meiner Meinung nicht sehr zielführend. Die kann man dann ja später wieder anlegen oder gleich einen Artikel daraus machen. Aber das überlasse ich dir, ich kenne mich mit dem Thema so gar nicht aus. Danke fürs Anpassen. --Liebe Grüße, Lómelinde Diskussion 08:53, 12. Jun. 2013 (CEST)

Ich denke, ich werde den Text aus Anwendungen#Softwaretechnik einfach überarbeiten und nach Korrelationsfehler (Software) übertragen. Für ein paar Tage wird der Rotlink wohl verkraftbar sein, falls nicht soll jemand die WL löschen. --Sigbert (Diskussion) 09:29, 12. Jun. 2013 (CEST)

Dein Importwunsch zu Korrelation

Hallo Sigbert,

dein Importwunsch ist erfüllt worden. Es wurde folgende Seite angelegt:

Benutzer:Sigbert/Korrelation (Signalverarbeitung)

Viel Spaß wünscht --Brackenheim 14:29, 9. Jun. 2013 (CEST)

Danke erstmal. Allerdings ist es die Unterseite bei mir nicht identisch zur aktuelle Version. --Sigbert (Diskussion) 14:35, 9. Jun. 2013 (CEST)

OK, hat sich erledigt :) --Sigbert (Diskussion) 14:36, 9. Jun. 2013 (CEST)

Wirtschafts- und Bevölkerungsstatistik

Hallo Sigbert

Du hast zu dem Thema schon mal ne Antwort geschrieben, deshalb ein ganz konkreter Vorschlag dazu. Im Artikel sind zwei Dinge vermischt, die so nicht zusammengehören. Der bestehende Artikel enthält ausser dem zweiten Satz nur Informationen zur Wirtschaftsstatistik, er sollte also auf das Lemma Wirtschaftsstatistik verschoben werden. (Der zweite Satz wird dann überflüssig.) Die bestehende Weiterleitung muss natürlich zuerst gelöscht werden. Die Weiterleitung Bevölkerungsstatistik kann ohne Schaden auf den Artikel Demographie zeigen. - Als Neuling habe ich mich nicht getraut, aber wenn du das für eine gute Idee hältst, würde ichs versuchen, die Anträge zu stellen. Grüsse --Chrisandres (Diskussion) 22:12, 11. Jun. 2013 (CEST)

Hallo, es gilt grundsätzlich: Sei mutig. Ich habe das nur in einen Artikel gepackt, weil wir noch gar nichts dazu hatten und eine Aufteilung ist sicherlich sinnvoll. Ich bin mir zwar nicht sicher, ob Bevölkerungsstatistik=Demografie korrekt ist. Aber falls nicht, dann wird es schon jemand in der Zukunft präzisieren. --Sigbert (Diskussion) 07:45, 12. Jun. 2013 (CEST)

Dein Importwunsch zu Korrelation

Hallo Sigbert,

dein Importwunsch ist erfüllt worden. Es wurde folgende Seite angelegt:

Benutzer:Sigbert/Korrelationstest

Viel Spaß wünscht --Brackenheim 16:10, 12. Jun. 2013 (CEST)

Wirtschaftsstatistik

Hallo Sigbert!

Der von dir angelegte Artikel Wirtschaftsstatistik wurde zum Löschen vorgeschlagen, da es ihm möglicherweise an Qualität mangelt und/oder die enzyklopädische Relevanz nicht eindeutig im Artikel erkennbar ist. Ob der Artikel tatsächlich gelöscht wird, wird sich im Laufe der siebentägigen Löschdiskussion entscheiden. Bedenke bei der argument- und nicht abstimmungsorientierten Diskussion bitte, was Wikipedia nicht ist. Um die Relevanz besser erkennen zu lassen und die Mindestqualität zu sichern, sollte primär der Artikel weiter verbessert werden. Das wiegt als Argument deutlich schwerer als ein ähnlich aufwändiger Beitrag in der Löschdiskussion.

Du hast gewiss einiges an Arbeit hineingesteckt und fühlst dich vielleicht vor den Kopf gestoßen, weil dein Werk als Bereicherung dieser Enzyklopädie gedacht ist. Sicherlich soll aber mit dem Löschantrag aus anderer Sichtweise ebenfalls der Wikipedia geholfen werden. Grüße, Xqbot (Diskussion) 19:01, 12. Jun. 2013 (CEST) (Diese Nachricht wurde automatisch durch einen Bot erstellt. Falls du zukünftig von diesem Bot nicht mehr über Löschanträge informiert werden möchtest, so trage dich hier ein.)

Bitte um Prüfung (2)

Hallo Sigbert, deine Auslagerung und Änderung im Artikel Korrelation hat leider eine defekte Weiterleitung Korrelationsfehler (Software) erzeugt. Könntest du diese bitte auf ein sinnvolles Ziel umleiten, oder, falls sie nicht mehr benötigt wird, löschen lassen? Vielen Dank im Voraus. --Liebe Grüße, Lómelinde Diskussion 09:13, 20. Jun. 2013 (CEST)

Meine Anfrage bei den Informatikern läuft bereits, da ich nichts Verwertbares via Google gefunden habe. --Sigbert (Diskussion) 09:34, 20. Jun. 2013 (CEST)

Oh, na dann, aber was machen wir inzwischen mit der Weiterleitung? Ich hätte sie gern aus der Liste heraus, weil man ja nie weiß, wann da eine Entscheidung erfolgen wird. --Liebe Grüße, Lómelinde Diskussion 09:44, 20. Jun. 2013 (CEST)

Wir warten noch bis morgen und dann stelle ich einen Antrag auf Löschen der Weiterleitung. --Sigbert (Diskussion) 13:58, 20. Jun. 2013 (CEST)

Gut, ich habe sie solange direkt auf das Lemma gelegt. Nochmals vielen Dank und einen schönen Tag. --Liebe Grüße, Lómelinde Diskussion 14:00, 20. Jun. 2013 (CEST)

LA gestellt. --Sigbert (Diskussion) 14:51, 21. Jun. 2013 (CEST)

Notation (Statistik)

Hallo Sigbert, du hast vor einiger Zeit den Artikel Notation (Statistik) angelegt, der aber offenbar nicht wirklich gebraucht wird, wenn man sich Spezial:Linkliste/Notation (Statistik) ansieht. Meinst du, man kann den Inhalt evtl. irgendwoanders besser platzieren, evtl. in Mathematische Notation oder Formelsammlung Stochastik? Viele Grüße, --Quartl (Diskussion) 13:38, 28. Jun. 2013 (CEST)

Diskriminanzanalyse: Bilder

Hallo Sigbert,

ich würde mich freuen, wenn du zu Diskussion:Diskriminanzanalyse#Bilder etwas beitragen würdest.

Viele Grüße, --Martin Thoma 20:27, 11. Aug. 2014 (CEST)

Quantile-Quantile-Plot

hallo sigbert,

im abschnitt "Trendbereinigter Q-Q-Plot" im oben genannten artikel steht: "Die Abweichungen von der Nulllinie parallel zur Y-Achse ..."

bist du der autor und ist wirklich die y-achse gemeint??

herzliche grüße --DominiqueSch (Diskussion) 14:08, 3. Sep. 2013 (CEST)

Hi, keine Ahnung, ob ich das mal geschrieben habe. Der Text ist aber schon richtig, allerdings klingt er etwas verquer. Vielleicht wäre es besser zu sagen "Die senkrechten Abweichungen

x_{i}-y_{i}

von der Nulllinie kommen nur von den Differenzen...". --Sigbert (Diskussion) 16:30, 3. Sep. 2013 (CEST)

Text korrigiert. --Sigbert (Diskussion) 16:38, 5. Okt. 2014 (CEST)

Dein Importwunsch zu en:BIRCH (data clustering)

Hallo Sigbert,

dein Importwunsch ist erfüllt worden. Es wurde folgende Seite angelegt:

Benutzer:Sigbert/Balanced iterative reducing and clustering using hierarchies

Viel Spaß wünscht Itti 10:41, 10. Okt. 2014 (CEST)

Dein Importwunsch zu Clusteranalyse

Hallo Sigbert,

dein Importwunsch ist erfüllt worden. Es wurde folgende Seite angelegt:

Benutzer:Sigbert/Multiview clustering

Viel Spaß wünscht Itti 10:53, 10. Okt. 2014 (CEST)

Dein Importwunsch zu Clusteranalyse

Hallo Sigbert,

dein Importwunsch ist erfüllt worden. Es wurde folgende Seite angelegt:

Benutzer:Sigbert/Spectral clustering

Viel Spaß wünscht Itti 11:04, 10. Okt. 2014 (CEST)

Dein Importwunsch zu Clusteranalyse

Hallo Sigbert,

dein Importwunsch ist erfüllt worden. Es wurde folgende Seite angelegt:

Benutzer:Sigbert/Maximum-Margin Clustering

Viel Spaß wünscht Itti 11:28, 10. Okt. 2014 (CEST)

Letzte Volkszählungen

Kannst du die Weltkarte zu last census aktualisieren? Myanmar hat 2014 einen Zensus abgehalten, womit das Land grün markiert werden sollte. --112.198.77.55 19:48, 10. Nov. 2014 (CET)

Erledigt --Sigbert (Diskussion) 21:30, 15. Nov. 2014 (CET)

R (Programmiersprache)

Hallo Sigbert, als eifrigen Mitarbeiter im Portal Statistik und Person, die schon mit R gearbeitet hat, möchte ich dich um deine Meinung zum Artikel zu R bitten. In den letzten Wochen habe ich Einiges am Artikel ergänzt und bin neugierig, was sich darüber hinaus noch verbessern ließe. Viele Grüße, BrunosapiJens (Diskussion) 18:01, 13. Jul. 2015 (CEST)

Sieht sehr gut aus. --Sigbert (Diskussion) 13:22, 3. Aug. 2015 (CEST)

Vielen Dank. --BrunosapiJens (Diskussion) 18:20, 4. Aug. 2015 (CEST)

statistische Frage

Hallo

Ich habe da mal eine statistische Frage, vielleicht kann man die beantworten.

Eine (große) Gruppe von Menschen soll eine größere Zahl von Objekten bewerten. Dies soll in der Form "sehr gut / gut / durchschnittlich / schlecht / sehr schlecht" umgesetzt werden. Hinterher soll eine Art Rangliste der Objekte erstellt werden, die absteigend von sehr gut geht. Im Grunde genommen interessieren dann aber nur die ganz guten Bewertungen.

Das einzelne Objekt soll nicht nur von einem Menschen bewertet werden, sondern möglichst viele. Daran schließt sich meine statistische Frage an: ab wieviele Bewertungen eines Objektes (also n=?) hat man eine gute Aussage, die auch Ausreißer verträgt? Eine Bewertung allein ist schlecht, ein eher zufälliges Ergebnis. Zwei Bewertungen sind auch schlecht. fünf Bewertungen oder mehr? Oder sollte es 5 +1 (fünf Bewertungsstufen +1) sein? oder doppelt, bei zehn Bewertungen? Wieviele Menschen (mindestens) sollen ein Objekt bewerten, damit statistisch gesehen ein guter Wert zu erhalten ist? Die Berechnung sollte dann auch besser über ein geometrisches Mittel laufen, arithmetisches Mittel ist nicht so gut geeignet?

Problem/Fragestellung verstanden?

Danke für deine Mühe sich hier hinein zu denken. --Atamari (Diskussion) 17:03, 1. Okt. 2015 (CEST)

Hallo,

1.) Zu den Bewertungsstufen: ob man eine gerade oder ungerade Anzahl von Bewertungsstufen macht, hängt davon ab, ob man eine Mittelkategorie zu lassen will oder nicht oder ob man eine Entscheidung im Bereich gut/schlecht erzwingen will. Eine Mittelkategorie könnte als "Fluchtkategorie" benutzt werden, z.B. wenn jemand das Produkt nicht kennt. Das ist also eine inhaltlich Entscheidung. Die Anzahl der Bewertungsstufen sollte nicht zu gross sein, sonst besteht die Gefahr das verschiedene Personen die Stufen verschieden interpretieren. Sie darf aber auch nicht zu klein sein, da man weiss das Befragte nur ungern die Extremkategorien wählen. D.h. man landet meist bei 5, 6 oder 7 Stufen.

2.) Ich würde den einzelnen Kategorien die Werte 1=gut bis 5=schlecht zuordnen und dann das arithmetische Mittel über alle Personen bilden und damit die Rangliste bilden. Problematisch wird es allerdings, wenn die Verteilung der Antworten bei einem Produkt nicht unimodal ist, was aber eher nicht zu erwarten ist. Für je zwei Produkte stellt sich dann die Frage, ob die Mittelwerte unterschiedlich sind oder nicht. Sind die Befragten eine Zufallsstichprobe, dann würde man die Mittelwerte mit dem Zweistichproben-t-Test prüfen. Mit Hilfe der Poweranalyse könnte man auch minimale Stichprobenumfänge festlegen. Ist es keine Zufallsstichprobe, dann sollte man eine Effektstärke (Cohens d bzw. Cohens r) berechnen und sich eine Grenze setzen, ab wann man Mittelwerte als unterschiedlich betrachtet. Generell gilt: je mehr Beobachtungen desto besser/genauer ist die Analyse.

3.) Die Analysen unter 2.) machen aber nur Sinn, wenn man die ordinale Kategorien, z.B. mit 1 bis 5 kodiert und durch das Rechnen als metrisch auffasst. D.h. man impliziert, dass der Abstand von 1 zwischen zwei Nachbarkategorien immer das gleiche bedeutet. Es gibt auch komplexere Verfahren, allerdings kann ich nicht beurteilen, ob sich der Einsatz hier lohnt.

--Sigbert (Diskussion) 11:03, 2. Okt. 2015 (CEST)

Hmmm, Danke erst mal für dei Beantwortung.

Die Anzahl der Bewertungsstufen ist erst mal ok. Durch die Bewertung sollen die sehr guten Objekte identifiziert werden, das heist durch die breite Masse der Menschen als "sehr gut" eingestuft. Aber da ist das Problem, wenn nur ein Mensch eine Bewertung abgibt - ist es nicht breite Masse. Ich habe das erst mal abstrakt formuliert, konkret geht es um das VorjuryTool bei WLM (Wikipedia:Wiki Loves Monuments 2015/Deutschland/Vorjury) es geht dabei um rund 39.000 Bilder die eine Bewertung brauchen. Jedes Bild soll eine Bewertung innerhalb der 5 Klassen bekommen.

So ganz habe ich das in deiner Antwort noch nicht heraus gelesen, was die Statistik "empfiehlt" wie groß "n " sein soll. Also wie viele Bewertungen ein Bild mindestens erhalten sollte. Zur Zeit sind alle Bilder mindestens 1x bewertet. Rund 5200 sind 2x (oder mehr) bewertet.

Angenommen ein Bild hat 4x sehr gut erhalten (5 Sterne) und 1x sehr schlecht (1 Stern). Das arithmetische Mittel wäre 4,2 - gerundet 4. Also nur 4 Sterne, obwohl ein Aussreißer dabei war. Aussreißer jetzt ohne Wertung, es kann sein, dass der eine Bewerter etwas anderes gesehen hatte oder sich einfach verklickt. Konsequenz ist aber, dass das Bild eine Kategorie/Bewertungsstufe abgerutscht wäre.

--Atamari (Diskussion) 11:21, 2. Okt. 2015 (CEST)

1.) Die Tests bzw. Effektstärken vergleichen die Mittelwertdifferenz der Bewertungen mit der Streuung der Bewertungen. Mit wenigen Bewertungen pro Bild bekommt man natürlich keine sinnvollen Wert für die Streuung (zumindest ist der noch unzuverlässiger als der Mittelwert). Ich vermute mal, es dürfte auch schwierig sein für alle Bilder z.B. mehr als 10 Bewertungen zu bekommen.

2.) Ich würde mal darüber nachdenken die Bilder zu gruppieren nach: nur ein Bewerter hat bewertet, nur zwei Bewerter haben das Bild bewertet, und so weiter bis zu einer Endgruppe "k oder mehr Bewerter haben das Bild bewertet". Und dann für jede Gruppe für den Mittelwert pro Bild eine Grenze festlegen.

3.) Gibt es eine Information, ob es pro Bild mehr Bewertungen hätte geben können? D.h. gesehen haben das Bild schon mehr Bewerter, aber sie haben einfach keine Bewertung abgegeben? Dann könnte man einen hypothetischen Bewertungswert pro Bewerter auf Basis der bewerteten Bilder berechnen. Allerdings würde das auch statistisch auf sehr schwachen Füssen stehen und aufwendig zu berechnen sein.

4.) Als Alternative für den Mittelwert käme noch der Median oder der Modus in Frage. Bei wenigen Bewertern läuft man da jedoch in Probleme: der Modus (häufigster Bewertungswert) kann bei wenigen Bewerter nicht eindeutig sein, was macht man dann? Der Median und der Mittelwert stimmen überein, wenn es weniger als drei Bewerter gibt. Bei deinem Beispiel würde sich zwar der Median zu 1 ergeben, jedoch findet damit eine Interpretation der schlechten Bewertung statt: sollte der mittlere Wert nicht 4,2 sein, falls ein Bewerter tatsächlich meint das Bild ist "sehr schlecht"?

5.) Ich würde mich darauf konzentrieren, dass die Bilder mit einem Bewerter noch einen zweiten Bewerter bekommen (insbesondere die, die mit "sehr gut" bewertet wurden) und danach darauf das Bilder mit zwei Bewertern möglichst drei Bewerter bekommen usw. Die Frage nach einer minimalen Anzahl der Bewertungen pro Bild macht in eurem Fall wohl wenig Sinn, denn meine erste Antwort wäre min. 30 damit der Zweistichproben-t-Test anwendbar ist.

--Sigbert (Diskussion) 12:57, 2. Okt. 2015 (CEST)

Das System ist so angelegt, dass möglichst viele Bewertungen abgegeben werden. Dem Bewerter wird immer ein Bild vorlegt, das bislang die wenigsten Bewertungen hat. Somit ist ein begrenzender Faktor die Zeit. Und das ist der etwa der 15. Oktober, weil wir dann an dem folgenden Wochenende die Endauswertung mit der (Haupt-)Jury machen. Also entspricht auch deinen Punkten 1) und 2). 3) würde ich als vernachlässigbar halten. Man kann zwar Bilder überspringen - das ist aber eher die Ausnahme.

Die Zahl von rund 30 Bewertungen für jedes Bild (also rund 39.000) ist theoretisch möglich, da mittlerweile 48 Personen bei der Bewertung mitmachen. Aber nicht jeder wird zigtausende Bilder bewerten. Im Moment ist ja jedes Bild 1x bewertet worden. 2x ist auch realistisch. Es ist aber noch nicht gewiss wo wir in einer Woche stehen bei 3x oder mehr. --Atamari (Diskussion) 15:15, 2. Okt. 2015 (CEST)

Dann würde ich das Vorwauswahlsystem grundsätzlich ändern (jetzt sicher nicht mehr zu realisieren):

1. Reduktion der Auswahlmöglichkeiten auf zwei Kategorien gut/nicht-gut

2. Anzeige einer Zufallsauswahl von k Bildern in dem mindestens ein Bild (evtl. genau ein Bild) als gut ausgewählt wird

3. Sind alle Bilder von min. 2 Bewertern gesehen worden, dann sollte die Wk. ob ein Bild in eine Zufallsauswahl für die nächsten Bewerter gelangt davon abhängen wie die beiden vorherigen Bewertungen waren. Wurde es zwei- oder mehrmals nicht als gut befunden, dann sollte die Wk. geringer sein (aber nicht Null), dass es nochmals einem anderen Bewerter gezeigt wird.

Im Marketing Bereich müsste es eigentlich Methoden und Literatur (z.B. Choice Experiment) geben wie man sowas am besten macht.

Viel Erfolg --17:10, 2. Okt. 2015 (CEST)

Wikiläum-Verdienstorden

Hallo Sigbert,

für Deine langjährige Wikipedia-Mitarbeit möchte ich Dir herzlich danken und folgende Auszeichnungen verleihen:

Hiermit gratuliere ich
Sigbert
zu 5 Jahren ehrenamtlicher Arbeit
im Dienst der Verbesserung unserer Enzyklopädie
und verleihe den

Wikiläums-Verdienstorden in Bronze
gez. --Bahrmatt (Diskussion) 15:49, 13. Feb. 2016 (CET)

Hiermit gratuliere ich
Sigbert
zu 10 Jahren ehrenamtlicher Arbeit
im Dienst der Verbesserung unserer Enzyklopädie
und verleihe den

Wikiläums-Verdienstorden in Silber
gez. --Bahrmatt (Diskussion) 15:49, 13. Feb. 2016 (CET)

Beispiel Korrelationskoeffizient

Hallo Sigbert, bei dem Beispiel des Korrelationskoeffizienten https://de.wikipedia.org/w/index.php?title=Korrelationskoeffizient&oldid=160193481#Empirischer_Korrelationskoeffizient hast du dich irgendwie verhaspelt. Wenn xquer 9 ist, müsste xi-xquer ja 1 ergeben usw. Guck doch mal drauf. Oder bin ich schon mächtig verkalkt? Gruß --Philipendula (Diskussion) 17:45, 29. Nov. 2016 (CET)

Nope, weiss nicht was mich da geritten hat. Habe die Werte mal korrigiert. Die Grafik und das Ergebnis stimmen jedoch. --Sigbert (Diskussion) 08:52, 30. Nov. 2016 (CET)

Dein Importwunsch von Lineare Regression nach Benutzer:Sigbert/Einfache lineare Regression

Hallo Sigbert,

Dein Importwunsch ist erfüllt worden. Es wurde folgende Seite angelegt:

Benutzer:Sigbert/Einfache lineare Regression

Viel Spaß beim Editieren weiterhin, -- TaxonBot • 11:35, 1. Dez. 2016 (CET)
ps: Wenn Du künftig nicht mehr über erledigte Importe informiert werden möchtest, trage Dich bitte in die Robinson-Liste ein.

Dein Importwunsch von Lineare Regression nach Benutzer:Sigbert/Multiple lineare Regression

Hallo Sigbert,

Dein Importwunsch ist erfüllt worden. Es wurde folgende Seite angelegt:

Benutzer:Sigbert/Multiple lineare Regression

Viel Spaß beim Editieren weiterhin, -- TaxonBot • 11:41, 1. Dez. 2016 (CET)
ps: Wenn Du künftig nicht mehr über erledigte Importe informiert werden möchtest, trage Dich bitte in die Robinson-Liste ein.

Einfache lineare Regression

Hallo Sigbert,

Ich habe den Artikel zur einfachen lineare Regression in deinem Benutzernamensraum gesehen und finde ihn sehr gut. Falls du Hilfe beim ausbauen brauchst sag bescheid. Liebe Grüße. --JonskiC (Diskussion) 20:09, 3. Apr. 2017 (CEST)

Tut dir keinen Zwang an Änderungen zu machen. Um die Artikel in den Namensraum einzubringen, müssen aber beide Artikel einfache und multiple lineare Regression fertig sein und der Ursprungsartikel mehr zu einem Übersichtsartikel mit Verweisen auf die Hauptartikel ausgebaut werden. Ich bin ein bisschen faul (vielleicht über Ostern) und die multiple Regression ist ja auch noch komplett offen. --Sigbert (Diskussion) 08:19, 4. Apr. 2017 (CEST)

Anonym

Suche

Benutzer Diskussion:Sigbert/Archiv/1

Der erste Eintrag :)

Sichtungsrechte

Herzlich willkommen auch von den Mitarbeitern des Portal:Mathematik

Behobene Redundanz?

Helferlein

{1} offen in Q?

Hotcat

Bedingter Erwartungswert

T-Test‎

Validität

Portal Statistik

Linkage_Clustering / Clusteranalyse

Weblinks

Weiterbearbeitung?

Kovarianz

Deine Nachricht vom 15.01.2011

Re: Dezimalpunkt

Clusteranalyse

F-Test

Definition Statistik

Minitab

Mitglieder des House of Lords

Quelle zu Effektstärke

Wikistudie

Fehlerbalken

Zufallsstichprobe

Dein Importwunsch

Bitte um Prüfung

Dein Importwunsch zu Korrelation

Dein Importwunsch zu Korrelation

Bitte um Prüfung (2)

Diskriminanzanalyse: Bilder

Dein Importwunsch zu en:BIRCH (data clustering)

Dein Importwunsch zu Clusteranalyse

Dein Importwunsch zu Clusteranalyse

Dein Importwunsch zu Clusteranalyse

Letzte Volkszählungen

statistische Frage

Wikiläum-Verdienstorden

Beispiel Korrelationskoeffizient

Dein Importwunsch von Lineare Regression nach Benutzer:Sigbert/Einfache lineare Regression

Dein Importwunsch von Lineare Regression nach Benutzer:Sigbert/Multiple lineare Regression

Einfache lineare Regression

Navigation

Wikiwerkzeuge

Seitenwerkzeuge

Weitere Projekte