Diskussion:Lineare Paneldatenmodelle

aus Wikipedia, der freien Enzyklopädie

Trennung

Könnte man den Artikel nicht besser in zwei Artikel aufteilen. Beide Modelle sind zwar eng verwandt, aber nicht identisch. Außerdem gibt es für beide Effekte auch deutsche Namen, sodass denglischen Stilblüten wie "Random-effects-Modell" leicht vermieden werden können. Auch "Modell" ist im Lemma verzichtbar. 85.178.186.249 21:39, 11. Nov. 2011 (CET)

Ich arbeite gerade an einer Überarbeitung/Neufassung des Artikels und wollte mich bisher am bisherigen Lemma orientieren und beides hier einstellen. Der Vorteil ist, dass ich die einleitende Darstellung zu OLS in Paneldatensätzen nur einmal schreiben brauche und dass man wahrscheinlich deutlicher herausarbeiten kann, welches Modell welchen Vorteil bietet, wenn man sie beide "auf der gleichen Seite" hat. Ich könnte aber auch mit einer Aufteilung leben. Mein Vorschlag zur Güte wäre: Ich fahre erst einmal mit der Überarbeitung fort (im Moment gibt es ohnehin nicht viel aufzuteilen ;) ), und danach schauen wir uns mal an, was mehr Sinn macht. Falls du etwas beitragen kannst und willst, bist du natürlich herzlich eingeladen! Viele Grüße,--SEM 22:00, 11. Nov. 2011 (CET) PS: Welche deutschen Namen meinst du? Habe bisher noch keine gefunden, also nur her damit!
Inzwischen habe ich weiter nachgedacht: Ich denke, du hast Recht, eine Trennung wäre besser. Werde das in den nächsten Tagen in Angriff nehmen (aus technischen Gründen wahrscheinlich nach der Überarbeitung).Gruß,--SEM 20:19, 13. Nov. 2011 (CET)
Danke für die tollen Ergänzungen. Zur Trennung gebe ich allerdings noch between-effects-Modelle zu bedenken. (z.B. hier --Zulu55 09:05, 14. Nov. 2011 (CET)
Dankeschön! Hm ja, der Between-Effects-Schätzer sollte dann auch noch eingebaut werden, und der Hausman-Test eigentlich auch. Hm... ich denke, ich fahre erst mal weiter fort und erweitere den Artikel, und dann schauen wir mal, ob die Trennung wirklich besser ist. Also zurück zu Plan A, sozusagen ;) Gruß,--SEM 09:44, 14. Nov. 2011 (CET)
So, ich bin inzwischen fertig. Im Moment tendiere ich dazu, dass besser beide Modelle in einem Artikel beschrieben werden sollten, da doch einiges klarer wird (z.B. der Hausman-Test). Aber ich bin offen für Kommentare und andere Vorschläge. Ich würde aber eine Verschiebung zu entweder Fixed- und Random-Effects oder Fixed- und Random-Effects-Modell anregen, das würde das Lemma weniger sperrig machen und ist in der Schreibung konsistent mit z.B. [1] Grüße,--SEM 23:04, 23. Nov. 2011 (CET)

Redundanzen zu Paneldatenanalyse

Dei Informationen zu den Modellen sollten aus Paneldatenanalyse (vorerst) hierher übertragen werden. Dort sind zusätzlich auch noch dynamische Modelle beschrieben. --Zulu55 09:54, 21. Nov. 2011 (CET)

Danke fuer den Hinweis, werde es bei meiner weiteren Bearbeitung beruecksichtigen. Gruesse,--SEM 12:31, 21. Nov. 2011 (CET)
Vieleicht sollte das Ganze auch in Panelmodell und Mehrebenenmodell umbenannt werden, um weitere zukünfitge Redundanzen mit Mehrebenenmodellen zu vermeiden. --Zulu55 13:44, 21. Nov. 2011 (CET)

Hm, mein Vorschlag wäre: Hier: Weiterer Ausbau (z.B. weitere im FE-Modell angewandte Schätzer, Hausman-Test, kurzer Ausblick auf Probleme im FE-Modell => Verweis zu dynamischen Panelmodellen), dann Abgleich mit Paneldatenanalyse, was da noch drinsteht und hier fehlt und ggfs. Ergänzung hier. Dann Kürzung von Paneldatenanalyse und stattdessen Verweis hierher. Bei dem Mehrebenenmodell bin ich aber ehrlich gesagt überfragt. Viele Grüße,--SEM 01:12, 22. Nov. 2011 (CET)

Für Nicht-Mathematiker unbrauchbar

Im Zusammenhang mit medizinischen Studien (bzw. Meta-Analysen) habe ich mich für eine Erklärung zu dem "fixed effect model" bzw. "random effects" interessiert. Dieser Artikel hier scheint zwar eine hübsche Zusammenfassung aus einem komplizierten mathematischen Werk zu sein, irgendwelche Erklärungen zur praktischen Verwendung (im wohl grössten Anwendungsgebiet) wird nicht gegeben. Des weiteren vermisse ich die Vermittlung eines Konzepts, welches über die mathematische Syntax hinausgeht. Für Personen, welche sich während des Studiums nicht intensiv mit Mathematik und Statistik auseinandergesetzt haben (und das ist wohl die grosse Mehrheit der Wikipedia-Leser), sind die hier aufgefürten Erklärungen unbrauchbar und verwirren mehr, als sie erklären können.

-- 193.5.216.100 09:45, 13. Dez. 2011 (CET)

Danke für deinen Kommentar. Nach Überfliegen des englischen Artikels zur Meta-Analyse scheint mir, dass das Problem eher darin liegt, dass die gleichen Wörter bei Paneldaten- und Metaanalysen etwas anderes bedeuten und dass der Artikel hier bisher nicht auf Metaanalysen eingeht. Ich werde mal versuchen, etwas dahingehend zu ergänzen in den nächsten Tagen und Wochen.Gruß,--SEM 10:25, 13. Dez. 2011 (CET)

Unverständlich

Normalerweise hätte ich diesen Artikel sofort zur Löschung vorgeschlagen, da der Inhalt nur für Extrem-Spezialisten verständlich ist. Ich erkenne aber die gute Absicht des Hauptautors durch die Meldung auf der 3M und biete daher meine Hilfe bei der Übersetzung des Artikels ins Deutsche an. Fangen wir also an:

  1. Jemand, der FREM versteht, braucht diesen Artikel nicht. Brauchen tun ihn nur Leute, die es nicht verstehen. Das entspricht im Allgemeinen dem Hauptnutzen von Wikipedia.
  2. Jemand, der FREM nicht versteht, braucht mindestens 10 weitere Erklärungen, um den Einleitungstext zu verstehen. ABER:"Die Wikipedia ist eine allgemeine Enzyklopädie und kein Fachbuch und sollte ... so allgemeinverständlich wie möglich sein, aber das jeweilige Thema in angemessener Breite und Tiefe darstellen, und den Zugang zum Thema so einfach wie möglich gestalten (besonders in der Definition und Einleitung, da diese im Allgemeinen zuerst gelesen werden)".

... dieses bietet dieser Artikel nicht - darüber sind wir uns sicherlich einig. Versuchen wir also, den Artikel zu übersetzen - dazu biete ich folgende Herangehensweise an:

  • Ich (Friedrich Graf) bin Fotograf, Systemadministrator, Lehrausbilder und programmiere einige Dinge. Mein Problem: ich verstehe noch nicht einmal, worum es in diesem Artikel geht, Wenn also ich, als überdurchschnittlich gebildeter Leser, dieses nicht verstehe, wie geht es den anderen?

Erkläre mir daher bitte, worum es im Artikel geht. Danach konnen wir den Artikel "Stück für Stück" ins Deutsche übersetzen. --Friedrich Graf 14:20, 7. Jan. 2012 (CET)

Hallo Friedrich und vielen Dank für deine Beteiligung: Nur eine Bitte: Könnten wir die Diskussion hierüber bitte in der Reviewdiskussion weiterdiskutieren? Dort wird bereits über den Artikel und über eine verständlichere Einleitung diskutiert, und da sich dort auch ein paar andere beteiligt haben, wäre es in meinen Augen einfacher, die Diskussion dort fortzuführen. Gruß,--SEM 15:16, 7. Jan. 2012 (CET)

... habe ich mir durchgelesen und eine (sehr) grobe Ahnung bekommen. Ich werde mich dort aber nicht an der Diskussion beteidigen, denn hier werden zuviele Interessen durcheinandergebracht:

  • lesenswert Kandidatur vorbereiten
  • die Bestätigung von Fachkollegen einholen
  • 3M zur Artikelqualität einholen usw.

Mir geht es ausschliesslich um die Übersetzung ins Deutsche - sprich die "Laienverständlichkeit". Wenn daran kein Interesse besteht, verlasse ich diese Baustelle wieder kommentarlos. --Friedrich Graf 18:10, 7. Jan. 2012 (CET)

Ich sehe nicht, wie hier Interessen durcheinander geworfen werden: Ziel des Reviews war/ist die Vorbereitung einer Lesenswert-Kandidatur, wozu auch die Laienverständlichkeit/ OMA-Tauglichkeit gehört. Die 3M ergab sich aufgrund des Reviews da wir bei der Formulierung der Einleitung in der Diskussion nicht weiterkamen- die 3M-Anfrage bezog sich vor allem auf die Einleitung (siehe meine Formulierung dort). Was du mit "Bestätigung von Fachkollegen" meinst, weiß ich nicht. Selbstverständlich habe ich Interesse daran, dass der Artikel verstanden wird, ich verstehe aber ehrlich gesagt nicht ganz, warum das nicht im Review geschehen kann, wo es auch noch andere Diskutanten gibt, die, wie z.B. der IP-Diskutant, ein ähnliches Anliegen haben wie du. Viele Grüße,--SEM 18:28, 7. Jan. 2012 (CET)

Kein Problem - ich wollte dich nicht angreifen. Meine Äußerungen beziehen sich nicht ausschliesslich auf deine Absichten. Aber durch die Wahl der verschiedenen Disussionsbühnen ist der Fokus der Diskussionen sehr unscharf (ich rede nicht von deinen alleinigen Meinungsäußerungen). Um jetzt keine Wortklauberei zu betreiben: ich sehe nicht, das die von dir favorisierte Diskussionsbühne eine Verbesserung des Artikels im Sinne der Laienverständlichkeit bringen kann.
Ich mache es einfach: ich werde dieses Lemma von meiner Beobachtungsliste nehmen und wünsche dir bei dem von dir gewählten Weg ehrlichen Herzens viel Erfolg. Solltest du später unzufrieden mit dem Erreichten sein, kannst du mich natürlich gerne wieder ansprechen. BG --Friedrich Graf 19:15, 7. Jan. 2012 (CET)

Sorry, ich habe deinen Abschnitt in Bezug auf die Interessen in der Tat ein wenig in den falschen Hals bekommen ;) Nach der nochmaligen Konkretisierung kann ich deine Argumente allerdings zumindest teilweise nachvollziehen und würde dich deswegen bitten, den Artikel auf der BL zu lassen und hier weiterzudiskutieren. Mein ursprüngliches Ziel war einfach, die Diskussionen etwas zusammenzuhalten, aber ich kann dein Argument nachvollziehen, dass im Review ein anderer Arbeitsfokus und ein anderes Publikum vorliegt. Viele Grüße,--SEM 19:39, 7. Jan. 2012 (CET)

Konkrete Fragen

  1. Läßt sich dieses "Nachbildung von Wirkmechanismen" konkretisieren?
    Mir ist bewußt, das es bei mathematischen Modellen eher um die Verallgemeinerung geht. Aber hier geht es um die Anwendung (beispielsweise) bei Sozialwissenschaften. Deren Bandbreite wiederum ist so groß, das es hier sicherlich konkreter geht (Gegenfrage: können mit den Modellen des Lemma schulpädagogische Fragen beantwortet werden? Sicherlich nicht.)?!
  2. "Unter bestimmten Voraussetzungen" - läßt sich das für einen Laien konkreter machen? Beispielsweise in diesem Sinne: "Unter der Voraussetzung, das in einer komplexen Sozialsituation einzelne Elemente voneinander klar zu trennen und mathematisch präzise dargestellt werden können, kann die folgende Formel ..."

Die restlichen Fragen später. --Friedrich Graf 20:56, 9. Jan. 2012 (CET)

  1. Hm, eine Formulierung, die mir in den Sinn kommt und zumindest ein wenig präziser ist wäre "Abbildung kausaler Zusammenhänge". Die Sache hier ist natürlich auch: Modellieren lässt sich ja prinzipiell alles, die Frage ist dann, ob ich es auch sinnvoll schätzen kann ;) Wäre "Abbildung kausaler Zusammenhänge" deswegen immer noch zu unkonkret? Das Problem ist nämlich in meinen Augen, dass die Bandbreite hier eben wirklich sehr groß ist (nicht umsonst macht man den Ökonomen ja oft den Vorwurf, sie seien die "imperialistischen Sozialwissenschaftler". Zu deiner Gegenfrage: Kommt drauf an, was genau du unter "schulpädagogisch" verstehst. Es gibt ökonomische Studien zu den Effekten von Klassengröße, peer-effects und der Gestaltung der Notengebung auf die Leistung der Schüler; in manchen davon werden auch Fixed-Effects-Schätzer verwendet, meist sind die aber nur ein Teil der Identifikationsstrategie. Aber du siehst: Ja, grundsätzlich lässt sich die Idee auch auf schulpädagogische Fragen anwenden.
  2. Hm ja und nein, das ist in einem gewissen Sinne ein Henne-Ei-Problem. Die Voraussetzungen werden ein paar Zeilen später geschildert, es kommt auf die Korrelation der individuellen Heterogenität mit den erklärenden Variablen drauf an. Und das ist mein Problem: Fange ich mit den eigentlich Voraussetzungen an, wird der Leser gleich in eine Flut von Fremdwörtern und ihm wahrscheinlich unbekannten Begriffen (individuelle Heterogenität, exogen,...) geworfen; schreibe ich nur von "Voraussetzungen" kommt die berechtigte Frage, was diese denn sind.

Ich versuche es mal mit einem Beispiel: Nehmen wir das Beispiel des Effektes von Bildung auf den Lohn. Ich möchte wissen wie sich, im Erwartungswert, der Lohn einer Person ändert, wenn er mehr Bildung hat. Ich sammle Daten über Lohn, Bildung und weitere Variablen, von denen ich denke, dass sie mit der Bildung und mit dem Lohn korreliert sind: Alter, Berufserfahrung, Geschlecht, Bildung der Eltern, ggs. andere Variablen für den familiären Hintergrund etc. Nun ist mir aber bewusst, dass es daneben auch Variablen gibt, die ich nicht genügend erfassen kann. Sagen wir, es gäbe eine gewisse angeborene "Eignung" (bspw. Intelligenz in all ihren Facetten). Diese kann ich nicht messen, sie ist aber höchstwahrscheinlich relevant. Wenn ich das glaube, bin ich in der Welt von RE und FE angekommen, ich denke dann schon, wenn du willst, in einem Random- oder Fixed-Effects-Modell. In welchem Modell ich bin, hängt davon ab, was ich glaube: Bin ich der Meinung, dass die angeborene Eignung nicht mit der Bildung korreliert ist, so ist es ein RE-Modell. Bin ich der Meinung, dass sie mit der Bildung korreliert ist, ist es ein FE-Modell. Die Frage der Korrelation zwischen der unbeobachteten Variable (Eignung) und der/den erklärenden Variable(n) (Bildung) ist also zentral. Und je nachdem, welche der beiden Annahmen ich treffe (Unkorreliertheit oder nicht) lässt sich dann eben ein anderer Schätzer herleiten. Was ich in der Einleitung versuche ist, diese Idee abstrakt, also ohne Beispiel, rüberzubringen, und das ist zugegebenermaßen extrem schwer. Gruß und an dieser Stelle schon einmal danke,--SEM 22:12, 9. Jan. 2012 (CET)

A.) Ich verstehe ungefähr den Rahmen, um den es geht. Meine Gegenfrage hatte einen anderen Hintergrund:

  • ca. 30% der Abgänger des MIT sind in den letzten 10 Jahren mit viel Geld in die Welt der Finanzen gelockt worden. Ihre Aufgabe dort bestand im wesentlichen in der Profitmaximierung des Derivatehandels. Das dies in den letzten Jahren für viele Börsianer trotzdem in Problemen geendet hat, zeigt die Grenzen dieser Berechnungsmodelle. Es gibt 2 Arten mit diesen Grenzen umzugehen. Zum einen immer mehr Informationen besorgen (die Wetterforschung ist ein gutes Beispiel dafür) oder die Grenze definieren (die Konsumforschung tut dies gerne - beispielsweise bei den Einschaltquoten).
  • Nach meiner Logik hat jedes System und jedes Modell seine Grenzen. Ich meine das wertfrei.
  • Wenn es also eine Grenze gibt, dann läßt sich auch nicht sagen "Modellieren lässt sich ja prinzipiell alles".

Was ist also die Grenze - in der diese Modelle agieren können?

B.) Du schreibst: "... es kommt auf die Korrelation der individuellen Heterogenität mit den erklärenden Variablen drauf an."
Ich werde diesen Satz mal "ins Deutsche" übersetzen: "Gib mir die richtigen Fakten und den richtigen Zusammenhang, dann kann ich alles berechnen." Wenn ich das jetzt richtig verstanden habe, dann sind wir wieder bei Punkt A. Also: wo ist die Grenze ...
--Friedrich Graf 22:40, 9. Jan. 2012 (CET)

Okay, wir haben ein wenig aneinander vorbeigeredet; ich dachte, dir geht es um die Voraussetzungen, wann RE und FE besser sind als OLS. Zunächst: Die Bezeichnung "Modell" macht mir immer mehr Kopfschmerzen (ist aber so in der Literatur Standard), da sie auch ein wenig suggeriert, es gebe notwendigerweise ein theoretisches Modell hinter jedem geschätzten kausalen Zusammenhang, was aber nicht unbedingt sein muss. Modell heisst hier vor allem: Theoretische Annahmen an die zu verarbeitenden Daten. Nun fragst du nach Grenzen, und das lässt sich prinzipiell auf verschiedene Arten beantworten:

  • Wann kann man das Modell auf Daten anwenden? => Wie gesagt ist das Modell bloß eine Sammlung von Annahmen an die Daten. Annahmen kannst du prinzipiell auf alle Daten loslassen, in dem Fall sollten es aber Panel- oder Multileveldaten sein. Davon abgesehen kannst du aber rein von der Machbarkeit her alles in so ein Modell zwängen. Die Frage ist, wie sinnvoll ist das. Du solltest zumindest eine Idee haben, dass gewisse X einen Einfluss auf das y haben, sodass du nicht Sonneneruptionen auf den Benzinpreis in Castrop-Rauxel regressierst. Woher diese Idee kommt- nun, das ist offen: Frühere Studien, theoretisch-formale Modelle, verbale Argumente, gesunder Menschenverstand,...
  • Wann ist das Modell "richtig"? Die grobe Antwort hierauf lautet: Wenn die Annahmen des Modells erfüllt sind. Und hier ist das Problem, denn das ist etwas, das man nicht oder sehr schlecht testen oder verifizieren kann. Hier kommt es in meinen Augen schlichtweg darauf an, ob der Autor den Leser überzeugen kann, dass sein postulierter Wirkzusammenhang "realistisch" ist. Die Sache ist, dass, im Gegensatz zur Börse, nicht so "einfach" gesagt werden kann, ob das Modell erfolgreich ist. Erfolreich ist eine FE-Schätzung im wissenschaftlichen Sinne so lange, bis jemand mit einer "besseren" Identifikationsstrategie kommt und zeigt, dass der Effekt ein anderer (größerer/kleinerer, mit umgekehrterm Vorzeichen) ist, dass der FE-Schätzer also über/unterschätzt.
  • Wann ist das Modell "sinnvoll" im Sinne von besser als andere Methoden? Auch hier wieder die grobe Antwort: Das Modell ist dann sinnvoll, wenn es neben den beobachteten Variablen unbeobachtete Variablen gibt, die über die Zeit konstant sind und nicht in die Regression mit aufgenommen werden können. In diesem Falle ist es nämlich besser als eine Kleinste-Quadrat-Schätzung. Das Modell ist nicht sinnvoll, wenn es solche unbeobachteten Variablen nicht gibt, und es ist nicht sinnvoll, wenn es weitere Endogenität gibt, z.B. aufgrund von Messungenauigkeit, umgekehrter Kausalität (y hat einen Effekt auf x, aber x hat auch einen Effekt auf y) oder wenn sich die unbeobachteten Variablen nicht adäquat über einen indiviuums-spezifischen, zeit-konstanten Effekt "auffangen" lassen. Gruß,--SEM 09:38, 10. Jan. 2012 (CET)

... mal eine kleine Zwischengeschichte zum Thema "statistische Auswertung". Hat aber natürlich wenig mit unserem Lemma zu tun :-) ... --Friedrich Graf 14:14, 10. Jan. 2012 (CET)

Grenzen - und Vorteile gegenüber Experimenten

Die Grenzen sollten vielleicht eher im Artikel Paneldatenanalyse erläutert werden. Generell gilt: Kausalität lässt sich nur bedingt abbilden:

  • Ein deutliches Defizit gegenüber Experimenten ist das unvermögen, bei einem Effekt nachzuweisen, dass die Veränderung einer unabhängigen Variable wirklich die Ursache ist. Beispiel aus der Schulpädagogik: Im Jahr 2000 haben die Schüler einer Schule die den Notendurchschnitt von 3,0. Es wird im Jahr 2001 ein neues Lehrverfahren eingeführt und beibehalten (z.B. späterer Schulbeginn). Im Jahr 2001 haben die Schüler einen Notendurchschnitt von 2,5, und im nächsten Jahr von 2,0. Auch auf Individualebene ließe sich nun im Beispiel dank der verwendeten Paneldatenanalyse nachweisen, dass jeder Schüler besser wird (es wäre ja bei der Querschnittsbetrachtung möglich gewesen, dass nur wenige Schüler sehr viel besser werden und so den Schnitt anheben). Die Paneldatenanalyse würde nun i. d. R. so interpretiert werden, dass ein kausaler Effekt von der neuen Lehrmethode auf die bessren Noten besteht. Das muss aber nicht sein:
    • Es könnte eine nicht gemessene Drittvariable verantwortlich sein, die gleichzeitig mit der neuen Lehrmethode auftrat, etwa das die Schule mehr Geld bekommen hat, und daher neue Bücher angeschafft wurden, die für die Schüler viel besser verständlich sind.
    • Es könnte sogar so sein, dass der kausale Effekt umgekehrt ist: Durch Verbesserung der Leistungen hat sich die Schule als dankeschön überlegt, den Schulbeginn morgens etwas später zu starten. D.h.: Ohne inhaltliche Ahnung kann man mit der Paneldatenanalyse viel Unsinn treiben.
  • Der Vorteil gegenüber Experimenten liegt in der Praxisnähe. Viele sozialwissenschaftliche Sachverhalte lassen sich nicht im Experiment nachbilden, da die Konstanthaltung exogener Faktoren einen zu großen Einschnitt in das Leben der betroffen Menschen darstellen würde. Siehe auch Quasi-Experiment, Forschungsdesign, Experimentelle Ökonomik, Experimentelle Psychologie (und evtl. Menschenversuch)--Zulu55 09:21, 10. Jan. 2012 (CET)

Ja, das ist ein weiterer sehr guter Punkt: In meinen Augen ist FE/RE und die Paneldatenanalyse historisch ein Schritt hin zu Quasi-Experimenten etc. Sozusagen am Anfang war die Kleinste-Quadrat-Schätzung; diese hat Probleme, wenn es zu Endogenität (d.h. Korrelation zwischen dem Fehlerterm und der erklärenden Variable) kommt. Für einen möglichen Grund der Endogenität (das Auslassen von nichtbeobachtbaren, zeitkonstanten, individuumspezifischen Faktoren) schafft die Paneldatenanalyse in Verbindung mit FE/RE-Schätzern Abhilfe, für andere Punkte muss man dann auf Instrumentvariablen, Regressions-Diskontinuitäts-Analysen, Natürliche oder Laborexperimente und andere Forschungsdesigns zurückgreifen. --SEM 10:01, 10. Jan. 2012 (CET)

Ja, das ist die Grenze, die ich meine - Danke.
Ich werde das ganze mal in meinem Kopf etwas bewegen und würde danach folgende Verfahrensweise vorschlagen:

  1. Wir arbeiten direkt im Lemma - es arbeitet sich einfach am praktischsten. Jeder Unsinn von mir kann ja problemlos rückgängig gemacht werden.
    1. Ich selbst werde reine Fakten niemals ohne Rücksprache löschen - was ich tun werde ist es, diese (Fakten) ggfl. weiter nach hinten (im Text) zu schieben.
  2. Am Anfang (über dem Inhaltsverzeichnis) werde ich versuchen einen extrem-einfach Text zu formulieren. Danach würde ich ein Kapitel "Grundlagen" machen, indem ich die in der jetzigen Einleitung genannten Fakten reinpacke.
  3. Nach der Absegung der neuen Einleitung würde ich den restlichen Inhalt etwas umbauen (reine Sortierarbeit).
  4. Danach seid ihr wieder gefragt, mit fachlichen Details ...

BG --Friedrich Graf 14:53, 10. Jan. 2012 (CET) P.S. Später würde ich oben im Text gerne ein Foto von irgendeiner Menschenmenge oder etwas anderen einfügen. Das ganze mit einem erklärenden Satz. Aber dazu kommen wir später ...

Review-Diskussion (6. Dezember 2011 - 10. Januar 2012)

Der Artikel war in der QS-Mathematik/Wirtschaft/Soziologie und wurde von mir, unter tatkräftiger Mithilfe von Mitarbeitern der genannten Portale (diese math-Umgebung macht mich noch fertig ;) ) komplett überarbeitet und ergänzt. Da am Ende ein in meinen Augen sehr ordentlicher Artikel rausgekommen ist, dachte ich mir, dass ich diesen hier einstelle, um festzustellen, wie es in Bezug auf eine mögliche Kandidatur für die lesenswerten Artikel aussieht. Ich hoffe, dass sich trotz der wahrscheinlich etwas trockenen Kost der ein oder andere Reviewer findet und bitte um Kommentare und Anregungen, insbesondere in Bezug auf die OMA-Tauglichkeit, denn gerade da bin ich halt ein wenig "betriebsblind". Viele Grüße,--SEM 11:29, 6. Dez. 2011 (CET)

Halle SEM, habe wie meist erstmal die nur Einleitung gelesen. Okay, die meisten Laien werden sich nicht angesprochen fühlen. Denn mangels Fachkenntnissen ist der Laie bei Artikeln wie diesen auf viele Links angewiesen, er muss also quasi mindestens ein Dutzend Artikel lesen. Das meine ich aber nicht negativ. In der Einleitung könnten mMn gerne noch Wikilinks auf die Begriffe 'Schätzung' und/oder 'Schätzer', 'Heterogenität' und evtl. 'Endogenität' ergänzt werden. Danke und Gruss --Toni am See 08:03, 7. Dez. 2011 (CET)
Ich sehe gerade: Hast du deine Random-Effects-Kovarianzmatrix falsch? Und die Unkorreliertheit der Fehler ist bei Gauss-Markow verletzt, die Diagonalelemente sind alle gleich. --Erzbischof 10:41, 7. Dez. 2011 (CET)
Vielen Dank euch beiden! Links zu Exogenität, Schätzung und Heterogenität habe ich eingefügt (Endogenität war bisher- recht unvorteilhaft- bei "exogen" verlinkt). Erzbischof: Ja, ein Subskript war falsch, danke. Wegen Gauss-Markov: Hm ja, ist immer so eine Sache. Manche verstehe unter heteroskedasticity nur ungleiche Varianzenn (also ungleiche Diagonalterme), an anderer Stelle umfasst heteroskedasticity auch Autokorrelation der Fehlerterme. Aber hier macht es wohl in der Tat mehr Sinn, mit dem Gauss-Markov-Artikel der Wikipedia konsistent zu sein. Viele Grüße,--
Ich meinte, du hast Diagonal- und Nichtdiagonalelemente vertauscht. Nebenbei: Daraus, dass die Voraussetzungen von Gauss-Markov nicht erfuellt sind, folgt erstmal nichts. --Erzbischof 16:14, 7. Dez. 2011 (CET)
Hoppla, ja, danke, bei der Matrix war einiges falsch. Das mit Gauß-Markov habe ich etwas umformuliert. Gruß und danke,--SEM 23:31, 7. Dez. 2011 (CET)

Auf der Diskussionsseite wurde angesprochen, dass der Artikel nichts zu Random- und Fixed-Effects in Metaanalysen enthält. Das ist korrekt, allerdings scheint mir, dass die dort verwendeten Bezeichnungen (siehe [2]) etwas ziemlich anderes sind (kein Panelcharakter, Schätzung im RE-Fall durch restricted Maximum Likelihood, RE ist das präferierte Modell,...). Ich überlege deswegen, ob es ratsam ist, den Artikel hier auf Random- und Fixed-Effects (Paneldaten) zu verschieben und darauf hinzuweisen, dass es auch Random-Effects und Fixed-Effect (Metaanalyse) gibt. Kommentare/Gegenargumente hierzu? --SEM 19:56, 16. Dez. 2011 (CET)

Ich verstehe nur Bahnhof. Ein Bild/Diagramm würde mir sicherlich helfen. 79.193.49.50 17:26, 18. Dez. 2011 (CET)

Hm, das mit Bildern und Diagrammen ist leider nicht so einfach, da es sich dabei ja um rein abstrakte Konzepte handelt. Ich schau mich mal um, was man zur Illustration benutzen könnten. Grüße,--SEM 17:42, 18. Dez. 2011 (CET)
Abstrakte Konzepte? Es wird doch sicher Datensätze geben, an die die hier behandelten Modelle angepaßt wurden. Oder? 79.193.22.101 13:12, 20. Dez. 2011 (CET)
Mit abstraktem Konzept meine ich, dass ein "Fixed Effect" eben ein theoretisches Konzept ist, ein Achsenabschnitt einer Regression, wenn man so will und als solcher in den meisten Fällen keine Größe von Interesse ist (deswegen wird er im FE-Schätzer ja auch durch Durchschnitsbildung aus dem Modell entfernt) und sich deswegen schwer visualisieren lässt. Beispiele für Studien gibt es ja, und es sind ja bereits zwei im Artikel genannt, aber auch die lassen sich schwer in Grafiken verpacken. Ich habe zunächst einmal eine Grafik eingefügt, die verdeutlicht, was genau ein konsistenter Schätzer ist. Grüße,--SEM 13:29, 20. Dez. 2011 (CET)
PS: Ich habe das Beispiel nun ein wenig prominenter platziert und mehr ausgeführt. Hilft das dem Verständnis?
Ok, dann will ich etwas deutlicher werden. Als Fixed-Effects- und Random-Effects-Modelle bezeichnet man verfeinerte Verfahren der linearen Regressionsanalyse, die in Verbindung mit Paneldaten verwendet werden können (siehe auch Paneldatenanalyse). Die beiden Modelle erlauben eine im Vergleich zur Methode der kleinsten Quadrate bessere Schätzung Modelle sind keine Verfahren, sondern Modelle. Verfahren sind Methoden, um Modelle an Daten anzupassen, d.h. um die entsprechenden Modellparameter zu schätzen. Insofern erlauben die Modelle an sich keine Schätzung, vielmehr benötigt man einen Schätzer. Im Artikel werden diese Begriffe munter durcheinandergewürfelt. Dann werden die Schätzungen mal durch Querstrich, dann wieder durch Zirkumflex gekennzeichnet - totales Chaos. Also mir vergeht da die Lust weiterzulesen. Es wird auch nirgendwo in der Einleitung motiviert, warum man gerade solche speziellen (linearen) Modelle anpassen will. Gerade in der Ökonomie sollte es doch anschauliche Beispiele geben. Wie man den/die Schätzer herleitet, mag der geneigte Leser der weiterführenden Literatur entnehmen oder entsprechende Softwarepakete benutzen. Auch gehören Fachbegriffe (Heterogenität, Endogenität, ...) möglichst nicht in die Einleitung. 79.193.26.108 16:01, 21. Dez. 2011 (CET)


Der Reihe nach:
  • Modell/Verfahren/Schätzer: Da hast du Recht, das war in der Einleitung durcheinander gewürfelt.Ich habe den Text allerdings nochmals durchgelesen, und mir ist sonst keine Stelle aufgefallen, wo dies vorkommt.
  • Dann werden die Schätzungen mal durch Querstrich, dann wieder durch Zirkumflex gekennzeichnet - totales Chaos Ich sehe deswegen keine Inkonsistenz in der Notation: Wenn ich eine theoretische Gleichung aufstelle, werden die Koeffizienten (Beta, Omega, sigma) nicht eigens gekennzeichnet; wird dagegen der Schätzer benutzt, habe ich ihn immer mit einem Zirkumflex gekennzeichnet. Der Querstrich kommt nur dort vor, wo ein Durchschnitt gebildet wird, und dort wird auch erklärt, was die Querstrich-Notation bedeutet- z.B. im Abschnitt Fixed-Effects/Within-Schätzer: „Das zu schätzende Modell wird also zu [...] wobei...“.
  • Auch gehören Fachbegriffe (Heterogenität, Endogenität, ...) möglichst nicht in die Einleitung. Grundsätzlich korrekt- aber hier geht es schlichtweg nicht anders. Das ganze RE/FE-Zeug baut eben auf der Problematik der Endogenität auf- ohne Endogenität gibt es keine Bedarf für RE/FE, dann ist die Methode der Kleinsten Quadrate fast immer ausreichend. Ich habe noch ein paar Informationen ergänzt, aber viel Verbesserungspotential sehe ich eben (leider) nicht. Die weiterführenden Links sind hier halt einfach sehr wichtig, weil der Artikel nicht wirklich verstanden werden kann, wenn nicht klar ist, was ein konsistenter Schätzer ist. Falls du einen besseren Weg weißt, lass es mich wissen.
  • Es wird auch nirgendwo in der Einleitung motiviert, warum man gerade solche speziellen (linearen) Modelle anpassen will. Gerade in der Ökonomie sollte es doch anschauliche Beispiele geben. Werde versuchen, noch etwas einzubauen. Viele Gr+ße,--SEM 18:18, 21. Dez. 2011 (CET)

PS: An einer Grafik arbeite ich.

Ausstieg schon im ersten Satz der Einleitung. Etwas allgemeiner bitte. Etwa so: Als Fixed-Effects- und Random-Effects-Modelle werden hauptsächlich in den Wirtschaftswissenschaften spezielle mathematische Konstrukte zur Nachbildung von ökonomischen Wirkmechanismen bezeichnet. Die genaue Spezifikation der Modelle erfolgt durch theoretische Vorüberlegungen und die statistische Auswertung empirischer Daten. DAS ist eine abtrakte Beschreibung ohne viel Fachchinesisch. Vielleicht sollte man noch erwähnen, dass diese Modelle häufig eingesetzt werden. Der Rest (Paneldaten, mathematische Formulierung, Abhängigkeiten in den Daten, etc.) kann in den Artikel. 79.193.26.108 20:10, 21. Dez. 2011 (CET)
Nein, das gefällt mir nicht. Der Satz ist korrekt, aber zu generell, den könntest du so genauso in zig weitere Artikel schreiben. Wenn außerdem, wie du dir das vorstellst, das die alleinige Einleitung ist, dann wird sie auch den Anforderungen an die Einleitung, die hier bei Wikipedia herrschen, nicht gerecht: Unmittelbar darauf sollte eine kurze Einleitung mit einer Zusammenfassung der wichtigsten Aspekte des Artikelinhalts folgen. Die Einleitung sollte dem Leser einen kurzen Überblick über das Thema ermöglichen und das Lemma bereits ausreichend erklären. Das ist hier nicht der Fall, der Leser weiß dann zwar, dass es RE/FE-Modell ein mathematisches Konstrukt zur Nachbildung von ökonomischen Wirkmechanismen ist, hat aber immer noch keine Ahnung, wozu es eingesetzt wird und worum es überhaupt geht. Dein Einstieg gefällt mir, aber ich würde es vielleicht so formulieren:

Als Fixed-Effects- und Random-Effects-Modelle werden hauptsächlich in den Sozialwissenschaften verwendete mathematische Konstrukte zur Nachbildung von Wirkmechanismen bezeichnet. Sie können als Verfeinerung der linearen Modelle angesehen werden und finden in Verbindung mit Paneldaten und Mehrebenenanalysen Andwendung. Die auf Basis der beiden Modelle entwickelten Schätzer erlauben eine im Vergleich zur Methode der kleinsten Quadrate bessere Schätzung, wenn neben den beobachteten erklärenden Variablen individuelle, über Zeit konstante Heterogenität besteht ...-gefolgt vom Rest --SEM 22:25, 21. Dez. 2011 (CET)

Ok, verstehe. eine im Vergleich zur Methode der kleinsten Quadrate bessere Schätzung Was genau bedeutet "besser"? Etwas präziser: Als Fixed-Effects- und Random-Effects-Modelle werden hauptsächlich in den Sozial- und Wirtschaftswissenschaften verwendete mathematische Konstrukte zur Nachbildung von Wirkmechanismen bezeichnet. Diese Modelle wurden insbesondere hinsichtlich einer effektiven Auswertung von sog. Paneldaten konstruiert und gehören zur Klasse der linearen Regressionsmodelle. Unter bestimmten Voraussetzungen für die zu verarbeitenden Daten können Verfahren (Schätzer) für die Regression eingesetzt werden, deren Effizienz höher als die der weithin verwendeten Methode der Kleinsten Quadrate ist. Der Wikipedia-Artikel zur linearen Regression ist sehr gut und die darin verwendete Notation sollte im Sinne besserer Verständlichkeit übernommen werden. 79.193.55.216 19:53, 22. Dez. 2011 (CET)

"Besser" kommt eben auf das Modell drauf an-im RE-Modell ist die Kleinste-Quadrat-Schätzung ja immer noch konsisten, der RE-Schätzer ist effizienter; im FE-Modell dagegen ist die KQ-Schätzung inkonsistent. Als Fixed-Effects- und Random-Effects-Modelle werden hauptsächlich in den Sozial-und Wirtschaftswissenschaften verwendete mathematische Konstrukte zur Nachbildung von Wirkmechanismen bezeichnet. Diese Modelle wurden insbesondere hinsichtlich einer effektiven Auswertung von sog. Panel- und Mehrebenen-Daten [Abschnitt zu FE/RE in der Mehrebenen-Analyse ist in Arbeit] konstruiert und gehören zur Klasse der linearen Regressionsmodelle. Unter bestimmten Voraussetzungen für die zu verarbeitenden Daten können Verfahren (Schätzer) für die Regression eingesetzt werden, die gegenüber der weithin verwendeten Methode der Kleinsten Quadrate vorteilhaft sind. Die Vorteile der Random-Effects- und Fixed-Effects-Schätzer treten dann auf, wenn bestimmte individuums-spezifische Größen wie Motivation und Fähigkeit nicht erfasst und als Kontrollvariable in die Regression mit aufgenommen werden können (sog. individuelle Heterogenität). * Im Random-Effects-Modell wird davon ausgegangen, dass diese Heterogenität exogen ist ...usw --SEM 21:13, 22. Dez. 2011 (CET)

Ich schlage nun vor, auf eine dritte Meinung zu warten. 79.193.55.216 22:38, 22. Dez. 2011 (CET)

Ok; Ich habe es auch einmal auf WP:DM eingetragen, dann geht es vielleicht ein wenig schneller. Grüße,--SEM 18:09, 23. Dez. 2011 (CET)

Will wohl keiner :o( 79.193.53.17 13:26, 30. Dez. 2011 (CET)
Scheinbar nicht :( --SEM 10:00, 31. Dez. 2011 (CET)
Doch, ich will schon, hatte aber über die Feiertage nicht ausreichend Zeit, mir das genauer anzusehen. Hab ich nun getan, und gesehen, dass Eure beiden Entwürfe zunächst weitgehend gleich sind; erst gegen Ende der vorgeschlagenen Passagen wird SEM deutlicher - und meiner Einschätzung nach auck damit korrekter. Was evtl. insgesamt noch klarer herausgearbeitet werden sollte (könnte) ist die Unterscheidung zwischen einem RE-/FE-Modell und einem RE-/FE-Schätzer. Hoffe diese (erste?) dritte Meinung hilft, --AMH-DS 15:35, 4. Jan. 2012 (CET)
Vielen Dank für deine Beteiligung! Bezüglich der Unterscheidung zwischen Schätzer und Modell: Siehst du die Schwäche dort eher im Artikel oder eher in der Einleitung,oder in beidem? Viele Grüße,--Stephan

Weitere Überarbeitung

So, damit wir (damit meine ich vor allem Benutzer:Zulu55, Benutzer:Friedrich Graf und ich, ggfs. andere) sich besser koordinieren können, habe ich einmal das Review beendet, hier archiviert und schlage vor, die Diskussion nun konzentriert hier fortzuführen. Friedrichs Einleitungsvorschlage habe ich einmal wieder eingefügt; ich habe ihn allerdings ein wenig umformuliert (man wertet Daten aus, keine Werte); insbesondere der letzte Satz stieß mir auf:

Fixed-Effects- und Random-Effects-Modelle sind mathematische Hilfsmittel, mit denen statistische Werte ausgewertet werden können. Diese spezielle Art der Auswertung wird hauptsächlich in den Sozial-und Wirtschaftswissenschaften verwendete. Der Unterschied zu anderen Methoden liegt in der hohen Qualität der errechneten Daten.

"Qualität der errechneten Daten" ist ein recht unbestimmter und unspezifischer Begriff; zudem kann er so auch als falsch bezeichnet werden, da nicht klar wird, gegenüber was die Qualität besser ist. Hier sollten wir also noch ein wenig feilen. Was die Arbeitsweise angeht, würde ich Zulu55 gerne widersprechen und denke, dass Friedrich seine Bearbeitungen erst einmal im Artikel fortsetzen soll; wir können ja dann ggfs. immer noch revertieren oder ändern. Gruß,--SEM 20:15, 10. Jan. 2012 (CET)

Zwei kleine Verbesserungsvorschläge: Bei der Vorstellung der Formel des RE-Modells sollte gleich deutlich gesagt, welche Variablen beobachtet und welche geschätzt werden sollen, und bei der Formel für den RE-Schätzer sollte man angeben, was bedeutet. -- HilberTraum 21:50, 10. Jan. 2012 (CET)

Ich bitte, meine Schnitzer zu endschuldigen - mir ging es vorrangig darum, erstmal die Richtung zu skizzieren, in die ich mit der Überarbeitung gehen würde.
Was das erste Kapitel betrifft, erscheint mir sowohl von Inhalt, als auch von der Überschrift das Thema "Voraussetzungen" oder "Abgrenzung" sehr treffend zu sein, denn im 1. Kapitel sollte stehen, was das besondere gerade an dieser Methode ist. Schliesslich schreiben wir kein Fachbuch, sondern eine Enzyklopädie. Wenn es keinen Widerspruch gibt, würde ich auf Basis der bisherigen Fakten dieses - 1. - Kapitel skizzieren.

Noch eine Bemerkung zur direkten Arbeit im Lemma. Dieses hat 2 Gründe:

  • Ich habe etwas Erfahrung damit, komplizierte Artikel einfacher zu machen. U.a. achten die Hauptautoren sehr pinglig darauf, das keiner "ihrer" Fakten verloren geht. Die History-Übersicht direkt im Lemma ist perfekt, damit jeder nachvollziehen kann, das ich ja nichts lösche.
  • Dies ist ein Special-Interest-Lemma. Die Zugriffszahlen halten sich in Grenzen. D.h., selbst wenn ich völligen Bockmist schreibe, werden nicht allzuviele Menschen Herzrasen bekommen ;-)

... lasst uns die Sache ruhig und übersichtlich angehen: ich werde noch etwas die Reaktionen abwarten und frühestens morgen weitermachen. BG --Friedrich Graf 22:43, 10. Jan. 2012 (CET)

Also von meiner Seite her hast du grünes Licht; den Einwurf von HilberTraum werde ich die nächsten Tage ebenfalls einarbeiten (das wird deine Bearbeitung ja nicht stören). --SEM 22:58, 10. Jan. 2012 (CET)

Verbesserung der skizzierten Artikelstruktur

An dieser Stelle möchte ich folgende Verfahrensweise vorschlagen (und bitte um eure Mithilfe):

  1. Sortierarbeiten
    1. Strategischer Führung des interessierten Lesers verbessern. Beispiel: "Kleinste-Quadrate-Schätzung in Paneldaten" und "Beispiel" sollten entweder getauscht werden - oder inhaltlich in andere Kapitel eingebaut werden.
    2. Doppelte Fakten entfernen. Beispiel: der Hinweis auf "Sozial- und Wirtschaftswissenschaften"
    3. Kapitelüberschriften harmonisieren. Beispiel "Einführung" und "Grundlagen"
  2. Leserlichkeit verbessern
    1. Schachtelsätze oder ähnliches vereinfachen
    2. Wikilinks verbessern
    3. letzte Kontrolllesungen und Faktencheck.

Dann dürfte dieses Lemma fertig sein. Da wir ein überschaubarer Kreis von Leuten sind, würde ich weiterhin das "live" arbeiten im Lemma favorisieren. Sollte jemand starke Bedenken haben: dafür ist die Diskussionsseite da. Vom Zeitrahmen vermute ich ca. 10 Tage ... BG --Friedrich Graf 00:36, 13. Jan. 2012 (CET)

Stimme dir zu, allerdings mit einer kleinen Ergänzung: Die Einleitung sollte abschließend noch ein wenig erweitert werden. Im Moment ist sie zu kurz und tut nicht, was z.B. [3] von einer guten Einleitung verlangt:sollte dem Leser einen kurzen Überblick über das Thema ermöglichen und das Lemma bereits ausreichend erklären. Ansonsten bin ich allerdings deiner Meinung. Gruß,--SEM 08:38, 13. Jan. 2012 (CET) PS: Das Kapitel "Kleinste-Quadrat-Schätzung in Paneldaten" gefällt mir derzeit gar nicht mehr so gut; ich lasse es vorerst mal drin, überlege aber, wie ich es gut auf andere Abschnitte aufteilen könnte. Gruß,--SEM 08:43, 13. Jan. 2012 (CET)

Okay - und ich werde in den Stunden mal über die Einleitung nachdenken. --Friedrich Graf 10:22, 13. Jan. 2012 (CET)

Bei Grundlagen stößt mir schon lange folgender Satz auf "wenn bestimmte individuums-spezifische Größen wie Motivation und Fähigkeit nicht erfasst und als Kontrollvariable in eine Regression mit aufgenommen werden können" - sprich: ich erfasse etwas nicht und kann es dann (weil ich es nicht erfasst habe) mit aufnehmen. Ich vermute ja, was gemeint ist, aber so ist der Satz unlogisch. --Friedrich Graf 22:03, 13. Jan. 2012 (CET)

{{{1}}} (erl.)

Weitere Fragen (bzgl. Grundlagen):

  1. "Random-Effects- und Fixed-Effects-Modelle und die daraus entwickelten Schätzer sind dann vorteilhaft" - ich hatte den Sachverhalt so verstanden, das RE-FE mit Hilfe der Schätzer ... , ausserdem sind "per Definition" Schätzer kein Alleinstellungsmerkmal von RE-FE. Aus diesen beiden Tatsachen würde sich eine andere Logik ergeben. Ich vermute aber, das es sich um speziell für RE-FE entwickelte Schätzer handelt. In diesem Fall müsste auch der Satzinhalt geändert werden. Ich kann das gerne übernehmen, da alle Sätze noch viel zu komplex sind (und ich das eh ändern will), brauche aber erst die fachliche Bestätigung.
Ja, gemeint sind speziell die daraus entwickelten Schätzer, also die Schätzer, die unter den Annahmen des RE/FE-Modells hergeleitet werden.
  1. "Im REM wird davon ausgegangen ... Vergleicht man den für dieses Modell entwickelten Random-Effects-Schätzer mit der Methode der kleinsten Quadrate, so sind beide Schätzer konsistent, der Random-Effects-Schätzer ist jedoch zusätzlich noch effizient." - der Leser, der es bis zum Ende dieser Satzkonstruktion geschafft - und halbwegs verstanden - hat, fragt sich an dieser Stelle "Warum"? Warum ist der RES effizient?
Der RES ist effizient, weil die Daten auf eine Art transformiert werden, dass sie die Annahmen des Gauß-Markov-Theorems erfüllen (und aus diesen folgt, dass ein Schätzer, der die gegebenen Bedingungen erfüllt, effizient gegenüber allen anderen linearen Schätzer ist). Das alles folgt später bei der Beschreibung des RES. Nicht vergessen: Das, was du gerade liest, war mein ursprünglicher Vorschlag für die Einleitung, und wenn ich da schon von Gauß-Markov gefaselt hätte, würdest du mir das jetzt auch um die Ohren hauen ;-)
  1. Es werden die Grundlagen beider Modelle angerissen. An dieser Stelle frage ich mich (als Leser): "wenn beide Modelle auf verschiedenen Annahmen (bezüglich fehlender Parameter) beruhen, woher weiß der Anwender, welches Modell er anwenden soll? Und wenn er sich entscheiden hat, warum war würfeln nicht besser - da es sich ja in jedem Fall nur um Annahmen handelt?! BG --Friedrich Graf 22:29, 14. Jan. 2012 (CET)
Am Ende des Tages ist die Antwort "kommt drauf an", nämlich darauf, welche Annahme du verteidigen kannst. Fixed-Effects ist sicher die konsevativere, vorsichtigere und deswegen zumindest in der Mikroökonometrie verbreitete Variante. Eine andere Alternative wäre es, beide Tests zu machen und dann den am Ende geschilderten Hausman-Test durchzufüren. Gruß,--SEM 22:49, 14. Jan. 2012 (CET)
"Am Ende des Tages ist die Antwort "kommt drauf an", nämlich darauf, welche Annahme du verteidigen kannst." - Damit wäre es in letzter Konsequenz so, das es bei den Modellen des Lemmas ausschliesslich um "die modellhafte Darstellung wirklichkeitsnaher Daten handelt - die aber einen ständigen Vergleich mit der Wirklichkeit benötigen, um wirklichkeitsnah bleiben zu können." ... ich will hier nicht mit philosophischen Fragen langweilen, sondern versuche nur die Kausalität (Henne-Ei) herauszubekommen. Die u.g. Kritik an der Einleitung hat schliesslich ihre Berechtigung ... aber wie stellt man diese Kausaltät in verständlichem Deutsch dar?! --Friedrich Graf 12:10, 15. Jan. 2012 (CET)

Einleitung

Warum ist denn nun wieder an der im Review entstandenen Einleitung herumgedoktert worden? Die alten Fehler sind wieder drin. Es fängt schon damit an: Fixed-Effects- und Random-Effects-Modelle sind mathematische Hilfsmittel, mit denen statistische Daten ausgewertet werden können. Daher nochmal: Nicht die Modelle werten Daten aus, sondern vielmehr die Schätzer. Die Schätzer bestimmen die Parameter der in diesem Fall linearen Modelle - deren Koeffizienten also - anhand unvollständiger, endlicher und fehlerbehafteter multivariater (Mess)Daten bzw. Beobachtungen. Das Besondere an den Schätzern hier scheint zu sein (hab mich nicht näher damit beschäftigt), dass die Daten vor der Schätzung iwie transformiert und dann die Parameter tatsächlich rückgerechnet werden können (?). Fixed- und Random-Effects-Modelle scheinen sich lediglich dadurch zu unterscheiden, wie man mit Modellungenauigkeiten umgeht. Entweder schätzt man wie beim FEM mehr Parameter (was zu numerischen Problemen führen kann), oder man modelliert den Anteil des "Kleinkrams" (z.B. Kopplungen, schnelle Fluktuationen oder einfach nur Unbekanntes) als Rauschen wie beim REM womit man sich aber logischerweise größere Schätzungenauigkeiten für die Modellparameter einfängt. Vielleicht können wir das erstmal klären, bevor am Artikel weitergearbeitet wird? Danke! 79.193.34.82 11:17, 15. Jan. 2012 (CET)

Stimmt, du hast Recht, der Lapsus mit dem Modell ist leider wieder reingekommen, sorry, das ist mir ebenfalls im Laufe der Diskussion entfallen. Dein Einwurf ist aber selbstverständlich korrekt, ebenso deine Ausführungen zu Schätzer. Das Besondere an diesen Schätzern ist hier in der Tat die Transformation; für Beta muss dabei nicht einmal etwas zurückgerechnet werden, schon das transformierte Modell schätzt die "korrekten" Betas. Beim FEM können mehr Parameter geschätzt werden, aber oft wird das nicht einmal getan, weil die individuums-spezifischen Effekte per se nicht interessant sind, sondern man nur an den Betas interessiert ist. Der Unterschied besteht darin, dass die Modelle zwei Arten von "Kleinkrams" annehmen: Einen allgemeinen (eben z.B. schnelle Fluktuationen, schlichter Zufall etc), der in beiden Fällen als Rauschen aufgefasst wird; daneben aber einen individuumspezifischen Effekt (eben die Alphas); Der Unterschied, ist dass im REM dieser zusätzliche, indiduumspezifische Kleinkrams als schlichtes zusätzliches Rauschen aufgefasst wird, im FEM dagegen als systematischer Unterschied, der aus dem Modell entfernt werden muss, da sonst der Beta-Schätzer inkonsistent ist. Gruß,--SEM 11:30, 15. Jan. 2012 (CET)
Schnelle Antwort, danke :o) Es geht also letztlich nur um die Eigenschaften und die Behandlung des Offsets Alpha? 1) Beim REM wird Alpha ins Rauschen mit reingezogen (=random effect). Dadurch erhält man aber korreliertes Rauschen v. Das wiederum führt zwar zu erwartungstreuen und konsistenten jedoch ineffizienten OLS-Schätzungen für die Betas, sprich die Schätzfehler sind größer als die durch den normalen Rauschterm u eingebrachten Fehler. Deshalb wird ein spezieller Schätzer konstruiert, der asymptotisch effizient ist. Wie der Schätzer das nun macht, wird überhaupt nicht klar. Die Grundidee sollte spätestens im Artikel kurz skizziert werden. 2) Beim FEM dagegen hängt Alpha explizit von den x ab und es macht wenig Sinn den Term ins Rauschen auszulagern (da das Rauschen ja gerade die von x unabhängigen Effekte modellieren soll). Der normale OLS-Schätzer für die Betas würde für diesen Fall nicht nur ineffizient sondern sogar nicht erwartungstreu sein, oder wie? Das kommt nicht rüber. Auch die Idee zur Beseitigung der Schätzprobleme wird später im Artikel nicht dargestellt, sondern es werden einfach nur Formeln in den Raum geworfen. Das sollte ohne viel Fachchinesisch, also einigermaßen anschaulich geklärt werden, weil es die Essenz des Artikels ist. 79.193.34.82 12:42, 15. Jan. 2012 (CET)
Ja, das ist so korrekt; der OLS-Schätzer wäre im FE-Fall nicht nur nicht erwartungstreu, sondern sogar inkonsistent, also selbst für unendlich große Stichproben würde er nicht gegen den wahren Wert konvergieren. Gut, wenn das nicht rüberkommt, ist das natürlich schlecht, aber immerhin wissen wir dann um eine weitere Baustelle ;) --SEM 14:52, 15. Jan. 2012 (CET)
PS: Ich habe nun einmal im RE-Abschnitt ergänzt, warum das Modell effizient ist; es sind wieder Formeln, aber die Idee kommt hoffentlich durch: Wenn man Omega kennt, kann man ein transformiertes Modell mit einer Varianz-Kovarianzmatrix bauen, das die Gauß-Markov-Annahmen erfüllt und deswegen effizient ist; Omega ist aber nicht bekannt, deswegen wird zuerst das Modell mit OLS geschätzt (ist ja konsistent) und daraus ein (wegen der Konsistenz von OLS konsistenter) Schätzer für Omega konstruiert, der dann den Part des "waren" Omega einnimmt. Da Omega-geschätzt asymptotisch gegen Omega geht, ist der Schätzer dann asymptotisch effizient. --SEM 16:34, 15. Jan. 2012 (CET)

Ich finde die neue Einleitung ebenfalls nicht gut. Abgesehen von den genannten ungenauen Formulierungen und davon dass sie den Artikelinhalt nicht zusammenfasst, ist sie viel zu allgemein und damit nichtssagend. So sehr ich dafür bin, laienverständliche Einführungen zu haben: Aber wenn man hier für omA etwas Gutes tun will, sollte man lieber erklären, was es bedeutet eine Regression zu machen, was es mit erklärenden und erklärten Variablen auf sich hat, was Panel-Daten sind usw. -- HilberTraum 12:01, 15. Jan. 2012 (CET)

Ich kann nur um Geduld bitten, wir versuchen gerade den Artikel zu vereinfachen. Ich kann nur anbieten, das wir auf dieser Diksussionsseite Bescheid geben, wenn alles fertig ist. Generell: ich fahre Anfang Februar in den Urlaub - bis dahin wollte ich eigentlich fertig sein.
Was den konkreten Sachverhalt (Schätzer) betrifft: ja dieser Fakt wird noch verbessert. --Friedrich Graf

Kein Problem: Ich wollte auch gar nicht drängeln, sondern nur eine mögliche Richtung aufzeigen. -- HilberTraum 12:43, 15. Jan. 2012 (CET)

Version 16.1. Nachts

Ich versuche mich jetzt mal in etwas umfangreicheren Edits. Wenn ich fertig bin, gebe ich an dieser Stelle Bescheid. Danach ist Kritik gern gesehen ... --Friedrich Graf 22:15, 16. Jan. 2012 (CET)

3 Kommentare: In der Einleitung ist das von dem Benutzer mit der IP-Nummer genannte Problem mit den Modellen, die zur Auswertung benutzt werden, noch nicht gelöst; wie oben gesagt: Modelle werten keine Daten aus, sondern Schäzer. Und Modelle verwenden auch keine Schätzer, sondern Modelle erlauben die Benutzung/Verwendung gewisser Schätzer. Mein Vorschlag für einen ersten Satz, der beides berücksichtigt, und hoffentlich verständlich ist: Fixed- und Random-Effects-Modelle sind mathematische Annahmen, die an statistische Daten gestellt werden. Auf Basis dieser Annahmen lassen sich sogenannte Fixed- und Random-Effecs-Schätzer zur Datenauswertung herleiten. Die beiden Modelle und die daraus hergeleiteten Schätzer werden hauptsächlich in den Sozial- und Wirtschaftswissenschaften verwendet. Kommentare der anderen hierzu?

Fixed-Effects- und Random-Effects-Modelle verwenden spezielle Schätzer, womit sie in der Lage sind die o.g. statistischen Daten effizienter auszuwerten. Das "effizient" ist hier leider falsch, da nur RE effizienter ist, FE dagegen auf Konsistenz abzielt. Außerdem sollte erklärt werden, dass dies gegenüber herkömmlichen Methoden wie der Kleinsten-Quadrat-Schätzung gilt. Sind die Elemente einer statistischen Grundgesamtheit von gleichmäßiger Beschaffenheit, so sind sie "homogen". Ein typisches Beispiel ist die Menge aller Schrauben. In den Sozial- und Wirtschaftswissenschaften sind die Elemente der Grundgesamtheit nicht homogen. Werden beispielsweise bestimmte individuums-spezifische Größen wie Motivation und Fähigkeit nicht erfasst, entsteht eine sogenannte individuelle Heterogenität).

=> Das stimmt so leider nicht ganz; die Daten sind natürlich auch dann nicht homogen, wenn es keine Effekte gibt, die man übersieht. Wenn du z.B. Daten über die Körpergröße der Menschen erhebst, sind diese natürlich heterogen ;) Gruß, --SEM 23:23, 16. Jan. 2012 (CET)

Ich habe die KOntrollvariablen einmal etwas mehr ausgeführt. --SEM 00:15, 17. Jan. 2012 (CET)

... jetzt bin ich erstmal fertig ... und merke, das du doch parallel gearbeitet hast. Ich hoffe, das es nicht zu Bearbeitungskonflikten gekommen ist.
In jedem Fall habe ich die alte Kapitelversion erstmal unsichtbar stehen lassen - wegen mir kann sie aber gelöscht werden.
Ich bin jetzt ziemlich müde vom Tag - mein eigenes Kontrolllesen muß bis morgen warten ... aber tut euch keinen Zwang an! Gute Nacht. --Friedrich Graf 00:39, 17. Jan. 2012 (CET)

Zunächst mal vielen Dank! Den einen Satz habe ich wieder entfernt, da er eben gerade KOnsistenz beschrieben hat und damit redudant und teilweise falsch war (eben weil OLS ja im RE-Fall schon konsistent ist). Davon und von den o.g. Punkten abgesehen sollte es aber passen, aber ich gehe heute Abend nochml genauer drüber. Ich hatte keinen BK, ich hoff du auch nicht! --SEM 09:31, 17. Jan. 2012 (CET)

Ok, dann leg ich mal los:
  1. Warum wird das Einkommen-Bildung-Beispiel nicht mehr ausgeführt. MMn sollte es eher noch mehr als weniger Beispiele geben.
  2. FEM und REM sind kein Konstrukt (das wäre eine Variable), sondern ein mathematisches Modell.
  3. Das Hauptthema der Einleitung ist nicht FE und RE, sondern: "Was ist ein statistisches Verfahren?". Das ist so, als würde man in der Einleitung von Schabrackenhyäne die Charakteristika der Säugetiere aufzählen.
  4. Dass Parameter der Grundgesamtheit ermittelt werden ist zwar (auf sehr hohem Abstraktionsniveau!) auch bei einer Regression richtig, aber leichter nachvollziehbar fände ich darzustellen, dass man unbekannte Koeffizienten des Modells herausfinden will.
  5. Die Einleitung verlinkt auf BKLs.
  6. Es wird mMn nach zu oft von "Auswertung von Daten" gesprochen. Das ist zwar nicht falsch, aber wirkt durch die Häufung und die Allgemeinheit des Ausdrucks auf mich irgendwie störend.
  7. "Kleinste Quadrate" wird weder verlinkt noch erklärt.
  8. Mir scheint die Tatsache, dass die unabhängigen Variablen bei konkreten Beispielen in erklärende Variablen und Kontrollvariablen eingeteilt werden, für das Verfahren ganz nebensächlich (bitte korrigiert mich, wenn ich mich irre). Also gäbe es dann keinen Grund, so ausführlich auf Kontrollvariablen einzugehen.
Mehr evtl. später, wenn ich mehr Zeit habe.-- HilberTraum 12:26, 17. Jan. 2012 (CET)

Erstmal einige Ausgewählte Antworten:

  1. ... dann muß dieser Teil aber besser formuliert sein.
  2. Bitte ändere es.
  3. Ich versuche die Gewichtung zu ändern. Generell gilt aber, das wir hier sehr viel selbst erklären müssen, da es (für Laien) kaum gute Lemmata gibt (Beispiel Kontrollvariable). Das macht aber den wesentlichen Unterschied zu Säugetieren u.a. Themen aus. Im übrigen ist das eine generelle Schwäche mathematischer Artikel (Beispiel: "Nichtnullstellenmenge") - ich versuche dies dann in viel Kleinarbeit zu ändern. Leider ergibt sich selten so eine gute Arbeitsathmosphäre wie hier.
  4. Bitte versuche dich an einer besseren Formulierung.
  5. Siehe Problem der fehlenden Erklärungen. Es macht wenig Sinn, ein erklärungsbedürftiges Wort auf eine Seite zu verlinken, bei der ich die Erklärung nicht verstehe. Und leider betrifft das bei unserem Lemma zuviele Worte. Wenn du aber eine gute Alternative hast: nur zu!
  6. Ich versuche das zu ändern.
  7. Richtig - es war zu spät gestern Nacht.
  8. Wenn ich das mathematisch-statistische Problem richtig verstanden habe, ist gerade das Fehlen von Kontrollvariablen ein häufiges Problem- bei dem die im Lemma beschriebenen Modelle eine Lösung anbieten.

BG --Friedrich Graf 13:52, 17. Jan. 2012 (CET)

ad Punkt 1: Gerne! Wo fehlt es deiner Meinung nach noch an einer besseren Beschreiung des Einkommens-Bildungs-Beispiels?
ad Punkt 2: Könnten wir da vielleicht auf meinen weiter oben beschriebenen Einleitungsentwurf zurückgreifen: Fixed- und Random-Effects-Modelle sind mathematische Annahmen, die an statistische Daten gestellt werden. Auf Basis dieser Annahmen lassen sich sogenannte Fixed- und Random-Effecs-Schätzer zur Datenauswertung herleiten. Die beiden Modelle und die daraus hergeleiteten Schätzer werden hauptsächlich in den Sozial- und Wirtschaftswissenschaften verwendet.
ad Punkt 8: Ich würde sagen, grundsätzlich habt ihr beide Recht. Die Kontrollvariablen an sich sind nichts Besonderes an dieser Methode; Dass man nicht für alle Variablen kontrollieren kann, ist ja auch ein Problem der Kleinsten-Quadrat-Schätzung. So lange allerdings Kontrollvariable so nichtssagend ist, kann ich die Idee, mehr hier im Artikel zu erläutern, nachvollziehen.
Grüße,--SEM 14:36, 17. Jan. 2012 (CET)

  • zu 8.) dann würde ich auf das Ende der Überarbeitung warten und dann anhand des restlichen Kontext entscheiden.
  • zu1.) (verkürzt dargestellt) Ein intuitives Beispiel ... gefunden werden: Eine mögliche Regression wäre also

Ich lese also: "ein mögliches Auswertungsverfahren wäre ..." und lese die Formel. Das mag für ein Fachbuch i.O. sein, aber hier sollen Leute lesen, die nur wenig davon verstehen. Und die Formel ist dabei kein intuitives Beispiel.
wobei einen Vektor mit zusätzlichen Kontrollvariablen wie Alter, Erfahrung u.ä. darstellt.
Der Vektor hat je nach Fachgebiet unterschiedliche Verwendungen. Bei mir beispielsweise: Vektorgrafik. In jedem Fall entstehen mit diesem Satz mehr neue Fragen, als alte beantwortet werden.
wird hierbei alle Effekte auffangen, die bei einem Individuum über Zeit konstant sind und nicht in die Regression mit aufgenommen werden können.
Übersetzung: hier werden Dinge beachtet, die sich nicht ändern und in die Datenanalyse NICHT mit aufgenommen werden können. Eine seltsame Logik ...
Ein Beispiel hierfür ist die Fähigkeit („ability“) der beobachteten Individuen. Die individuelle Fähigkeit wird wahrscheinlich eine Auswirkung auf den Verdienst eines Individuums haben, sie kann aber nicht oder nur schwer als Kontrollvariable in die Regression mit aufgenommen werden, da sie schwer messbar ist.
Hier muß nur der Satzbau und Ausdruck verbessert werden.
Darüber hinaus kann auch davon ausgegangen werden, dass die persönliche Fähigkeit über die zeit konstant ist.
Im Zeitalter lebenslangen lernens halte ich das für ein Gerücht. Man sich nur die gesellschaftliche Änderung durch das Internet ansehen ...
Ähnliches gilt für andere, unbeobachtete aber relevante Variablen, die gemeinsam die „individuelle Heterogenität“ bilden. Besteht eine solche individuelle Heterogenität, so wird die Anwendung des Kleinste-Quadrate-Schätzers nicht optimal sein und Random-Effects- und Fixed-Effects-Schätzer können Abhilfe schaffen.
... im Übrigen strotzt das Beispiel vor "Kontrollvariablen". Diese nicht extra zu erklären, wäre schlecht ...
BG --Friedrich Graf 16:45, 17. Jan. 2012 (CET)

Zur Formel: Es ist ja gerade der Sinn der ganzen Geschichte, eine Formel für das Einkommen zu finden. Also ganz wird man nicht drumrumkommen. Das mit der "Fähigkeit" habe ich so verstanden, dass das der Anteil ist, der sich durch Lernen und Bildung nicht ändert, stimmt das?
Zur Sache mit dem Vektor aus erklärenden Var. und Kontrollvariablen: Da fände ich es allerdings auch gut, wenn es ein Beispiel gäbe mit einer einzelnen erklärenden Var. und ohne Kontrollvariablen. Da ich das Verfahren allerdings nicht richtig kenne, weiß ich nicht, ob es in so einem einfachen Fall noch sinnvoll wäre. -- HilberTraum 18:34, 17. Jan. 2012 (CET)
@SEM: Deinen Einleitungsvorschlag finde recht gut gelungen, nur halt ein bisserl kurz... wenn man vielleicht noch "Datenauswertung" etwas konkretisieren könnte. Auf jedem Fall sollten wie gesagt mMn weitergehende "laienverständliche Erklärungen" nicht in die Einleitung, sondern in eine eigenen Abschnitt vor der Definition der Modelle. -- HilberTraum 19:56, 17. Jan. 2012 (CET)
  • "Formeln": sorry, da habe ich mich mißverständlich ausgedrückt. Selbstverständlich MUSS in dieses Lemma (nicht nur) eine Formel.
  • "Laienverständlichkeit": Damit es auch hier keine Mißverständnisse gibt: ich denke nicht, das es sinnvoll ist, das gesamte Lemma auf die Laienhafte Art umzuschreiben. Eigentlich nur Einleitung und das 1. Kapitel. Normalerweise sogar nur die Einleitung - aber es besteht wegen mangelnder Verlinkungsmöglichkeiten ein großer Erklärungsbedarf. Spätestens ab dem 2. Kapitel hätte ich nur noch den Satzbau entkompliziert.

--Friedrich Graf 20:46, 17. Jan. 2012 (CET)

Bei den ganzen Versionen, weiß ich mittlerweile auch nicht mehr, welche Schätzer jetzt wie konsistent und/oder effizient sind, aber die Stelle Der für dieses Modell entwickelten Random-Effects-Schätzer ist konsistent und effizient. Im Vergleich hierzu liefert die "Methode der kleinsten Quadrate" konsistente Ergebnisse macht schon sprachlich keinen Sinn. -- HilberTraum 21:16, 17. Jan. 2012 (CET)

Ja, das ist etwas ungeschickt formuliert. Zum allgemeinen Überblick nochmal: RE-Modell: OLS, RE-Schätzer konsistent; RE-Schätzer effizient FE-Modell: OLS inkonistent, FE-Schätzer konsistent

  • Vektoren: Naja, dann kann man ja an dieser Stelle auch einfach einen wikilink setzen, oder? Ich finde, die Begriffe "Vektor" und "Matrix" kann man einem Leser eines solchen Artikels schon zumuten, zumal es dazu ja (im Gegensatz zu "Kontrollvariable" einen vernünftigen Wikipedia-Artikel gibt)
  • Einleitung: @HilberTraum: Sorry, das war missverständlich ausgedrückt; mein Entwurf bezog sich lediglich auf den ersten Satz, das sollte kein Entwurf für die ganze Einleitung sein, sondern nur den derzeitigen ersten Satz (bzw. erste 2 Sätze) ersetzen: Fixed-Effects- und Random-Effects-Modelle sind mathematische Hilfskonstruktionen, mit denen statistische Daten ausgewertet werden können. Diese spezielle Art der Auswertung wird hauptsächlich in den Sozial- und Wirtschaftswissenschaften verwendet. Und dafür mein Vorschlag: Fixed- und Random-Effects-Modelle sind mathematische Annahmen, die an statistische Daten gestellt werden. Auf Basis dieser Annahmen lassen sich sogenannte Fixed- und Random-Effecs-Schätzer herleiten. Diese werden dazu verwendet, um ökonomische Wirkzusammenhänge zu überprüfen und zu quantifzieren. Die beiden Modelle und die daraus hergeleiteten Schätzer werden hauptsächlich in den Sozial- und Wirtschaftswissenschaften verwendet. So? VG,--SEM 21:42, 17. Jan. 2012 (CET)
Ja, finde ich recht gut (nur bei "ökonomische Wirkzusammenhänge quantifizieren" musste ich - sorry - irgendwie an Buzzword-Bingo denken ;-). Aber wie schon gesagt, kann ich mit dem Rest der momentanen Einleitung halt nicht so recht warm werden. -- HilberTraum 22:40, 17. Jan. 2012 (CET)

Ja, deine Bedenken in der Hinsicht kann ich nachvollziehen; die Einleitung sollte ja den Artikelinhalt prägnant zusammenfassen, und das sind hier die entsprechenden Schätzer und nicht Schätzmethoden allgemein. Andererseits ist halt die Gefahr dass der Leser, wenn die Einleitung zu technisch ist, abgeschreckt wird und die darauf folgende verständliche Erläuterung der Grundlagen gar nicht erst liest. Warten wir einmal die restliche Überarbeitung ab, und dann können wir uns ja am Ende ggfs. nochmal über die Einleitung unterhalten! Gruß,--SEM 09:31, 18. Jan. 2012 (CET)

Wenn ich die Artikelqualität heute mit der von Neujahr vergleiche, hat sich schon viele zum Besseren getan. Ich denke, unser Weg ist richtig, auch wenn wir alle noch noch nicht zufrieden sind ... vermutlich werde ich heute Abend wieder Zeit für die nächsten Ediths finden, ich gebe dann Bescheid. BG --Friedrich Graf 09:16, 18. Jan. 2012 (CET)

... Schluß für Heute. --Friedrich Graf 22:30, 18. Jan. 2012 (CET)

Herleitung des Schätzers

Wenn mich gerade nicht alles täuscht, sind die Gleichungen der Art

und folgende mathematisch nicht korrekt: Hier wird die Matrix mit den skalaren Größen multipliziert, das ist nicht das gleiche wie die Transformation der Vektorgleichung mit der Matrix. Eigentlich kann nur letzteres Sinn machen. -- HilberTraum 21:31, 17. Jan. 2012 (CET)

Ja, korrekter Einwand, ist verbessert. Danke für das wache Auge! --SEM 21:47, 17. Jan. 2012 (CET)

Fertig

Auch mit einigen Tagen Abstand habe ich jetzt keine wesentlichen Änderungswünsche mehr gefunden. Nach meinem dafürhalten ist dieses Lemma jetzt ein gutes Lemma geworden. Ein sperriges Thema ist jetzt wikilike eingeleitet und mit genügend fachlichem Background unterfüttert.
... und wir haben sogar eine Bebilderung :-) In diesem Sinne möchte ich mich von dieser Überarbeitung verabschieben - es war eine angenehme Arbeit mit euch! BG --Friedrich Graf 23:11, 20. Jan. 2012 (CET)

Zunächst einmal vielen Dank für dein Engagement und für die gute Zusammenarbeit! Der Abschnitt "Grundlagen und Beispiele" gefällt mir nun wirklich sehr gut; ein paar Bedenken habe ich noch bei der Einleitung, und hier würde ich dir gerne noch einmal um deine weitere Mitarbeit bitten:

Bei der Auswertung statistischer Daten sollen aus einer endlichen Menge an Daten Aussagen über die grundlegende Verteilung (derselben) in einer Grundgesamtheit ermittelt werden. Man versucht die unbekannten Parameter (dieser Grundgesamtheit) mit Hilfe von Schätzern zu ermitteln.Der Schätzer ist jedoch eine Zufallsvariable, was zu einer gewisse Unschärfe bei den ermittelten Parametern führt (s.a. Verteilungsfunktion und Varianz). Damit wird selbst im Idealfall der "Wahre Wert" (der fehlenden Parameter) nicht erreichen, sondern nur Werte in seiner Nähe.

Ich kann damit leben, dies in der Einleitung zu belassen, danach sollte allerdings noch ein weiterer Abschnitt folgen. Mein (zugegebenermaßen noch recht unausgegorener) Vorschlag wäre: Die Fähigkeit, den wahren Wert zumindest im Erwartungswert zu erreichen (Erwartungstreue) oder asymptotisch für große Stichproben gegen ihn zu konvergieren ([[Konsistenz (Statistik)|Statistik) sowie die Varianz des Schätzers um den Wahren Wert sind deswegen wichtige Eigenschaften eines Schätzers. Die Methode der Kleinsten Quadrate ist ein weit verbreiteter Schätzer, der unter den Annahmen des Satzes von Gauß-Markov eine effiziente und konsistente Schätzung ermöglicht. Werden jedoch relevante Größen nicht in die Regression mit aufgenommen, so können Endogenität, Heteroskedastizität und Autokorrelation entstehen, wodurch die Kleinste-Quadrat-Schätzung ihre wünschenswerten Eigenschaften verliert. Im Zusammenhang mit Panel- und Mehrebenendaten können jedoch unter den Annahmen der Fixed- und Random-Effechts-Modelle weitere Schätzer hergeleitet werden, die manche dieser potentiellen Probleme lösen. Was haltet ihr davon? Gruß,--SEM 11:05, 21. Jan. 2012 (CET) PS: Hoppla, ein paar wikilinks sind falsch gesetzt-die würden nat. noch korrigiert werden ;)

Ich werde mir das heute Abend ansehen ... --Friedrich Graf 11:54, 21. Jan. 2012 (CET)
PS: Noch eine kleine Frage: Du hast das Bildungs/Einkommensbeispiel ausgeklammert, hat das einen besonderen Grund? --SEM 12:45, 21. Jan. 2012 (CET)

Mein Vorschlag (ich denke, das im Kapitel "Grundlagen" vor den Satz "Ein Anwendungsbeispiel..." ein guter Platz wäre):
Eine wichtige Eigenschaft von Schätzern ist ihre Genauigkeit (Erwartungstreue) gegenüber dem Wahren Wert. Ebenso sollen sie effizient sein und statistische Minimalforderungen erfüllen (Konsistenz).
Die "Methode der Kleinsten Quadrate" ist ein weit verbreiteter Schätzer, der unter den Annahmen des "Satzes von Gauß-Markov" eine effiziente und konsistente Schätzung ermöglicht. Wenn jedoch nicht alle relevanten Größen in der Regression berücksichtigt werden, können die Ergebnisse ausserhalb der Minimal-Anforderungen liegen. Diese starken Abweichungen erzeugen unerwünschte Effekte:

Damit verliert die "Kleinste-Quadrat-Schätzung" ihre wünschenswerten Eigenschaften.
Fixed- und Random-Effects-Modelle können aus Panel- und Mehrebenendaten spezielle Schätzer herleiten, die manche dieser potentiellen Probleme lösen.

Ansonsten: im Kapitel "Version 16.1. Nachts" habe ich begründet, warum ich das Bildungs/Einkommensbeispiel ausgeklammert habe - wir können es gerne noch überarbeiten. In jedemFall: löschen wollte ich mir nicht anmaßen. --Friedrich Graf 17:52, 21. Jan. 2012 (CET)

Der Grund, warum ich die Einleitung gerne um den von mir geannnten Abschnitt ergänzen würde ist, wie oben schon von HilberTraum erwähnt: Die Einleitung hat im Moment wenig mit FE/RE zu tun, sondern mehr mit der allgemeinen Thematik eines statistischen Schätzers. Ich kann verstehen, dass es hier für das Verständnis des Lesers von Vorteil ist, sozusagen bei "Adam und Eva" anzufangen; da die Einleitung aber den Leser auch über das Lemma informieren sollte, sollte das dann eben auch konsequent zu Ende geführt werden; will sagen: Nach der Lektüre der Einleitung sollte der Leser zumindest grob wissen, was FE/RE ist und wann es angewandt wird. Mein Vorschlag oben oder auch deiner, wenn er denn in der Einleitung steht, könnten hier Abhilfe schaffen- aber dafür sollten sie eben in die Einleitung. (Zu deinem Vorschlag noch ein paar Anmerkungen: Ich würde die Konsistenz und Effizienz auch zu den "wichtigen Eigeschaften" dazu zählen und nicht nur die Erwartungstreue, zumal ja gerade hierauf immer wieder verwiesen wird; Außerdem leiten die Modelle nicht aus den Daten Schätzern her, sondern unter den Annahmen der Modelle können Schätzer hergeleitet werden (die dann wiederum auf die Daten angewendet werden) Und nicht die Verletzung der Konsistenz erzeugt die unerwünschten Effekte, sondern die unerwünschten Effekte führen zur Verletzung der Konsistenz und/oder Effizienz.).

Bezüglich des Einkommensbeispieles: Ja bitte, ich wäre für Verbesserungsvorschläge dankbar! Gruß,--SEM 19:15, 21. Jan. 2012 (CET)

Überarbeitung Einleitung

Ich habe eben probeweise den Ergänzungstext in die Einleitung eingefügt und halte ihn dort aus 2 Gründen für falsch:

  • er überfrachtet die Einleitung
  • er liefert keinen Mehrwert für das Verstehen, worum es im Lemma geht.

Dein Argument, das die Einleitung nur mit allgemeinen Aussagen zu tun hat, würde durch die Ausführungen (nur) zum Schätzerproblem auch nicht besser werden. Wobei ich diesbezüglich ("dort stehen hauptsächlich nur allgemeine Aussagen") eigentlich anderer Meinung bin. Ich verstehe aber deinen Wunsch, die Schätzerproblematik näher an die Einleitung zu rücken. Ich könnte mir daher folgende Einleitungsvariante vorstellen:
...Schätzer werden hauptsächlich in den Sozial- und Wirtschaftswissenschaften verwendet.
siehe hierzu auch das Kapitel Grundlagen und Beispiele.
... Bei der Auswertung statistischer
--Friedrich Graf 20:38, 21. Jan. 2012 (CET)

  • Eine Überfrachtung der Einleitung ist möglich; jedoch bin ich hier eher dafür, eine zu lange als ein uninformative Einleitung zu haben. Im Moment hat die Einleitung eben sehr wenig mit FE/RE zu tun:
    • Fixed- und Random-Effects-Modelle sind mathematische Annahmen, die an statistische Daten gestellt werden. Auf Basis dieser Annahmen lassen sich sogenannte Fixed- und Random-Effecs-Schätzer herleiten. Diese werden dazu verwendet, um ökonomische Wirkzusammenhänge zu überprüfen und zu quantifizieren. Die beiden Modelle und die daraus hergeleiteten Schätzer werden hauptsächlich in den Sozial- und Wirtschaftswissenschaften verwendet. Soweit so gut, der Leser hat eine grobe Ahnung. Er fragt sich aber, was an diesen Schätzern und Modellen besonders ist.
    • Der Abschnitt Bei der Auswertung...Nähe könnte so bei jedem Artikel über einen Schätzer stehen oder allgemein in einem Artikel darüber, was ein Schätzer ist. Ich finde ihn hier hilfreich, aber er hilft nicht beim Verständnis, was ein RE/FE ist. Der Leser weiß immer noch nicht, was an diesen Schätzern und Modellen besonders ist, weiß aber immerhin, welche Probleme auftreten können.
    • Fixed-Effects- und Random-Effects-Modelle verwenden spezielle Schätzer, womit sie in der Lage sind, die o.g. statistischen Daten effizienter auszuwerten. Okay, der Leser weiß nun, dass FE/RE in der Lage sind "effizienter" auszuwerten- aber was heißt hier effizienter? Effizienter als was?
    • Es fehlt eben schlichtweg noch, was FE/RE ausmacht; Deswegen mein Vorschlag: Er definiert, was Effizienz und Konsistenz sind und nennt kurz das Problem nicht beobachteter Variablen. Das ist langatmiger, aber der Leser weiß danach hoffentlich nicht nur, dass FE/RE-Modelle bei der Datenverarbeitung helfen, sondern auch zumindest ungefähr, wo sie helfen- nämlich wenn manche Variablen nicht beobachtet werden.
  • Du sagst, die Einleitung liefere keinen Mehrwert für das weitere Verständnis des Artikels; Das ist korrekt, aber das ist auch nicht ihre alleinie Aufgabe; Die Einleitung soll den Leser auch grob über den Artikelinhalt informieren, ihn zusammenfassen. Die grobe Richtlinie sollte sein: Wenn ein Leser nur die Einleitung liest, sollte er trotzdem ungefähr wissen, um was es geht. Und hier geht es eben speziell um FE/RE, und nicht darum, was ein Schätzer ist. Um Verständlichkeit und Information zu vereinen, halte ich deswegen eine ausführlichere Einleitung für geeignet. --SEM 22:05, 21. Jan. 2012 (CET)
  1. Gedanke: FE- und REM verwenden spezielle Schätzer, womit sie in der Lage sind, die o.g. statistischen Daten effizienter auszuwerten.. Das ist für den unwissenden Leser eine wesentliche Information: "aha, der Schätzer machts". Der Halbwissende wird fragen "was ist besonderes an diesem Schätzer?". Beide erwarten keine Antwort in der Einleitung. Dazu kommt, das die Bedeutung des Wortes "Effizienz" sowohl in der Umgangssprache, als auch in der Statistik vergleichbare Bedeutungen haben.
  2. Gedanke: Ich werde keinen Streit beginnen. Wenn du mich aber nach meiner Meinung fragst: es ist unnötig. Ich habe oben einen Spezialhinweis angeboten (Verweis zum Kapitel) - das wäre in solchen Fällen eine übliche Praxis in Lemmata, die ihre Kapitel nicht überfrachten wollen.
  3. Gedanke: Wenn du deinen o.g. Gedanken weiterführst, wirst du feststellen, das die Einleitung noch andere, wesentliche Informationen wegläßt. Willst du diese auch in der Einleitung erklären?
    Beispiel: FE + REM haben verschiedene Hacken. Ich hatte das im Diskussionskapitel "Verbesserung der skizzierten Artikelstruktur" bereits angesprochen - unter dem Stichwort "Warum nicht gleich würfeln?". Davor sprachen wir übrigens über Grenzen dieser Verfahren usw.

--Friedrich Graf 22:26, 21. Jan. 2012 (CET)

  1. Doch, eine Antwort über die Frage, was an diesem Schätzer bzw. an diesen Modellen besonders ist, darf in der Einleitung erwartet werden. Sonst könnten wir ja die Einleitung per C&P auch zum Kleinste-Quadrat-Schätzer und zu anderen übertragen ;)
  2. Ich will deswegen sicher auch keinen Streit; aber ich finde es eben wichtig, dass eine Einleitung das Lemma erklärt und nicht nur etwas, das zum Verständnis des Lemmas wichtig ist
  3. Selbstverständlich will ich das nicht alles in der Einleitung erklären; aber wie gesagt: Die Besonderheiten sollten schon zutrage kommen, ebenso die Anwendung in Verbindung mit Panel/Mehrebenendaten. Sonst sind wir eben, wie von HilberTraum ausgedrückt, bei Die Hyäne ist ein Säugetier. Säugetiere sind... Gruß,--SEM 23:33, 21. Jan. 2012 (CET)
Mach es.
Ich mag es nicht, wenn Einleitungen nicht zum Punkt kommen - um es beim Beispiel der Hyäne zu sagen: "die H. ist ein Aasfressendes Säugetier mit ausgeprägter ..." Daneben ein Foto. Das ist alles sehr eindeutig und zufreffend. Den Rest erfährt der Leser im Text. Wir müssen nicht das "aasfressende" in der Einleitung erklären, da es selbsterklärend ist, bzw. verlinkt werden kann.
So: mach bei diesem Punkt jetzt einfach, was du denkst, denn wir werden sonst beide keinen gemeinsamen Nenner finden! Und das ist die Sache auch nicht wert ... --Friedrich Graf 17:25, 23. Jan. 2012 (CET)
Danke, ich warte allerdings einmal ab ob HilberTraum oder der Benutzer mit der 75. ... IP noch etwas dazu sagen wollen. Gruß,--SEM 09:40, 24. Jan. 2012 (CET)

Überarbeitung Beispiel

(verkürzte Darstellung) Ein intuitives Beispiel ... gefunden werden: Eine mögliche Regression wäre also

1.) Ich lese also: "ein mögliches Auswertungsverfahren wäre ..." und lese die Formel. Das mag für ein Fachbuch i.O. sein, aber hier sollen Leute lesen, die nur wenig davon verstehen. Und die Formel ist dabei kein intuitives Beispiel.
wobei einen Vektor mit zusätzlichen Kontrollvariablen wie Alter, Erfahrung u.ä. darstellt.
2.) Der Vektor hat je nach Fachgebiet unterschiedliche Verwendungen. Bei mir beispielsweise: Vektorgrafik. In jedem Fall entstehen mit diesem Satz mehr neue Fragen, als alte beantwortet werden.
wird hierbei alle Effekte auffangen, die bei einem Individuum über Zeit konstant sind und nicht in die Regression mit aufgenommen werden können.
3.) Übersetzung: hier werden Dinge beachtet, die sich nicht ändern und in die Datenanalyse NICHT mit aufgenommen werden können. Eine seltsame Logik ...
Ein Beispiel hierfür ist die Fähigkeit („ability“) der beobachteten Individuen. Die individuelle Fähigkeit wird wahrscheinlich eine Auswirkung auf den Verdienst eines Individuums haben, sie kann aber nicht oder nur schwer als Kontrollvariable in die Regression mit aufgenommen werden, da sie schwer messbar ist.
4.) Hier muß nur der Satzbau und Ausdruck verbessert werden.
Darüber hinaus kann auch davon ausgegangen werden, dass die persönliche Fähigkeit über die zeit konstant ist.
5.) Im Zeitalter lebenslangen lernens halte ich das für ein Gerücht. Man sich nur die gesellschaftliche Änderung durch das Internet ansehen ...
Ähnliches gilt für andere, unbeobachtete aber relevante Variablen, die gemeinsam die „individuelle Heterogenität“ bilden. Besteht eine solche individuelle Heterogenität, so wird die Anwendung des Kleinste-Quadrate-Schätzers nicht optimal sein und Random-Effects- und Fixed-Effects-Schätzer können Abhilfe schaffen.
Vor der Überarbeitung würde mich besonders ein Statment zu 3+5 interessieren. --Friedrich Graf 20:44, 21. Jan. 2012 (CET)

1) Okay, ich überlege mir was. 2) Wie gesagt: Dafür gibt es wikilinks, die dann eben auf den richtigen Vektor verlinken. 3) bei einem Individuum über Zeit konstant sind, aber nicht als Kontrollvariablen in die Regression mit aufgenommen werden können, z.B. weil sie nicht direkt beobachtbar sind Klarer? 5) Schlage vor, stattdessen "Intelligenz" zu nehmen. Ich stimme dir zu, dass "Fähigkeit" hier ein wenig irreführend ist. Gruß,--SEM 22:05, 21. Jan. 2012 (CET)

"Intelligenz" ist gut. Bei dem Rest warte ich erstmal auf deine Vorlage. --Friedrich Graf 22:27, 21. Jan. 2012 (CET)

Habe mal angefangen; da eh ausgeklammert ist, können wir da ja beide gefahrlos am Text selbst arbeiten!--SEM 23:33, 21. Jan. 2012 (CET)

Habe mal zu 1) etwas formuliert. Gruß,--SEM 09:19, 23. Jan. 2012 (CET)

Vielleicht könnte man noch etwas dazu sagen, wie in dem Beispiel gemessen wird, das ist mir nämlich noch nicht so ganz klar. Geht es hier um die Zeit für Bildung neben dem Beruf oder um reine "Bildungsjahre" vor dem Breuf, in denen nicht gearbeitet wird, dann verstehe ich nicht ganz die Abhängigkeit von der Zeit t. -- HilberTraum 11:28, 23. Jan. 2012 (CET)
Hm ja, ein guter Punkt. Ich beginne da gerade selbst ein wenig zu zweifeln, ob das ein gutes Beispiel ist; die meisten Paper, die ich gefunden habe, setzen Fixed-Effects zwar ein, aber nur als Teil einer Schätzstrategie. Ich suche noch weiter und melde mich dann nochmals hier. Habe was gefunden und werde es einbauen. Das Beispiel mit Bildung auf Einkommen ist sicher nicht das Beste im Sinne von "am nächsten an der Forschung", aber es ist in meinen Augen intuitiver als die meiste anderen, moderneren Studien. Werde es demnächst einbauen, vllt schaffe ich es heute Abend noch. Gruß,--SEM 12:46, 23. Jan. 2012 (CET)
Ist nun etwas ergänzt, auch im "Probleme"-Beispiel. G,--SEM 09:41, 24. Jan. 2012 (CET)

Kleinigkeiten

Bitte besser formulieren: In einem Modell in Abweichungen vom Mittelwert kann sich diese Fehlerbehaftung noch verstärken. --Friedrich Graf 16:41, 24. Jan. 2012 (CET)

Bitte besser formulieren: ... asymptotisch für große Stichproben ... - in der Einleitung sollte ein Satz dem willigen Durchschnittsbürger verständlich sein. Den Inhalt dieser Satzkonstruktion ist selbst mit nachlesen ("asymptotisch") etwas wirr. BG --Friedrich Graf 15:46, 27. Jan. 2012 (CET)

Noch eine Frage

Zu erst einmal an dieser Stelle schon einmal herzlichen Dank an alle für die Mithilfe. Eine Frage noch an 79.139...: Du hast vor einiger Zeit einmal noch bemängelt: Deshalb wird ein spezieller Schätzer konstruiert, der asymptotisch effizient ist. Wie der Schätzer das nun macht, wird überhaupt nicht klar. Die Grundidee sollte spätestens im Artikel kurz skizziert werden. 2) Beim FEM dagegen hängt Alpha explizit von den x ab und es macht wenig Sinn den Term ins Rauschen auszulagern (da das Rauschen ja gerade die von x unabhängigen Effekte modellieren soll). Der normale OLS-Schätzer für die Betas würde für diesen Fall nicht nur ineffizient sondern sogar nicht erwartungstreu sein, oder wie? Das kommt nicht rüber. Auch die Idee zur Beseitigung der Schätzprobleme wird später im Artikel nicht dargestellt, sondern es werden einfach nur Formeln in den Raum geworfen. Das sollte ohne viel Fachchinesisch, also einigermaßen anschaulich geklärt werden, weil es die Essenz des Artikels ist Kommt das in der derzeitigen Form der Abschnitte "Der Random-Effects-Schätzer" und "Der Fixed Effects/Within-Schätzer" nun besser rüber? Gruß,--SEM 19:33, 9. Feb. 2012 (CET)

von der QS-Mathe-Seite hierher verschoben

http://de.wikipedia.org/wiki/Portal:Mathematik/Qualit%C3%A4tssicherung#Fixed-_und_Random-Effects-Modelle --Zulu55 (Diskussion) 15:09, 2. Aug. 2012 (CEST)

  • Die Einleitung geht überhaupt nicht auf das Thema ein, sondern beschreib verschwurbelt, was Schätzer und statistische Daten sind. "Fixed- und Random-Effects-Modelle sind mathematische Annahmen, die an statistische Daten gestellt werden." -> soso... und: "Werden jedoch relevante Größen nicht in die Regression mit aufgenommen, so können Endogenität, Heteroskedastizität und Autokorrelation entstehen, wodurch die Kleinste-Quadrat-Schätzung ihre wünschenswerten Eigenschaften verliert. Im Zusammenhang mit Panel- und Mehrebenendaten können jedoch unter den Annahmen der Fixed- und Random-Effects-Modelle weitere Schätzer hergeleitet werden, die diese Probleme lösen." -> nein, der Ziel eines Panelmodells ist doch was ganz anderes.
  • Warum neben fixed und random nicht between-Schätzer beschrieben werden bleibt mir unklar. Überhaupt würde ich das ganze zu einem zu erstellenden Artikel Panelmodell verschieben. Die Überlappung mit Paneldatenanalyse ist zudem riesig. --Zulu55 (Diskussion) 16:09, 1. Aug. 2012 (CEST)
Ich verstehe nicht ganz, warum du deine Kritik nicht einfach auf Diskussion:Fixed- und Random-Effects-Modelle darlegst. Die Einleitung wurde dort vor nicht allzu langer Zeit ausführlich diskutiert und auch die Problematik mit der Redundanz zu Paneldatenanalyse wurde dort bereits angesprochen. Die Hauptautoren SEM und Friedrich Graf sind aktiv und stehen für eine Diskussion sicher weiter zur Verfügung. Viele Grüße, --Quartl (Diskussion) 16:30, 1. Aug. 2012 (CEST)
Aus dem Grund warum hier Artikel generell eingetragen werden. Sehe die Qualitätsstandards 1 (Einleitung) und 2 (Definition) nicht erfüllt. Und wegen des Mehr-Augen-Prinzips. Wofür ist die Seite hier denn sonst da? --Zulu55 (Diskussion) 12:04, 2. Aug. 2012 (CEST)
Nun, der Artikel wurde von dir infolge von
angelegt. Dann war er hier in der QS
und wurde daraufhin gründlich überarbeitet und entlassen. Dann gab es ein längeres Review
mit guter Beteiligung. Ich kann mir nicht vorstellen, was die QS hier noch leisten kann/soll. Viele Grüße, --Quartl (Diskussion) 13:20, 2. Aug. 2012 (CEST)

Ich empfinde es auch als etwas merkwürdig und schlechten Stil, den Artikel hier einfach ohne Rücksprache auf der Disk oder sonstwo in die QS zu stecken. Die Einleitung ist nicht perfekt, aber der Grat zwischen Laienverständlichkeit und den Anforderungen von WP:WSIGA in Bezug auf die Einleitung ist gerade hier nach meinem Empfinden recht schwierig und hat schon für einige Diskussionen gesorgt. Der Between-Schätzer wird übrigens sehr wohl erwähnt, im Abschnitt "Weitere konsistente Schätzer im Random-Effects-Modell" wird seine Konsistenz erklärt. Über eine Erweiterung des Artikels und eine Verschmelzung mit Panelmodell könnte man nachdenken, das ist aber nichts, was sich einfach so im Handumdrehen bewältigen ließe, und ich sehe nicht, wie das eine Aufgabe für die QS sein sollte. Etwas verwunderte Grüße,--SEM (Diskussion) 14:33, 2. Aug. 2012 (CEST)

Das Review kannte ich noch nicht. Nichts für ungut. Dann verschieb ich das hier mal auf die Artikeldiskussionsseite. --Zulu55 (Diskussion) 15:09, 2. Aug. 2012 (CEST)
Moin, nochmals zu deiner Kritik am Artikel vor einigen Tagen: Die Idee einer Verschiebung gefällt mir gut, ich würde Lineare Paneldatenmodelle als Ziellemma vorschlagen; unter dem Lemma könnten dann beide Modelle abgehandelt werden, ohne dass ich ständig zwischen Modell und Schätzer schwanken muss. Ich würde einmal einen Vorschlag für den Artikel formulieren, den einbauen und verschieben (wird in den nächsten 2-3 Tagen geschehen) und würde dich bitten, den Artikel mal auf die Beo zu nehmen/da zu lassen und dich dann nach der Überarbeitung daran zu beteiligen. Beste Grüße,--SEM (Diskussion) 14:25, 13. Aug. 2012 (CEST)
Warum Lineare Paneldatenmodelle und nicht Panelmodell? 1. Allgemeiner 2. Warum nicht auch für andere offen bleiben? 3. gebräuchlicher Begriff. --Zulu55 (Diskussion) 15:55, 13. Aug. 2012 (CEST)
Nun, ich hatte nicht vor, den Artikel signifikant zu erweitern, sondern ging eher davon aus, dass Dynamische Paneldatenmodelle in einen eigenen Artikel gehören. Gruß,--SEM (Diskussion) 17:55, 13. Aug. 2012 (CEST)

Überarbeiten

Ich würde die jetzige Einleitung ersatzlos streichen. Für mich kein mehrwert für den Artikel erkennbar. Für absolut grundlegende Begriffe muss man halt in den anderen Artikeln nachschauen. Besser ein Verweis auf lineare Regression, sagen, dass das das grundlegende Modell ist (was man schon mal verstanden haben sollte) und in wie fern Panelmodelle eine Erweiterung davon sind --Zulu55 (Diskussion)

was man schon mal verstanden haben sollte - das halte ich für den falschen Ansatz. Wir schreiben bei WP kein Fachbuch, sondern für Laien. Und das Intro soll das Thema Laienverständlich anreissen.
Ich würde die jetzige Einleitung ersatzlos streichen. - wozu? Damit wäre das Lemma kaputt. Dann kannst du einen Löschantrag stellen. Das ist einfacher.
Für mich kein mehrwert für den Artikel erkennbar. - kann nur eins bedeuten - "dieses Lemma ist nicht relevant". Ergo: Löschantrag.
Solltest du etwas anderes gemeint haben, würde ich um eine deutlichere und unmißverständlichere Aussage bitten. --Friedrich Graf (Diskussion) 18:15, 13. Aug. 2012 (CEST)

Überarbeitung, 15.8.

So, meine Überarbeitung ist erst einmal abgeschlossen. Der grundsätzliche Kern des Artikels ist derselbe. Die oben bemängelte Einleitung ist immer noch da, allerdings nicht mehr in der Einleitung, sondern am Anfang des "Grundlagen"-Abschnittes, wo sie in meinen Augen sehr stimmig hineinpasst. Der Artikel ist noch nicht verschoben, aber jetzt schon so geschrieben, als sei er unter dem Lemma "Lineare Paneldatenmodelle" oder "Paneldatenmodelle", RE- und FE-Modell werden zunächst als Untermodelle der linearen Paneldatenmodelle beschrieben, sodann erfolgt für jedes Modell eine Beschreibung möglicher Schätzer, zum Abschluss dann der Vergleich. Ich hoffe, dass der Artikel so besser gefällt (mir tut er es definitiv) und bitte um eure Kommentare und Vorschläge! Was das Lemma angeht, würde ich weiter für Lineare Paneldatenmodelle plädieren, da der Artikel derzeit diese behandelt. Falls er je um andere Modelle erweitert wird, könnte man ja dann immer noch verschieben. Ich persönlich fände es allerdings besser, Dynamische Paneldatenmodelle in einem eigenen Artikel zu behandeln. Grüße,--SEM (Diskussion) 16:38, 15. Aug. 2012 (CEST)

finde ich viel besser so. vielen Dank. --Zulu55 (Diskussion) 16:59, 15. Aug. 2012 (CEST)
Ja, die Struktur ist jetzt deutlich besser. Lineare Paneldatenmodelle finde ich als Lemma in Ordnung, der Artikel ist, so wie er ist, lang genug, noch mehr Modelle sollten mMn nicht rein. Noch eine Kleinigkeit: Den Ausdruck "Observationseinheit" finde ich ziemlich ungewöhnlich, Wikipedia kennt den auch nur in ganz anderem Zusammenhang. -- HilberTraum (Diskussion) 22:12, 15. Aug. 2012 (CEST)
Danke (auch für die sprachliche Überarbeitung!), das war wohl einfach schlampig übersetzt, ich habe jetzt einfach "Individuen" geschrieben. Gruß,--SEM (Diskussion) 11:43, 16. Aug. 2012 (CEST)
Ist "für ... kontrollieren" in der Einleitung nicht auch zu wörtlich übersetzt aus "to control for"? Ist zumindest als Ausdruck nicht besonders allgemeinverständlich. -- HilberTraum (Diskussion) 12:41, 16. Aug. 2012 (CEST)
Hm ja, so lange wir keinen Artikel über Kontrollvariablen haben, auf den man hier verlinken könnte, ist ein "normalerer" Ausdruck wohl besser. Ich habe einmal "berücksichtigen" geschrieben. Gruß,--SEM (Diskussion) 13:16, 17. Aug. 2012 (CEST)

Schätzung des RE-Modells

Hallo,

die Ausführungen zur Schätzung des RE-Modells mögen inhaltlich korrekt sein, sind so aber meiner Meinung nach nicht verständlich. Einerseits suggeriert der Abschnitt durch die Benennung der Zwischenüberschriften, dass sowohl OLS- als auch GLS-Schätzer zur Anwendung kommen. Das ist meines Erachtens falsch. Der OLS-Schätzer ist gerade kein Schätzer im RE-Modell.

Zweitens ist bei der formalen Darstellung der GLS-Schätzung nicht erläutert, wofür X' steht. Spätestens dadurch ist die Formel auch nicht nachvollziehbar, sofern man den Inhalt nicht sowieso schon kennt. Und das ist meines Erachtens nicht Sinn der Sache.

--Jazzman 14:44, 24. Mai 2016 (CEST)

Doch, der OLS-Schätzer kann im RE-Modell verwendet werden- er ist nicht effizient, und man muss die Standardfehler anpassen, aber da der Fehlerterm mit X per RE-Annahme unkorreliert ist, ist er unverzerrt und konsistent. Der RE-Schätzer ist GLS, bzw. FGLS, aber OLS ist trotzdem ein möglicher und konsistenter Schätzer im RE-Modell (deswegen die Unterscheidung zwischen RE/FE-Modell und -Schätzer. Der Hinweis mit dem X' ist allerdings korrekt, das werde ich bei nächster Gelegenheit nachfassen. Danke und Gruß,--SEM (Diskussion) 15:52, 24. Mai 2016 (CEST)
Ist jetzt im "Grundlagen"-Abschnitt ergaenzt. Viele Gruesse, --SEM (Diskussion) 15:09, 2. Jun. 2016 (CEST)