Zentraler Grenzwertsatz

aus Wikipedia, der freien Enzyklopädie
Annäherung von symmetrischen (oben) und schiefen (unten) Binomialverteilungen (rot) an die Normalverteilung (grün)

Der zentrale Grenzwertsatz (von Lindeberg-Lévy) (auch CLT von englisch central limit theorem) ist ein bedeutendes Resultat der Wahrscheinlichkeitstheorie.[1] Der zentrale Grenzwertsatz liefert die Begründung für das Phänomen, dass sich bei der additiven Überlagerung vieler kleiner unabhängiger Zufallseffekte zu einem Gesamteffekt zumindest approximativ eine Normalverteilung ergibt, wenn keiner der einzelnen Effekte einen dominierenden Einfluss auf die Varianz besitzt.[1]

Der Satz ist benannt nach Lindeberg und Lévy.

Es existieren verschiedene Verallgemeinerungen, für die eine identische Verteilung keine notwendige Voraussetzung ist. Stattdessen wird dann eine andere Voraussetzung gefordert, die sicherstellt, dass keine der Variablen zu großen Einfluss auf das Ergebnis erhält. Beispiele sind die Lindeberg-Bedingung und die Ljapunow-Bedingung. Darüber hinausgehende Verallgemeinerungen gestatten sogar „schwache“ Abhängigkeit der Zufallsvariablen. Die Klasse der Verallgemeinerungen des zentralen Grenzwertsatzes wird zentrale Grenzwertsätze genannt.

Die Bezeichnung geht auf G. Pólyas Arbeit Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem von 1920 zurück.[2]

Der Zentrale Grenzwertsatz der Statistik bei identischer Verteilung

Sei eine Folge von Zufallsvariablen, die auf demselben Wahrscheinlichkeitsraum mit dem Wahrscheinlichkeitsmaß alle dieselbe Wahrscheinlichkeitsverteilung aufweisen und unabhängig sind (u.i.v. = unabhängig und identisch verteilt, engl. i.i.d. = independent and identically distributed). Sei weiter angenommen, dass sowohl der Erwartungswert als auch die Standardabweichung existieren und endlich sind.

Betrachten wir nun die -te Teilsumme dieser Zufallsvariablen . Der Erwartungswert von ist und die Varianz ist (siehe Gleichung von Bienaymé). Bildet man daraus die standardisierte Zufallsvariable

dann besagt der Zentrale Grenzwertsatz, dass die Verteilungsfunktion von für punktweise gegen die Verteilungsfunktion der Standardnormalverteilung konvergiert. Dies entspricht genau dem Begriff der Konvergenz in Verteilung in der Stochastik. Ist die Verteilungsfunktion von , dann bedeutet dies, dass für jedes reelle

In etwas anderer Schreibweise erhält man

wobei

der Mittelwert der ersten Summanden der Zufallsvariablen ist.

Bemerkungen

  • Der Zentrale Grenzwertsatz kann aber auch elementar, das heißt ohne das tiefliegende Hilfsmittel der charakteristischen Funktion, bewiesen werden. Dazu werden Erwartungswerte der Form untersucht, die einerseits im Fall einer Indikatorfunktion eines abgeschlossenen Intervalls der Wahrscheinlichkeit entsprechen und andererseits in Fällen einer genügend glatten Funktion gut approximiert werden können. Dieses Verfahren eines elementaren Beweises stammt von Jarl Waldemar Lindeberg.[3]
  • Endliche Stichprobenumfänge lassen die Frage nach der Konvergenzgüte aufsteigen. Unter bestimmten Bedingungen liefert der Satz von Berry-Esseen eine Antwort: Existiert das dritte zentrierte Moment und ist es endlich, dann ist die Konvergenz zur Normalverteilung gleichmäßig und die Konvergenzgeschwindigkeit wenigstens von der Ordnung .
  • Da für stochastisch unabhängige normalverteilte Zufallsvariablen die Summe wieder normalverteilt ist (da die Normalverteilung eine alpha-stabile Verteilung ist), gilt für diese der zentrale Grenzwertsatz im Endlichen, genauer ist für jedes bereits standardnormalverteilt.

Verallgemeinerungen

Eine Verallgemeinerung des Zentralen Grenzwertsatzes ist der mehrdimensionale zentrale Grenzwertsatz. Er liefert Aussagen über die Konvergenz der Verteilungen von Zufallsvektoren gegen die mehrdimensionale Standardnormalverteilung.

Eine weitere Verallgemeinerung ist der zentrale Grenzwertsatz von Lindeberg-Feller. Er lässt auch gewisse Abhängigkeiten zwischen den Zufallsvariablen zu, indem er sie zu Gruppen zusammenfasst und die Unabhängigkeit nur innerhalb dieser Gruppen fordert. Die Folge dieser Gruppen wird ein Schema von Zufallsvariablen genannt. Die Lindeberg-Bedingung und die Ljapunow-Bedingung lassen sich auch für Schemata von Zufallsvariablen formulieren und liefern damit Kriterien für die Konvergenz bei Verwendung von Schemata.

Beweis-Techniken für zentrale Grenzwertsätze

Um zentrale Grenzwertsätze zu beweisen gibt es verschiedene Möglichkeiten, zum Beispiel die Methode von Stein oder Techniken aus der Fourier-Analysis.

Literatur

  • Hans Fischer, A History of the Central Limit Theorem. From Classical to Modern Probability Theory, New York 2011, ISBN 978-0-387-87856-0, doi:10.1007/978-0-387-87857-7.

Siehe auch

Weblinks

Einzelnachweise

  1. a b Zentraler Grenzwertsatz. In: Guido Walz (Hrsg.): Lexikon der Mathematik. 1. Auflage. Spektrum Akademischer Verlag, Mannheim/Heidelberg 2000, ISBN 3-8274-0439-8.
  2. Jeff Miller: Earliest Known Uses of Some of the Words of Mathematics.
    George Pólya: Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem, Mathematische Zeitschrift, 8, 1920, S. 171–181 (online)
  3. Jarl Waldemar Lindeberg: Eine neue Herleitung des Exponentialgesetzes in der Wahrscheinlichkeitsrechnung, Mathematische Zeitschrift, Band 15, 1922, S. 211–225 (Online-Version).
    Siehe auch Jörg Bewersdorff: Statistik – wie und warum sie funktioniert. Ein mathematisches Lesebuch. Vieweg+Teubner Verlag 2011, ISBN 978-3-8348-1753-2, doi:10.1007/978-3-8348-8264-6, S. 139–146.