Hotellingsche T-Quadrat-Verteilung
Dichtefunktion
Verteilungsfunktion
Parameter
p – Dimension der Zufallsvariablen m – verknüpft mit der Stichprobengröße
Träger
x
∈
(
0
,
+
∞
)
{\displaystyle x\in (0,+\infty )\;}
if
p
=
1
{\displaystyle p=1}
x
∈
[
0
,
+
∞
)
{\displaystyle x\in [0,+\infty )\;}
otherwise.
Die Hotellingsche T -Quadrat-Verteilung [1] ist eine Wahrscheinlichkeitsverteilung , die 1931 von Harold Hotelling erstmals beschrieben wurde.[2] Sie ist eine Verallgemeinerung der Studentschen t-Verteilung .
Definition
Hotellings T-Quadrat-Verteilung ist definiert als
t
2
=
n
(
x
−
μ
)
′
W
−
1
(
x
−
μ
)
{\displaystyle t^{2}=n({\mathbf {x} }-{\mathbf {\mu } })'{\mathbf {W} }^{-1}({\mathbf {x} }-{\mathbf {\mu } })}
mit
n
{\displaystyle n}
einer Anzahl von Punkten
x
{\displaystyle {\mathbf {x} }}
ist ein Spaltenvektor mit
p
{\displaystyle p}
Elementen
W
{\displaystyle {\mathbf {W} }}
ist eine
p
×
p
{\displaystyle p\times p}
-Kovarianzmatrix .
Eigenschaften
Es sei
x
∼
N
p
(
μ
,
V
)
{\displaystyle x\sim N_{p}(\mu ,{\mathbf {V} })}
eine Zufallsvariable mit einer multivariaten Normalverteilung und
W
∼
W
p
(
m
,
V
)
{\displaystyle {\mathbf {W} }\sim W_{p}(m,{\mathbf {V} })}
(unabhängig von
x
{\displaystyle x}
) habe eine Wishart-Verteilung mit einer nicht-singulären Kovarianzmatrix
V
{\displaystyle \mathbf {V} }
und mit
m
=
n
−
1
{\displaystyle m=n-1}
. Dann ist die Verteilung von
t
2
{\displaystyle t^{2}}
:
T
2
(
p
,
m
)
{\displaystyle T^{2}(p,m)}
, Hotellingsche T -Quadrat-Verteilung mit Parametern
p
{\displaystyle p}
und
m
{\displaystyle m}
.
F
{\displaystyle F}
sei die F-Verteilung . Dann kann gezeigt werden, dass gilt:
m
−
p
+
1
p
m
T
2
∼
F
p
,
m
−
p
+
1
{\displaystyle {\frac {m-p+1}{pm}}T^{2}\sim F_{p,m-p+1}}
.
Unter der Annahme, dass
x
1
,
…
,
x
n
{\displaystyle {\mathbf {x} }_{1},\dots ,{\mathbf {x} }_{n}}
p
×
1
{\displaystyle p\times 1}
-Spaltenvektoren mit reellen Zahlen sind.
x
¯
=
(
x
1
+
⋯
+
x
n
)
/
n
{\displaystyle {\overline {\mathbf {x} }}=(\mathbf {x} _{1}+\cdots +\mathbf {x} _{n})/n}
sei der Mittelwert. Die positiv definite
p
×
p
{\displaystyle p\times p}
-Matrix
W
=
∑
i
=
1
n
(
x
i
−
x
¯
)
(
x
i
−
x
¯
)
′
/
(
n
−
1
)
{\displaystyle {\mathbf {W} }=\sum _{i=1}^{n}(\mathbf {x} _{i}-{\overline {\mathbf {x} }})(\mathbf {x} _{i}-{\overline {\mathbf {x} }})'/(n-1)}
sei ihre Stichproben-Kovarianzmatrix . (Die Transponierte einer Matrix
M
{\displaystyle M}
sei mit
M
′
{\displaystyle M'}
bezeichnet).
μ
{\displaystyle \mu }
sei ein
p
×
1
{\displaystyle p\times 1}
-Spaltenvektor (bei Anwendung ein Schätzer des Mittelwertes). Dann ist die Hotellingsche T -Quadrat-Verteilung
t
2
=
n
(
x
¯
−
μ
)
′
W
−
1
(
x
¯
−
μ
)
.
{\displaystyle t^{2}=n({\overline {\mathbf {x} }}-{\mathbf {\mu } })'{\mathbf {W} }^{-1}({\overline {\mathbf {x} }}-{\mathbf {\mu } }).}
t
2
{\displaystyle t^{2}}
hat eine enge Beziehung zum quadrierten Mahalanobis-Abstand .
Insbesondere kann gezeigt werden[3] , dass, wenn
x
1
,
…
,
x
n
∼
N
p
(
μ
,
V
)
{\displaystyle {\mathbf {x} }_{1},\dots ,{\mathbf {x} }_{n}\sim N_{p}(\mu ,{\mathbf {V} })}
unabhängig sind und
x
¯
{\displaystyle {\overline {\mathbf {x} }}}
und
W
{\displaystyle {\mathbf {W} }}
wie oben definiert sind, dann hat
W
{\displaystyle {\mathbf {W} }}
eine Wishart-Verteilung mit
n
−
1
{\displaystyle n-1}
Freiheitsgraden , so dass
W
∼
W
p
(
V
,
n
−
1
)
{\displaystyle \mathbf {W} \sim W_{p}(V,n-1)}
und ist unabhängig von
x
¯
{\displaystyle {\overline {\mathbf {x} }}}
und
x
¯
∼
N
p
(
μ
,
V
/
n
)
{\displaystyle {\overline {\mathbf {x} }}\sim {\mathcal {N}}_{p}(\mu ,V/n)}
.
Daraus folgt
t
2
=
n
(
x
¯
−
μ
)
′
W
−
1
(
x
¯
−
μ
)
∼
T
2
(
p
,
n
−
1
)
.
{\displaystyle t^{2}=n({\overline {\mathbf {x} }}-{\mathbf {\mu } })'{\mathbf {W} }^{-1}({\overline {\mathbf {x} }}-{\mathbf {\mu } })\sim T^{2}(p,n-1).}
Einzelnachweise
Diskrete univariate Verteilungen
Kontinuierliche univariate Verteilungen
Multivariate Verteilungen