Standardfehler

Der Standardfehler oder Stichprobenfehler ist ein Streuungsmaß für eine Schätzfunktion ${\hat {\vartheta }}$ für einen unbekannten Parameter $\vartheta$ der Grundgesamtheit. Der Standardfehler ist definiert als die Standardabweichung $\sigma ({\hat {\vartheta }})={\sqrt {\operatorname {Var} ({\hat {\vartheta }})}}$ der Schätzfunktion, ${\hat {\vartheta }}$ , das heißt also die Quadratwurzel aus der Varianz^[1]. In den Naturwissenschaften und der Metrologie wird auch der durch den GUM geprägte Begriff Standardunsicherheit verwendet.

Bei einem erwartungstreuen Schätzer ist daher der Standardfehler ein Maß für die durchschnittliche Abweichung des geschätzten Parameterwertes vom wahren Parameterwert. Je kleiner der Standardfehler ist, desto genauer kann der unbekannte Parameter mit Hilfe der Schätzfunktion geschätzt werden. Der Standardfehler hängt unter anderem ab von

dem Stichprobenumfang und
der Varianz in der Grundgesamtheit.

Allgemein gilt: Je größer der Stichprobenumfang, desto kleiner der Standardfehler; je kleiner die Varianz, desto kleiner der Standardfehler.

Eine wichtige Rolle spielt der Standardfehler auch bei der Berechnung von Schätzfehlern, Konfidenzintervallen und Teststatistiken.

Der Standardfehler liefert eine Aussage über die Güte des geschätzten Parameters. Je mehr Einzelwerte es gibt, desto kleiner ist der Standardfehler, und umso genauer kann der unbekannte Parameter geschätzt werden. Der Standardfehler macht die gemessene Streuung (Standardabweichung) zweier Datensätze mit unterschiedlichen Stichprobenumfängen vergleichbar, indem er die Standardabweichung auf den Stichprobenumfang normiert.

Wird mit Hilfe von mehreren Stichproben der unbekannte Parameter geschätzt, so werden die Ergebnisse von Stichprobe zu Stichprobe variieren. Natürlich stammt diese Variation nicht von einer Variation des unbekannten Parameters (denn der ist fix), sondern von Zufallseinflüssen, z. B. Messungenauigkeiten. Der Standardfehler ist die Standardabweichung der geschätzten Parameter in vielen Stichproben. Im Allgemeinen gilt: Für eine Halbierung des Standardfehlers ist eine Vervierfachung des Stichprobenumfangs nötig.

Im Gegensatz dazu bildet die Standardabweichung die in einer Grundgesamtheit tatsächlich vorhandene Streuung ab, die auch bei höchster Messgenauigkeit und unendlich vielen Einzelmessungen vorhanden ist (z. B. bei Gewichtsverteilung, Größenverteilung, Monatseinkommen). Sie zeigt, ob die Einzelwerte nahe beieinander liegen oder eine starke Spreizung der Daten vorliegt.

Angenommen, man untersucht die Grundgesamtheit von Kindern, die Gymnasien besuchen, hinsichtlich ihrer Intelligenzleistung. Der unbekannte Parameter ist also die mittlere Intelligenzleistung der Kinder, die ein Gymnasium besuchen. Wenn nun zufällig aus dieser Grundgesamtheit eine Stichprobe des Umfanges $n$ (also mit $n$ Kindern) gezogen wird, dann kann man aus allen $n$ Messergebnissen den Mittelwert berechnen. Wenn nun nach dieser Stichprobe noch eine weitere, zufällig gezogene Stichprobe mit der gleichen Anzahl von $n$ Kindern gezogen und deren Mittelwert ermittelt wird, so werden die beiden Mittelwerte nicht exakt übereinstimmen. Zieht man noch eine Vielzahl weiterer zufälliger Stichproben des Umfanges $n$ , dann kann die Streuung aller empirisch ermittelten Mittelwerte um den Mittelwert der Grundgesamtheit ermittelt werden. Diese Streuung ist der Standardfehler. Da der Mittelwert der Stichprobenmittelwerte der beste Schätzer für den Mittelwert der Grundgesamtheit ist, entspricht der Standardfehler der Streuung der empirischen Mittelwerte um den Mittelwert der Grundgesamtheit. Er bildet nicht die Intelligenzstreuung der Kinder, sondern die Genauigkeit des errechneten Mittelwerts ab.

Für den Standardfehler benutzt man verschiedene Bezeichnungen um ihn von der Standardabweichung $\sigma$ der Grundgesamtheit zu unterscheiden und um zu verdeutlichen, dass es sich um die Streuung des geschätzten Parameters von Stichproben handelt:

$\sigma _{n}$ ,
$\sigma ({\hat {\vartheta }})$ oder
$\sigma _{\hat {\vartheta }}$ .

Der Standardfehler spielt auch eine wichtige Rolle bei Konfidenzintervallen und Tests. Wenn die Schätzfunktion ${\hat {\vartheta }}$ erwartungstreu und zumindest approximativ normalverteilt ( ${\mathcal {N}}(\vartheta ,\sigma ^{2}({\hat {\vartheta }}))$ ) ist, dann ist

{\frac {{\hat {\vartheta }}-\vartheta }{\sigma ({\hat {\vartheta }})}}\approx {\mathcal {N}}(0;1)

.

Auf dieser Basis lassen sich $(1-\alpha )$ -Konfidenzintervalle für den unbekannten Parameter $\vartheta$ angeben:

P({\hat {\vartheta }}-z_{1-\alpha /2}\sigma ({\hat {\vartheta }})\leq \vartheta \leq {\hat {\vartheta }}+z_{1-\alpha /2}\sigma ({\hat {\vartheta }}))=1-\alpha

bzw. Tests formulieren, z. B. ob der Parameter einen bestimmten Wert $\vartheta _{0}$ annimmt:

H_{0}:\vartheta =\vartheta _{0}

vs.

H_{1}:\vartheta \neq \vartheta _{0}

und die Teststatistik ergibt sich zu:

V={\frac {{\hat {\vartheta }}-\vartheta _{0}}{\sigma ({\hat {\vartheta }})}}\approx {\mathcal {N}}(0;1)

.

$z_{1-\alpha /2}$ ist das $(1-\alpha /2)$ -Quantil der Standardnormalverteilung und sind auch der kritische Wert für den formulierten Test. In der Regel muss $\sigma ({\hat {\vartheta }})$ aus der Stichprobe geschätzt werden, so dass

V={\frac {{\hat {\vartheta }}-\vartheta _{0}}{{\hat {\sigma }}({\hat {\vartheta }})}}\approx t_{n-1}

gilt, wobei $n$ die Anzahl der Beobachtungen ist. Für $n\geq 30$ kann die t-Verteilung durch die Standardnormalverteilung approximiert werden.

Der Standardfehler des arithmetischen Mittels ist gleich

\sigma ({\overline {X}})={\frac {\sigma }{\sqrt {n}}}

,

wobei $\sigma$ die Standardabweichung einer einzelnen Messung bezeichnet. Der Standardfehler des Mittelwertes kann entweder mit obiger Formel und Schätzung von $\sigma$ berechnet werden, oder direkt mithilfe des Bootstrapping-Verfahrens oder der Jackknife-Methode.

Herleitung

Der Mittelwert einer Stichprobe vom Umfang $n$ ist definiert durch

{\overline {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}.

Betrachtet man die Schätzfunktion

{\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}

mit unabhängigen, identisch verteilten Zufallsvariablen $X_{1},\ldots ,X_{n}$ mit endlicher Varianz $\sigma ^{2}$ , so ist der Standardfehler definiert als die Wurzel aus der Varianz von ${\overline {X}}$ . Man berechnet unter Verwendung der Rechenregeln für Varianzen und der Gleichung von Bienaymé:

\sigma ({\overline {X}})^{2}=\operatorname {Var} \left({\overline {X}}\right)=\operatorname {Var} \left({\frac {1}{n}}\sum _{i=1}^{n}X_{i}\right)={\frac {1}{n^{2}}}\operatorname {Var} \left(\sum _{i=1}^{n}X_{i}\right)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\operatorname {Var} \left(X_{i}\right)={\frac {1}{n^{2}}}n\sigma ^{2}={\frac {\sigma ^{2}}{n}}

woraus die Formel für den Standardfehler folgt. Falls $\operatorname {Var} (X_{i})=\sigma _{i}^{2}$ gilt, so folgt analog

\sigma ({\overline {X}})^{2}={\frac {1}{n^{2}}}\sum _{i=1}^{n}\sigma _{i}^{2}

.

Schätzung von σ

Da in den Standardfehler die Standardabweichung $\sigma$ der Grundgesamtheit eingeht, muss für eine Schätzung des Standardfehlers die Standardabweichung in der Grundgesamtheit mit einem möglichst erwartungstreuen Schätzer derselben geschätzt werden.

Unterstellt man eine Stichprobenverteilung, so kann der Standardfehler anhand der Varianz der Stichprobenverteilung berechnet werden:

bei der Binomialverteilung mit Parametern $N,\,p$

\sigma _{{\bar {x}},\mathrm {binom} }={\frac {\sqrt {N\cdot p\cdot (1-p)}}{\sqrt {n}}}

,

bei der Exponentialverteilung mit Parameter $\lambda$ (Erwartungswert = Standardabweichung = $1/\lambda$ ):

\sigma _{{\bar {x}},\mathrm {exp} }={\frac {1}{\lambda {\sqrt {n}}}}

und bei der Poisson-Verteilung mit Parameter $\lambda$ (Erwartungswert = Varianz = $\lambda$ ):

\sigma _{{\bar {x}},\mathrm {poisson} }={\sqrt {\frac {\lambda }{n}}}

Dabei bezeichnen

$\sigma _{{\bar {x}},\mathrm {binom} },\sigma _{{\bar {x}},\mathrm {exp} },\sigma _{{\bar {x}},\mathrm {poisson} }$ die Standardfehler der jeweiligen Verteilung, und
$n$ den Stichprobenumfang.

Soll der Standardfehler für den Mittelwert geschätzt werden, dann wird die Varianz $\sigma ^{2}$ mit der korrigierten Stichprobenvarianz geschätzt.

Beispiel

Für die Eiscreme-Daten^[2]^[3] wurde für den Pro-Kopf-Verbrauch von Eiscreme (gemessen in Pint) das arithmetische Mittel, dessen Standardfehler und die Standardabweichung für die Jahre 1951, 1952 und 1953 berechnet.

Weitere Informationen Jahr, Mittelwert ...

Jahr	Mittelwert	Standardfehler des Mittelwerts	Standard- abweichung	Anzahl der Beobachtungen
1951	0,34680	0,01891	0,05980	10
1952	0,34954	0,01636	0,05899	13
1953	0,39586	0,03064	0,08106	7

Schließen

Für die Jahre 1951 und 1952 sind die geschätzten Mittelwerte und Standardabweichungen sowie die Beobachtungszahlen etwa gleich. Deswegen ergeben die geschätzten Standardfehler auch etwa den gleichen Wert. Im Jahr 1953 sind zum einen die Beobachtungszahlen geringer als auch die Standardabweichung größer. Daher ist der Standardfehler fast doppelt so groß wie die Standardfehler aus den Jahren 1951 und 1952.

Thumb — 95 % Schätzintervalle für drei Jahre für das arithmetische Mittel des Pro-Kopf-Eiscremeverbrauchs.

Die grafische Darstellung kann mittels eines Fehlerbalkendiagramms erfolgen. Rechts werden die 95 %-Schätzintervalle für die Jahre 1951, 1952 und 1953 dargestellt. Wenn die Stichprobenfunktion ${\bar {X}}$ zumindest approximativ normalverteilt ist, dann sind die 95 %-Schätzintervalle gegeben durch ${\bar {x_{j}}}\pm 1{,}96\cdot s_{j}/{\sqrt {n_{j}}}$ mit $j=1951,1952,1953$ und ${\bar {x}}_{j}$ die Stichprobenmittelwerte und $s_{j}^{2}$ die Stichprobenvarianzen.

Auch hier sieht man deutlich, dass der Mittelwert 1953 ungenauer geschätzt werden kann als die Mittelwerte von 1951 und 1952 (längerer Balken für 1953).

Endlich große Population

Bei einer endlich großen Population mit Größe $N$ und Stichprobengröße $n$ ist die Varianz des geschätzten Mittelwertes^[4]

\operatorname {Var} \left({\frac {1}{n}}\sum _{i}X_{i}\right)={\frac {1}{n}}\left(1-{\frac {n}{N}}\right)\sigma ^{2}.

Die Varianz des Mittelwert-Schätzers ist somit Null, wenn $n=N$ .

Im klassischen Regressionsmodell für die einfache lineare Regression $Y_{i}=\beta _{0}+\beta _{1}x_{i}+\varepsilon _{i}$ wird vorausgesetzt, dass

die Störterme $\varepsilon _{i}\sim \,(0,\sigma ^{2})$ normalverteilt sind,
die Störterme unabhängig sind und
die Werte $x_{i}$ fix sind (also keine Zufallsvariablen),

wobei $i=1,\ldots ,n$ die gemachten Beobachtungen durchläuft. Für die Schätzfunktionen

{\hat {\beta }}_{1}={\frac {\sum _{i}(x_{i}-{\overline {x}})(Y_{i}-{\overline {Y}})}{\sum _{i}(x_{i}-{\overline {x}})^{2}}}

und

{\hat {\beta }}_{0}={\overline {Y}}-{\hat {\beta }}_{1}{\overline {x}}

ergibt sich dann

{\hat {\beta }}_{1}\sim {\mathcal {N}}(\beta _{1},\sigma _{{\hat {\beta }}_{1}}^{2})

und

{\hat {\beta }}_{0}\sim {\mathcal {N}}(\beta _{0},\sigma _{{\hat {\beta }}_{0}}^{2})

.

Die Standardfehler der Regressionskoeffizienten ergeben sich zu

\sigma _{{\hat {\beta }}_{1}}=\operatorname {SD} ({\hat {\beta }}_{1})=\sigma {\sqrt {\underbrace {\frac {1}{\sum \nolimits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}} _{=:a_{1}}}}=\sigma \cdot {\sqrt {a_{1}}}

und

\sigma _{{\hat {\beta }}_{0}}=\operatorname {SD} ({\hat {\beta }}_{0})=\sigma {\sqrt {\underbrace {\frac {\sum \nolimits _{i=1}^{n}x_{i}^{2}}{n\sum \nolimits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}} _{=:a_{0}}}}=\sigma \cdot {\sqrt {a_{0}}}

.

Beispiel: Für die Eiscreme-Daten^[2]^[3] wurde für den Pro-Kopf-Verbrauch von Eiscreme (gemessen in halbe Liter) eine einfache lineare Regression mit der mittleren Wochentemperatur (in Fahrenheit) als unabhängige Variable durchgeführt. Die Schätzung des Regressionsmodells ergab:

{\text{Pro-Kopf-Verbrauch}}=0{,}20686+0{,}00311\cdot {\text{Temperatur}}

.

Weitere Informationen Modell, Nicht standardisierte Koeffizienten ...

Modell	Nicht standardisierte Koeffizienten		Standardisierte Koeffizienten	T	Sig.
	Regressionskoeffizienten	Standardfehler	Standardisierte Koeffizienten
Konstante	0,20686	0,02470		8,375	0,000
Temperatur	0,00311	0,00048	0,776	6,502	0,000

Schließen

Zwar ist der geschätzte Regressionskoeffizient für die mittlere Wochentemperatur sehr klein, jedoch ergab der geschätzte Standardfehler einen noch kleineren Wert. Die Genauigkeit, mit der der Regressionskoeffizient geschätzt wird, ist gut 6,5 mal so klein wie der Koeffizient selbst.

Der Ausdruck

\sigma ({\hat {\theta }}_{ML})={\frac {1}{\sqrt {-{\frac {\partial ^{2}}{\partial \theta ^{2}}}\ell ({\hat {\theta }}_{ML})}}}

wird auch als Standardfehler des Maximum-Likelihood-Schätzers bezeichnet, wobei $\ell (\cdot )=\log {\mathcal {L}}(\cdot )$ die Log-Likelihood-Funktion und $-{\frac {\partial ^{2}}{\partial \theta ^{2}}}\ell ({\hat {\theta }}_{ML})$ die beobachtete Fisher-Information darstellt (die Fisher-Information an der Stelle des ML-Schätzers ${\hat {\theta }}_{ML}$ ).^[5]

Standardfehler der Regression

[1]
Eric W. Weisstein: Standard Error. Abgerufen am 7. November 2021 (englisch).
[2]
Koteswara Rao Kadiyala (1970): Testing for the independence of regression disturbances. In: Econometrica, 38, 97–117.
[3]
Eiscreme Daten. In: Data and Story Library, abgerufen am 16. Februar 2010
[4]
Quenouille, M. (2014). Introductory Statistics. Niederlande: Elsevier Science. https://books.google.de/books?id=anHiBQAAQBAJ&pg=PA208
[5]
Supplement: Loglikelihood and Confidence Intervals. Abgerufen am 14. Juli 2021.

[1] [1]
Eric W. Weisstein: Standard Error. Abgerufen am 7. November 2021 (englisch).

[krk-2] [2]
Koteswara Rao Kadiyala (1970): Testing for the independence of regression disturbances. In: Econometrica, 38, 97–117.

[icecream-3] [3]
Eiscreme Daten. In: Data and Story Library, abgerufen am 16. Februar 2010

[4] [4]
Quenouille, M. (2014). Introductory Statistics. Niederlande: Elsevier Science. https://books.google.de/books?id=anHiBQAAQBAJ&pg=PA208

[Loglikelihood_and_Confidence_Intervals-5] [5]
Supplement: Loglikelihood and Confidence Intervals. Abgerufen am 14. Juli 2021.

[1]

[2]

[3]

[4]

[5]