Top-Fragen
Zeitleiste
Chat
Kontext

Studentsche t-Verteilung

Wahrscheinlichkeitsverteilung Aus Wikipedia, der freien Enzyklopädie

Studentsche t-Verteilung
Remove ads

Die studentsche t-Verteilung (auch Student-t-Verteilung oder kurz t-Verteilung) ist eine Wahrscheinlichkeitsverteilung, die 1908 von William Sealy Gosset entwickelt[1] und nach seinem Pseudonym Student benannt wurde.[2]

Thumb
Dichten von -verteilten Zufallsgrößen

Gosset hatte festgestellt, dass die standardisierte Schätzfunktion des Stichproben-Mittelwerts normalverteilter Daten nicht mehr normalverteilt, sondern -verteilt ist, wenn die zur Standardisierung des Mittelwerts benötigte Varianz des Merkmals unbekannt ist und mit der Stichprobenvarianz geschätzt werden muss. Seine -Verteilung erlaubt – insbesondere für kleine Stichprobenumfänge – die Berechnung der Verteilung der Differenz vom Mittelwert der Stichprobe zum wahren Mittelwert der Grundgesamtheit.

Die -Werte hängen vom Signifikanzniveau sowie von der Stichprobengröße ab und bestimmen das Vertrauensintervall und damit die Aussagekraft der Schätzung des Mittelwertes. Die -Verteilung wird mit wachsendem schmaler und geht für in die Standardnormalverteilung über (siehe Grafik rechts). Hypothesentests, bei denen die -Verteilung Verwendung findet, bezeichnet man als t-Tests.

Die Herleitung wurde erstmals 1908 veröffentlicht,[1] als Gosset in der Dubliner Guinness-Brauerei arbeitete. Da sein Arbeitgeber die Veröffentlichung nicht gestattete, veröffentlichte Gosset sie unter dem Pseudonym Student. Der t-Faktor und die zugehörige Theorie wurden erst durch die Arbeiten von R. A. Fisher belegt, der die Verteilung Student’s distribution (Student'sche Verteilung) nannte.

Die -Verteilung kommt allerdings auch schon in früheren Publikationen anderer Autoren vor. Zuerst wurde sie 1876 von Jacob Lüroth als A-posteriori-Verteilung bei der Behandlung eines Problems der Ausgleichsrechnung hergeleitet, 1883 in einem ähnlichen Zusammenhang von Edgeworth[3][4].

Remove ads

Definition

Zusammenfassung
Kontext

Eine stetige Zufallsvariable genügt der studentschen -Verteilung mit Freiheitsgraden, wenn sie die Wahrscheinlichkeitsdichte

besitzt. Dabei ist

die Gammafunktion. Für natürliche Zahlen gilt insbesondere (hierbei bezeichnet die Fakultät von )

Alternativ lässt sich die -Verteilung mit Freiheitsgraden auch definieren als die Verteilung der Größe

,

wobei eine standardnormalverteilte Zufallsvariable und eine von unabhängige Chi-Quadrat-verteilte Zufallsvariable mit Freiheitsgraden ist.

Remove ads

Verteilung

Zusammenfassung
Kontext

Die Verteilungsfunktion lässt sich geschlossen ausdrücken als

oder als

mit

wobei die Betafunktion darstellt.

berechnet die Wahrscheinlichkeit dafür, dass eine gemäß verteilte Zufallsvariable einen Wert kleiner oder gleich erhält.

Remove ads

Eigenschaften

Zusammenfassung
Kontext

Es sei eine -verteilte Zufallsvariable mit Freiheitsgraden und Dichte .

Wendepunkte

Die Dichte besitzt Wendepunkte bei

Median

Der Median ist

Modus

Der Modus ergibt sich zu

Symmetrie

Die Studentsche -Verteilung ist symmetrisch um die 0.

Erwartungswert

Für den Erwartungswert erhält man für

Der Erwartungswert für existiert nicht.

Varianz

Die Varianz ergibt sich für zu

Schiefe

Die Schiefe ist für

Wölbungen

Für die Kurtosis-Wölbung und die Exzess-Wölbung erhält man für

Momente

Für die -ten Momente und die -ten zentralen Momente gilt:

Beziehung zur Betaverteilung

Das Integral

ist die unvollständige Betafunktion

wobei

den Zusammenhang zur vollständigen Betafunktion herstellt. Dann ist für

mit

Wenn t gegen unendlich geht, strebt gegen 1. Im Grenzfall steht im Zähler und Nenner obigen Bruches also dasselbe, das heißt, man erhält:

Remove ads

Nichtzentrale t-Verteilung

Zusammenfassung
Kontext

Die Größe

mit und als Nichtzentralitätsparameter folgt der sogenannten nichtzentralen -Verteilung.[5] Diese Verteilung wird vor allem zur Bestimmung des β-Fehlers bei Hypothesentests mit -verteilter Prüfgröße verwendet. Ihre Wahrscheinlichkeitsdichte lautet:[6]

Thumb
Einige Dichten von nichtzentralen -Verteilungen

Die Klammer mit der Summe hypergeometrischer Funktionen lässt sich noch etwas einfacher schreiben,[7] sodass ein kürzerer alternativer Ausdruck für die Dichte entsteht:

wobei ein Hermitesches Polynom mit negativem Index darstellt mit .

Der Erwartungswert liegt für bei

und die Varianz (für ) bei

Mit erhält man die Kennwerte der zentralen -Verteilung.

Remove ads

Beziehung zu anderen Verteilungen

Zusammenfassung
Kontext

Beziehung zur Cauchy-Verteilung

Für und mit ergibt sich die Cauchy-Verteilung als Spezialfall aus der Studentschen -Verteilung.

Beziehung zur Chi-Quadrat-Verteilung und Standardnormalverteilung

Die -Verteilung beschreibt die Verteilung eines Ausdruckes

wobei eine standardnormalverteilte und eine Chi-Quadrat-verteilte Zufallsvariable mit Freiheitsgraden bedeutet. Die Zählervariable muss unabhängig von der Nennervariable sein. Die Dichtefunktion der -Verteilung ist dann symmetrisch bezüglich ihres Erwartungswertes . Die Werte der Verteilungsfunktion liegen in der Regel tabelliert vor.

Verteilung mit schweren Rändern

Die Verteilung gehört zu den Verteilungen mit schweren Rändern.

Näherung durch die Normalverteilung

Mit steigender Zahl von Freiheitsgraden kann man die Verteilungswerte der -Verteilung mit Hilfe der Normalverteilung annähern. Als Faustregel gilt, dass ab 30 Freiheitsgraden die -Verteilungsfunktion durch die Normalverteilung approximiert werden kann.

Remove ads

Verwendung in der mathematischen Statistik

Zusammenfassung
Kontext

Verschiedene Schätzfunktionen sind -verteilt.

Wenn die unabhängigen Zufallsvariablen identisch normalverteilt sind mit Erwartungswert und Standardabweichung , kann bewiesen werden, dass der Stichprobenmittelwert

und die Stichprobenvarianz

stochastisch unabhängig sind.

Weil die Zufallsgröße eine Standardnormalverteilung hat und einer Chi-Quadrat-Verteilung mit Freiheitsgraden folgt, ergibt sich, dass die Größe

nach Definition -verteilt ist mit Freiheitsgraden.

Also ist der Abstand des gemessenen Mittelwertes vom Mittelwert der Grundgesamtheit verteilt wie . Damit berechnet man dann das 95-%-Konfidenzintervall für den Mittelwert zu

wobei der Wert für implizit durch bestimmt ist, wobei die Verteilungsfunktion einer Zufallsvariablen bezeichnet, die -verteilt ist mit Freiheitsgraden. Dieses Intervall ist für etwas größer als dasjenige, welches sich mit bekanntem aus der Verteilungsfunktion der Normalverteilung bei gleichem Konfidenzniveau ergeben hätte .

Remove ads

Herleitung der Dichte

Zusammenfassung
Kontext

Die Wahrscheinlichkeitsdichte der -Verteilung lässt sich herleiten aus der gemeinsamen Dichte der beiden unabhängigen Zufallsvariablen und , die standardnormal beziehungsweise Chi-Quadrat-verteilt sind:[8]

Mit der Transformation

bekommt man die gemeinsame Dichte von und , wobei und .

Die Jacobideterminante dieser Transformation ist:

Der Wert ist unwichtig, weil er bei der Berechnung der Determinante mit 0 multipliziert wird. Die neue Dichtefunktion schreibt sich also

Gesucht ist nun die Randverteilung als Integral über die nicht interessierende Variable :

Remove ads

Ausgewählte Quantile der t-Verteilung

Tabelliert sind -Werte für verschiedene Freiheitsgrade und gebräuchliche Wahrscheinlichkeiten (0,75 bis 0,999), wofür gilt:

Aufgrund der Spiegelsymmetrie der Dichte braucht man für den Fall des beidseitig symmetrisch begrenzten Intervalls nur die Wahrscheinlichkeitsskala anzupassen. Dabei verringern sich die Wahrscheinlichkeiten bei gleichem , denn das Integrationsintervall wird durch Wegschneiden des Bereichs von bis reduziert:

Werden bei einer Stichprobe Beobachtungen durchgeführt und aus der Stichprobe Parameter geschätzt, so ist die Anzahl der Freiheitsgrade.

Zu der Anzahl von Freiheitsgraden in der ersten Spalte und dem Signifikanzniveau (dargestellt als in der zweiten Zeile) wird in jeder Zelle der folgenden Tabelle der Wert des (einseitigen) Quantils , entsprechend DIN 1319-3, angegeben. Dies erfüllt für die Dichte der -Verteilung die folgenden Gleichungen:

Einseitig:
Zweiseitig:

Also findet man beispielsweise mit und die -Werte von 2,776 (zweiseitig) oder 2,132 (einseitig).

Die Quantilfunktion der -Verteilung ist die Lösung der Gleichung und damit prinzipiell über die Umkehrfunktion zu berechnen. Konkret gilt hier

mit als Inverse der regularisierten unvollständigen Betafunktion. Dieser Wert ist in der Quantiltabelle unter den Koordinaten p und n eingetragen.

Für wenige Werte (1,2,4) vereinfacht sich die Quantilfunktion:[9]

Tabelle einiger t-Quantile

Weitere Informationen ...
Remove ads
Commons: Studentsche -Verteilung – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads