Test t de Student

O test t de Student ou test t é un test de hipótese que emprega conceptos estatísticos para rexeitar ou non unha hipótese nula cando a estatística de test ( $t\;$ ) segue unha distribución t de Student.

Esa premisa emprégase normalmente cando a estatística de test, na realidade, segue unha distribución normal, mais a varianza da poboación $\sigma$ ² é descoñecida. Nese caso, emprégase a varianza da mostra $s\;$ ² e, con ese axuste, a estatística de proba pasa a seguir unha distribución t de Student.

A estatística t foi introducida en 1908 por William Sealy Gosset, químico da cervexaría Guinness en Dublin, Irlanda, que tiña como pseudónimo "student").^[1]^[2]^[3] Gosset fora contratado debido á política innovadora de Claude Guinness de recrutar os mellores graduados de Oxford e Cambridge para os cargos de bioquímico e estatístico da industria Guinness.^[2] Gosset desenvolveu o test t como un modo barato de estudar a calidade da cervexa tipo stout. Publicou o test t na revista académica Biometrika en 1908, mais foi forzado a usar o seu pseudónimo polo seu empregador, que cría que o feito de usar estatística era un segredo industrial. De feito, a identidade de Gosset non foi recoñecida polos seus compañeiros estatísticos.^[4]

Se se fixeren moitas mostras de tamaño $n\!$ a partir da mesma poboación e se extraeren as medias dunha variable desa poboación que posúe unha distribución normal, a distribución desas moitas medias seguiría unha distribución t de Student. Por exemplo, se se imaxina que a altura das persoas segue unha distribución normal, ao seleccionarmos diversas mostras aleatorias de 100 persoas e calcularmos a media da altura das persoas de cada mostra, esa media da altura das persoas seguirá unha distribución t de Student.

Cómpre entender que, na distribución t de Student, os valores moi baixos ou moi altos teñen menor probabilidade de ocorrer, indicando que é menos probable que a media dunha mostra presente valores moi distantes da media da poboación.

O formato da distribución t de Student depende do número de graos de liberdade. Canto maior é o número de graos de liberdade, máis "concentrada" é a distribución. Para valores moi grandes de graos de liberdade, a distribución t de Student aproxímase á distribución normal.

O test t consiste en formular unha hipótese nula e consecuentemente unha hipótese alternativa, calcular o valor de $t\!$ conforme á fórmula apropiada e aplicalo á función densidade de probabilidade da distribución t de Student medindo o tamaño da área baixo esa función para valores maiores ou iguais a $t\!$ . Esa área representa a probabilidade da media desa(s) mostra(s) en cuestión ter(en) presentado o(s) valor(es) observado(s) ou algo máis extremo. Se a probabilidade de que ese resultado ocorra for moi pequena, pódese concluír que o resultado observado é estatisticamente relevante. Esa probabilidade tamén se chama de p-valor ou valor p. Consecuentemente, o nivel de confianza $\alpha \!$ é igual a 1 - p-valor.

Normalmente emprégase un "punto de corte" para o p-valor ou para o nivel de confianza para definir se a hipótese nula debe ser rexeitada ou non. Se o p-valor for menor que ese "punto de corte", a hipótese nula é rexeitada. En caso contrario, a hipótese nula non se rexeita.

É común que se empreguen os "puntos de corte" para p-valor 0,1 %, 0,5 %, 1 %, 2 % ou 5 %, facendo que os niveis de confianza sexan, respectivamente, 99,9 %, 99,5 %, 99 %, 98 % ou 95 %. No caso de que sexa usado o p-valor 5 % como "punto de corte" e a área baixo a función de densidade de probabilidade da distribución t de Student sexa menor do que 5 %, pódese afirmar que a hipótese nula é rexeitada con nivel de confianza do 95 %.

Debe observarse que non rexeitar a hipótese nula non é o mesmo que afirmar que a hipótese alternativa é válida co mesmo nivel de confianza. Iso sería unha interpretación incorrecta do test.

Unicaudal fronte a bicaudal

Dependendo da definición da hipótese nula, debe ser usado unha ou dúas colas da distribución t de Student na avaliación da proba. Por exemplo, se a hipótese nula for ${\bar {x}}\leq \mu _{0}$ e a hipótese alternativa ${\bar {x}}>\mu _{0}$ , o test debería ser feito soamente para valores maiores de $t\!$ e, polo tanto, ao consultar a función densidade de probabilidade da distribución t de Student, débese considerar soamente a área superior a $t\!$ , ou sexa, soamente unha das colas da distribución.

Por outra banda, se a hipótese nula for ${\bar {x}}=\mu _{0}$ e, consecuentemente, a hipótese alternativa ${\bar {x}}\neq \mu _{0}$ , teríase que avaliar ao mesmo tempo a posibilidade de ${\bar {x}}<\mu _{0}$ e de ${\bar {x}}>\mu _{0}$ . Para iso, ao consultar a función de densidade de probabilidade da distribución t de Student, deben considerarse as áreas baixo a curva para valores superiores a $t\!$ e inferiores a $-t\!$ , ou sexa, as dúas colas da distribución. Como a distribución é simétrica, os tamaños desas áreas son iguais.

O test t para a media dunha mostra consiste en medir a probabilidade de que a media da mostra en cuestión presente o valor observado ${\bar {x}}$ ou algo máis extremo, dada a media da poboación $\mu _{0}\!$ .

Para facer iso, estipúlase, por exemplo, que a hipótese nula é ${\bar {x}}\leq \mu _{0}$ e que, por consecuencia, a hipótese alternativa é ${\bar {x}}>\mu _{0}$ . Emprégase a seguinte fórmula para o cálculo do estatístico t:

t={\frac {{\bar {x}}-\mu _{0}}{\tfrac {s}{\sqrt {n}}}}

, onde:

${\bar {x}}$ : Media da mostra;
$\mu _{0}\!$ : Valor fixo usado para a comparación coa media da mostra;
$s\!$ : Desvío típico da mostra;
$n\!$ : Tamaño da mostra.

Canto maior $t\!$ , máis confianza se ten ao rexeitar a hipótese nula, ou sexa, máis certeza se ten ao afirmar que ${\bar {x}}\leq \mu _{0}$ non é certo.

Nótese que, na fórmula superior, canto maior ${\bar {x}}-\mu _{0}$ , maior será $t\!$ . Ou sexa, canto maior é a distancia dos valores observados ao valor que estamos comparando, terase máis certeza en afirmar que son distintos. Do mesmo modo, $t\!$ aumentta cando o tamaño da mostra $n\!$ é maior ou cando o desvío típico $s\!$ é menor. Teoricamente, o desvío típico que se emprega debería ser o da poboación (normalmente identificado co símbolo $\sigma \!$ ), mais en moitos casos prácticos ese valor é descoñecido, sendo necesario aproximalo polo desvío típico da mostra $s\!$ :

s={\sqrt {{\dfrac {1}{n-1}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}

Exemplo práctico

Un coche determinado consegue percorrer 15 km por cada litro de combustible gastado nunha estrada chá en boas condicións, mais esa distancia pode variar debido a diversos factores. Considérese que a distancia percorrida por litro de combustible teña unha distribución normal con media 15 km e desvío típico de 2 km.

Supóñase que se faga unha modificación no motor dese coche co obxectivo de aumentar a distancia percorrida por litro de combustible. Despois da modificación, foron realizados 10 probas. Nesas probas, a media das distancias percorridas por litro de combustíbel foi de 16,6 km.

Ao principio, como 16,6 km é unha distancia superior a 15 km, parece que a modificación no motor aumentou a distancia percorrida por litro de combustíbel. Mais, para comprobar ese efecto de forma estatística, defínese a hipótese nula ${\bar {x}}\leq \mu _{0}$ e calculamos o valor de $t\!$ .

Neste caso, temos:

{\bar {x}}=16,6\,\mathrm {km}

\mu _{0}=15\,\mathrm {km}

s=2\,\mathrm {km}

n=10

Así,

t={\frac {16,6-15}{\tfrac {2}{\sqrt {10}}}}=2,53

Conforme a función de densidade de probabilidade da distribución t de Student con 9 (10-1) graos de liberdade, existe 1,61 % de probabilidade de valores superiores a 2,53 seren obtidos no caso de que a distancia percorrida por litro de combustible non ser alterada. Se estivermos usando o nivel de confianza do 95 %, rexeitariamos a hipótese nula ${\bar {x}}\leq \mu _{0}$ . Iso pode ser explicado de dúas formas:

A probabilidade obtida co t calculado (1,61 %) é inferior ao "punto de corte" do p-valor (5 %), ou
O valor t do "punto de corte" escollido (95 % de confianza, que corresponde ao t de 1,833), é inferior ao t calculado (2,53).

Na primeira explicación, é necesario calcular a área baixo a función de densidade de probabilidade da distribución t de Student con 9 graos de liberdade para valores superiores a 2,53 usando algún software estatístico ou táboa de cálculo. Na segunda explicación, alén dos softwares estatísticos ou táboas de cálculo, tamén podería chegarse ao valor 1,833 usando unha táboa de valores para a distribución t de Student, que normalmente constan en libros de estatística.

Enténdase que, se usásemos o nivel de confianza do 99 %, ao contrario de 95 %, non rexeitariamos a hipótese nula porque:

A probabilidade obtida co t calculado (1,61 %) é superior ao "punto de corte" do p-valor (1 %), ou
O valor t do "punto de corte" escollido (99 % de confianza, que corresponde ao t de 2,821), é superior ao t calculado (2,53).

Tamaños iguais, varianzas iguais

Este test só debe ser usado cando:

o tamaño das mostras (n) dos dous grupos son iguais;
Podemos asumir que as dúas distribucións posúen a mesma varianza.

O estatístico t calcúlase segundo a fórmula:

t={\frac {{\bar {x}}_{1}-{\bar {x}}_{2}}{S_{x_{1}x_{2}}\cdot {\sqrt {\frac {2}{n}}}}}

,onde

\ S_{x_{1}x_{2}}={\sqrt {\frac {S_{x_{1}}^{2}+S_{x_{2}}^{2}}{2}}}

A cantidade de graos de liberdade que se empregan nese test é $2n-2$ .

Tamaños distintos, variâncias iguais

Esta proba só debe ser usado cando se pode asumir que as dúas distribucións posúen a mesma varianza.

O estatístico t calcúlase segundo a fórmula:

t={\frac {{\bar {x}}_{1}-{\bar {x}}_{2}}{S_{x_{1}x_{2}}\cdot {\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}}}

,onde

S_{x_{1}x_{2}}={\sqrt {\frac {(n_{1}-1)S_{x_{1}}^{2}+(n_{2}-1)S_{x_{2}}^{2}}{n_{1}+n_{2}-2}}}.

A cantidade de graos de liberdade que se empregan nese test é $n_{1}+n_{2}-2$ .

Tamaños distintos, varianzas distintas

Este test emprégase cando as mostras posúen varianzas distintas. Para confirmar se as varianzas son realmente distintas, é recomendable realizar unha proba de varianzas.

O estatístico t calcúlase segundo a fórmula:

t={{\bar {x}}_{1}-{\bar {x}}_{2} \over s_{{\bar {x}}_{1}-{\bar {x}}_{2}}}

,onde

s_{{\bar {x}}_{1}-{\bar {x}}_{2}}={\sqrt {{s_{1}^{2} \over n_{1}}+{s_{2}^{2} \over n_{2}}}}

A cantidade de graos de liberdade que se empregan nese test é:

{\frac {(s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2})^{2}}{(s_{1}^{2}/n_{1})^{2}/(n_{1}-1)+(s_{2}^{2}/n_{2})^{2}/(n_{2}-1)}}

Esta ecuación denomínase ecuación de Welch–Satterthwaite.

O test t tamén pode empregarse para examinar a significancia dos coeficientes de regresións. En xeral esa proba emprégase para confirmar se a variable que está sendo usada na regresión está realmente contribuíndo para a estimación.

[1]
Richard Mankiewicz
[2]
"Biografía". Arquivado dende o orixinal o 01 de decembro de 2016. Consultado o 20 de novembro de 2016.
[3]
Box, Joan Fisher. "Guinness, Gosset, Fisher, and Small Samples" (en inglés) 2. doi:10.1214/ss/1177013437.
[4]
Raju, Tonse N. K. "William Sealy Gosset and William A. Silverman: Two “Students” of Science" (en inglés) 116. PMID 16140715. doi:10.1542/peds.2005-1134.

Outros artigos

[1] [1]
Richard Mankiewicz

[Gossett-2] [2]
"Biografía". Arquivado dende o orixinal o 01 de decembro de 2016. Consultado o 20 de novembro de 2016.

[3] [3]
Box, Joan Fisher. "Guinness, Gosset, Fisher, and Small Samples" (en inglés) 2. doi:10.1214/ss/1177013437.

[4] [4]
Raju, Tonse N. K. "William Sealy Gosset and William A. Silverman: Two “Students” of Science" (en inglés) 116. PMID 16140715. doi:10.1542/peds.2005-1134.

[1]

[2]

[3]

[4]