Desviación típica

Interpretación e aplicación

A desviación estándar é unha medida do grao de dispersión dos datos do valor medio. Dito doutra maneira, a desviación estándar é simplemente a "media" ou variación esperada con respecto da media aritmética.

Unha desviación estándar grande indica que os puntos están lonxe da media e unha desviación pequeno indica que os datos están agrupados cerca da media.

Por exemplo, as tres mostras (0, 0, 14, 14), (0, 6, 8, 14) e (6, 6, 8, 8) cada unha teñen unha media de 7. As súas desviacións estándar son 7, 5 e 1, respectivamente. A terceira mostra ten unha desviación moito menor que as outras dúas porque os seus valores están máis próximos a 7.

A desviación estándar pode ser interpretado como unha medida de incerteza. A desviación estándar dun grupo repetido de medidas dá a precisión destas. Cando se vai determinar se un grupo de medidas está de acordo co modelo teórico, a desviación estándar desas medidas é de vital importancia: se a media das medidas está demasiado afastada da predición (coa distancia medida en desviacións estándar), entón considérase que as medidas contradín a teoría. Isto é de esperarse xa que as medicións caen fóra do rango de valores dos cales sería razoable esperar que ocorresen se o modelo teórico fose correcto.

Remove ads

Formulación

A desviación estándar (DS/DE) é unha medida de dispersión usada en estatística que indica canto tenden a afastarse os valores puntuais da media nunha distribución. De feito, especificamente a desviación estándar é "a media da distancia de cada punto respecto do valor medio". Adóitase representar por un S ou coa letra sigma, $\sigma _{}^{}$ . Esta medida é máis estable que o percorrido e toma en consideración o valor de cada dato.

É posible calcular a desviación estándar como a raíz cadrada da integral

{\sigma }^{2}=\int _{-\infty }^{\infty }{(x-\mu )}^{2}f(x)dx

onde

\mu =\int _{-\infty }^{\infty }xf(x)dx

O DS é a raíz cadrada da varianza da distribución

\sigma ^{2}=\lim _{n\to \infty }{\frac {1}{n}}\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}

Así a varianza é a media dos cadrados das diferenzas entre cada valor da variable e a media aritmética da distribución.

Aínda que esta fórmula é correcta, na práctica interesa realizar inferencias de poboación, polo que no denominador en vez de n, úsase n-1 (Corrección de Bessel)