Varianza

En teoría de probabilidad, la varianza o variancia (que suele representarse como $\sigma ^{2}$ ) de una variable aleatoria es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. Su unidad de medida corresponde al cuadrado de la unidad de medida de la variable: por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La varianza tiene como valor mínimo 0. La desviación estándar (raíz cuadrada positiva de la varianza) es una medida de dispersión alternativa, expresada en las mismas unidades que los datos de la variable objeto de estudio.

Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersión más robustas.

Una ventaja de la varianza como medida de dispersión es que es más susceptible de manipulación algebraica que otras medidas de dispersión como la Desviación absoluta esperada; por ejemplo, la varianza de una suma de variables aleatorias no correlacionadas es igual a la suma de sus varianzas. Una desventaja de la varianza para aplicaciones prácticas es que, a diferencia de la desviación estándar, sus unidades difieren de la variable aleatoria, razón por la cual la desviación estándar se reporta más comúnmente como una medida de dispersión una vez terminado el cálculo.

Existen dos conceptos distintos que se denominan "varianza". Uno, como se ha comentado anteriormente, forma parte de una distribución de probabilidad teórica y se define mediante una ecuación. La otra varianza es una característica de un conjunto de observaciones. Cuando la varianza se calcula a partir de observaciones, éstas se suelen medir a partir de un sistema del mundo real. Si están presentes todas las observaciones posibles del sistema, la varianza calculada se denomina varianza poblacional. Sin embargo, normalmente sólo se dispone de un subconjunto, y la varianza calculada a partir de éste se denomina varianza muestral. La varianza calculada a partir de una muestra se considera una estimación de la varianza de toda la población. Existen múltiples formas de calcular una estimación de la varianza de la población, como se explica en la sección siguiente.

Los dos tipos de varianza están estrechamente relacionados. Para véase cómo, considérese que una distribución de probabilidad teórica puede utilizarse como generador de observaciones hipotéticas. Si se genera un número infinito de observaciones utilizando una distribución, entonces la varianza muestral calculada a partir de ese conjunto infinito coincidirá con el valor calculado utilizando la ecuación de la distribución para la varianza.

El término varianza fue acuñado por Ronald Fisher en un artículo publicado en enero de 1919 con el título The Correlation Between Relatives on the Supposition of Mendelian Inheritance.^[1]

A continuación se hará un repaso de las fórmulas, hay que tener en cuenta que la fórmula de la varianza para una población (σ²) difiere de la fórmula de la varianza para una muestra (s²), Pero antes de ver la fórmula de la varianza, debemos decir que la varianza en estadística es muy importante. Ya que aunque se trata de una medida sencilla, puede aportar mucha información sobre una variable en concreto.

[1]

Varianza

medida de dispersión en estadística / De Wikipedia, la enciclopedia encyclopedia

Estimado Wikiwand AI, Seamos breves simplemente respondiendo estas preguntas clave: