La varianza es una medida de dispersión que representa la variabilidad de una serie de datos relacionados con la media.
Se calcula oficialmente como la suma de los residuos al cuadrado dividida por el total de observaciones.
También se puede calcular como la desviación estándar al cuadrado. Por cierto, aprendimos la diferencia entre el valor de la variable desperdiciada y el valor promedio de toda la variable.
Antes de mirar la fórmula de la varianza, debemos decir que las diferencias estadísticas son muy importantes.
Porque aunque esta es una métrica simple, puede proporcionar mucha información sobre variables específicas.
Fórmula para calcular la varianza La unidad de medida de la varianza es siempre la unidad de medida correspondiente a los datos, pero que aumenta al cuadrado. La diferencia siempre es mayor o igual a cero.
Formula de la Varianza
Cuando el residuo se eleva al cuadrado, la diferencia matemática no se puede restaurar a un valor negativo. De esta forma, no puede ser menor que cero.
Donde
- X: variable sobre la que se pretenden calcular la varianza
- xi: observación número i de la variable X. i puede tomará valores entre 1 y n.
- n: número de observaciones.
- x̄: Es la media de la variable X.
O lo que es lo mismo:
¿Qué diferencia existe entre la varianza y la desviación típica?
Una pregunta que se puede plantear es que la diferencia entre varianza y desviación estándar .
De hecho, sus resultados de medición son los mismos. La varianza es el cuadrado de la desviación estándar. O a la inversa, la desviación estándar es la raíz cuadrada de la varianza.
La desviación estándar opera en la unidad de medida original. Por supuesto, como de costumbre, ¿qué significa varianza como concepto?
Pues bien, aunque la explicación del valor que da no nos da mucha información, su cálculo es necesario para obtener los valores de otros parámetros.
Para calcular la covarianza, necesitamos la varianza, no la desviación estándar; para calcular ciertas matrices econométricas, necesitamos usar la varianza, no la desviación estándar. Esto es conveniente cuando se utilizan datos en ciertos cálculos
¿Por qué se elevan al cuadrado los residuos?
La razón por la que el residuo está cuadrado es simple. Si no estuvieran al cuadrado, la suma de los escombros sería cero.
Es un páramo. Así que para evitar esto, como con la desviación típica, están al cuadrado.
El resultado es la unidad de medida en la que se miden los datos pero se cuadran.
Por ejemplo, si tuviéramos datos sobre los salarios de un cierto número de personas en euros, los datos indicados por la brecha estarían en euros cuadrados.
Para dar sentido a la interpretación, calculamos la desviación estándar y pasamos los datos al euro.
- Desviación -> (2-3) = -1
- Desviación -> (4-3) = 1
- Desviación -> (2-3) = -1
- Desviación -> (4-3) = 1
- Desviación -> (2-3) = -1
- Desviación -> (4-3) = 1
Si sumamos todas las desviaciones el resultado es cero.
Ejemplo de cálculo de la varianza
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con un salario diferente:
Santiago: 1.500 euros
Orlando: 1.200 euros
Daniel: 1.700 euros
Miguel: 1.300 euros
Mateo: 1.800 euros
La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 + 1.700 + 1.300 + 1.800) /5) 1.500 euros.
Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:
Obtendremos que se debe calcular tal que:
El resultado es 52.000 euros al cuadrado. Es importante recordar que siempre que calculamos la varianza, debemos elevar al cuadrado la unidad de medida.
Para convertirlo a Euros, en este caso tendremos que implementar la desviación estándar.
El resultado aproximado es de 228 euros. Esto significa que, de media, la diferencia entre los sueldos de distintas personas es de 228 euros.