Logo Studenta

Medidas de dispersión varianza

¡Estudia con miles de materiales!

Vista previa del material en texto

Medidas de dispersión: varianza
La Estadística Descriptiva no solo se limita a proporcionar medidas de tendencia central,
sino que también incluye medidas de dispersión que nos permiten analizar la variabilidad
de los datos. Una de las medidas de dispersión más utilizadas es la varianza.
La varianza es una medida que indica qué tan dispersos están los datos con respecto a la
media. En otras palabras, nos proporciona una medida de la variabilidad de los datos
alrededor de la media aritmética. Para calcular la varianza, se realiza lo siguiente:
Restar cada valor del conjunto de datos por la media aritmética.
Elevar al cuadrado cada uno de los resultados obtenidos en el paso anterior.
Sumar todos los valores obtenidos en el paso anterior.
Dividir la suma obtenida entre el número total de observaciones.
La fórmula matemática para calcular la varianza es la siguiente:
Varianza = Σ(x - μ)² / n
Donde:
Σ representa la suma de los valores.
x es cada valor del conjunto de datos.
μ es la media aritmética.
n es el número total de observaciones.
La varianza se expresa en unidades al cuadrado, ya que se obtiene elevando al cuadrado
las diferencias entre cada valor y la media. Por lo tanto, no es fácil de interpretar
directamente. Para tener una medida más interpretable, se utiliza la desviación estándar.
La desviación estándar es la raíz cuadrada de la varianza y se expresa en las mismas
unidades que los datos originales. Es una medida más comúnmente utilizada, ya que
proporciona una idea más intuitiva de la dispersión de los datos. La fórmula para calcular
la desviación estándar es la siguiente:
Desviación estándar = √Varianza
La varianza y la desviación estándar son medidas útiles para comparar la dispersión de
diferentes conjuntos de datos. Si dos conjuntos de datos tienen la misma media
aritmética, pero uno tiene una varianza o desviación estándar mayor, esto indica que los
datos están más dispersos en ese conjunto.
Es importante tener en cuenta que tanto la varianza como la desviación estándar son
sensibles a los valores extremos o atípicos. Si un conjunto de datos contiene valores
extremos, esto puede aumentar la varianza y la desviación estándar, lo que puede afectar
su interpretación. Por lo tanto, es recomendable analizar la presencia de valores atípicos
antes de interpretar estas medidas.
En resumen, la varianza y la desviación estándar son medidas de dispersión utilizadas en
estadística descriptiva para analizar la variabilidad de los datos alrededor de la media
aritmética. La varianza proporciona una medida de dispersión en unidades al cuadrado,
mientras que la desviación estándar es una medida más intuitiva y se expresa en las
mismas unidades que los datos originales. Estas medidas son útiles para comparar la
dispersión de diferentes conjuntos de datos, pero es importante tener en cuenta la
presencia de valores atípicos que puedan afectar su interpretación.

Continuar navegando