Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Medidas de dispersión: varianza La Estadística Descriptiva no solo se limita a proporcionar medidas de tendencia central, sino que también incluye medidas de dispersión que nos permiten analizar la variabilidad de los datos. Una de las medidas de dispersión más utilizadas es la varianza. La varianza es una medida que indica qué tan dispersos están los datos con respecto a la media. En otras palabras, nos proporciona una medida de la variabilidad de los datos alrededor de la media aritmética. Para calcular la varianza, se realiza lo siguiente: Restar cada valor del conjunto de datos por la media aritmética. Elevar al cuadrado cada uno de los resultados obtenidos en el paso anterior. Sumar todos los valores obtenidos en el paso anterior. Dividir la suma obtenida entre el número total de observaciones. La fórmula matemática para calcular la varianza es la siguiente: Varianza = Σ(x - μ)² / n Donde: Σ representa la suma de los valores. x es cada valor del conjunto de datos. μ es la media aritmética. n es el número total de observaciones. La varianza se expresa en unidades al cuadrado, ya que se obtiene elevando al cuadrado las diferencias entre cada valor y la media. Por lo tanto, no es fácil de interpretar directamente. Para tener una medida más interpretable, se utiliza la desviación estándar. La desviación estándar es la raíz cuadrada de la varianza y se expresa en las mismas unidades que los datos originales. Es una medida más comúnmente utilizada, ya que proporciona una idea más intuitiva de la dispersión de los datos. La fórmula para calcular la desviación estándar es la siguiente: Desviación estándar = √Varianza La varianza y la desviación estándar son medidas útiles para comparar la dispersión de diferentes conjuntos de datos. Si dos conjuntos de datos tienen la misma media aritmética, pero uno tiene una varianza o desviación estándar mayor, esto indica que los datos están más dispersos en ese conjunto. Es importante tener en cuenta que tanto la varianza como la desviación estándar son sensibles a los valores extremos o atípicos. Si un conjunto de datos contiene valores extremos, esto puede aumentar la varianza y la desviación estándar, lo que puede afectar su interpretación. Por lo tanto, es recomendable analizar la presencia de valores atípicos antes de interpretar estas medidas. En resumen, la varianza y la desviación estándar son medidas de dispersión utilizadas en estadística descriptiva para analizar la variabilidad de los datos alrededor de la media aritmética. La varianza proporciona una medida de dispersión en unidades al cuadrado, mientras que la desviación estándar es una medida más intuitiva y se expresa en las mismas unidades que los datos originales. Estas medidas son útiles para comparar la dispersión de diferentes conjuntos de datos, pero es importante tener en cuenta la presencia de valores atípicos que puedan afectar su interpretación.
Compartir