Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Medidas de posición central y Medidas de dispersión Clase del día 07/04/2022 Docente: Roberto E. Díaz Ansberck Medidas de posición central Media Es el valor que habitualmente se toma como representación de los datos. Es la suma de todos los valores de la variable dividida entre el número total de elementos. Si los datos están agrupados, se toma la marca de la clase como representante del intervalo y se realizan todos los cálculos como si los valores de la variable fueran las marcas de las clases. Si se considera una variable estadística X que tiene k valores diferentes, que se re- presentan por ix y sus frecuencias para in , entonces la media aritmética se calcula: Para datos discretos: ҧ𝑥 = σ𝑥𝑖 𝑛 Para conjuntos de datos: ҧ𝑥 = σ 𝑥𝑖 ∙ 𝑓𝑖 𝑛 Medidas de posición central Mediana La mediana es el valor de la variable que divide las observaciones en dos grupos de igual número de elementos, de modo que en el primer grupo todos los datos sean menores o iguales que la mediana, y en el otro grupo, todas los datos sean mayores o iguales. Por lo tanto, es una cantidad que indica orden dentro de la ordenación. Cuando haya un número impar de valores, la mediana será justo el valor central. 𝑀𝑒 = 𝑥𝑛 2 Cuando haya un número par de valores, la mediana será la media de los dos valores centrales de la variable. Del mismo modo que en el caso anterior: 𝑀𝑒 = 𝑥𝑛/2 + 𝑥 ( 𝑛 2 +1) 2 Para datos agrupados se trabaja de la misma manera pero en vez de usar la x, utilizamos las marcas de clase (Mc) Medidas de posición central Moda Es el valor de la variable que más veces se repite, es decir, el valor que tiene mayor frecuencia absoluta. Pueden existir distribuciones con más de una moda: bimodales, trimodal, etc. Para datos no agrupados: En las distribuciones sin agrupar, la obtención de la moda es inmediata, solo debemos encontrar el elemento x con mayor frecuencia absoluta. Para datos agrupados En los supuestos que la distribución venga dada en intervalos, se busca el intervalo con la mayor frecuencia absoluta, y por ende como no podemos elegir un intervalo como moda, vamos a utilizar su marca de clase correspondiente como moda. Medidas de dispersión Varianza Se define como la media aritmética de los cuadrados de las desviaciones de los valores de la variable respecto de la media aritmética de la distribución. Responde a la expresión: Para conjuntos discretos: 𝑆2 = σ(𝑥𝑖 − ҧ𝑥)2 𝑛 Para intervalos: 𝑆2 = σ(𝑀𝑐𝑖− ҧ𝑥)2∙ 𝑓𝑖 𝑛 Como se puede observar en la definición, la varianza es un promedio del cuadrado de los errores que se cometen al considerar la media aritmética como “el representante” de todos y cada uno de los datos. Medidas de dispersión Desviación típica o desviación estándar Se define como la raíz cuadrada, con signo positivo, de la varianza. Responde a la siguiente expresión: 𝑆 = 𝑆2 La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos. El coeficiente de variación Es una de las más significativas y determina el grado de significación de un con- junto de datos relativo a su media aritmética. Se define como el cociente entre la desviación típica y la media aritmética de la distribución de datos. 𝐶𝑉 = 𝑆 ҧ𝑥 Se utiliza mucho para comparar cambios en el tiempo u otro aspecto. ¡Muchas gracias por su atención!
Compartir