Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Medidas de Centralización Nos dan un valor central de la distribución de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Algunas de las medidas son: Promedio o Media Es la medida de posición más frecuentemente usada. a) Se usa para datos numéricos. b) Representa el centro de gravedad o el punto de equilibrio de los datos. Podemos imaginar a los datos como un sistema físico, en el que cada dato tiene una "masa" unitaria y lo ubicamos sobre una barra en la posición correspondiente a su valor. La media representa la posición en que se debería ubicar el punto de apoyo para que el sistema esté en equilibrio. c) La suma de las distancias de los datos a la media es cero. Esta propiedad está relacionada con el hecho que la media es el centro de gravedad de los datos. c) Es muy sensible a la presencia de datos atípicos Con solo modificar un dato la media se desplaza. En este caso la media no es una buena medida de posición de los datos. Se Calcula: �̅� = ∑ 𝑥𝑖𝑖 𝑛 No siempre se conocen todos los datos, la información viene tabulada agrupada en intervalos de clase, a esto se lo conoce como datos agrupados. Para datos agrupados, se reemplaza xi por la marca de clase mi, (es el punto medio del intervalo de clase) entonces queda �̅� = ∑ 𝑚𝑖 𝑓𝑖𝑖 𝑛 Mediana Muestral La mediana es el dato que ocupa la posición central en la muestra ordenada de menor a mayor. se puede hallar sólo para variables cuantitativas. 1. Se ordenan los datos de menor a mayor. 2. La mediana es el dato que ocupa la posición ( 𝑛+1 2 ) en la lista ordenada. • Si el número de datos es impar, la mediana ( 𝑥 o Me ) es el dato que ocupa la posición central. • Si el número de datos es par, la mediana ( 𝑥 o Me ) es el promedio de los dos datos centrales. Para datos agrupados, la mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas, es decir, se tiene que buscar el intervalo en el que se encuentre. n / 2 . Luego se puede calcular con la siguiente fórmula: Me = Li + n 2 − Fi−1 fi Ai Donde: • Li es el límite inferior de la clase donde se encuentra la mediana. • n / 2 es la semisuma de los datos. • Fi - 1 es la frecuencia acumulada anterior del intervalo de clase donde se encuentra la mediana. • fi es la frecuencia absoluta del intervalo donde se encuentra la mediana. • Ai es la amplitud de los intervalos. Ejemplo: En la siguiente tabla se muestran las edades de un grupo de personas. Edad Marca clase fi Fi [0-10) 5 3 5 [10-20) 15 6 9 [20- 30) 25 7 16 [30-40) 35 12 28 [40 - 50) 45 3 31 1. Calculemos la media aritmética: n = 31 entonces �̅� = 5 . 3 + 15 . 6 + 25 . 7 + 35 . 12 + 45 . 3 31 = 26,94 2. Calculemos la mediana (Me). Lo primero que se debe hacer para poder calcular la mediana es identificar la clase que contiene la mediana, se busca el intervalo en el que se encuentre n / 2 en este caso n/ 2 = 3 1 / 2 = 15,5. Se debe buscar el intervalo donde la frecuencia acumulada (F¡) contenga el valor obtenido (15,5). La clase que lo contiene es la que esta remarcada en la tabla. Edad Marca clase fi Fi [0-10) 5 3 5 [10-20) 15 6 9 [20- 30) 25 7 16 [30-40) 35 12 28 [40 - 50) 45 3 31 Reemplazando en la fórmula, queda: Me = 20 + 15,5 − 9 7 10 = 29,285 Moda La moda (M0), es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene por qué ser única. Para datos agrupados, la moda se encuentra en el intervalo de clase que contiene la mayor frecuencia absoluta de los datos, se calcula: Mo = Li + fi−1 fi−1 + fi+1 Ai Donde: • Li es el límite inferior del intervalo de clase donde se encuentra la moda. • fi - 1 es la frecuencia absoluta anterior del intervalo de clase donde se encuentra la moda. • fi +1 es la frecuencia absoluta del intervalo posterior del intervalo de clase donde se encuentra la moda. • Ai es la amplitud de los intervalos Observando el ejemplo anterior, el intervalo que contiene a la moda es el que esta remarcado en la siguiente tabla: Edad Marca clase fi Fi [0-10) 5 3 5 [10-20) 15 6 9 [20- 30) 25 7 16 [30-40) 35 12 28 [40 - 50) 45 3 31 Reemplazando en la fórmula, queda: Mo = 30 + 7 7 + 3 10 = 37 Se dice que una distribución es simétrica cuando coinciden la media, la mediana y la moda. Medidas de Dispersión Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta qué punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Algunas de estas medidas son: Varianza La varianza (s2), es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto de observación 𝑠2 = ∑ (𝑥𝑖 − �̅�) 2 𝑓𝑖𝑖 𝑛 − 1 Si los datos están agrupados se utiliza la marca de clase mi en vez de xi , es decir, 𝑠2 = ∑ (𝑚𝑖 − �̅�) 2 𝑓𝑖𝑖 𝑛 − 1 Desviación Típica (s) La varianza viene dada por las mismas unidades que la variable, pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la varianza, es decir: 𝑠 = √𝑠2, o sea s = √ ∑ (𝑥𝑖− �̅�)2 𝑓𝑖𝑖 𝑛−1 Recorrido o Rango Muestral El Recorrido o Rango Muestral (Re). Es la diferencia entre el valor de las observaciones mayor y el menor. Re = xmax - xmjn
Compartir