Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística Descriptiva Medidas de Centralización y Dispersión Medidas de Centralización Dan un valor central de la distribución de frecuencias, siendo un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Algunas de las medidas son: Promedio o Media ➢ Es la medida de posición más frecuentemente usada. Se usa para datos numéricos. ➢ Podemos imaginar a los datos como un sistema físico, en el que cada dato tiene una "masa" unitaria y lo ubicamos sobre una barra en la posición correspondiente a su valor. La media representa la posición en que se debería ubicar el punto de apoyo para que el sistema esté en equilibrio. ➢ La suma de las distancias de los datos a la media es cero. Esta propiedad está relacionada con el hecho que la media es el centro de gravedad de los datos. ➢ Es muy sensible a la presencia de datos atípicos. En este caso la media no es una buena medida de posición de los datos. ➢ Se Calcula: തx = σ i xi n Ejemplo: Número de llamadas que entran a una Central Telefónica por minuto: 84, 91, 72, 68, 87 y 78. Hallar la media muestral n = 6 y se calcula la media തx = 84+91+72+68+87+78 6 = 480 6 = 80 llamadas por minuto Verificaremos que la suma de las distancias a la media es cero: (84 – 80) + (91-80) + (72-80) + (68-80) + (87-80) + (78-80) = 4 +11 – 8 – 12 + 7 – 2 = 0 Diap. 5 ➢ Cuando la información esta tabulada en intervalos de clase, es decir, datos agrupados, la media se calcula reemplazando xi por la marca de clase mi, entonces: തx = σimi fi n Ejemplo: En la siguiente tabla se muestran las edades de un grupo de personas Edad Marca clase fi Fi [0-10) 5 3 3 [10-20) 15 6 9 [20- 30) 25 7 16 [30-40) 35 12 28 [40 - 50) 45 3 31 Calculamos la media: n = 31, entonces തx = 5 . 3 + 15 . 6 + 25 . 7 + 35 . 12 + 45 . 3 31 = 26,94 años Diap. 5 Media datos no agrupados Media datos agrupados 0 0,2 0,4 0,6 0,8 1 1,2 68 72 78 84 87 91 f 0 5 10 15 5 15 25 35 45 f Diap. 3 Diap. 4 . . Mediana Muestral La mediana es el dato que ocupa la posición central en la muestra ordenada de menor a mayor. se puede hallar sólo para variables cuantitativas. ❑ Se ordenan los datos de menor a mayor. ❑ La mediana es el dato que ocupa la posición n+1 2 en la lista ordenada. ➢Si el número de datos es impar, la mediana ( �ු� o Me ) es el dato que ocupa la posición central, es decir, Me = xු = xn+1 2 ➢Si el número de datos es par, la mediana ( �ු� o Me ) es el promedio de los dos datos centrales: Me = xු = xn 2 + xn 2 +1 2 Diap. 7 Ejemplo: ✓ Para n impar Hallar la mediana de la siguiente serie de números: 3,5,2,6,5,9,5,2,8 Primero se ordenan de menor a mayor, entonces queda: 2,2,3,5,5,5,6,8,9 n = 9 , Me = xු = xn+1 2 = 5 ✓ Para n par El número de llamadas que entran a una Central Telefónica por minuto: 84, 91, 72, 68, 87 y 78. Primero se ordenan de menor a mayor, entonces queda: 68, 72, 78, 84, 87, 91 n = 6 , entonces Me = xු = xn 2 + xn 2 +1 2 = x3 + x4 2 = 78+84 2 = 81 Diap. 6 0 2 4 2 3 5 6 8 9 f 0 0,5 1 1,5 68 72 78 84 87 91 f ➢ Para datos agrupados, la mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas, es decir, se tiene que buscar el intervalo en el que se encuentre n / 2. Además, se puede calcular con la siguiente fórmula: xු = Me = Li + n 2 − Fi−1 fi Ai Donde: ▪ Li es el límite inferior de la clase donde se encuentra la mediana. ▪ n / 2 es la semisuma del número de datos. ▪ Fi - 1 es la frecuencia acumulada anterior del intervalo de clase donde se encuentra la mediana. ▪ fi es la frecuencia absoluta del intervalo donde se encuentra la mediana. ▪ Ai es la amplitud de los intervalos. Diap. 9 Ejemplo: Hallar la mediana en la siguiente tabla que se muestran las edades de un grupo de personas. Edad Marca clase fi Fi [0-10) 5 3 3 [10-20) 15 6 9 [20- 30) 25 7 16 [30-40) 35 12 28 [40 - 50) 45 3 31 Se identificar la clase que contiene la mediana, para ello se busca el intervalo en el que se encuentre n / 2 = 31/2 = 15,5. Edad Marca clase fi Fi [0-10) 5 3 3 [10-20) 15 6 9 [20- 30) 25 7 16 [30-40) 35 12 28 [40 - 50) 45 3 31 Reemplazando en la fórmula, queda: xු = Me = 20 + 15,5−9 7 10 = 29,285 Diap. 8 0 5 10 15 5 15 25 35 45 f Moda Muestral La moda (M0), es el valor de la variable que más veces se repite, es decir, no necesariamente es un único valor. Ejemplo: Hallar la moda de la siguiente serie de números: 3,5,2,6,5,9,5,2,8 Primero se ordenan de menor a mayor, entonces queda: 2,2,3,5,5,5,6,8,9 Mo = 5 0 1 2 3 4 2 3 5 6 8 9 f ➢ Para datos agrupados, la moda se encuentra en el intervalo de clase que contiene la mayor frecuencia absoluta de los datos, se calcula: Mo = Li + fi−1 fi−1 + fi+1 Ai Donde: ▪ Li es el límite inferior del intervalo de clase donde se encuentra la moda. ▪ fi - 1 es la frecuencia absoluta anterior del intervalo de clase donde se encuentra la moda. ▪ fi +1 es la frecuencia absoluta del intervalo posterior del intervalo de clase donde se encuentra la moda. ▪ Ai es la amplitud de los intervalos Diap. 12 Diap. 11 Ejemplo: Hallar la moda en la siguiente tabla que se muestran las edades de un grupo de personas. Edad Marca clase fi Fi [0-10) 5 3 3 [10-20) 15 6 9 [20- 30) 25 7 16 [30-40) 35 12 28 [40 - 50) 45 3 31 El intervalo que contiene a la moda es: Edad Marca clase fi Fi [0-10) 5 3 3 [10-20) 15 6 9 [20- 30) 25 7 16 [30-40) 35 12 28 [40 - 50) 45 3 31 Reemplazando en la fórmula, queda: Mo = 30 + 7 7 + 3 10 = 37 0 5 10 15 5 15 25 35 45 f Medidas de Dispersión Las medidas de dispersión cuantifican la separación, la variabilidad de los valores de la distribución respecto al valor central. Algunas de estas medidas son: ➢ Recorrido o Rango Muestral Es la diferencia entre el valor de la observación mayor y la observación menor. Re = xmax - xmjn ➢ Varianza (s2) Es el promedio del cuadrado de las distancias entre cada observación y la media del conjunto de observación s2 = σi xi − തx 2 fi n − 1 ✓ Si los datos están agrupados se utiliza la marca de clase mi en vez de xi , es decir: s2 = σi mi − തx 2 fi n − 1 ➢ Desviación Típica (s) La varianza viene dada por las mismas unidades que la variable, pero al cuadrado, para evitar este problema se puede usar como medida de dispersión la desviación típica que se define: s = s2, o sea s = σi xi− തx 2 fi n−1 Diap. 16 Diap. 17 Diap. 15 Ejemplo: El número de llamadas que entran a una Central Telefónica por minuto: 84, 91, 72, 68, 87 y 78. Hallar la varianza y la Desviación Típica o Estándar. n = 6 y തx = 80 s2= (84−80)2+(91−80)2+(72 −80)2+(68−80)2+(87 −80)2+(78 −80)2 5 = 16 + 121 + 64 + 144 + 49 + 4 5 = 398 5 = 79,6 (llamadas por minuto)2 s = s2 = 79,6 Kg2 = 8,9 llamadas por minuto Desviación Desviación Ejemplo para datos agrupados En la siguiente tabla se muestran las edades de un grupo de personas Edad Marca clase fi Fi [0-10) 5 3 3 [10-20) 15 6 9 [20- 30) 25 7 16 [30-40) 35 12 28 [40 - 50) 45 3 31 Calcular la varianza y la desviación típica o estándar, sabiendo que n = 31 y തx = 26,94 años s2 = 5 − 26,94 2. 3 + 15 − 26,94 2. 6 + 25 − 26,94 2. 7 + 35 − 26,94 2. 12 + 45 − 26,94 2 . 3 30 s2 = 1444,11 +855,36+26,32+779,52+978,48 30 = 4083,79 30 = 136,13 años2 , entonces s = 136,13 años2 = 11,67 años Diap. 15 0 5 10 15 5 15 25 35 45 f DesviaciónDesviación
Compartir