Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 1 Medidas de dispersión Por: Sandra Elvia Pérez Rango En un estudio estadístico… El rango se define como la diferencia que existe entre el mayor y el menor de los datos analizados. Esto es, si se realiza un estudio sobre las estaturas de los soldados del VII Batallón y el soldado de menor estatura mide 1.65 metros y el soldado más alto mide 1.94 metros, entonces el rango de estaturas de los soldados es: 29.065.194.1 =− Lo anterior indica que la variación de las alturas de los soldados del VII Batallón es de 0.29 metros. Para datos desordenados, primero se requiere localizar al menor y mayor de los datos y luego calcular la diferencia entre ellos. Para una distribución de frecuencias simple es más sencillo determinar el rango, debido a que los datos ya se encuentran ordenados. Analiza el siguiente ejemplo. Determina el rango para los datos mostrados en la siguiente distribución de frecuencias simple. x f 60 16 70 13 80 23 90 14 100 7 Tabla 1. Distribución de frecuencias simples x dato y f frecuencia. El rango para este conjunto de valores es: Rango = 100 – 60 = 40 Es decir, 40 es la diferencia entre el dato mayor (100) y el dato menor (60). GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 2 ¿Cómo crees que se calcula el rango en una distribución de frecuencias por intervalos? Analiza el siguiente ejemplo. Determina el rango para los datos mostrados en la siguiente distribución de frecuencias por intervalos. clases f 61 – 70 8 71 – 80 10 81 – 90 19 91 – 100 9 101 – 110 5 Tabla 2. Distribución de frecuencias por intervalos clases y f frecuencia. El rango para este conjunto de valores es: Rango = 110 – 61 = 49 Es decir, el rango para una distribución de frecuencias por intervalos es el límite mayor de la última clase menos el límite inferior de la primera clase. De esta forma: El rango es la media de dispersión que da la amplitud de variación de los datos y también se le conoce como recorrido. Varianza y desviación estándar Analiza los siguientes conjuntos de datos: A = 10, 11, 12, 12, 13, 13, 13, 14, 14, 15 B =10, 11, 12, 13, 14, 14, 15 GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 3 ¿Cómo se encuentran distribuidos estos datos? Para contestar esta pregunta, calcula el rango para cada conjunto. Rango A Rango B 15 – 10 = 5 15 – 10 = 5 El rango es igual para los dos conjuntos, pero al observar los conjuntos se notan distintos. Analiza las gráficas para cada conjunto de datos. ¿Qué observas? Conjunto A x F 10 1 11 1 12 2 13 3 14 2 15 1 Conjunto B X F 10 1 11 1 12 1 13 1 14 2 15 1 Figura 1. Gráfica de barras de Conjunto A. Figura 2. Gráfica de barras de Conjunto B. El conjunto A muestra una mayor concentración hacia los datos centrales que el conjunto B. Debido a que el rango sólo contempla los datos extremos (el dato mayor y el dato menor), no es capaz de dar información sobre cómo se dispersan los datos con respecto a un valor central. Para ello, la medida de dispersión más utilizada es la desviación estándar, también conocida como desviación típica. Desviación estándar para datos desordenados Para calcular la desviación estándar en conjuntos de datos desordenados se aplica la siguiente fórmula: 1 1 2 3 2 1 0 1 2 3 4 10 11 12 13 14 15 fre cu en ci a Conjunto A Conjunto B 1 1 1 1 2 1 0 1 2 3 10 11 12 13 14 15 fre cu en ci a Conjunto B GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 4 El análisis de la fórmula de la desviación estándar será a través de los siguientes ejemplos. Ejemplo 1 Calcula la desviación estándar del conjunto de datos: A = 10, 11, 12, 12, 13, 13, 13, 14, 15 Solución La fórmula de la desviación es ( ) n xx s ∑ −= 2 , por lo que para utilizarla, primero se requiere que se determine la media aritmética: 56.12 9 151413131312121110 = ++++++++ =x Ahora que ya tienes la media aritmética, calcula la diferencia de cada uno de los datos con respecto a ella; a dicha diferencia ( )xx − se le llama desviación. Usa una tabla para realizar los cálculos. x ( )xx − 10 56.256.1210 −=− 11 56.156.1211 −=− 12 56.056.1212 −=− 12 56.056.1212 −=− 13 44.056.1213 =− 13 44.056.1213 =− 13 44.056.1213 =− 14 44.156.1214 =− 15 44.256.1215 =− Tabla 3. Obtención del valor ( )xx − donde x es el valor del dato y x es el valor de la mediana. GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 5 De la tabla 3 se puede observar que la desviación de x = 10, con respecto a la media 56.12=x , es -2.56; y que la desviación de x = 13, con respecto a la media 56.12=x , es 0.44. La fórmula incluye el término ( )∑ − 2xx por lo que se debe elevar al cuadrado cada desviación y efectuar la suma. Para hacerlo usa la tabla 3, pero le agregas una columna. x ( )xx − ( )2xx − 10 56.256.1210 −=− 6,553 11 56.156.1211 −=− 2,433 12 56.056.1212 −=− 0,31 12 56.056.1212 −=− 0,31 13 44.056.1213 =− 0,193 13 44.056.1213 =− 0,193 13 44.056.1213 =− 0,193 14 44.156.1214 =− 2,073 15 44.256.1215 =− 5,953 ( )∑ =− 2xx 18.22 Tabla 4. Obtención del valor ( )∑ − 2xx donde x es el valor del dato y x es el valor de la mediana. Dividiendo ( )∑ − 2xx entre n, que es el número total de datos, en este caso n = 9 queda: ( ) 024.2 9 22.18 2 == −∑ n xx A este resultado se le conoce como varianza. Varianza es el promedio de las desviaciones al cuadrado y se representa con s2. Para este ejemplo: 024.22 =s GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados.Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 6 Una desventaja de la varianza son sus unidades, por lo que la varianza para este ejemplo es 2.024 unidades cuadradas. Si las unidades fueran pesos, la varianza sería pesos al cuadrado; si fueran kilogramos, la varianza sería 2.024 kilogramos cuadrados. Finalmente, extraes raíz cuadrada a la varianza, es decir: ( ) 42.1 024.2 2 = = − = ∑ s s n xx s La desviación estándar del conjunto de datos es s = 1.42, pero… ¿Qué significa? Magaña (2003) define la desviación estándar como sigue: “Es la desviación promedio de los datos de una distribución respecto a su media” (p. 121). La anterior definición menciona que la desviación estándar da información de cómo se desvían los datos con respecto a su media aritmética. Analiza otro ejemplo: Ejemplo 2 Calcula la desviación estándar del conjunto de datos siguiente: B = 10, 11, 12, 12, 13, 14, 15 Solución La fórmula para calcular la desviación estándar es: ( ) n xx s ∑ −= 2 GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 7 La media aritmética para el conjunto de datos es: 43.12 7 87 7 15141312121110 = = ++++++ = x x En la tabla 5 se llevan a cabo los cálculos de las desviaciones ( )xx − y de los cuadrados de las desviaciones ( )2xx − , así como la suma de estos últimos. x ( )xx − ( )2xx − 10 43.243.1210 −=− 5,90 11 43.143.1211 −=− 2,04 12 43.043.1212 −=− 0,18 12 43.043.1212 −=− 0,18 13 57.043.1213 =− 0,33 14 57.143.1213 =− 2,47 15 57.243.1213 =− 6,61 ( )∑ =− 2xx 17.71 Tabla 5. Obtención del valor ( )∑ − 2xx donde x es el valor del dato y x es el valor de la mediana. La varianza del conjunto de dato es: ( ) 53.2 7 71.17 7 2 2 == − =∑ xxs Y la desviación estándar es: 59.153.2 ==s Las desviaciones de los conjuntos de datos planteados en los ejemplos anteriores: A = 10, 11, 12, 12, 13, 13, 13, 14, 15 (Ejemplo 1) B = 10, 11, 12, 12, 13, 14, 15 (Ejemplo 2) Son s = 1.42 y s = 1.59, respectivamente. GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 8 El hecho de que la desviación estándar del conjunto B sea mayor que la del conjunto A, a pesar de que sus rangos son iguales, indica que los datos del conjunto B están más dispersos de su media aritmética, esto es, no se concentran en torno a ella. En las figuras 3 y 4 se muestran nuevamente las gráficas de los datos de ambos conjuntos. Conjunto A x F 10 1 11 1 12 2 13 3 14 2 15 1 Conjunto B X F 10 1 11 1 12 1 13 1 14 2 15 1 Figura 3. Gráfica de barras de Conjunto A. s = 1.42 Figura 4. Gráfica de barras de Conjunto B. s = 1.59 Una desviación estándar igual a cero implicaría que todos los datos son iguales a su media aritmética, es decir, que no tendrían ninguna dispersión. Entre mayor sea la desviación estándar, mayor será la dispersión. Desviación estándar para datos agrupados Para datos agrupados en distribuciones de frecuencia simple y con intervalos la fórmula para calcular la desviación estándar es: 1 1 2 3 2 1 0 1 2 3 4 10 11 12 13 14 15 fre cu en ci a Conjunto A Conjunto B 1 1 1 1 2 1 0 1 2 3 10 11 12 13 14 15 fre cu en ci a Conjunto B GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 9 La fórmula sólo varía en la inclusión de la frecuencia (f). Es importante señalar que el valor de x para datos agrupados en distribuciones de frecuencia con intervalos es el valor de la marca de clase. A continuación se presentan algunos ejemplos. Ejemplo 1 Calcula la desviación estándar de los datos agrupados en la siguiente distribución de frecuencias simples. x f 8 5 9 2 12 3 15 6 19 7 21 4 25 4 Tabla 6. Tabla de distribución de frecuencia simple. GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 10 Por tratarse de datos agrupados, es conveniente utilizar una tabla para llevar el registro de los cálculos. En la tabla 7 se realizan los cálculos de la media, la varianza y la desviación estándar. x f xf ⋅ ( )xx − ( )2xx − ( )2xxf − 8 5 (8)(5)=40 -8,16 66,61 333,03 9 2 18 -7,16 51,28 102,57 12 3 36 -4,16 17,32 51,95 15 6 90 -1,16 1,35 8,09 19 7 133 2,84 8,06 56,41 21 4 84 4,84 23,41 93,65 25 4 100 8,84 78,12 312,49 n= 31 501∑ =⋅ xf ( )∑ =−⋅ 2xxf 958.19 La media aritmética es: 16.16 31 501 == ⋅ = ∑ n xf x La varianza es: ( ) 91.30 31 19.958 2 2 2 = = −⋅ =∑ s n xxf s La desviación estándar queda: 56.591.30 ==s , que significa que los datos, en promedio, se desvían de la media aritmética 5.56. Tabla 7. Obtención de varianza y distribución estándar para datos organizados en frecuencia simple. En el siguiente ejemplo se calcula la desviación estándar de un conjunto de datos agrupados en una distribución de frecuencias con intervalos. Ejemplo 2 Calcula la desviación estándar de los datos agrupados en la siguiente distribución de frecuencias con intervalos. Clases F 114 ─ 128 9 129 ─ 143 10 144 ─ 158 6 159 ─ 173 8 174 ─ 188 7 Tabla 8. Tabla de distribución de frecuencia por intervalos. GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 11 Por tratarse de datos agrupados, es conveniente utilizar una tabla para registrar los cálculos realizados. En la tabla 9 se realizan los cálculos de la media, la varianza y la desviación estándar. Clases Marca de clase x f xf ⋅ ( )xx − ( )2xx − ( )2xxf− 114 ─ 128 121 9 (121)(9)=1089 -27,75 770,0625 6930,5625 129 ─ 143 136 10 1360 -12,75 162,5625 1625,625 144 ─ 158 151 6 906 2,25 5,0625 30,375 159 ─ 173 166 8 1328 17,25 297,5625 2380,5 174 ─ 188 181 7 1267 32,25 1040,0625 7280,4375 n= 40 5950∑ =⋅ xf ( )∑ =−⋅ 2xxf 18247,5 La media aritmética es: 75.148 40 5950 == ⋅ =∑ n xf x La varianza es: ( ) 19.456 40 5.18247 2 2 2 = = −⋅ =∑ s n xxf s La desviación estándar queda: 36.2118.456 ==s , que significa que los datos, en promedio, se desvían de la media aritmética 21.36. Tabla 9. Obtención de varianza y distribución estándar para datos organizados en frecuencia por intervalos. Cuando los cálculos contienen cantidades grandes o decimales, efectuar los cálculos se puede complicar un poco. En estos casos se recomienda usar una hoja de cálculo de programas como Excel para hacer las operaciones. En los ejemplos anteriores se revisó cómo calcular la varianza y la desviación estándar para datos no agrupados y agrupados en distribuciones de frecuencia simple y con intervalos. GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 12 Aplica este conocimiento para resolver el siguiente problema: En la tabla 10 se muestran las ventas diarias de un negocio de comida rápida, en los últimos 30 días. Clases F 1500 ─ 1800 5 1801 ─ 2101 6 2102 ─ 2402 8 2403 ─ 2703 7 2704 ─ 3004 4 Tabla 10. Tabla de distribución de frecuencia por intervalos de las ventas de un negocio de comida. • ¿Cuál es el promedio de las ventas diarias? • ¿Cuál es el rango de las ventas diarias? • ¿Cuál es la desviación estándar de las ventas diarias? Solución Haz los cálculos necesarios usando una tabla como la que aparece a continuación. Clases Marca de clase (x) f xf ⋅ ( )xx − ( )2xx − ( )2xxf − 1500 - 1800 1650 5 8250 -591,97 350424,53 1752122,67 1801 -2101 1951 6 11706 -290,97 84661,60 507969,61 2102 – 2402 2252 8 18016 10,03 100,67 805,34 2403 -2703 2553 7 17871 311,03 96741,73 677192,14 2704 - 3004 2854 4 11416 612,03 374584,80 1498339,20 n = 30 67259∑ =⋅ xf ( )∑ =−⋅ 2 xxf 4 436 428.97 Tabla 11. Tabla auxiliar para el cálculo de medidas de dispersión. GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 13 ¿Cuál es el promedio de las ventas diarias? La media aritmética también se le conoce como promedio, por lo que: 97.2241 30 67259 == ⋅ =∑ x n xf x En promedio, este negocio de comida rápida tiene ventas diarias de 2, 241.97 pesos. ¿Cuál es el rango de las ventas diarias? El rango de las ventas diarias es: 150415003004 =−=Rango Esto significa que la diferencia entre el día que más se vendió y el día en el que se tuvieron menos ventas es de 1,504 pesos. ¿Cuál es la desviación estándar de las ventas diarias? La desviación estándar es: ( ) 55.38496.147880 30 97.4436428 2 == = −⋅ = ∑ s n xxf s Esto indica que en promedio las ventas diarias se desvían o dispersan de la media aritmética 384.55 pesos. En la figura 5 se expone una gráfica de barras donde se muestran las marcas de clase y las frecuencias absolutas de los datos. GAE-05_M3AA1L1_Dispersión ©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. 14 Figura 5. Marcas de clase y las frecuencias absolutas de los datos. Dependiendo del propósito del estudio estadístico, se puede requerir que se organicen los datos en distribuciones de frecuencias, de representarlos en gráficas o de calcular las medidas de tendencia central y de dispersión, ya que todo en conjunto ayudará a que la interpretación de la información contenida en los datos sea más precisa y, en consecuencia, las decisiones que se tomen con base en estos análisis también sean más atinadas y pertinentes. Referencia Magaña, L. (2003). Matemáticas III, Estadística y Probabilidad. México: Compañía Editorial Nueva Imagen. Bibliografía Evans, J. R. & Lindsay, W. M. (2008). Administración y control de la calidad (7.ª ed.; F. Sánchez, trad.). México: Cengage Learning. Fuenlabrada, S. (2002). Probabilidad y Estadística. México: McGraw-Hill. Ventas diarias en los últimos 30 días 0 2 4 6 8 10 1650 1951 2252 2553 2854 Ventas diarias (en pesos) Nú m er o de d ía s
Compartir