Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA Dpto. de Estadística e Informática Semana 4. Medidas de variabilidad Inicio • Motivación • Logros • Saberes previos Desarrollo • Medidas de variabilidad • Propiedades de transformación de variables • Ejercicios resueltos Cierre • Ejercicios propuestos • Autoevaluación (Moodle) 2 3 Los productores de leche del valle de Cajamarca: ¿Su producción diaria de leche (litros) por productor, es muy similar? ¿La producción diaria de leche (litros), con la raza Hoistein es más variable que con la raza Jersey? 4 ¿Qué se entiende por variabilidad en un conjunto de datos? ¿Porqué es importante medir la variabilidad? ¿Para qué sirven las medidas de variabilidad? Al término de la sesión, el estudiante estará en capacidad de: Calcular e interpretar medidas de variabilidad. Comparar la variabilidad de varios conjunto de datos. Aplicar las propiedades de transformación de variables. Resolver ejercicios propuestos. Autoevaluación (Aula virtual) Ejemplos, ejercicios resueltos y propuestos Transformación de variables Coeficiente de variabilidad Variancia y desviación estándar Rango y Rango intercuatil 5 Son medidas de variabilidad permiten conocer el grado de dispersión o variabilidad dentro de un conjunto de datos. Se usan para comparar la variabilidad entre dos o más conjuntos de datos. Cuando los datos presentan baja variabilidad, se dice que son homogéneos y cuando presentan alta variabilidad se dice que son heterogéneos. Las principales medidas de variabilidad son las siguientes: •La amplitud o rango •El rango intercuartílico •La variancia y la desviación estándar •El coeficiente de variabilidad 6 Ejemplo 1. Considerar los siguientes datos como las notas de la primera práctica de una muestra de alumnos cada una de las tres secciones de una asignatura: Grupo Notas Media A 14 14 14 14 14 14 14 14 14 14 14 B 14 13 15 14 12 15 16 13 12 16 14 C 19 8 19 11 16 18 6 13 10 20 14 Los grupos A, B y C tienen la misma media pero diferente dispersión en torno a la media. • Respecto a la variabilidad o dispersión: A < B < C • Respecto a la homogeneidad : A > B > C • Respecto a la confiabilidad de la media: A > B > C 7 El rango o amplitud de un conjunto de observaciones es igual a la diferencia entre el valor máximo y el valor mínimo. R = Xmax – Xmin Ejemplo 2. Notas de PC1: 14,13,15,14,12,15,16,13,12,16,18,14,16 Hallar e interpretar el rango. R = 18 – 12 = 6 puntos. Interpretación. La amplitud de la nota de la primera práctica fue de 6 puntos. Desventajas: • Esta afectada por valores extremos • No mide la variabilidad de los datos intermedios 8 El rango intercuartílico, se calcula como la diferencia entre el percentil 75 (P75 = Q3) y el percentil 25 (P25 = Q1). RI = P75 - P25 El RI corresponde al rango del 50% central de los datos. Ejemplo 3. Notas de PC1: 12,12,13,13,14,14,14,15,15,16,16,16,18 Hallar e interpretar el rango intercuartílico. Pos=25(14/100)=3.5, P25=13+0.5x(13-13)=13 Pos=75(14/100)=10.5, P75=16+0.5x(16-16)=16 RI = 16 – 13 = 3 puntos. Interpretación. La amplitud del 50% central de las notas de la primera práctica fue de 3 puntos. 9 La variancia es el promedio de la suma de cuadrados de las desviaciones respecto a la media. Poblacional: Muestral: Desviación estándar muestral: Para una tabla de frecuencias: donde k número de categorías 2 2 2 2 1 1 1 1N N j j j j X X N N N 2 2 2 2 1 1 1 1 1 1 n n j j j j S X X X n X n n 2SS 2 2 2 2 1 1 1 1 ( ) ( ) 1 1 k k i i i i i i S f X X f X nX n n 10 Ejemplo 4. Halle la variancia y desviación estándar muestral de las notas de la primera práctica para los 3 grupos. Grupo Notas Media A 14 14 14 14 14 14 14 14 14 14 14 1960 B 14 13 15 14 12 15 16 13 12 16 14 1980 C 19 8 19 11 16 18 6 13 10 20 14 2192 x 0014101960 110 1 1 1 22 10 1 22 A i iA Syxxnx n S 49.122.222.214101980 110 1 1 1 22 10 1 22 B i iB Syxxnx n S 08.578.2578.2514102192 110 1 1 1 22 10 1 22 C i iC Syxxnx n S Las notas del grupo C son más variables que las del grupo B. Las notas del grupo A es cero, son una constante. 11 El coeficiente de variabilidad es una medida de dispersión relativa (no tiene unidades) y se define como la razón entre la desviación estándar y la media aritmética de un conjunto de observaciones. Poblacional: 100 CV Muestral: 100 x s cv Ejemplo 5. Halle el coeficiente de variabilidad de las notas de la primera práctica para el grupo B. %6.10100 14 49.1 100 xx x S cv B B B Interpretación. La variabilidad de la primera práctica del grupo B es 10.6%. 12 Ejemplo 6. Los siguientes datos corresponden al tiempo (en minutos), al cabo del cual se duermen las ratas después de haber recibido un tipo de tranquilizante (A o B). Tipo A Tipo B n 18 ratas 20 ratas x 9.94 min 15.2 min s 2.81 min 2.84 min ¿Con qué tranquilizante el tiempo es más homogéneo? 2.81 100% 28.27 % 9.94 Acv 2.84 100% 18.68 % 15.2 Bcv Por lo tanto, el tranquilizante B tiene tiempos más homogéneas que el A. 13 Ejercicio 1. Los siguientes datos corresponden a las mediciones de la emisión diaria (en toneladas) de óxido de azufre de una planta industrial. Calcule e interprete las medidas de variabilidad (Rango, Rango intercuartílico, Varianza, Desviación estándar y Coeficiente de variación). 15.8 26.4 17.3 11.2 23.9 24.5 13.9 9.4 22.7 18.5 15.2 11.0 7.7 20.0 16.2 14 Solución. Los siguientes datos corresponden a las mediciones de la emisión diaria (en toneladas) de óxido de azufre de una planta industrial. X=Mediciones diarias de óxido de azufre, n=15 mediciones Rango: r = Max-Min=26.4-7.7=18.7 Interpretación. La amplitud de la emisión de óxido de azufre fue 18.7 Tn. Rango intercuartil: RI=P75–P25 = 22.7–11.2 = 11.5 P25: Pos=25x(15+1/100)=4, P25=11.2 P75: Pos=75x(15+1/100)=12, P75=22.7 Interpretación. La amplitud del 50% central de la emisión de óxido de azufre fue 11.5 Tn. 15.8 26.4 17.3 11.2 23.9 24.5 13.9 9.4 22.7 18.5 15.2 11.0 7.7 20.0 16.2 15 Solución. Variancia: ΣXi=15.8+26.4+…+16.2 = 253.7, ΣX2i=15.8 2+26.42+…+16.22 = 4755.67 S2 = (4755.67-15x16.912)/14 = 33.19 Interpretación. La variancia de la emisión de óxido de azufre fue 33.19 Tn2. Desviación estándar: Interpretación. La desviación estándar de la emisión de óxido de azufre fue 5.76 Tn. Coeficiente de variación. Interpretación. La variación de la emisión de óxido de azufre es 34.1% 𝐜𝐯 = 𝐒 𝐗 𝐱𝟏𝟎𝟎 = 𝟓.𝟕𝟔 𝟏𝟔.𝟗𝟏 𝐱𝟏𝟎𝟎 = 𝟑𝟒.𝟏% 𝐒 = 𝐒𝟐 = 𝟑𝟑.𝟏𝟗 = 𝟓.𝟕𝟔 X = 16.91 S2 = Xi 2 − nxX 2 n− 1 16 Comparación de la variabilidad Para comparar la variabilidad entre dos o más conjuntos de datos, se debe considerar: Unidades de medidas diferentes Unidades de medidas iguales Medias similares Medias diferentes cv1 con cv2 S1 con S2 cv1 con cv2 Propiedades de transformación de datos Sea la variable Y, entonces para 17 Medida 2 X X S S 2 Y Y S S Y a bX 2 2 X X b S bS Y bX Y a X 2 2 X X b S bS Ejemplo 7. Se presentan las medidas estadísticas de las ventas (soles) y tiempo extra (horas) de los vendedores de dos zonas (A y B). Promedio Desviación estándar Coeficiente de variabilidad Zona Ventas Tiempo Ventas Tiempo Ventas Tiempo A 236.3 3.5 82.6 1.5 35.0 42.9 B 450.5 3.6 98.5 2.8 21.9 77.7 a. ¿Las ventas de la zona A son menos variables que las de la zona B?. Falso, cvA = 35.0% > cvB= 21.9% (Promedio diferentes) b. El tiempo extra de la zona B muestra más variabilidad que la zona A. Verdadero, SB = 2.8 > SA = 1.5 (Promedio similares) c. Para la zona A, las ventas son menos variables que el tiempo extra. Verdadero, cvVentas = 35.0% < cvTiempo = 42.9% (Variables diferentes) 18 Ejercicio 2 Los sueldos de 100 trabajadores de una empresa de servicios de limpieza tienen una media de $300 y una desviación estándar de $50. Se proponen dos alternativas de aumento: Alternativa A: Aumentarles $75 a cada uno; Alternativa B: Aumentarles el 15% del sueldo más $20 a cada uno. ¿Cuál de las alternativas será la más conveniente para los siguientes casos:?. Justifique su respuesta. a. Si la empresa dispone sólo de $37000 para pagar el aumento de sueldos. b. Si la empresa quiere tener los aumentos de sueldos más homogéneos. 19 Solución: 𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐀: 𝐘𝐀 = 𝐗+ 𝟕𝟓⟹ 𝐘 𝐀 = 𝟑𝟎𝟎+ 𝟕𝟓 = 𝟑𝟕𝟓⟹ 𝐓𝐨𝐭𝐚𝐥 = 𝐘𝐢 = 𝟏𝟎𝟎𝐱𝟑𝟕𝟓 = 𝟑𝟕𝟓𝟎𝟎 a. Calculando el monto total requerido: Entonces, puesto que solo se tienen $37000 disponibles, se escoge la alternativa B que sólo se necesita $36500. b. Calculando los coeficientes de variación Entonces, se escoge la alternativa A, puesto que tienen menos variabilidad 𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐀: 𝐘𝐀 = 𝐗+ 𝟕𝟓⟹ 𝐒𝐘 = 𝐒𝐗 = 𝟓𝟎 ⟹ 𝐜𝐯𝐘 = 𝟓𝟎 𝟑𝟕𝟓 𝐱𝟏𝟎𝟎 = 𝟏𝟑.𝟑% 𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐁: 𝐘𝐁 = 𝟏.𝟏𝟓𝐗+ 𝟐𝟎 ⟹ 𝐒𝐘 = 𝟏.𝟏𝟓𝐒𝐗 = 𝟓𝟕.𝟓 ⟹ 𝐜𝐯𝐘 = 𝟓𝟕.𝟓 𝟑𝟔𝟓 𝐱𝟏𝟎𝟎 = 𝟏𝟓.𝟖% 20 X X Total X n X n 𝐧 = 𝟏𝟎𝟎, 𝐗 = 𝟑𝟎𝟎, 𝐒 = 𝟓𝟎 𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐁: 𝐘𝐁 = 𝟏.𝟏𝟓𝐗+𝟐𝟎⟹ 𝐘 𝐁 = 𝟏.𝟏𝟓𝐱𝟑𝟎𝟎 + 𝟐𝟎 = 𝟑𝟔𝟓 ⟹ 𝐓𝐨𝐭𝐚𝐥 = 𝐘𝐢 = 𝟏𝟎𝟎𝐱𝟑𝟔𝟓 = 𝟑𝟔𝟓𝟎𝟎 Ejercicio 3. En la siguiente tabla se presenta la distribución de número de parcelas que poseen cada agricultor en una muestra al azar de 50 de la sierra central. Halle e interprete él coeficiente de variación. Número de parcelas Xi Número de agricultores fi 1 5 2 15 4 12 5 10 6 8 Total 50 21 2 2 2 1 i if X nX S n Σ fiXi =5x1+15x2+12x4+10x5+8x6 = 181 Σ fiX 2 i =5x1 2+15x22+12x42+10x52+8x62 = 795 S2 = (795 - 50x3.622)/49 = 2.85, S=1.69 cv = (1.69/3.62)x100 = 46.7% 𝐗 = 𝟑.𝟔𝟐 Ejercicios propuestos. 1. En un supermercado se determinó que el tiempo que demora una cajera en atender a los clientes tiene un Coeficiente de Variación de 0.4, la empresa decide cambiar el tipo de máquinas registradoras con lo cual los tiempos de atención al cliente disminuyen en 2 minutos y el coeficiente de variación es ahora de 60%. Determinar el tiempo promedio y la desviación estándar de los tiempos de atención, antes y después del cambio de máquinas registradoras. 22 2. Para evaluar la efectividad de sus empleados, una empresa dedicada a la venta de teléfonos celulares ha recopilado la siguiente información sobre el número de teléfonos vendidos en la última semana por sus 64 empleados: Número de empleados 13 15 16 8 5 4 3 Número de ventas 5 6 7 8 9 10 11 a. Calcule e intérprete las medidas de variabilidad. b. La empresa le paga a sus empleados 100 soles semanales más una comisión de 40 soles por celular vendido y sobre estos ingresos los empleados deben aportar el 15% a su AFP. Calcule el promedio y la desviación estándar para el ingreso neto promedio semanal por empleado. 23 Referencias bibliográficas Anderson D., Sweendy D., Williams T. (2016) Estadística para Administración y Economía. 12ª. Edición. México. Cengage Learning Editores. Capítulo 3. Newbold, P. y Carlson, W. y Thorne, B. (2008). Estadística para Administración y Economía (6ta. ed.) Madrid: Pearson Education. Prentice Hall 24
Compartir