Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
ESTADÍSTICA BÁSICA SEMESTRE 2017-I PRÁCTICA 5 VIERNES, 23 DE JUNIO DE 2017 Nombre:___________________________________________________________________________ Sección:___________________ Sólo puede consultarse el formulario y las tablas que se adjuntan. Utiliza 𝜶 = 𝟎. 𝟎𝟓 salvo que se indique lo contrario 1. Un analista desea realizar una encuesta para saber la proporción de estudiantes universitarios que tienen a Claro como operador de su celular. a) Si desea estimar dicha proporción con un margen de error de 0.05, para una confianza del 95%, ¿a cuántos estudiantes debe encuestar? Justifica adecuadamente tu respuesta. (2p) b) Cuando el analista lleva ya 50 estudiantes encuestados obtiene que el 22% de los alumnos tienen como operador a Claro. Utilizando esta información, ¿cuál deberá ser ahora el tamaño de la muestra para cumplir los objetivos especificados en el apartado (a)? (2p) c) Además del operador de telefonía, este analista les pregunta sobre la duración de su última llamada registrada. Las respuestas de los 50 encuestados tienen una duración media de �̅� = 3.50 minutos, con una cuasidesviación típica de �̂� = 1.4 minutos. Asumiendo que la duración de una llamada sigue una distribución normal, contrasta si la duración media de una llamada es inferior a 4 minutos. Al realizar este contraste, escribe claramente cuál es la hipótesis nula, la alternativa, el estadístico de contraste y la distribución de referencia, justificando adecuadamente tu respuesta. (2p) d) Repite el contraste de la sección anterior, pero ahora sin asumir que la muestra procede de una distribución normal. Comenta brevemente qué diferencias hay en la realización de este contraste respecto al realizado en el apartado (c). (2p) SOLUCIÓN a) Para calcular el tamaño muestral necesario para un margen de error determinado nos basaremos en la fórmula 𝑛 = ( 𝑧0.025√𝑝𝑞 𝐿 ) 2 . (0.5p) Esta expresión asume que la proporción muestral, �̂�, se puede aproximar a una normal, para lo que se necesitará que 𝑛 sea lo suficientemente grande para que se cumpla 𝑛𝑝𝑞 > 5.(0.5p) En esta expresión, es necesario usar un valor de 𝑝 que, obviamente, desconocemos. Para solventarlo, tomamos el caso más desfavorable, en el que 𝑝𝑞 toma su máximo valor, lo que sucede cuando 𝑝 = 𝑞 = 0.5. (0.5p) Entonces, el tamaño muestral para 𝐿 = 0.05 es 𝑛 = ( 1.96√0.5×0.5 0.05 ) 2 ≈ 385. (0.5p) Es fácil comprobar que 385(0.5)(0.5) > 5, por lo que la aproximación a la normal de �̂�, en la que se basa esta fórmula, es válida. b) Usando la estimación �̂� = 0.22, el tamaño muestral requerido será 𝑛 = ( 𝑧0.025√�̂��̂� 𝐿 ) 2 = ( 1.96√0.22×0.78 0.05 ) 2 ≈ 264. Se comprueba que 𝑛𝑝𝑞 = 264(0.22)(0.78) = 45.3 > 5, por lo que la aproximación a la normal de �̂�, en la que se basa esta fórmula, es válida. c) La media poblacional será inferior a 4 minutos (𝜇 < 4) o no (𝜇 ≥ 4). El contraste de medias será: 𝐻0: 𝜇 ≥ 4 𝐻1: 𝜇 < 4. (0.25p) El estadístico de contraste, dado que no conocemos 𝜎, será el estadístico 𝑡: 𝑡 = �̅� − 𝜇0 �̂�/√𝑛 = 3.50 − 4 1.4/√50 = −2.525. (0.25p) Al tratarse de una muestra de una población normal, la distribución de referencia es la 𝑡𝑛−1 ≡ 𝑡49 (0.5p). Dado que 𝐻1: 𝜇 < 4, la región de rechazo está en la cola de la izquierda de la distribución (ver figura) (0.25p). Para buscar el valor crítico −𝑡49;0.05 con las tablas que estamos manejando, tomamos como valor más próximo el valor correspondiente a 𝑡50 (en la práctica usaríamos una computadora), obteniéndose que −𝑡49;0.05 ≈ −1.676 (0.25p) Como 𝑡 = −2.525 < −1.676 nos encontramos en la región de rechazo. La diferencia encontrada (entre los 3.5 minutos de media muestral y los 4 minutos de media poblacional) es significativa (muy poco probable que sea un efecto del muestreo) y, por tanto, debemos rechazar 𝐻0. Los datos muestran evidencia suficiente para asumir que la duración media de una llamada es inferior a 4 minutos. (0.5p) d) Si no podemos asumir que la muestra viene de una normal, podemos utilizar la aproximación a la normal de �̅�, al tener una muestra grande (> 30). Los resultados serán menos precisos. En la elaboración del contraste, lo único que cambia es la distribución de referencia, que ahora será la N(0,1) (ver figura). El valor crítico para 𝛼 = 0.05 es −1.645. En este caso, seguimos estando en la región de rechazo de la hipótesis nula, 2. Una compañía aseguradora se encuentra estudiando la siniestralidad de tres marcas de autos, A, B y C. Para ello, toma una muestra de un registro de 150 autos de cada marca. - De la muestra de la marca A, se encuentra que 30 autos habían sufrido algún accidente. - De la muestra de la marca B, se encuentra que 45 autos habían sufrido algún accidente. - De la muestra de la marca C, se encuentra que 40 autos habían sufrido algún accidente. Definimos el nivel de accidentes de una determinada marca como la proporción (poblacional) de vehículos de dicha marca que han sufrido accidentes. Responda de manera justificada las siguientes cuestiones: a) Con base en los datos tomados, ¿es posible afirmar que el nivel de accidentes es mayor en los autos de B que en los de A? (2.5 p) b) Construya un intervalo de confianza de la diferencia de proporciones de autos que han sufrido accidentes de las marcas B y C. (2.5 p) c) Con base en el intervalo de confianza construido en el apartado anterior, ¿es posible afirmar que no existe diferencia entre el nivel de accidentes de las marcas B y C? (1 p) SOLUCIÓN: a) Se necesita comparar la proporción de autos que han sufrido accidentes en las marcas A (𝑝𝐴)y de la marca B (𝑝𝐵), para comprobar si dicha proporción es mayor en B que en A. 1. Se establecen las hipótesis (0.5 p): 𝐻0: 𝑝𝐴 ≥ 𝑝𝐵 𝐻0: 𝑝𝐴 < 𝑝𝐵 2. Se establece el estadístico de contraste (0.5 p): 𝑍0 = (�̂�𝐴 − �̂�𝐵) √�̂�0�̂�0 ( 1 𝑛𝐴 + 1 𝑛𝐵 ) = 0.2 − 0.3 √0.25×0.75× ( 1 150 + 1 150 ) = −2.00 �̂�0 = 𝑛𝐴�̂�𝐴 + 𝑛𝐵�̂�𝐵 𝑛𝐴 + 𝑛𝐵 = 150×0.2 + 150×0.3 300 = 0.25 3. Se establece la distribución del estadístico de contraste (0.5 p): 𝑍0~𝑁(0,1) 4. Se realiza el contraste. Este es un contraste hacia la izquierda; por ser 𝛼 = 0.05, el valor crítico del contraste es −1.645 (0.5 p). Como el valor del estadístico de contraste es menor que el valor crítico, se rechaza la hipótesis nula. Por lo tanto, los datos muestran suficiente evidencia de que el nivel de accidentes es mayor en los autos de la marca B que en los de A (0.5 p). -2.00 - También es posible que hayan realizado el contraste: 𝐻0: 𝑝𝐵 ≤ 𝑝𝐴 𝐻0: 𝑝𝐵 > 𝑝𝐴 En dicho caso, el valor crítico es +𝟏. 𝟔𝟒𝟓. La conclusión debe ser la misma. b) Se pide construir un intervalo de confianza de la diferencia de las proporciones de autos que han sufrido accidentes en los autos de las marcas B y C. 𝐼𝐶(0.95) = 𝑝𝐵 − 𝑝𝐶 ∈ {�̂�𝐵 − �̂�𝐶 ± 𝑧𝛼 2 √ �̂�𝐵�̂�𝐵 𝑛𝐵 + �̂�𝐶�̂�𝐶 𝑛𝐶 } 𝐼𝐶(0.95) = 𝑝𝐵 − 𝑝𝐶 ∈ {0.3 − 0.2667 ± 1.96√ 0.3×0.7 150 + 0.2667×0.7333 150 } 𝐼𝐶(0.95) = 𝑝𝐵 − 𝑝𝐶 ∈ [−0.0686; 0.1352] - Intervalo construido correctamente: 2.5 p. - También es posible que hayan calculado 𝑰𝑪(𝟎. 𝟗𝟓) = 𝒑𝑪 − 𝒑𝑩 ∈ [−𝟎. 𝟏𝟑𝟓𝟐; 𝟎. 𝟎𝟔𝟖𝟔] . Dicha alternativa también tiene puntaje completo. - No son correctas estas alternativas: 𝒑𝑩 − 𝒑𝑪 ∈ [−𝟎. 𝟏𝟑𝟓𝟐; 𝟎. 𝟎𝟔𝟖𝟔] 𝒑𝑪 − 𝒑𝑩 ∈ [−𝟎. 𝟎𝟔𝟖𝟔; 𝟎. 𝟏𝟑𝟓𝟐] Si se ha cometido ese error, el puntaje es de 1.5 p. c) Se pide realizar un contraste de hipótesis para comprobar si la diferencia entre las proporciones del apartado anterior es igual a cero. Dicho contraste debe realizarse utilizando el intervalo de confianza construido en el apartado b. Respuesta: Sí es posible afirmar que no existe diferenciasignificativa, debido a que el valor “0” se encuentra en el intervalo de confianza, lo que indica que hay evidencia suficiente para afirmar que la diferencia entre ambas proporciones tiene un valor igual a cero. - Respuesta correcta justificada: 1 punto. - Respuesta incorrecta, o sin justificación: 0 puntos. 3. El tiempo para ejecutar una determinada tarea de producción en una fábrica es una variable aleatoria normal con una media histórica de 30 segundos, y una desviación estándar de 3 segundos, que tomaremos como valores poblacionales. Un ingeniero ha logrado disminuir el tiempo medio de ejecución de esta tarea a 25 segundos, pero teme que exista el riesgo de que la variabilidad haya aumentado. Para analizar este riesgo, ha tomado una muestra de 100 tiempos de ejecución de la tarea, y ha encontrado que la cuasidesviación estándar es de 3.1 segundos. Responda de manera justificada a las siguientes cuestiones: a) ¿Apoyan los datos la suposición de que la variabilidad del tiempo de ejecución ha aumentado? (2 p) b) Construya un intervalo de confianza de la varianza del tiempo de ejecución de la tarea. (2 p) c) ¿Qué ocurriría con nuestro análisis si la distribución del tiempo no fuera normal? (2 p) SOLUCIÓN a) Se pide realizar un contraste de hipótesis para comprobar si la desviación es ahora mayor, que su valor histórico, 3. Se realizará, por tanto, un contraste de hipótesis para comprobar si la varianza es mayor que 9. 1. Se establecen las hipótesis (0.5 p): 𝐻0: 𝜎 2 ≤ 9 𝐻0: 𝜎 2 > 9 2. Se establece el estadístico de contraste. Como se conoce �̂� (0.5 p): 𝜒0 2 = (𝑛 − 1)�̂�2 𝜎0 2 = 99×9.61 9 = 105.71 3. Se establece la distribución del estadístico de contraste (0.5 p): Por ser una muestra de 100 datos procedente de una población normal, la distribución del estadístico de contraste es una chi-cuadrado con 99 grados de libertad. 𝜒0 2 ∼ 𝜒99 2 4. Se realiza el contraste. Este es un contraste hacia la derecha; por ser 𝛼 = 0.05, el valor crítico del contraste es 123.22 (0.5 p)*. Como las tablas que se utilizan no tienen 𝜒99 2 , tomamos como valor aproximado 𝜒100 2 , siendo 𝜒100;0.05 2 = 124.3. Como el valor del estadístico de contraste (105.71) es menor que el valor crítico, se acepta la hipótesis nula. Por lo tanto, no hay evidencia para afirmar que la variabilidad ha aumentado (0.5 p). - Si se utilizan los valores de 3 y 3.1 como varianza y cuasivarianza, se corrigen únicamente los 1.5 puntos de las partes 3 y 4 (la distribución del estadístico de contraste, el valor crítico y región de rechazo, y la conclusión, con base en el estadístico calculado). b) Se pide construir un intervalo de confianza de la diferencia de la varianza. 𝐼𝐶(0.95): 𝜎2𝜖 [ (𝑛 − 1)�̂�2 𝜒99,0.025 2 ; (𝑛 − 1)�̂�2 𝜒99,0.975 2 ] 𝐼𝐶(0.95): 𝜎2𝜖 [ 99×9.61 128.42 ; 99×9.61 73.36 ] 𝐼𝐶(0.95): 𝜎2𝜖[7.4084, 12.9688] Para la corrección, es igual de válido si se usan: 𝝌𝟏𝟎𝟎,𝟎.𝟎𝟐𝟓 𝟐 = 𝟏𝟐𝟗. 𝟓𝟔 𝝌𝟏𝟎𝟎,𝟎.𝟗𝟕𝟓 𝟐 = 𝟕𝟒. 𝟐𝟐 En dicho caso, el intervalo de confianza resultante es: 𝑰𝑪(𝟎. 𝟗𝟓): 𝝈𝟐𝝐[𝟕. 𝟑𝟒𝟑𝟐, 𝟏𝟐. 𝟖𝟏𝟖𝟓] c) Si X no es normal, no se cumple que: 𝜒0 2 = (𝑛 − 1)�̂�2 𝜎0 2 ~𝜒𝑛−1 2 (1 p) Esto tendría como consecuencia que el análisis realizado (contraste de hipótesis e intervalo de confianza) no sea válido, debido a que el nivel de confianza no será el buscado, sino uno distinto. (1p)
Compartir