Logo Studenta

Practica5_EDB_2017_I_solucion

¡Estudia con miles de materiales!

Vista previa del material en texto

ESTADÍSTICA BÁSICA 
SEMESTRE 2017-I 
PRÁCTICA 5 
VIERNES, 23 DE JUNIO DE 2017 
Nombre:___________________________________________________________________________ 
Sección:___________________ 
Sólo puede consultarse el formulario y las tablas que se adjuntan. Utiliza 𝜶 = 𝟎. 𝟎𝟓 salvo que se indique lo contrario 
 
1. Un analista desea realizar una encuesta para saber la proporción de estudiantes universitarios que tienen a Claro 
como operador de su celular. 
a) Si desea estimar dicha proporción con un margen de error de 0.05, para una confianza del 95%, ¿a cuántos 
estudiantes debe encuestar? Justifica adecuadamente tu respuesta. (2p) 
b) Cuando el analista lleva ya 50 estudiantes encuestados obtiene que el 22% de los alumnos tienen como 
operador a Claro. Utilizando esta información, ¿cuál deberá ser ahora el tamaño de la muestra para cumplir 
los objetivos especificados en el apartado (a)? (2p) 
c) Además del operador de telefonía, este analista les pregunta sobre la duración de su última llamada 
registrada. Las respuestas de los 50 encuestados tienen una duración media de �̅� = 3.50 minutos, con una 
cuasidesviación típica de �̂� = 1.4 minutos. Asumiendo que la duración de una llamada sigue una distribución 
normal, contrasta si la duración media de una llamada es inferior a 4 minutos. Al realizar este contraste, 
escribe claramente cuál es la hipótesis nula, la alternativa, el estadístico de contraste y la distribución de 
referencia, justificando adecuadamente tu respuesta. (2p) 
d) Repite el contraste de la sección anterior, pero ahora sin asumir que la muestra procede de una distribución 
normal. Comenta brevemente qué diferencias hay en la realización de este contraste respecto al realizado en 
el apartado (c). (2p) 
 
SOLUCIÓN 
a) Para calcular el tamaño muestral necesario para un margen de error determinado nos basaremos en la 
fórmula 
𝑛 = (
𝑧0.025√𝑝𝑞
𝐿
)
2
. (0.5p) 
Esta expresión asume que la proporción muestral, �̂�, se puede aproximar a una normal, para lo que se 
necesitará que 𝑛 sea lo suficientemente grande para que se cumpla 𝑛𝑝𝑞 > 5.(0.5p) 
En esta expresión, es necesario usar un valor de 𝑝 que, obviamente, desconocemos. Para solventarlo, 
tomamos el caso más desfavorable, en el que 𝑝𝑞 toma su máximo valor, lo que sucede cuando 𝑝 = 𝑞 =
0.5. (0.5p) 
Entonces, el tamaño muestral para 𝐿 = 0.05 es 
𝑛 = (
1.96√0.5×0.5
0.05
)
2
≈ 385. (0.5p) 
 
Es fácil comprobar que 385(0.5)(0.5) > 5, por lo que la aproximación a la normal de �̂�, en la que se basa 
esta fórmula, es válida. 
 
b) Usando la estimación �̂� = 0.22, el tamaño muestral requerido será 
𝑛 = (
𝑧0.025√�̂��̂�
𝐿
)
2
= (
1.96√0.22×0.78
0.05
)
2
≈ 264. 
 
Se comprueba que 𝑛𝑝𝑞 = 264(0.22)(0.78) = 45.3 > 5, por lo que la aproximación a la normal de �̂�, en la 
que se basa esta fórmula, es válida. 
 
c) La media poblacional será inferior a 4 minutos (𝜇 < 4) o no (𝜇 ≥ 4). El contraste de medias será: 
𝐻0: 𝜇 ≥ 4 
𝐻1: 𝜇 < 4. (0.25p) 
 
El estadístico de contraste, dado que no conocemos 𝜎, será el estadístico 𝑡: 
 
𝑡 =
�̅� − 𝜇0
�̂�/√𝑛
=
3.50 − 4
1.4/√50
= −2.525. (0.25p) 
 
Al tratarse de una muestra de una población normal, la distribución de referencia es la 𝑡𝑛−1 ≡ 𝑡49 (0.5p). 
Dado que 𝐻1: 𝜇 < 4, la región de rechazo está en la cola de la izquierda de la distribución (ver figura) 
(0.25p). 
 
Para buscar el valor crítico −𝑡49;0.05 con las tablas que 
estamos manejando, tomamos como valor más próximo el 
valor correspondiente a 𝑡50 (en la práctica usaríamos una 
computadora), obteniéndose que 
−𝑡49;0.05 ≈ −1.676 (0.25p) 
 
Como 𝑡 = −2.525 < −1.676 nos encontramos en la región de rechazo. La diferencia encontrada (entre los 
3.5 minutos de media muestral y los 4 minutos de media poblacional) es significativa (muy poco probable 
que sea un efecto del muestreo) y, por tanto, debemos rechazar 𝐻0. Los datos muestran evidencia 
suficiente para asumir que la duración media de una llamada es inferior a 4 minutos. (0.5p) 
 
d) Si no podemos asumir que la muestra viene de una normal, 
podemos utilizar la aproximación a la normal de �̅�, al tener una 
muestra grande (> 30). Los resultados serán menos precisos. 
En la elaboración del contraste, lo único que cambia es la 
distribución de referencia, que ahora será la N(0,1) (ver figura). 
El valor crítico para 𝛼 = 0.05 es −1.645. 
 
En este caso, seguimos estando en la región de rechazo de la hipótesis nula, 
 
 
 
 
 
 
 
 
2. Una compañía aseguradora se encuentra estudiando la siniestralidad de tres marcas de autos, A, B y C. Para ello, 
toma una muestra de un registro de 150 autos de cada marca. 
- De la muestra de la marca A, se encuentra que 30 autos habían sufrido algún accidente. 
- De la muestra de la marca B, se encuentra que 45 autos habían sufrido algún accidente. 
- De la muestra de la marca C, se encuentra que 40 autos habían sufrido algún accidente. 
Definimos el nivel de accidentes de una determinada marca como la proporción (poblacional) de vehículos de dicha 
marca que han sufrido accidentes. Responda de manera justificada las siguientes cuestiones: 
a) Con base en los datos tomados, ¿es posible afirmar que el nivel de accidentes es mayor en los autos de B que 
en los de A? (2.5 p) 
b) Construya un intervalo de confianza de la diferencia de proporciones de autos que han sufrido accidentes de 
las marcas B y C. (2.5 p) 
c) Con base en el intervalo de confianza construido en el apartado anterior, ¿es posible afirmar que no existe 
diferencia entre el nivel de accidentes de las marcas B y C? (1 p) 
SOLUCIÓN: 
 
a) Se necesita comparar la proporción de autos que han sufrido accidentes en las marcas A (𝑝𝐴)y de la marca B 
(𝑝𝐵), para comprobar si dicha proporción es mayor en B que en A. 
 
1. Se establecen las hipótesis (0.5 p): 
𝐻0: 𝑝𝐴 ≥ 𝑝𝐵 
𝐻0: 𝑝𝐴 < 𝑝𝐵 
 
2. Se establece el estadístico de contraste (0.5 p): 
 
𝑍0 =
(�̂�𝐴 − �̂�𝐵)
√�̂�0�̂�0 (
1
𝑛𝐴
+
1
𝑛𝐵
)
=
0.2 − 0.3
√0.25×0.75× (
1
150
+
1
150
)
= −2.00 
 
�̂�0 =
𝑛𝐴�̂�𝐴 + 𝑛𝐵�̂�𝐵
𝑛𝐴 + 𝑛𝐵
=
150×0.2 + 150×0.3
300
= 0.25 
 
3. Se establece la distribución del estadístico de contraste (0.5 p): 
 
𝑍0~𝑁(0,1) 
 
4. Se realiza el contraste. Este es un contraste hacia la izquierda; por ser 𝛼 = 0.05, el valor crítico del 
contraste es −1.645 (0.5 p). 
 
 
 
Como el valor del estadístico de contraste es menor que el valor crítico, se rechaza la hipótesis nula. Por lo 
tanto, los datos muestran suficiente evidencia de que el nivel de accidentes es mayor en los autos de la 
marca B que en los de A (0.5 p). 
-2.00 
 
- También es posible que hayan realizado el contraste: 
 
𝐻0: 𝑝𝐵 ≤ 𝑝𝐴 
𝐻0: 𝑝𝐵 > 𝑝𝐴 
 
En dicho caso, el valor crítico es +𝟏. 𝟔𝟒𝟓. La conclusión debe ser la misma. 
 
b) Se pide construir un intervalo de confianza de la diferencia de las proporciones de autos que han sufrido 
accidentes en los autos de las marcas B y C. 
 
𝐼𝐶(0.95) = 𝑝𝐵 − 𝑝𝐶 ∈ {�̂�𝐵 − �̂�𝐶 ± 𝑧𝛼
2
√
�̂�𝐵�̂�𝐵
𝑛𝐵
+
�̂�𝐶�̂�𝐶
𝑛𝐶
 } 
 
𝐼𝐶(0.95) = 𝑝𝐵 − 𝑝𝐶 ∈ {0.3 − 0.2667 ± 1.96√
0.3×0.7
150
+
0.2667×0.7333
150
 } 
𝐼𝐶(0.95) = 𝑝𝐵 − 𝑝𝐶 ∈ [−0.0686; 0.1352] 
 
- Intervalo construido correctamente: 2.5 p. 
 
- También es posible que hayan calculado 𝑰𝑪(𝟎. 𝟗𝟓) = 𝒑𝑪 − 𝒑𝑩 ∈ [−𝟎. 𝟏𝟑𝟓𝟐; 𝟎. 𝟎𝟔𝟖𝟔] . Dicha 
alternativa también tiene puntaje completo. 
 
- No son correctas estas alternativas: 
𝒑𝑩 − 𝒑𝑪 ∈ [−𝟎. 𝟏𝟑𝟓𝟐; 𝟎. 𝟎𝟔𝟖𝟔] 
𝒑𝑪 − 𝒑𝑩 ∈ [−𝟎. 𝟎𝟔𝟖𝟔; 𝟎. 𝟏𝟑𝟓𝟐] 
Si se ha cometido ese error, el puntaje es de 1.5 p. 
 
 
c) Se pide realizar un contraste de hipótesis para comprobar si la diferencia entre las proporciones del apartado 
anterior es igual a cero. Dicho contraste debe realizarse utilizando el intervalo de confianza construido en el 
apartado b. 
 
Respuesta: Sí es posible afirmar que no existe diferenciasignificativa, debido a que el valor “0” se encuentra en 
el intervalo de confianza, lo que indica que hay evidencia suficiente para afirmar que la diferencia entre ambas 
proporciones tiene un valor igual a cero. 
 
- Respuesta correcta justificada: 1 punto. 
- Respuesta incorrecta, o sin justificación: 0 puntos. 
 
 
 
 
 
 
 
 
 
3. El tiempo para ejecutar una determinada tarea de producción en una fábrica es una variable aleatoria normal con 
una media histórica de 30 segundos, y una desviación estándar de 3 segundos, que tomaremos como valores 
poblacionales. Un ingeniero ha logrado disminuir el tiempo medio de ejecución de esta tarea a 25 segundos, pero 
teme que exista el riesgo de que la variabilidad haya aumentado. Para analizar este riesgo, ha tomado una muestra 
de 100 tiempos de ejecución de la tarea, y ha encontrado que la cuasidesviación estándar es de 3.1 segundos. 
Responda de manera justificada a las siguientes cuestiones: 
 
a) ¿Apoyan los datos la suposición de que la variabilidad del tiempo de ejecución ha aumentado? (2 p) 
b) Construya un intervalo de confianza de la varianza del tiempo de ejecución de la tarea. (2 p) 
c) ¿Qué ocurriría con nuestro análisis si la distribución del tiempo no fuera normal? (2 p) 
 
SOLUCIÓN 
 
a) Se pide realizar un contraste de hipótesis para comprobar si la desviación es ahora mayor, que su valor 
histórico, 3. Se realizará, por tanto, un contraste de hipótesis para comprobar si la varianza es mayor que 9. 
 
1. Se establecen las hipótesis (0.5 p): 
𝐻0: 𝜎
2 ≤ 9 
𝐻0: 𝜎
2 > 9 
 
2. Se establece el estadístico de contraste. Como se conoce �̂� (0.5 p): 
 
𝜒0
2 =
(𝑛 − 1)�̂�2
𝜎0
2 =
99×9.61
9
= 105.71 
 
3. Se establece la distribución del estadístico de contraste (0.5 p): 
Por ser una muestra de 100 datos procedente de una población normal, la distribución del estadístico de 
contraste es una chi-cuadrado con 99 grados de libertad. 
𝜒0
2 ∼ 𝜒99
2 
4. Se realiza el contraste. Este es un contraste hacia la derecha; por ser 𝛼 = 0.05, el valor crítico del contraste 
es 123.22 (0.5 p)*. 
 
 
Como las tablas que se utilizan no tienen 𝜒99
2 , tomamos como valor aproximado 𝜒100
2 , siendo 𝜒100;0.05
2 =
124.3. 
 
Como el valor del estadístico de contraste (105.71) es menor que el valor crítico, se acepta la hipótesis 
nula. Por lo tanto, no hay evidencia para afirmar que la variabilidad ha aumentado (0.5 p). 
 
 
- Si se utilizan los valores de 3 y 3.1 como varianza y cuasivarianza, se corrigen únicamente los 1.5 
puntos de las partes 3 y 4 (la distribución del estadístico de contraste, el valor crítico y región de 
rechazo, y la conclusión, con base en el estadístico calculado). 
 
b) Se pide construir un intervalo de confianza de la diferencia de la varianza. 
 
𝐼𝐶(0.95): 𝜎2𝜖 [
(𝑛 − 1)�̂�2
𝜒99,0.025
2 ;
(𝑛 − 1)�̂�2
𝜒99,0.975
2 ] 
 
𝐼𝐶(0.95): 𝜎2𝜖 [
99×9.61
128.42
;
99×9.61
73.36
] 
 
𝐼𝐶(0.95): 𝜎2𝜖[7.4084, 12.9688] 
 
Para la corrección, es igual de válido si se usan: 
𝝌𝟏𝟎𝟎,𝟎.𝟎𝟐𝟓
𝟐 = 𝟏𝟐𝟗. 𝟓𝟔 
𝝌𝟏𝟎𝟎,𝟎.𝟗𝟕𝟓
𝟐 = 𝟕𝟒. 𝟐𝟐 
 
En dicho caso, el intervalo de confianza resultante es: 
 
𝑰𝑪(𝟎. 𝟗𝟓): 𝝈𝟐𝝐[𝟕. 𝟑𝟒𝟑𝟐, 𝟏𝟐. 𝟖𝟏𝟖𝟓] 
 
c) Si X no es normal, no se cumple que: 
 
𝜒0
2 =
(𝑛 − 1)�̂�2
𝜎0
2 ~𝜒𝑛−1
2 
(1 p) 
 
Esto tendría como consecuencia que el análisis realizado (contraste de hipótesis e intervalo de confianza) no sea 
válido, debido a que el nivel de confianza no será el buscado, sino uno distinto. (1p)

Continuar navegando

Contenido elegido para ti

90 pag.
26 pag.
31289_t2

User badge image

Aprendiendo Juntos

19 pag.
Inferencia Estadistica - ALICAR OCANTO

SIN SIGLA

User badge image

Ali Ocanto Bastidas

24 pag.
Inferencia Estadistica - ALICAR OCANTO OF

SIN SIGLA

User badge image

Ali Ocanto Bastidas