Logo Studenta

EAS201aPrueba2_Pauta_

¡Estudia con miles de materiales!

Vista previa del material en texto

Pontificia Universidad Católica de Chile
Facultad de Ciencias Económicas y Administrativas
Segundo Semestre 2018
Curso : Inferencia Estad́ıstica
Sigla : EAS201a
Profesores : Rafael Águila (Sec 1, 2 y 3), Cristian Vásquez (Sec 4) y Victor Correa (Sec 5)
Pauta Prueba 2
Problema 1
El śındrome del comportamiento anterior crónico es un mal que se manifiesta por el dolor en el muslo debido
al ejercicio anterior. Inflamación y daño al nervio y a la función muscular se suman al dolor, que disminuye
con el reposo. Susan Beckhman y colaboradores realizaron un experimento que inclúıa a 10 corredores y a 10
ciclistas saludables para determinar si la mediciones de presión sobre el comportamiento del músculo anterior
difieren en los corredores y en los ciclistas. En la siguiente tabla se resumen los datos (presión ejercida sobre
el comportamiento se mide en miĺımetro de mercurio).
Corredores Ciclistas
Estado Media Desviación Media Desviación
Reposo 14.5 3.92 11.1 3.98
80 % del consumo máximo de 02 12.2 3.49 11.5 4.95
Asumiendo que los datos registrados provienen de una distribución normal realice lo siguiente:
(a) [2.5 Ptos] Asumiendo igualdad en las varianzas de la población, construya un Intervalo de Con-
fianza al 95 % para la diferencia en las presiones medias sobre el comportamiento entre los corredores
y los ciclistas que están en reposo, ¿Cuál seŕıa su conclusión?.
(b) [2.5 Ptos] Asumiendo varianzas distintas de la población, construya un Intervalo de Confianza
al 90 % para la diferencia en las presiones medias sobre el comportamiento entre los corredores y los
ciclistas que hacen ejercicio con un 80 % de consumo máximo de ox́ıgeno, ¿Cuál seŕıa su conclusión?.
(c) [1.0 Ptos] A partir de los intervalos en a) y en b). ¿Cómo interpretaŕıa usted los resultados que
obtuvo?
Solución:
(a) Asumiendo que las varianzas son iguales pero desconocidas, se debe utilizar un intervalo de confianza
T-Student. Primero determinar el S2p entre corredores y ciclistas en reposo
s2x = 3.92
2
= 15.37
s2y = 3.98
2
= 15.84
s2p =
9 · 15.37 + 9 · 15.84
18
= 15.605
t18(0.975) = 2.101 [1.0 Ptos]
EAS201A -Inferencia Estad́ıstica 1 Segundo Semestre 2018
El intervalo de confianza queda determinado de la siguiente manera
IC(µx − µy, 1− α) =
X − Y − t1−α2 (n+m− 2)Sp
√
1
n
+
1
m
, X − Y + t1−α2 (n+m− 2)Sp
√
1
n
+
1
m

Reemplazado con los datos observados de la muestra se tiene
IC(µx − µy, 95 %) =
14.5− 11.1− 2.101√15.605
√
2
10
, 14.5− 11.1 + 2.101
√
15.605
√
2
10
 [0.5 Ptos]
= (3.4− 3.71, 3.4 + 3.71)
= (−0.31, 7.11) [0.5 Ptos]
Dado que el valor 0 está contenido en el intervalo de confianza, con un α = 0.05 de significancia (95 %
de confianza), se concluye que no existe diferencia entre las presiones medias de corredores y ciclistas
en reposo.[0.5 Ptos]
Observación: Si el intervalo se realizó de la forma µy − µx, los puntajes asignados por el desarrollo
son los mismos y el intervalo resultante es:
IC(µy − µx, 95 %) = (−7.11, 0.31)
La conclusión es la misma.
(b) Aqúı las varianzas son distintas y desconocidas, por lo tanto se debe construir un intervalo de confianza
T-Student aproximando los grados de libertad. A partir de las varianzas muestrales de corredores y
ciclistas que hacen ejercicio con un 80 % de consumo máximo de ox́ıgeno se tiene
s2x = 3.49
2 = 12.18
s2y = 4.95
2 = 24.5
g =

(
12.18
10
+
24.5
10
)2
(12.18/10)2
9
+
(25.4/10)2
9

= [16.174]
= 16
t0.95(16) = 1.746 [1.0 Ptos]
En este caso el intervalo de confianza queda determinado de la siguiente manera
IC(µx − µy, 1− α) =
X − Y − t1−α2 (g)
√
S2x
n
+
S2y
m
, X − Y + t1−α2 (g)
√
S2x
n
+
S2y
m

EAS201A -Inferencia Estad́ıstica 2 Segundo Semestre 2018
Reemplazando en el intervalo anterior con los datos observados se tiene
IC(µx − µy, 90 %) =
12.2− 11.5− 1.746
√
12.18
10
+
24.5
10
, 12.2− 11.5 + 1.746
√
12.18
10
+
24.5
10
 [0.5 Ptos]
= (0.7− 3.34, 0.7 + 3.34)
= (−2.64, 4.04) [0.5 Ptos]
Dado que el valor 0 está contenido en el intervalo de confianza, con un α = 0.05 de significancia (95 %
de confianza), se concluye que no existe diferencia entre las presiones medias de corredores y ciclistas
en reposo que hacen ejercicio con un 80 % de consumo máximo de ox́ıgeno.[0.5 Ptos]
Observación: Si el intervalo se realizó de la forma µy − µx, los puntajes asignados por el desarrollo
son los mismos y el intervalo resultante es:
IC(µy − µx, 95 %) = (−4.04, 2.64)
La conclusión es la misma.
(c) En ambos intervalos de confianza se llega a la misma conclusión, los datos no muestran evidencia
emṕırica de una diferencia entre las medias de presión de corredores y ciclistas cuando se estuvo
anteriormente en reposo o al 80 % de consumo máximo de ox́ıgeno [1.0 Ptos].
EAS201A -Inferencia Estad́ıstica 3 Segundo Semestre 2018
Problema 2
Una importante empresa quiere evaluar las ventas anuales de dos productos marcas “A” y “B”, donde las
ventas anuales de la marca “A” tiene distribución X ∼ Normal(θ1, θ21) y las ventas anuales de la marca
“B” tienen la distribución normal Y ∼ Normal(θ2, θ22), donde θ1 > θ2 > 0. Considere “n” (tamaño muestra)
puntos de ventas y sean X1, X2, . . . , Xn muestra aleatoria de X y Y1, Y2, . . . , Yn muestra aleatoria de Y .
Dado que los productos son complementarios en cada tienda, se tiene,
Cov(Xi, Yk) =
{
θ1θ2, si i = k,
0, en otro caso.
Realice lo siguiente:
(a) [1.0 Ptos] Muestre que Cov(X,Y ) =
θ1θ2
n
.
(b) [1.0 Ptos] Muestre que Var(X − Y ) =
(θ1 − θ2)2
n
.
(c) [2.5 Ptos] Suponga que se desea evaluar las hipótesis H0 : θ1 − θ2 ≤ 38 vs H1 : θ1 − θ2 > 38.
Utilizando (a) y (b) construya un Test de Hipótesis para evaluar H0 y H1 con un α = 0.05 de nivel
de significancia, es decir, construya un pivote útil y bajo H0 determine la región de rechazo del test.
(d) [1.5 Ptos] Si a partir de una muestra se tiene que n = 16, x = 200 y y = 150. ¿Se puede afirmar que
la diferencia de la ventas medias de “A” y “B”, es mayor que 38 u.m al 5 % de significación?
Solución:
(a) Aqúı se debe aplicar las propiedades de la covarianza
Cov(X,Y ) = Cov
( ∑n
i=1Xi
n
,
∑n
j=1 Yj
n
)
=
1
n2
Cov
 n∑
i=1
Xi,
n∑
j=1
Yj
 [0.5 Ptos]
=
1
n2
n∑
i=1
n∑
j=1
Cov (Xi, Yj)
=
1
n2
n∑
i=1
θ1θ2
=
θ1θ2
n
[0.5 Ptos]
(b) Ahora se debe aplicar las propiedades de la varianza más lo anterior
Var(X − Y ) = Var(X) + Var(Y )− 2Cov(X,Y ) [0.2 Ptos]
=
θ21
n
+
θ22
n
− 2
θ1θ2
n
[0.3 Ptos]
=
(θ1 − θ2)2
n
[0.5 Ptos]
EAS201A -Inferencia Estad́ıstica 4 Segundo Semestre 2018
(c) Primero las hipótesis planteadas son
H0 : θ1 − θ2 ≤ 38 vs H1 : θ1 − θ2 > 38, [0.5 Ptos]
dado que se desea comparar medias de las distribuciones de los datos se puede utilizar lo siguiente,
X ∼ Normal
(
θ1,
θ21
n
)
, [0.1 Ptos]
Y ∼ Normal
(
θ2,
θ22
n
)
, [0.1 Ptos]
X − Y ∼ Normal
(
θ1 − θ2,
(θ1 − θ2)2
n
)
[0.3 Ptos]
Estandarizando se puede tener un pivote útil para luego trabajar bajo H0
Z =
X − Y − (θ1 − θ2)√
(θ1 − θ2)2
n
∼ Normal(0, 1) [0.5 Ptos]
Bajo H0 y con un α = 0.05 el test rechaza para valores grandes de la distribución normal, es decir,
RR(H0) =

X − Y − (θ1 − θ2)√
(θ1 − θ2)2
n
> z0.95
 [0.5 Ptos]
=

X − Y − 38√
382
n
> 1.645
 [0.5 Ptos]
=
{
X − Y > 38 + 1.645
38
√
n
}
(d) Recuerde las hipótesis
H0 : θ1 − θ2 ≤ 38 vs H1 : θ1 − θ2 > 38,
Bajo H0 y con un nivel de α = 0.05 de significancia el test rechaza
RR(H0) =
{
X − Y > 38 + 1.645
38
√
n
}
reemplazando se tiene que
EAS201A -Inferencia Estad́ıstica 5 Segundo Semestre 2018
x− y = 200− 150
= 50,
38 + 1.645
38
√
16
= 53.6275 [1.0 Ptos]
Note que 50 ≯ 53.6275, por lo tanto, considerando un α = 0.05 de significancia, no existe evidencia
estad́ıstica para rechazar H0 [0.5 Ptos]
EAS201A -Inferencia Estad́ıstica 6 Segundo Semestre 2018
Problema 3
La crisis en Quintero y Puchuncav́ı comenzó hace varias semanas, con las dos intoxicaciones masivas en
la primera comuna que sumaron más de 300 personasafectadas. hace unos d́ıas, la Superintendencia del
Medio Ambiente formuló cargos contra algunas empresas, a las que acusó de causar esos dos episodios por la
liberación de gases en un proceso de limpieza de estanques de su terminal en Quintero. Se debe considerar
que desde que comenzó el problema, al centro médico de ambas comunas han estado saturados de personas,
y por lo mismo se requiere realizar un estudio sobre ello. Especialistas han reunido el tiempo de espera de
200 y 240 pacientes, respectivamente en cada lugar, ilustrados en la siguiente figura.
Tiempo de espera en ambas ciudades
Tiempo (en Horas)
F
re
qu
en
cy
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
0
20
40
60
80
Utilizando la información del anexo, para cada pregunta proponga de forma ordenada la hipótesis nula,
alternativa, nivel de significancia, valor-p y decisión
(a) [2.0 Ptos] Proponga una distribución para el tiempo de espera, al 5 % de significancia.
(b) [2.0 Ptos] Reporte el intervalo de confianza al 95 % del tiempo medio de cada comuna, y pruebe
al 5 % de significancia si son iguales. Utilice el resultado del test de comparación de varianzas como
información real para comparar el tiempo medio.
(c) [2.0 Ptos] ¿Con qué nivel de significancia se puede indicar que el tiempo promedio de atención en
Quintero es superior a 1.5 horas? Justifique su respuesta.
> ks.test(tiempo, "pgamma", 6,5)
D = 0.050858, p-value = 0.2051
> ks.test(tiempo, "pgamma", 4,4)
D = 0.16484, p-value = 8.252e-11
> ks.test(tiempo, "plnorm", 0.04,0.4)
D = 0.069717, p-value = 0.02776
> t.test(tiempo[Comuna=="Quintero"], mu=1.5, alternative="two.sided", conf.level = 0.9)
t = -14.001, df = 199, p-value < 2.2e-16
90 percent confidence interval:
1.048716 1.144000
> t.test(tiempo[Comuna=="Quintero"], mu=1.5, alternative="two.sided", conf.level = 0.95)
t = -14.001, df = 199, p-value < 2.2e-16
95 percent confidence interval:
1.039508 1.153208
> t.test(tiempo[Comuna=="Quintero"], mu=1.5, alternative="less", conf.level = 0.95)
t = -14.001, df = 199, p-value < 2.2e-16
95 percent confidence interval:
-Inf 1.144
> t.test(tiempo[Comuna=="Quintero"], mu=1.5, alternative="greater", conf.level = 0.95)
t = -14.001, df = 199, p-value = 1
95 percent confidence interval:
1.048716 Inf
> t.test(tiempo[Comuna=="Puchuncavı́"], mu=1.5, alternative="less", conf.level = 0.95)
t = -10.585, df = 239, p-value < 2.2e-16
95 percent confidence interval:
-Inf 1.227671
> t.test(tiempo[Comuna=="Puchuncavı́"], mu=1.5, alternative="two.sided", conf.level = 0.95)
EAS201A -Inferencia Estad́ıstica 7 Segundo Semestre 2018
t = -10.585, df = 239, p-value < 2.2e-16
95 percent confidence interval:
1.117284 1.237385
> var.test(tiempo~Comuna, conf.level = 0.95)
F = 1.372, num df = 239, denom df = 199, p-value = 0.02102
> t.test(tiempo~Comuna, var.equal=TRUE, conf.level = 0.95)
t = 1.9845, df = 438, p-value = 0.0495
95 percent confidence interval:
0.0002588641 0.154542093
> t.test(tiempo~Comuna, var.equal=FALSE, conf.level = 0.95)
t = 1.93, df = 437.44, p-value = 0.05425
95 percent confidence interval:
-0.001485323 0.163438776
Solución
(a) A partir de la información reportada, existen tres hipótesis: Gamma(6,5), Gamma(4,4), LogNor-
mal(0.04,0.4). De estas opciones, se desprede que:
H0 : Tiempo ∼ Gamma(6, 5) vs H1 : Tiempo � Gamma(6, 5) [0.5 Ptos]
Luego, como valor-p = 0.2051 [0.5 Ptos], α = 0.05 [0.5 Ptos] y p-valor > α, entonces no hay evidencia
suficiente para rechazar la hipótesis nula, y por tanto se concluye que el tiempo podŕıa seguir dicha
distribución. [0.5 Ptos]
(b) A partir de la información del reporte, se puede observar que IC(µQuintero)95 % = (1.039508 1.153208)
[0.2 Ptos], mientras que IC(µPuchuncav́ı)95 % = (1.117284 , 1.237385) [0.2 Ptos]. Notar que poseen
un tamaño de intervalo que se superpone, pero no es suficiente información para comparar. El primer
test a realizar es:
H0 :
σ21
σ22
= 1 vs H1 :
σ21
σ22
6= 1 [0.2 Ptos]
y como valor-p = 0.02102 < α = 0.05 [0.2 Ptos], entonces hay evidencia suficiente para rechazar la
hipótesis nula, y por tanto se concluye que las varianzas podŕıan ser distintas, al 5 % de significan-
cia.[0.2 Ptos]
Suponiendo que este resultado es cierto, como lo menciona la indicación del enunciado, se procede a
realizar el test:
H0 : µ1 − µ2 = 0 vs H1 : µ1 − µ2 6= 0 [0.3 Ptos]
Utilizando entonces el supuesto de varianzas desconocidas y distintas, se concluye que valor-p =
0.05425 > α = 0.05 [0.4 Ptos], y por tanto no hay evidencia estad́ıstica suficiente para rechazar
la hipótesis de igualdad de medias, con un 5 % de significancia.[0.3 Ptos]
(c) Notar que la hipótesis planteada es:
H0 : µQuintero ≤ 1.5 vs H1 : µQuintero > 1.5 [0.5 Ptos]
Luego, el valor-p asociado a la hipótesis es 1 [0.5 Ptos]. Esto implica que, para rechazar la hipótesis
e indicar lo pedido, se tendŕıa que utilizar un error del 100 % [0.5 Ptos].. En conclusión, no hay
escenarios posibles para encontrar evidencia estad́ıstica contra la hipótesis nula.[0.5 Ptos]
EAS201A -Inferencia Estad́ıstica 8 Segundo Semestre 2018

Otros materiales