Logo Studenta

Ayudantía10

¡Este material tiene más páginas!

Vista previa del material en texto

EAS201a - Inferencia Estad́ıstica
Escuela de Administración UC
Material de Apoyo
Ayudant́ıa 10
: , 1
Test de Bondad de Ajuste
Tópicos de la Ayudant́ıa
I Test χ2 de Pearson
I Ejercicios
I Test de Independencia
I Ejercicios
I Ejercicios Propuestos
: , 2
Test de Bondad de Ajuste
Test χ2 de Pearson
Suponga que se quiere testear:
H0 : fY (y) = f0(y)
vs (1)
H1 : fY (y) 6= f0(y)
El test de Bondad de Ajuste de Peason, agrupa los datos en k categoŕıas:
r1, r2, ..., rk , asociados a n experimentos independientes, donde
P(ri ) = πi , i = 1, ..., k .
De esta manera, las hipótesis en (1) es equivalente a testear
H0 : πi = π0i i = 1, ..., k
vs
H1 : πi 6= π0i al menos un i
donde π0i es la probabilidad de pertenecer a la categoŕıa i bajo el modelo
en H0.
: , 3
Test de Bondad de Ajuste
Test χ2 de Pearson
Defina:
I Oi el número de individuos en la muestra que pertenece a ri .
I Ei = nπi el valor esperado de la categoŕıa ri .
donde
∑k
i=1 oi = n y
∑k
i=1 πi = 1
Sean π̂0i los estimadores máximos verośımiles de π0i bajo el modelo en H0.
El estadistico del test está dado por
D =
k∑
i=1
(Oi − nπ̂0i )2
nπ̂0i
cuya distribución asintótica bajo H0 es χ
2 con k−1− s grados de libertad,
donde s es el número de parámetros a estimar en el modelo.
: , 4
Test de Bondad de Ajuste
Test χ2 de Pearson
Por lo tanto, con un nivel de significancia α, se rechaza H0 si
d =
k∑
i=1
(oi − nπ̂0i )2
nπ̂0i
> χ21−α,k−1−s
Para que la aproximación sea adecuada se requiere que se cumpla que
E0i = nπ̂0i ≥ 5 ∀i .
: , 5
Test de Bondad de Ajuste
Ejercicio 1
Se verificó el número de accidentes Y por semana que ocurren en un
crucero para n = 52 semanas y se obtuvieron los siguientes resultados:
y Frecuencia
0 32
1 12
2 8
3 o más 0
Pruebe la hipótesis que afirma que la variable aleatoria Y tiene una dis-
tribución Poisson, suponiendo que las observaciones son independientes.
Utilice un nivel de significancia de α = 0.05.
: , 6
Test de Bondad de Ajuste
Solución Ejercicio 1
Las hipótesis a testear son las siguientes:
H0 : Y ∼ Poisson(λ)
vs
H1 : Y � Poisson(λ)
Como no se conoce el valor de λ debemos estimarlo por su estimador
máximo verośımil, que es λ̂ = Y . A partir de los datos, se obtiene que
λ̂ = y = (0 · 32 + 1 · 12 + 2 · 8)/52 = 0.5384615
Considereando 3 categoŕıas: Y = 0, Y = 1 y Y ≥ 2, se tiene que las
probabilidades de cada una de las categoŕıas bajo H0 están dadas por
: , 7
Test de Bondad de Ajuste
Solución Ejercicio 1
π01 = P(Y = 0) = e
−λ
π02 = P(Y = 1) = λe
−λ
π03 = P(Y ≥ 2) = 1− e−λ − λe−λ
Estas probabilidades se estiman sustituyendo λ por λ̂,
π̂01 = e
−0.538 = 0.5839 π̂02 = 0.538e
−0.538 = 0.3141 π̂03 = 0.102
Aśı los valores esperados en cada una de las categoŕıas están dados por
E01 = nπ̂01 = 52 · 0.5839 = 30.3628
E02 = nπ̂02 = 52 · 0.3141 = 16.3332
E03 = nπ̂03 = 52 · 0.102 = 5.304
: , 8
Test de Bondad de Ajuste
Solución Ejercicio 1
Luego, los valores observados y esperados estimados están dados por
Categoŕıa
Y = 0 Y = 1 Y ≥ 2
oi 32 12 8
E0i 30.3628 16.3332 5.304
Como todas las categoŕıas cumplen con la condición êi ≥ 5, se tiene que
el estad́ıstico del test esta dado por
d =
3∑
i=1
(oi − E0i )2
E0i
=
(32− 30.3628)2
30.3628
+
(12− 16.3332)2
16.3332
+
(8− 5.304)2
5.304
= 2.608243
: , 9
Test de Bondad de Ajuste
Solución Ejercicio 1
Por otro lado, Como k = 3 categoŕıas y se estimó un sólo parámetro s = 1,
se tiene que χ20.95,3−1−1 = χ
2
0.95,1 = 3.841.
Como 2.608243 < 3.841 no existe evidencia para rechazar H0, es decir, los
datos no proporcionan evidencia suficiente para contradecir que Y posee
una distribución Poisson.
: , 10
Test de Bondad de Ajuste
Ejercicio 2
El verano pasado, por varios d́ıas se luchó por apagar los focos de incendio
que afectaban la zona centro-sur del páıs. Durante la planificación de la
estrategia para extinguir dichos focos, se recibe información del avance del
fuego en términos de su velocidad de avance Y (mts/min) en 36 puntos:
Velocidad (mts/min) ≤ 3 (3-4] (4-6] (6-8] > 8
Frecuencia 4 15 8 5 4
A partir de los datos se obtiene que
mean(Y) mean(Y^2)
4.378002 23.51589
: , 11
Test de Bondad de Ajuste
Ejercicio 2
¿Existe evidencia muestral de que los datos provienen de una distribución
Normal? Use los estimadores de máxima verosimilitud para estimar sus
parámetros y un α = 5%.
: , 12
Test de Bondad de Ajuste
Solución Ejercicio 2
Primero haremos el test para testear Normalidad, para ello las hipótesis
son
H0 : Y ∼ Normal(µ, σ2) vs Y � Normal(µ, σ2)
Para el calculo de las probabilidades en cada una de las categoŕıas, debemos
primero estimar µ y σ2 por los EMV:
µ̂ = Y = 4.378002 σ̂2 = Y 2−Y 2 = 23.51589−4.3780022 = 4.348988
: , 13
Test de Bondad de Ajuste
Solución Ejercicio 2
El cálculo de las probabilidades estimadas en cada categoŕıa bajo H0
(Y ∼ Normal(4.37, 4.34)) están dadas por
π̂01 = P(Y ≤ 3) = P
(
Y − 4.37
2.09
≤ 3− 4.37
2.09
)
= P
(
Z ≤ 3− 4.37
2.09
)
= Φ(−0.65) = 0.2578461
π̂02 = P(3 < Y ≤ 4) = P
(
3− 4.37
2.09
< Z ≤ 4− 4.37
2.09
)
= Φ(−0.17)− Φ(−0.65) = 0.4325051− 0.2578461 = 0.174659
π̂03 = P(4 < Y ≤ 6) = P
(
4− 4.37
2.09
< Z ≤ 6− 4.37
2.09
)
= Φ(0.77)− Φ(−0.17) = 0.7793501− 0.4325051 = 0.346845
: , 14
Test de Bondad de Ajuste
Solución Ejercicio 2
π̂04 = P(6 < Y ≤ 8) = P
(
6− 4.37
2.09
< Z ≤ 8− 4.37
2.09
)
= Φ(1.73)− Φ(0.77) = 0.9581849− 0.7793501 = 0.1788348
π̂05 = 1− π̂01 − π̂02 − π̂03 − π̂04
= 1− 0.2578461− 0.174659− 0.346845− 0.1788348
= 0.0418151
: , 15
Test de Bondad de Ajuste
Solución Ejercicio 2
Calculando los valores esperados estimados de cada categoŕıa,
E01 = nπ̂01 = 36 · 0.2578461 = 9.28246
E02 = nπ̂02 = 36 · 0.174659 = 6.287724
E03 = nπ̂03 = 36 · 0.346845 = 12.48642
E04 = nπ̂04 = 36 · 0.1788348 = 6.438053
E05 = nπ̂05 = 36 · 0.0418151 = 1.505344
Como la categoŕıa 5 no cumplen con la condición de que Ê0i ≥ 5, colap-
samos la categoŕıa 4 y 5, de la siguiente manera:
: , 16
Test de Bondad de Ajuste
Solución Ejercicio 2
Categoŕıa ≤ 3 (3-4] (4-6] > 6
oi 4 15 8 9
E0i 9.28246 6.287724 12.48642 7.943397
Luego el estad́ıstico observado del test está dado por
d =
3∑
i=1
(oi − E0i )2
E0i
= 16.83041
: , 17
Test de Bondad de Ajuste
Solución Ejercicio 2
Como k = 4 categoŕıas, el número de parámetros a estimar son s = 2, se
tiene que
χ20.95,4−1−2 = χ
2
0.95,1 = 3.84
Como 16.83041 > 3.84 con un 5% de significancia se rechaza H0, es decir,
los datos no distribuyen Normal.
: , 18
Test de Independencia
Dada dos variables aleatorias X e Y categóricas. Donde X posee r cate-
goŕıas e Y tiene c categoŕıas. Interesa testear si
H0 : X e Y son independientes
vs
H1 : X e Y no son independientes
Denote por A1, ....,Ar las r categoŕıas que toma la v.a X y por B1, ...,Bc
las c categoŕıas de la v.a Y ..
: , 19
Test de Independencia
Suponga que n observaciones son tomadas de un espacio muestral S parti-
cionado por los eventos A1, ....,Ar y B1, ...,Bc . Las frecuencias observadas
están dadas por
Frecuencias Observadas
B1 B2 · · · Bc Total
A1 n11 n12 · · · n1c R1
A2 n21 n22 · · · n2c R2
...
Ar nr1 nr2 · · · nrc Rr
Total C1 C2 · · · Cc n
Sea pi = P(Ai ), i = 1, ..., r
qj = P(Bj), j = 1, ..., c , con
∑r
i=1 pi =
∑c
j=1 qj = 1.
: , 20
Test de Independencia
Los estimadores EMV de pi y qj corresponden a las proporciones mues-
trales:
p̂1 = R1/n p̂2 = R2/n · · · p̂r = Rr/n
q̂1 = C1/n q̂2 = C2/n · · · q̂c = Cc/n
Las frecuencias esperadas estimadas son Eij = np̂i q̂j = RiCj/n.
De esta manera, con un nivel de significancia α , se rechaza H0 (indepen-
dencia) si
r∑
i=1
c∑
j=1
(nij − Eij)2
Eij
≥ χ21−α,(r−1)(c−1)
siempre que np̂i q̂j ≥ 5 para todo i , j .
: , 21
Test de Independencia
Ejercicio 3
Un estudio de la relación entre las condiciones de las instalaciones en
gasolineras y la agresividad en el precio de la gasolina reporta los siguientes
datos basados en una muestra de n = 441 gasolineras. A un nivel de 0.01,
¿La información sugiereque las condiciones de las instalaciones y la poĺıtica
de precios son independientes entre śı ?
Poĺıtica de precios observada
Condición Agresiva Neutral No agresiva
Anticuada 24 15 17
Estándar 52 73 80
Moderna 58 86 36
: , 22
Test de Independencia
Solución Ejercicio 3
Sea X las condiciones de las instalaciones en gasolineras e Y el precio de
la gasolina. Se quiere testear si
H0 : X e Y son independientes
vs
H1 : X e Y no son independientes
Para ello debemos calcular las probabilidades estimadas, para ellos primero
colapsamos la tabla, para calcular los totales:
Poĺıtica de precios observada Total
Condición Agresiva Neutral No agresiva
Anticuada 24 15 17 56
Estándar 52 73 80 205
Moderna 58 86 36 180
Total 134 174 133 441
: , 23
Test de Independencia
Solución Ejercicio 3
Luego las probabilidades estimadas p̂ij bajo H0 son:
Poĺıtica de precios observada
Condición Agresiva Neutral No agresiva
Anticuada 0.03858475 0.05010258 0.0382968
Estándar 0.1412477 0.1834112 0.1401936
Moderna 0.1240224 0.161044 0.1230969
: , 24
Test de Independencia
Solución Ejercicio 3
A partir de las probabilidades estimadas, se calcula los valores esperados
estimados como Eij = 441 · p̂ij
Poĺıtica de precios observada
Condición Agresiva Neutral No agresiva
Anticuada 17.01587 22.09524 16.88889
Estándar 62.29024 80.88434 61.82538
Moderna 54.69388 71.02040 54.28573
: , 25
Test de Independencia
Solución Ejercicio 3
Aśı el estad́ıstico del test observado
d =
r∑
i=1
c∑
j=1
(nij − Eij)2
Eij
= 22.47573
cuya distribución Bajo H0 es χ
2
(3−1)(3−1) = χ
2
4.
Luego, con un nivel de significancia de α = 0.01, se tiene que
χ20.99,4 = 13.2767.
Como d = 22.47573 > 13.2767, existe evidencia estad́ıstica para rechazar
H0, es decir el precio de la gasolina y las condiciones de las instalaciones
en las gasolineras están relacionados entre śı.
: , 26
Ejercicios Propuestos
1. Durante mucho tiempo, los criminalistas han debatido sobre si hay
relación entre las condiciones del clima y la incidencia de delitos
violentos. Se clasificaron 1361 homicidios según la estación del año,
con los siguientes resultados:
Invierno Primavera Verano Otoño
328 334 372 327
Pruebe la hipótesis nula de iguales proporciones de delitos en las
distintas estaciones del año para un α = 0.01.
: , 27
Ejercicios Propuestos
2. Cierto tipo de linterna se vende con las cuatro pilas incluidas. Se
obtiene una muestra al azar de 150 linternas y se determina el
número de pilas defectuosas en cada una, obteniendose los
siguientes resultados:
Número con defecto 0 1 2 3 4
Frecuencia 26 51 47 16 10
Sea X el número de pilas defectuosas de una linterna seleccionada al
azar. Pruebe la hipótesis nula de que la distribución de X es
Binomial (4, θ).
: , 28
Ejercicios Propuestos
3. Se dispone de una muestra aleatoria de individuos que viajan solos
en automóvil al trabajo, y cada individuo fue clasificado de acuerdo
con el tamaño de su automóvil y la distancia de recorrido. ¿La
siguiente información sugiere que dicha distancia y el tamaño del
automóvil están relacionados ?
Tamaño distancia de recorrido
auto [0− 10) [10− 20) ≥ 20
Subcompacto 6 27 19
Compacto 8 36 17
Mediano 21 45 33
Grande 14 18 6
: , 29
Ejercicios Propuestos
4. Se dispone de una muestra de entrenadores de atletismo, de los
cuales 2225 son entrenadores y 1141 son entrenadoras, se clasificó
según el número de años de experiencia como entrenador y se
obtuvieron los siguientes resultados:
Género Experiencia (años)
1-3 4-6 7-9 10-12 13+
Hombre 202 369 482 361 811
Mujer 230 251 238 164 258
¿Hay suficiente evidencia para concluir que la proporciones que caen
en ls categoŕıas de experiencia son diferentes para hombres y
mujeres? Utilice α = 0.01.
: , 30

Otros materiales

Materiales relacionados

54 pag.
psicotecnia - Viajeros MX

User badge image

Muchos Materiales

9 pag.
P_Value_y_Test_no_parametricos

User badge image

JHOSELYN CAROLINA TORRES VANEGAS

9 pag.