Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
EAS201a - Inferencia Estad́ıstica Escuela de Administración UC Material de Apoyo Ayudant́ıa 10 : , 1 Test de Bondad de Ajuste Tópicos de la Ayudant́ıa I Test χ2 de Pearson I Ejercicios I Test de Independencia I Ejercicios I Ejercicios Propuestos : , 2 Test de Bondad de Ajuste Test χ2 de Pearson Suponga que se quiere testear: H0 : fY (y) = f0(y) vs (1) H1 : fY (y) 6= f0(y) El test de Bondad de Ajuste de Peason, agrupa los datos en k categoŕıas: r1, r2, ..., rk , asociados a n experimentos independientes, donde P(ri ) = πi , i = 1, ..., k . De esta manera, las hipótesis en (1) es equivalente a testear H0 : πi = π0i i = 1, ..., k vs H1 : πi 6= π0i al menos un i donde π0i es la probabilidad de pertenecer a la categoŕıa i bajo el modelo en H0. : , 3 Test de Bondad de Ajuste Test χ2 de Pearson Defina: I Oi el número de individuos en la muestra que pertenece a ri . I Ei = nπi el valor esperado de la categoŕıa ri . donde ∑k i=1 oi = n y ∑k i=1 πi = 1 Sean π̂0i los estimadores máximos verośımiles de π0i bajo el modelo en H0. El estadistico del test está dado por D = k∑ i=1 (Oi − nπ̂0i )2 nπ̂0i cuya distribución asintótica bajo H0 es χ 2 con k−1− s grados de libertad, donde s es el número de parámetros a estimar en el modelo. : , 4 Test de Bondad de Ajuste Test χ2 de Pearson Por lo tanto, con un nivel de significancia α, se rechaza H0 si d = k∑ i=1 (oi − nπ̂0i )2 nπ̂0i > χ21−α,k−1−s Para que la aproximación sea adecuada se requiere que se cumpla que E0i = nπ̂0i ≥ 5 ∀i . : , 5 Test de Bondad de Ajuste Ejercicio 1 Se verificó el número de accidentes Y por semana que ocurren en un crucero para n = 52 semanas y se obtuvieron los siguientes resultados: y Frecuencia 0 32 1 12 2 8 3 o más 0 Pruebe la hipótesis que afirma que la variable aleatoria Y tiene una dis- tribución Poisson, suponiendo que las observaciones son independientes. Utilice un nivel de significancia de α = 0.05. : , 6 Test de Bondad de Ajuste Solución Ejercicio 1 Las hipótesis a testear son las siguientes: H0 : Y ∼ Poisson(λ) vs H1 : Y � Poisson(λ) Como no se conoce el valor de λ debemos estimarlo por su estimador máximo verośımil, que es λ̂ = Y . A partir de los datos, se obtiene que λ̂ = y = (0 · 32 + 1 · 12 + 2 · 8)/52 = 0.5384615 Considereando 3 categoŕıas: Y = 0, Y = 1 y Y ≥ 2, se tiene que las probabilidades de cada una de las categoŕıas bajo H0 están dadas por : , 7 Test de Bondad de Ajuste Solución Ejercicio 1 π01 = P(Y = 0) = e −λ π02 = P(Y = 1) = λe −λ π03 = P(Y ≥ 2) = 1− e−λ − λe−λ Estas probabilidades se estiman sustituyendo λ por λ̂, π̂01 = e −0.538 = 0.5839 π̂02 = 0.538e −0.538 = 0.3141 π̂03 = 0.102 Aśı los valores esperados en cada una de las categoŕıas están dados por E01 = nπ̂01 = 52 · 0.5839 = 30.3628 E02 = nπ̂02 = 52 · 0.3141 = 16.3332 E03 = nπ̂03 = 52 · 0.102 = 5.304 : , 8 Test de Bondad de Ajuste Solución Ejercicio 1 Luego, los valores observados y esperados estimados están dados por Categoŕıa Y = 0 Y = 1 Y ≥ 2 oi 32 12 8 E0i 30.3628 16.3332 5.304 Como todas las categoŕıas cumplen con la condición êi ≥ 5, se tiene que el estad́ıstico del test esta dado por d = 3∑ i=1 (oi − E0i )2 E0i = (32− 30.3628)2 30.3628 + (12− 16.3332)2 16.3332 + (8− 5.304)2 5.304 = 2.608243 : , 9 Test de Bondad de Ajuste Solución Ejercicio 1 Por otro lado, Como k = 3 categoŕıas y se estimó un sólo parámetro s = 1, se tiene que χ20.95,3−1−1 = χ 2 0.95,1 = 3.841. Como 2.608243 < 3.841 no existe evidencia para rechazar H0, es decir, los datos no proporcionan evidencia suficiente para contradecir que Y posee una distribución Poisson. : , 10 Test de Bondad de Ajuste Ejercicio 2 El verano pasado, por varios d́ıas se luchó por apagar los focos de incendio que afectaban la zona centro-sur del páıs. Durante la planificación de la estrategia para extinguir dichos focos, se recibe información del avance del fuego en términos de su velocidad de avance Y (mts/min) en 36 puntos: Velocidad (mts/min) ≤ 3 (3-4] (4-6] (6-8] > 8 Frecuencia 4 15 8 5 4 A partir de los datos se obtiene que mean(Y) mean(Y^2) 4.378002 23.51589 : , 11 Test de Bondad de Ajuste Ejercicio 2 ¿Existe evidencia muestral de que los datos provienen de una distribución Normal? Use los estimadores de máxima verosimilitud para estimar sus parámetros y un α = 5%. : , 12 Test de Bondad de Ajuste Solución Ejercicio 2 Primero haremos el test para testear Normalidad, para ello las hipótesis son H0 : Y ∼ Normal(µ, σ2) vs Y � Normal(µ, σ2) Para el calculo de las probabilidades en cada una de las categoŕıas, debemos primero estimar µ y σ2 por los EMV: µ̂ = Y = 4.378002 σ̂2 = Y 2−Y 2 = 23.51589−4.3780022 = 4.348988 : , 13 Test de Bondad de Ajuste Solución Ejercicio 2 El cálculo de las probabilidades estimadas en cada categoŕıa bajo H0 (Y ∼ Normal(4.37, 4.34)) están dadas por π̂01 = P(Y ≤ 3) = P ( Y − 4.37 2.09 ≤ 3− 4.37 2.09 ) = P ( Z ≤ 3− 4.37 2.09 ) = Φ(−0.65) = 0.2578461 π̂02 = P(3 < Y ≤ 4) = P ( 3− 4.37 2.09 < Z ≤ 4− 4.37 2.09 ) = Φ(−0.17)− Φ(−0.65) = 0.4325051− 0.2578461 = 0.174659 π̂03 = P(4 < Y ≤ 6) = P ( 4− 4.37 2.09 < Z ≤ 6− 4.37 2.09 ) = Φ(0.77)− Φ(−0.17) = 0.7793501− 0.4325051 = 0.346845 : , 14 Test de Bondad de Ajuste Solución Ejercicio 2 π̂04 = P(6 < Y ≤ 8) = P ( 6− 4.37 2.09 < Z ≤ 8− 4.37 2.09 ) = Φ(1.73)− Φ(0.77) = 0.9581849− 0.7793501 = 0.1788348 π̂05 = 1− π̂01 − π̂02 − π̂03 − π̂04 = 1− 0.2578461− 0.174659− 0.346845− 0.1788348 = 0.0418151 : , 15 Test de Bondad de Ajuste Solución Ejercicio 2 Calculando los valores esperados estimados de cada categoŕıa, E01 = nπ̂01 = 36 · 0.2578461 = 9.28246 E02 = nπ̂02 = 36 · 0.174659 = 6.287724 E03 = nπ̂03 = 36 · 0.346845 = 12.48642 E04 = nπ̂04 = 36 · 0.1788348 = 6.438053 E05 = nπ̂05 = 36 · 0.0418151 = 1.505344 Como la categoŕıa 5 no cumplen con la condición de que Ê0i ≥ 5, colap- samos la categoŕıa 4 y 5, de la siguiente manera: : , 16 Test de Bondad de Ajuste Solución Ejercicio 2 Categoŕıa ≤ 3 (3-4] (4-6] > 6 oi 4 15 8 9 E0i 9.28246 6.287724 12.48642 7.943397 Luego el estad́ıstico observado del test está dado por d = 3∑ i=1 (oi − E0i )2 E0i = 16.83041 : , 17 Test de Bondad de Ajuste Solución Ejercicio 2 Como k = 4 categoŕıas, el número de parámetros a estimar son s = 2, se tiene que χ20.95,4−1−2 = χ 2 0.95,1 = 3.84 Como 16.83041 > 3.84 con un 5% de significancia se rechaza H0, es decir, los datos no distribuyen Normal. : , 18 Test de Independencia Dada dos variables aleatorias X e Y categóricas. Donde X posee r cate- goŕıas e Y tiene c categoŕıas. Interesa testear si H0 : X e Y son independientes vs H1 : X e Y no son independientes Denote por A1, ....,Ar las r categoŕıas que toma la v.a X y por B1, ...,Bc las c categoŕıas de la v.a Y .. : , 19 Test de Independencia Suponga que n observaciones son tomadas de un espacio muestral S parti- cionado por los eventos A1, ....,Ar y B1, ...,Bc . Las frecuencias observadas están dadas por Frecuencias Observadas B1 B2 · · · Bc Total A1 n11 n12 · · · n1c R1 A2 n21 n22 · · · n2c R2 ... Ar nr1 nr2 · · · nrc Rr Total C1 C2 · · · Cc n Sea pi = P(Ai ), i = 1, ..., r qj = P(Bj), j = 1, ..., c , con ∑r i=1 pi = ∑c j=1 qj = 1. : , 20 Test de Independencia Los estimadores EMV de pi y qj corresponden a las proporciones mues- trales: p̂1 = R1/n p̂2 = R2/n · · · p̂r = Rr/n q̂1 = C1/n q̂2 = C2/n · · · q̂c = Cc/n Las frecuencias esperadas estimadas son Eij = np̂i q̂j = RiCj/n. De esta manera, con un nivel de significancia α , se rechaza H0 (indepen- dencia) si r∑ i=1 c∑ j=1 (nij − Eij)2 Eij ≥ χ21−α,(r−1)(c−1) siempre que np̂i q̂j ≥ 5 para todo i , j . : , 21 Test de Independencia Ejercicio 3 Un estudio de la relación entre las condiciones de las instalaciones en gasolineras y la agresividad en el precio de la gasolina reporta los siguientes datos basados en una muestra de n = 441 gasolineras. A un nivel de 0.01, ¿La información sugiereque las condiciones de las instalaciones y la poĺıtica de precios son independientes entre śı ? Poĺıtica de precios observada Condición Agresiva Neutral No agresiva Anticuada 24 15 17 Estándar 52 73 80 Moderna 58 86 36 : , 22 Test de Independencia Solución Ejercicio 3 Sea X las condiciones de las instalaciones en gasolineras e Y el precio de la gasolina. Se quiere testear si H0 : X e Y son independientes vs H1 : X e Y no son independientes Para ello debemos calcular las probabilidades estimadas, para ellos primero colapsamos la tabla, para calcular los totales: Poĺıtica de precios observada Total Condición Agresiva Neutral No agresiva Anticuada 24 15 17 56 Estándar 52 73 80 205 Moderna 58 86 36 180 Total 134 174 133 441 : , 23 Test de Independencia Solución Ejercicio 3 Luego las probabilidades estimadas p̂ij bajo H0 son: Poĺıtica de precios observada Condición Agresiva Neutral No agresiva Anticuada 0.03858475 0.05010258 0.0382968 Estándar 0.1412477 0.1834112 0.1401936 Moderna 0.1240224 0.161044 0.1230969 : , 24 Test de Independencia Solución Ejercicio 3 A partir de las probabilidades estimadas, se calcula los valores esperados estimados como Eij = 441 · p̂ij Poĺıtica de precios observada Condición Agresiva Neutral No agresiva Anticuada 17.01587 22.09524 16.88889 Estándar 62.29024 80.88434 61.82538 Moderna 54.69388 71.02040 54.28573 : , 25 Test de Independencia Solución Ejercicio 3 Aśı el estad́ıstico del test observado d = r∑ i=1 c∑ j=1 (nij − Eij)2 Eij = 22.47573 cuya distribución Bajo H0 es χ 2 (3−1)(3−1) = χ 2 4. Luego, con un nivel de significancia de α = 0.01, se tiene que χ20.99,4 = 13.2767. Como d = 22.47573 > 13.2767, existe evidencia estad́ıstica para rechazar H0, es decir el precio de la gasolina y las condiciones de las instalaciones en las gasolineras están relacionados entre śı. : , 26 Ejercicios Propuestos 1. Durante mucho tiempo, los criminalistas han debatido sobre si hay relación entre las condiciones del clima y la incidencia de delitos violentos. Se clasificaron 1361 homicidios según la estación del año, con los siguientes resultados: Invierno Primavera Verano Otoño 328 334 372 327 Pruebe la hipótesis nula de iguales proporciones de delitos en las distintas estaciones del año para un α = 0.01. : , 27 Ejercicios Propuestos 2. Cierto tipo de linterna se vende con las cuatro pilas incluidas. Se obtiene una muestra al azar de 150 linternas y se determina el número de pilas defectuosas en cada una, obteniendose los siguientes resultados: Número con defecto 0 1 2 3 4 Frecuencia 26 51 47 16 10 Sea X el número de pilas defectuosas de una linterna seleccionada al azar. Pruebe la hipótesis nula de que la distribución de X es Binomial (4, θ). : , 28 Ejercicios Propuestos 3. Se dispone de una muestra aleatoria de individuos que viajan solos en automóvil al trabajo, y cada individuo fue clasificado de acuerdo con el tamaño de su automóvil y la distancia de recorrido. ¿La siguiente información sugiere que dicha distancia y el tamaño del automóvil están relacionados ? Tamaño distancia de recorrido auto [0− 10) [10− 20) ≥ 20 Subcompacto 6 27 19 Compacto 8 36 17 Mediano 21 45 33 Grande 14 18 6 : , 29 Ejercicios Propuestos 4. Se dispone de una muestra de entrenadores de atletismo, de los cuales 2225 son entrenadores y 1141 son entrenadoras, se clasificó según el número de años de experiencia como entrenador y se obtuvieron los siguientes resultados: Género Experiencia (años) 1-3 4-6 7-9 10-12 13+ Hombre 202 369 482 361 811 Mujer 230 251 238 164 258 ¿Hay suficiente evidencia para concluir que la proporciones que caen en ls categoŕıas de experiencia son diferentes para hombres y mujeres? Utilice α = 0.01. : , 30
Compartir