Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Notas sobre inferencia estadística Valor-p, Test de bondad de ajuste e independencia. Vicente Breguel Gallaher vabreguel@uc.cl Segundo Semestre, 2017. 1. Valor-p Cuando analizamos los test estadísticos debemos saber que nunca pueden decirnos con absoluta certeza cuál de las dos hipótesis es la verdadera, sin embargo, pueden darnos una idea general de cuál probable es la hipótesis nula H0. Muchas veces quisiéramos poder conocer cuál es la probabilidad del evento que nos lleva a rechazar la hipótesis nula y a concluir a partir de la hipótesis alternativa, para medir si la conclusión podría haber sido obtenida por azar. En términos prácticos, el valor − p está definido como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido, suponiendo que la hipótesis nula es cierta. Es decir, re- presenta un umbral para rechazar H0, y permite no acceder a ningún valor crítico para tomar una decisión en un contraste de hipótesis solamente considerando las siguientes condiciones: valor − p α ! Rechazamos H0 valor − p > α ! No Rechazamos H0 En definitiva, se utiliza como una medida alternativa para tomar la decisión de si rechazar o no rechazar la hipótesis nula, y su aplicación práctica se detalla a continuación. Si H1 : θ > θ0 99K valor-p = 1− φ(zobs) Si H1 : θ < θ0 99K valor-p = φ(zobs) Si H1 : θ 6= θ0 99K valor-p = 2⇥ (1− φ(zobs)) Veamos ahora un caso práctico: 1.1. Ejercicio: Valor-p Sea un parámetro µ el verdadero promedio de contenido de desechos tóxicos en una máquina expandidora de humo. Un investigador sugiere estudiar si el promedio es mayor a 2.5 u.m dentro de cada máquina. En ese sentido, le pide plantear las hipotesis a estudiar y a tomar una decisión en función de la utilización del p− value y considerando un nivel de significancia del α = 5%. ¿Qué decide? ¿y al α = 10%? Suponga que el estadístico de prueba distribuye como una N(0, 1) y que luego de obtenidos los valores muestrales, toma un valor de zobs = 1,6 (recuerde que siempre cuando se obtiene el zobs se da por «cierta» la H0) 1 2 TEST’S CHI-CUADRADO: BONDAD DE AJUSTE E INDEPENDENCIA. 1.1.1. Solución Lo primero que debemos notar es que la hipótesis que el investigador solicita testear se relaciona a la hipótesis alternativa del ejercicio, quedando el contraste del siguiente modo: H0 : µ = 2,5 vs H1 : µ > 2,5 Además, sabemos que una región de rechazo para este tipo de contrastes es de la forma zobs > z1−α sin embargo, decidiremos según el cálculo del p− value. Dada la forma de la alternativa, vemos que la utilización del valor-p se reduce a obtener la siguiente proba- bilidad asociada a la siguiente estandarización 1− φ(zobs) ! 1− φ(1,6) = 1− 0, 9452 = 0, 0548. Es decir, el p− value es 5.48 %. En ese sentido: 1. Si α = 5%, NO rechazamos H0 y por tanto el investigador NO tiene razón en su teoría sobre la cantidad de desechos que tienen las máquinas expandidoras de humo. 2. Si α = 10%, SI rechazamos H0 y se cumple lo contrario a lo explicasdo en el punto (1). 2. Test’s Chi-Cuadrado: Bondad de ajuste e independencia. Las pruebas chi-cuadrado comienzan a modelar la esencia de la inferencia que ya no es paramétrica, ya que en la clásica ya estudiada, la distribución o población se asumía conocida y nosotros solamente estimabamos los parámetros que la componían. Ahora, cuando la distribución de probabilidad es desconocida, entonces debemos de alguna manera esti- marla, y es así como florece el concepto de la inferencia no paramétrica. En ese sentido, en esta sección estudiaremos dos de las pruebas más relevantes de este tópico: La prue- ba de bondad de ajuste (1 muestra) y la prueba de independencia (2 muestras). 2.1. Prueba de Bondad de Ajuste La prueba de la bondad de ajuste consiste principalmente en determinar si los datos de cierta muestra corresponden a cierta distribución poblacional. En este caso, es necesario que los valores de la va- riable en la muestra y sobre la cual queremos realizar la inferencia, esté dividida en clases de ocurrencia, o equivalentemente, sea cual sea la variable de estudio, deberemos categorizar los datos asignando sus valores a diferentes clases o grupos. A palabras simples, la prueba es una metodología útil para validar las hipótesis sobre la distribución teórica en la población que se realiza en la estadística paramétrica. Sirve para corroborar si mis datos siguen una distribución en particular, es decir, las hipótesis que se contrastan son del siguiente tipo: H0 : Y ⇠ f0(y; θ0) vs H1 : Y⇢⇠f0(y; θ0) ¿Cuáles son los pasos a seguir? 1. Debemos tener un número k de clases en las cuales se han ido registrando un total de n observaciones (n es el tamaño muestral). Denotaremos las frecuencias observadas en cada clase i como Oi, es decir, Oi es el número de valores en cada clase ki. Por supuesto, que al ser n el tamaño de la muestra (número de observaciones), se debe cumplir siempre que: O1 +O2 +O3 + . . .+Ok = n 2 2 TEST’S CHI-CUADRADO: BONDAD DE AJUSTE E INDEPENDENCIA.2.1 Prueba de Bondad de Ajuste 2. Luego, dependendiendo de la forma de la hipótesis nula (cuál será la distribución que queremos testear que representa de mejor manera los datos), obtendremos las frecuencias esperadas (teóricas) para cada clase i, y las denotaremos como Ei. Es decir, Ei es el número de valores esperados en cada clase ki. Por supuesto que debe seguir cumpliendose que la suma de las frecuencias esperadas es igual al número de observaciones, esto es: E1 + E2 + . . .+ Ek = n Estas se obtienen calculando la probabilidad de ocurrencia de la clase ki y luego multiplicando por el tamaño total de la muestra n. 3. Obtenidas ya las frecuencias esperadas y las teóricas, obtenemos el estadístico de prueba para realizar la Bondad de Ajuste, el cual estará definido del siguiente modo: χ2 ∗ = kX i=1 (Oi − Ei) 2 Ei Lo que nos muestra que es esperable que la diferencia entre lo observado Oi y lo esperado Ei sea lo más pequeña posible, de modo que entre menor es el valor del estadístico más coherentes serán las observaciones obtenidas con los valores esperados en función de la nula. 4. La regla de decisión será la siguiente: rechazar H0 al nivel de riesgo α si es que se cumple que X2 ∗ = kX i=1 (Oi − Ei) 2 Ei > χ2(1−α);(k−1−s) Siendo k el número de clases de la muestra, y s el número de parámetros estimados dentro de la distri- bución. Nota: Por último, es importante notar que para que se cumpla (por razones asintóticas) lo anterior debe ocurrir que el tamaño de la muestra general sea n > 30 y, además, que las frecuencias esperadas Ei representen todas un porcentaje mayor al 3% de n (> 5). Si esto no ocurre, se deben reagrupar las clases con frecuencias esperadas menores. 2.1.1. Ejemplo: Poisson. Una constructura particular llamada KADE S.A. entregó en los últimos meses 440 casas que fueron cons- truidas por la mano de obra que tienen contratada para este objetivo. De este número de hogares entregados se observó cuantos de ellos habían tenido alguna falla y/o habían sido razón de algún reclamo en particular, obteniendose los siguientes datos: Nº de errores o reclamos Frecuencia observada Oi 0 18 1 53 2 103 3 107 4 82 5 46 6 18 7 10 8 2 9 1 De este modo, se le pide testear al 5 % si el número de errores tendrá una distribución de Poisson, esto es: H0 : nº de errores tiene una distribución Poisson H1 : nº de errores NO tiene una distribución Poisson 3 2.1 Prueba de Bondad de Ajuste2 TEST’S CHI-CUADRADO: BONDAD DE AJUSTE E INDEPENDENCIA. 2.1.2. Solución ejemplo: Poisson 1. Lo primero que debemos notar es que siempre uno comienza asumiendo que la hipótesis nula es cierta, y para enfrentar este ejercicio debemos notar también que la distribución establecida en la hipótesis nula tiene un sólo parámetro: λ. En ese sentido, sabemos que representa una tasa media de ocurrencia de la variable aleatoria que sigue una distribución de poisson, por lo que los datos observados nos permiten hacer una estimación de este mismo del siguiente modo: bλ =0 ⇤ 18 + 1 ⇤ 53 + 2 ⇤ 103 + . . .+ 9 ⇤ 1 440 = 3,05 2. Luego, para obtener las frecuencias esperadas (bajo la «realidad» de que la hipótesis nula se cumple) debemos ocupar la función de probabilidad asociada a la distribución. De este modo, primero obtenemos las probabilidades de ocurrencia: P (X = 0|bλ = 3,05) = e −3,05 ⇤ (3,05)0 0! = 0,0474 P (X = 1|bλ = 3,05) = e −3,05 ⇤ (3,05)1 1! = 0,1444 [y así sucesivamente . . .] 3. Comenzamos a completar la tabla: a) Agregamos la tercera fila correspondiente a las probabilidades de ocurrencia asociadas a la distribución que establece la hipótesis nula: Nº de errores o reclamos Frecuencia observada Oi Probabilidad con Poisson λ = 3 0 18 0.0474 1 53 0.1444 2 103 0.2203 3 107 0.2339 4 82 0.1708 5 46 0.1042 6 18 0.0530 7 10 0.0231 8 2 0.0088 9 1 0.0030 b) Ahora, con la probabilidad de ocurrencia obtenemos las frecuencias esperadas Ei : Nº de errores Frecuencia Probabilidad Frecuencia o reclamos observada Oi con Poisson λ = 3 esperada Ei 0 18 0.0474 440*0.0474=20.84 1 53 0.1444 440*0.1444=63.56 2 103 0.2203 440*0.2203=96.92 3 107 0.2339 440*0.2339=98.54 4 82 0.1708 440*0.1708=75.14 5 46 0.1042 440*0.1042=45.83 6 18 0.0530 440*0.0530=23.30 7 10 0.0231 440*0.0231=10.15 8 2 0.0088 440*0.0088=3.87 9 1 0.0030 440*0.0030=1.31 4 2 TEST’S CHI-CUADRADO: BONDAD DE AJUSTE E INDEPENDENCIA.2.2 Prueba de independencia o homogeneidad c) Importante notar que las últimas dos clases Nº de errores = 9 y Nº de errores = 8 no representan separadamente las condiciones asintóticas que se deben cumplir en este test, por lo tanto debemos agruparlas para que juntas (con una Ei = 5,18) cumplan con la condición para la bondad de ajuste. 4. Finalmente, con la nueva «división» de clases, procedemos a obtener el estadístico X2 ∗ : X2 ∗ = kX i=1 (Oi − Ei) 2 Ei = (18− 20,84)2 20,84 + (53− 63,56)2 63,56 + . . .+ (3− 5,18)2 5,18 = 6,001 5. Ahora, considerando α = 5%, calculamos el estadístico a comparar: χ20,95;( 9 (k) −1− 1 (s) )=7 = 14, 067 6. De este modo, como no se cumple la regla de rechazo, NO rechazamos la hipótesis nula y por tanto los datos si pueden ser representados mediante una distribución de Poisson. 2.2. Prueba de independencia o homogeneidad El test de independencia surge cuando estamos interesados en determinar si dos cualidades o variables referidas a individuos de una misma población están relacionadas. Para el desarrollo de la prueba, supongamos que de la muestra de tamaño n se han observado dos característi- cas X e Y , obteniéndose una muestra aleatoria simple de carácter bidimensional (x1, y1), (x2, y2), . . . , (xn, yn). Sobre la base de dichas observaciones se desea contrastar si las características poblacionales x e y son inde- pendientes o no. H0 : independencia vs H1 : no independencia ¿Cuáles son los pasos a seguir? 1. Al conjunto de valores de X se divide en k conjuntos disjuntos A1, A2, A3, . . . , Ak. Además, el conjunto de valores de Y será descompusto en r conjuntos disjuntos B1, B2, . . . , Br. De ese modo, al clasificar los elementos de la muestra, aparecerá un cierto número de ellos nij en cada una de las k ⇥ r clases constituidas, dando lugar a una tabla de contingencia de la siguiente forma: A1 A2 . . . Ak Total B1 n11 n12 n1k n1. B2 n21 n2. ... ... Br nr1 nr2 nrk nr. Total n,1 n,2 n.k n 2. Con la tabla de contingencias anterior, procedemos a obtener las frecuencias esperadas eij bajo el supuesto de independencia (H0), haciendo un cálculo simple en términos del enfoque frecuentista: eij = ni ⇤ nj n y así rellenamos la nueva tabla en términos esperados: 5 2.2 Prueba de independencia o homogeneidad2 TEST’S CHI-CUADRADO: BONDAD DE AJUSTE E INDEPENDENCIA. A1 A2 . . . Ak Total B1 e11 e12 e1k n1. = e1. B2 e21 n2. = e2. ... ... Br er1 er2 erk nr. = er. Total e,1 e,2 e.k n 3. Obtenidas ya las frecuencias esperadas y las teóricas, obtenemos el estadístico de prueba para realizar la prueba de independencia, el cual estará definido del siguiente modo: X2IND = rX i=1 kX j=1 (nij − eij) 2 eij 4. La regla de decisión será la siguiente: rechazar H0 al nivel de riesgo α si es que se cumple que X2IND = rX i=1 kX j=1 (nij − eij) 2 eij > χ2(1−α);(r−1)×(k−1) de ese modo rechazaríamos la hipótesis de independencia en los datos y aprobaríamos el hecho de que NO lo son. 2.2.1. Ejemplo: Independencia. Se desea analizar con un riesgo α = 5% si el grado de satisfacción en el trabajo y el ingreso de una persona son variables aleatorias independientes o no. Para ello se encuesta a 442 personas obteniéndose los siguientes resultados. Satisfacción / Ingreso (nij) Alto Bajo Total Alto 263 42 305 Bajo 97 40 137 Total 360 82 442 = n Pruebe según el test de independencia que Ud. ya conoce, utilizando el estadístico de prueba ya conocido y su regla de rechazo asociada. 2.2.2. Solución ejemplo: Independencia. 1. Lo primero que debemos hacer es notar que hay k = r = 2 clases de cada característica (Satisfacción e ingreso). Lo anterior facilita mucho el cálculo de las frecuencias esperadas. Cómo sabemos que se calculan del siguiente modo: eij = ni ⇤ nj n procedemos a hacerlo para cada una de las seldas: ealto,alto = 305∗360 442 = 248,42 ealto,bajo = 305∗82 442 = 56,58 ebajo,alto = 137∗360 442 = 111,584 ebajo,bajo = 137∗82 442 = 25,416 6 3 EJERCICIOS MEZCLA: INDEPENDENCIA Y BONDAD DE AJUSTE. 2. Rellenamos la tabla para luego calcular el estadístico de prueba: Satisfacción / Ingreso (eij) Alto Bajo Total Alto 248.42 56.58 305 Bajo 111.584 25.416 137 Total 360 82 442 = n 3. Ahora calculamos el estadístico de prueba: X2IND = rX i=1 kX j=1 (nij − eij) 2 eij X2IND = (263− 248,42) 2 248,42 + (42− 56,58)2 56,58 + (97− 111,584)2 111,584 + (40− 25,416)2 25,416 = 14,8874 4. Evaluamos la regla de rechazo: X2IND = 14,8874 χ20,95;(2−1)×(2−1) = 3,841 (por tabla) De ese modo rechazamos la nula de independencia y, por tanto, los datos agrupados en satisfacción NO son independientes a los datos agrupados para ingreso. 3. Ejercicios mezcla: Independencia y bondad de ajuste. Una empresa de investigación de mercado, que está actualmente enfocada a las campañas presidenciales de este año, está estudiando las preferencias para los 3 candidatos más nombrados entre los electores de las tres más grandes circunscripciones del país, para ello selecciona en cada una de las 3 circunscripciones una muestra aleatoria de 200 electores, la tabla muestra la información obtenida: Preferencias I Circunscripción II Circunscripción III Circunscripción Total Candidato A 110 100 90 Candidato B 80 50 40 Candidato C 10 50 70 Total 600 = n 1. ¿Se puede afirmar, con un nivel de significación del 5 %, que en la III Circunscripción, los tres candidatos son igualmente probables? 2. ¿Se puede afirmar que, con un nivel de significación del 5 %, los tres candidatos tienen preferencias similares en las tres circunscripciones? 3. ¿Construya un intervalo del 90% de confianza para la diferencia entre la proporción de preferencias entre los candidatos B y C, que le permita averiguar si están o no en un empate estadístico? 3.1. Solución 1. Se trata de testear las siguientes hipótesis: H0 : πA = πB = πC vs H1 : Al menos un πi 6= 1 3 De ese modo, queremos ver si los datos tienen la misma distribución dentro de la III Circunscrip- ción, por lo que se procede a hacer un test de Bondad de Ajuste. Como en la tabla ya tenemos las 7 3.1 Solución 3 EJERCICIOS MEZCLA: INDEPENDENCIA Y BONDAD DE AJUSTE. frecuencias observadas Oi debemos proceder a obtener las esperadas Ei para luego calcular el estadís- tico de prueba. Cómo la hipótesis nula señala que la proporción de votantes dentro de la III Circunscripción es la misma para todos los candidatos πi = 1 3 8i, las frecuencias esperadas (y considerando que nIII = 200) son iguales para los 3: Ei = 200 ⇤ 1 3 = 66, 67. De ese modo: III Circunscripción Candidato A Candidato B Candidato C Oi 90 40 70 Ei 66,67 66,67 66,67 De ese modo, ahora procedemos a calcular el estadísticode prueba: X2 ∗ = 3X i=1 (Oi − Ei) 2 Ei = (90− 66,67)2 66, 67 + (40− 66,67)2 66, 67 + (70− 66,67)2 66, 67 = 18, 991 Como son 3 clases, y sabemos que la regla de rechazo se compara con una distribución χ2 procedemos a hacer el contraste: χ20,95,(3−1)=2 = 5,991 De ese modo, como 18.991>5.991 se rechaza H0 y, por tanto, no se puede considerar que en la III Circunscripción los tres candidatos son igualmente probables. 2. El test planteado corresponde a uno de independencia entre circunscripciones (homogeneidad) y por tanto se trata como tal. Como las frecuencias observadas Oi no cambian, procedemos a obtener las esperadas en este test particular de la forma: eij = ni ⇤ nj n Preferencias Oi I Circunscripción II Circunscripción III Circunscripción Total Candidato A 110 100 90 300 Candidato B 80 50 40 170 Candidato C 10 50 70 130 Total 200 200 200 600 = n Preferencias eij I Circunscripción II Circunscripción III Circunscripción Total Candidato A 300∗200600 = 100 300∗200 600 = 100 300∗200 600 = 100 300 Candidato B 170∗200600 = 56, 67 170∗200 600 = 56, 67 170∗200 600 = 56, 67 170 Candidato C 130∗200600 = 43, 33 130∗200 600 = 43, 33 130∗200 600 = 43, 33 130 Total 200 200 200 600 = n Ahora, calculamos el estadístico de prueba (trivialmente): X2IND = rX i=1 kX j=1 (nij − eij) 2 eij = 60, 37 Como sabemos que la regla de rechazo en estos casos se compara con χ21−α;(k−1)(r−1)=2∗2=4 = 9, 448 como 60,37>9,448 al 5 % es suficiente para rechazar H0. Es decir, las preferencias no se pueden consi- derar homogéneas en las tres circunscripciones. 8 3 EJERCICIOS MEZCLA: INDEPENDENCIA Y BONDAD DE AJUSTE. 3.1 Solución 3. Notemos que en (2) llegamos a la conclusión en que las circunscripciones no son independientes entre si, por lo tanto en el calculo de la varianza del pivote a utilizar en el intervalo de confianza debemos considerar la covarianza. ϕ = (pB − pC)− (πB − πC)q pB(1−pB)+pC(1−pC)+2pBpc n ⇠ N(0, 1) Armando el pivote dentro del intervalo de confianza y luego pivoteando llegamos al intervalo de confianza usual " pB − pC − Z1−α/2 ⇤ r pB(1− pB) + pC(1− pC) + 2pBpc n ; pB − pC + Z1−α/2 ⇤ E.E # Como en este caso ocurre que: pB = 170 600 = 0, 2833; pC = 130 600 = 0,2167;n = 600;Z0,95 = 1,645 finalmente: [0,0193 πB − πC 0, 1139] Cómo el intervalo no contiene el 0, podemos afirmar con un 90% de confianza que ambos candidatos no están en un empate estadístico. 9
Compartir