Logo Studenta

P_Value_y_Test_no_parametricos

¡Estudia con miles de materiales!

Vista previa del material en texto

Notas sobre inferencia estadística
Valor-p, Test de bondad de ajuste e independencia.
Vicente Breguel Gallaher
vabreguel@uc.cl
Segundo Semestre, 2017.
1. Valor-p
Cuando analizamos los test estadísticos debemos saber que nunca pueden decirnos con absoluta certeza cuál
de las dos hipótesis es la verdadera, sin embargo, pueden darnos una idea general de cuál probable es la
hipótesis nula H0.
Muchas veces quisiéramos poder conocer cuál es la probabilidad del evento que nos lleva a rechazar la
hipótesis nula y a concluir a partir de la hipótesis alternativa, para medir si la conclusión podría haber sido
obtenida por azar.
En términos prácticos, el valor − p está definido como la probabilidad de obtener un resultado al menos
tan extremo como el que realmente se ha obtenido, suponiendo que la hipótesis nula es cierta. Es decir, re-
presenta un umbral para rechazar H0, y permite no acceder a ningún valor crítico para tomar
una decisión en un contraste de hipótesis solamente considerando las siguientes condiciones:
valor − p  α ! Rechazamos H0
valor − p > α ! No Rechazamos H0
En definitiva, se utiliza como una medida alternativa para tomar la decisión de si rechazar o no rechazar la
hipótesis nula, y su aplicación práctica se detalla a continuación.
Si H1 : θ > θ0 99K valor-p = 1− φ(zobs)
Si H1 : θ < θ0 99K valor-p = φ(zobs)
Si H1 : θ 6= θ0 99K valor-p = 2⇥ (1− φ(zobs))
Veamos ahora un caso práctico:
1.1. Ejercicio: Valor-p
Sea un parámetro µ el verdadero promedio de contenido de desechos tóxicos en una máquina expandidora
de humo. Un investigador sugiere estudiar si el promedio es mayor a 2.5 u.m dentro de cada máquina. En
ese sentido, le pide plantear las hipotesis a estudiar y a tomar una decisión en función de la utilización del
p− value y considerando un nivel de significancia del α = 5%. ¿Qué decide? ¿y al α = 10%? Suponga que el
estadístico de prueba distribuye como una N(0, 1) y que luego de obtenidos los valores muestrales, toma un
valor de zobs = 1,6 (recuerde que siempre cuando se obtiene el zobs se da por «cierta» la H0)
1
2 TEST’S CHI-CUADRADO: BONDAD DE AJUSTE E INDEPENDENCIA.
1.1.1. Solución
Lo primero que debemos notar es que la hipótesis que el investigador solicita testear se relaciona a la hipótesis
alternativa del ejercicio, quedando el contraste del siguiente modo:
H0 : µ = 2,5 vs H1 : µ > 2,5
Además, sabemos que una región de rechazo para este tipo de contrastes es de la forma
zobs > z1−α
sin embargo, decidiremos según el cálculo del p− value.
Dada la forma de la alternativa, vemos que la utilización del valor-p se reduce a obtener la siguiente proba-
bilidad asociada a la siguiente estandarización 1− φ(zobs) ! 1− φ(1,6) = 1− 0, 9452 = 0, 0548. Es decir, el
p− value es 5.48 %. En ese sentido:
1. Si α = 5%, NO rechazamos H0 y por tanto el investigador NO tiene razón en su teoría sobre la cantidad
de desechos que tienen las máquinas expandidoras de humo.
2. Si α = 10%, SI rechazamos H0 y se cumple lo contrario a lo explicasdo en el punto (1).
2. Test’s Chi-Cuadrado: Bondad de ajuste e independencia.
Las pruebas chi-cuadrado comienzan a modelar la esencia de la inferencia que ya no es paramétrica, ya que en
la clásica ya estudiada, la distribución o población se asumía conocida y nosotros solamente estimabamos
los parámetros que la componían.
Ahora, cuando la distribución de probabilidad es desconocida, entonces debemos de alguna manera esti-
marla, y es así como florece el concepto de la inferencia no paramétrica.
En ese sentido, en esta sección estudiaremos dos de las pruebas más relevantes de este tópico: La prue-
ba de bondad de ajuste (1 muestra) y la prueba de independencia (2 muestras).
2.1. Prueba de Bondad de Ajuste
La prueba de la bondad de ajuste consiste principalmente en determinar si los datos de cierta muestra
corresponden a cierta distribución poblacional. En este caso, es necesario que los valores de la va-
riable en la muestra y sobre la cual queremos realizar la inferencia, esté dividida en clases de ocurrencia, o
equivalentemente, sea cual sea la variable de estudio, deberemos categorizar los datos asignando sus valores
a diferentes clases o grupos.
A palabras simples, la prueba es una metodología útil para validar las hipótesis sobre la distribución teórica
en la población que se realiza en la estadística paramétrica. Sirve para corroborar si mis datos siguen
una distribución en particular, es decir, las hipótesis que se contrastan son del siguiente tipo:
H0 : Y ⇠ f0(y; θ0) vs H1 : Y⇢⇠f0(y; θ0)
¿Cuáles son los pasos a seguir?
1. Debemos tener un número k de clases en las cuales se han ido registrando un total de n observaciones
(n es el tamaño muestral). Denotaremos las frecuencias observadas en cada clase i como Oi, es decir,
Oi es el número de valores en cada clase ki. Por supuesto, que al ser n el tamaño de la muestra (número
de observaciones), se debe cumplir siempre que:
O1 +O2 +O3 + . . .+Ok = n
2
2 TEST’S CHI-CUADRADO: BONDAD DE AJUSTE E INDEPENDENCIA.2.1 Prueba de Bondad de Ajuste
2. Luego, dependendiendo de la forma de la hipótesis nula (cuál será la distribución que queremos testear
que representa de mejor manera los datos), obtendremos las frecuencias esperadas (teóricas) para cada
clase i, y las denotaremos como Ei. Es decir, Ei es el número de valores esperados en cada clase ki.
Por supuesto que debe seguir cumpliendose que la suma de las frecuencias esperadas es igual al número
de observaciones, esto es:
E1 + E2 + . . .+ Ek = n
Estas se obtienen calculando la probabilidad de ocurrencia de la clase ki y luego multiplicando por el
tamaño total de la muestra n.
3. Obtenidas ya las frecuencias esperadas y las teóricas, obtenemos el estadístico de prueba para realizar
la Bondad de Ajuste, el cual estará definido del siguiente modo:
χ2
∗
=
kX
i=1
(Oi − Ei)
2
Ei
Lo que nos muestra que es esperable que la diferencia entre lo observado Oi y lo esperado Ei sea lo
más pequeña posible, de modo que entre menor es el valor del estadístico más coherentes serán las
observaciones obtenidas con los valores esperados en función de la nula.
4. La regla de decisión será la siguiente: rechazar H0 al nivel de riesgo α si es que se cumple que
X2
∗
=
kX
i=1
(Oi − Ei)
2
Ei
> χ2(1−α);(k−1−s)
Siendo k el número de clases de la muestra, y s el número de parámetros estimados dentro de la distri-
bución.
Nota: Por último, es importante notar que para que se cumpla (por razones asintóticas) lo anterior
debe ocurrir que el tamaño de la muestra general sea n > 30 y, además, que las frecuencias esperadas
Ei representen todas un porcentaje mayor al 3% de n (> 5). Si esto no ocurre, se deben reagrupar las
clases con frecuencias esperadas menores.
2.1.1. Ejemplo: Poisson.
Una constructura particular llamada KADE S.A. entregó en los últimos meses 440 casas que fueron cons-
truidas por la mano de obra que tienen contratada para este objetivo. De este número de hogares entregados
se observó cuantos de ellos habían tenido alguna falla y/o habían sido razón de algún reclamo en particular,
obteniendose los siguientes datos:
Nº de errores o reclamos Frecuencia observada Oi
0 18
1 53
2 103
3 107
4 82
5 46
6 18
7 10
8 2
9 1
De este modo, se le pide testear al 5 % si el número de errores tendrá una distribución de Poisson, esto es:
H0 : nº de errores tiene una distribución Poisson
H1 : nº de errores NO tiene una distribución Poisson
3
2.1 Prueba de Bondad de Ajuste2 TEST’S CHI-CUADRADO: BONDAD DE AJUSTE E INDEPENDENCIA.
2.1.2. Solución ejemplo: Poisson
1. Lo primero que debemos notar es que siempre uno comienza asumiendo que la hipótesis nula
es cierta, y para enfrentar este ejercicio debemos notar también que la distribución establecida en la
hipótesis nula tiene un sólo parámetro: λ. En ese sentido, sabemos que representa una tasa media de
ocurrencia de la variable aleatoria que sigue una distribución de poisson, por lo que los datos observados
nos permiten hacer una estimación de este mismo del siguiente modo:
bλ =0 ⇤ 18 + 1 ⇤ 53 + 2 ⇤ 103 + . . .+ 9 ⇤ 1
440
= 3,05
2. Luego, para obtener las frecuencias esperadas (bajo la «realidad» de que la hipótesis nula se cumple)
debemos ocupar la función de probabilidad asociada a la distribución. De este modo, primero obtenemos
las probabilidades de ocurrencia:
P (X = 0|bλ = 3,05) = e
−3,05 ⇤ (3,05)0
0!
= 0,0474
P (X = 1|bλ = 3,05) = e
−3,05 ⇤ (3,05)1
1!
= 0,1444
[y así sucesivamente . . .]
3. Comenzamos a completar la tabla:
a) Agregamos la tercera fila correspondiente a las probabilidades de ocurrencia asociadas a la
distribución que establece la hipótesis nula:
Nº de errores o reclamos Frecuencia observada Oi Probabilidad con Poisson λ = 3
0 18 0.0474
1 53 0.1444
2 103 0.2203
3 107 0.2339
4 82 0.1708
5 46 0.1042
6 18 0.0530
7 10 0.0231
8 2 0.0088
9 1 0.0030
b) Ahora, con la probabilidad de ocurrencia obtenemos las frecuencias esperadas Ei :
Nº de errores Frecuencia Probabilidad Frecuencia
o reclamos observada Oi con Poisson λ = 3 esperada Ei
0 18 0.0474 440*0.0474=20.84
1 53 0.1444 440*0.1444=63.56
2 103 0.2203 440*0.2203=96.92
3 107 0.2339 440*0.2339=98.54
4 82 0.1708 440*0.1708=75.14
5 46 0.1042 440*0.1042=45.83
6 18 0.0530 440*0.0530=23.30
7 10 0.0231 440*0.0231=10.15
8 2 0.0088 440*0.0088=3.87
9 1 0.0030 440*0.0030=1.31
4
2 TEST’S CHI-CUADRADO: BONDAD DE AJUSTE E INDEPENDENCIA.2.2 Prueba de independencia o homogeneidad
c) Importante notar que las últimas dos clases Nº de errores = 9 y Nº de errores = 8 no representan
separadamente las condiciones asintóticas que se deben cumplir en este test, por lo tanto debemos
agruparlas para que juntas (con una Ei = 5,18) cumplan con la condición para la bondad de
ajuste.
4. Finalmente, con la nueva «división» de clases, procedemos a obtener el estadístico X2
∗
:
X2
∗
=
kX
i=1
(Oi − Ei)
2
Ei
=
(18− 20,84)2
20,84
+
(53− 63,56)2
63,56
+ . . .+
(3− 5,18)2
5,18
= 6,001
5. Ahora, considerando α = 5%, calculamos el estadístico a comparar:
χ20,95;( 9
(k)
−1− 1
(s)
)=7 = 14, 067
6. De este modo, como no se cumple la regla de rechazo, NO rechazamos la hipótesis nula y por tanto los
datos si pueden ser representados mediante una distribución de Poisson.
2.2. Prueba de independencia o homogeneidad
El test de independencia surge cuando estamos interesados en determinar si dos cualidades o variables
referidas a individuos de una misma población están relacionadas.
Para el desarrollo de la prueba, supongamos que de la muestra de tamaño n se han observado dos característi-
cas X e Y , obteniéndose una muestra aleatoria simple de carácter bidimensional (x1, y1), (x2, y2), . . . , (xn, yn).
Sobre la base de dichas observaciones se desea contrastar si las características poblacionales x e y son inde-
pendientes o no.
H0 : independencia vs H1 : no independencia
¿Cuáles son los pasos a seguir?
1. Al conjunto de valores de X se divide en k conjuntos disjuntos A1, A2, A3, . . . , Ak. Además, el conjunto
de valores de Y será descompusto en r conjuntos disjuntos B1, B2, . . . , Br. De ese modo, al clasificar
los elementos de la muestra, aparecerá un cierto número de ellos nij en cada una de las k ⇥ r clases
constituidas, dando lugar a una tabla de contingencia de la siguiente forma:
A1 A2 . . . Ak Total
B1 n11 n12 n1k n1.
B2 n21 n2.
...
...
Br nr1 nr2 nrk nr.
Total n,1 n,2 n.k n
2. Con la tabla de contingencias anterior, procedemos a obtener las frecuencias esperadas eij bajo el
supuesto de independencia (H0), haciendo un cálculo simple en términos del enfoque frecuentista:
eij =
ni ⇤ nj
n
y así rellenamos la nueva tabla en términos esperados:
5
2.2 Prueba de independencia o homogeneidad2 TEST’S CHI-CUADRADO: BONDAD DE AJUSTE E INDEPENDENCIA.
A1 A2 . . . Ak Total
B1 e11 e12 e1k n1. = e1.
B2 e21 n2. = e2.
...
...
Br er1 er2 erk nr. = er.
Total e,1 e,2 e.k n
3. Obtenidas ya las frecuencias esperadas y las teóricas, obtenemos el estadístico de prueba para realizar
la prueba de independencia, el cual estará definido del siguiente modo:
X2IND =
rX
i=1
kX
j=1
(nij − eij)
2
eij
4. La regla de decisión será la siguiente: rechazar H0 al nivel de riesgo α si es que se cumple que
X2IND =
rX
i=1
kX
j=1
(nij − eij)
2
eij
> χ2(1−α);(r−1)×(k−1)
de ese modo rechazaríamos la hipótesis de independencia en los datos y aprobaríamos el hecho de que
NO lo son.
2.2.1. Ejemplo: Independencia.
Se desea analizar con un riesgo α = 5% si el grado de satisfacción en el trabajo y el ingreso de una persona
son variables aleatorias independientes o no. Para ello se encuesta a 442 personas obteniéndose los siguientes
resultados.
Satisfacción / Ingreso (nij) Alto Bajo Total
Alto 263 42 305
Bajo 97 40 137
Total 360 82 442 = n
Pruebe según el test de independencia que Ud. ya conoce, utilizando el estadístico de prueba ya conocido y
su regla de rechazo asociada.
2.2.2. Solución ejemplo: Independencia.
1. Lo primero que debemos hacer es notar que hay k = r = 2 clases de cada característica (Satisfacción
e ingreso). Lo anterior facilita mucho el cálculo de las frecuencias esperadas. Cómo sabemos que se
calculan del siguiente modo:
eij =
ni ⇤ nj
n
procedemos a hacerlo para cada una de las seldas:
ealto,alto =
305∗360
442 = 248,42
ealto,bajo =
305∗82
442 = 56,58
ebajo,alto =
137∗360
442 = 111,584
ebajo,bajo =
137∗82
442 = 25,416
6
3 EJERCICIOS MEZCLA: INDEPENDENCIA Y BONDAD DE AJUSTE.
2. Rellenamos la tabla para luego calcular el estadístico de prueba:
Satisfacción / Ingreso (eij) Alto Bajo Total
Alto 248.42 56.58 305
Bajo 111.584 25.416 137
Total 360 82 442 = n
3. Ahora calculamos el estadístico de prueba:
X2IND =
rX
i=1
kX
j=1
(nij − eij)
2
eij
X2IND =
(263− 248,42)
2
248,42
+
(42− 56,58)2
56,58
+
(97− 111,584)2
111,584
+
(40− 25,416)2
25,416
= 14,8874
4. Evaluamos la regla de rechazo:
X2IND = 14,8874
χ20,95;(2−1)×(2−1) = 3,841 (por tabla)
De ese modo rechazamos la nula de independencia y, por tanto, los datos agrupados en satisfacción NO
son independientes a los datos agrupados para ingreso.
3. Ejercicios mezcla: Independencia y bondad de ajuste.
Una empresa de investigación de mercado, que está actualmente enfocada a las campañas presidenciales de
este año, está estudiando las preferencias para los 3 candidatos más nombrados entre los electores de las
tres más grandes circunscripciones del país, para ello selecciona en cada una de las 3 circunscripciones una
muestra aleatoria de 200 electores, la tabla muestra la información obtenida:
Preferencias I Circunscripción II Circunscripción III Circunscripción Total
Candidato A 110 100 90
Candidato B 80 50 40
Candidato C 10 50 70
Total 600 = n
1. ¿Se puede afirmar, con un nivel de significación del 5 %, que en la III Circunscripción, los tres candidatos
son igualmente probables?
2. ¿Se puede afirmar que, con un nivel de significación del 5 %, los tres candidatos tienen preferencias
similares en las tres circunscripciones?
3. ¿Construya un intervalo del 90% de confianza para la diferencia entre la proporción de preferencias
entre los candidatos B y C, que le permita averiguar si están o no en un empate estadístico?
3.1. Solución
1. Se trata de testear las siguientes hipótesis:
H0 : πA = πB = πC vs H1 : Al menos un πi 6=
1
3
De ese modo, queremos ver si los datos tienen la misma distribución dentro de la III Circunscrip-
ción, por lo que se procede a hacer un test de Bondad de Ajuste. Como en la tabla ya tenemos las
7
3.1 Solución 3 EJERCICIOS MEZCLA: INDEPENDENCIA Y BONDAD DE AJUSTE.
frecuencias observadas Oi debemos proceder a obtener las esperadas Ei para luego calcular el estadís-
tico de prueba.
Cómo la hipótesis nula señala que la proporción de votantes dentro de la III Circunscripción es la
misma para todos los candidatos πi =
1
3 8i, las frecuencias esperadas (y considerando que nIII = 200)
son iguales para los 3: Ei = 200 ⇤
1
3 = 66, 67. De ese modo:
III Circunscripción Candidato A Candidato B Candidato C
Oi 90 40 70
Ei 66,67 66,67 66,67
De ese modo, ahora procedemos a calcular el estadísticode prueba:
X2
∗
=
3X
i=1
(Oi − Ei)
2
Ei
=
(90− 66,67)2
66, 67
+
(40− 66,67)2
66, 67
+
(70− 66,67)2
66, 67
= 18, 991
Como son 3 clases, y sabemos que la regla de rechazo se compara con una distribución χ2 procedemos
a hacer el contraste:
χ20,95,(3−1)=2 = 5,991
De ese modo, como 18.991>5.991 se rechaza H0 y, por tanto, no se puede considerar que en la III
Circunscripción los tres candidatos son igualmente probables.
2. El test planteado corresponde a uno de independencia entre circunscripciones (homogeneidad) y por
tanto se trata como tal. Como las frecuencias observadas Oi no cambian, procedemos a obtener las
esperadas en este test particular de la forma:
eij =
ni ⇤ nj
n
Preferencias Oi I Circunscripción II Circunscripción III Circunscripción Total
Candidato A 110 100 90 300
Candidato B 80 50 40 170
Candidato C 10 50 70 130
Total 200 200 200 600 = n
Preferencias eij I Circunscripción II Circunscripción III Circunscripción Total
Candidato A 300∗200600 = 100
300∗200
600 = 100
300∗200
600 = 100 300
Candidato B 170∗200600 = 56, 67
170∗200
600 = 56, 67
170∗200
600 = 56, 67 170
Candidato C 130∗200600 = 43, 33
130∗200
600 = 43, 33
130∗200
600 = 43, 33 130
Total 200 200 200 600 = n
Ahora, calculamos el estadístico de prueba (trivialmente):
X2IND =
rX
i=1
kX
j=1
(nij − eij)
2
eij
= 60, 37
Como sabemos que la regla de rechazo en estos casos se compara con
χ21−α;(k−1)(r−1)=2∗2=4 = 9, 448
como 60,37>9,448 al 5 % es suficiente para rechazar H0. Es decir, las preferencias no se pueden consi-
derar homogéneas en las tres circunscripciones.
8
3 EJERCICIOS MEZCLA: INDEPENDENCIA Y BONDAD DE AJUSTE. 3.1 Solución
3. Notemos que en (2) llegamos a la conclusión en que las circunscripciones no son independientes entre
si, por lo tanto en el calculo de la varianza del pivote a utilizar en el intervalo de confianza debemos
considerar la covarianza.
ϕ =
(pB − pC)− (πB − πC)q
pB(1−pB)+pC(1−pC)+2pBpc
n
⇠ N(0, 1)
Armando el pivote dentro del intervalo de confianza y luego pivoteando llegamos al intervalo de confianza
usual
"
pB − pC − Z1−α/2 ⇤
r
pB(1− pB) + pC(1− pC) + 2pBpc
n
; pB − pC + Z1−α/2 ⇤ E.E
#
Como en este caso ocurre que:
pB =
170
600
= 0, 2833; pC =
130
600
= 0,2167;n = 600;Z0,95 = 1,645
finalmente:
[0,0193  πB − πC  0, 1139]
Cómo el intervalo no contiene el 0, podemos afirmar con un 90% de confianza que ambos candidatos
no están en un empate estadístico.
9

Continuar navegando