Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
PRUEBA DE HIPOTESIS ESTADISTICAS Inferencias con respecto a parámetros poblacionales desconocidos, basadas en información muestral: estimaciones de los parámetros respectivos, ó pruebas de hipótesis referentes a sus valores. Hipótesis: Afirmación o proposición que puede ser cierta, pero que no lo es necesariamente. Una HIPOTESIS ESTADISTICA es una afirmación o conjetura acerca de una o más poblaciones. Específicamente es una afirmación o aseveración sobre el valor de un solo parámetro (característica de una población o característica de una distribución de probabilidad), sobre los valores de varios parámetros o sobre la forma de una distribución de probabilidad completa. En Estadística las hipótesis están sujetas a verificación en base a datos. La única forma de tener una certeza absoluta de la veracidad o falsedad de una hipótesis estadística puede ser examinar a toda la población. Esto es, con frecuencia impracticable (o imposible), y entonces ¿qué hacemos? Tomamos una muestra de la población y usamos la muestra para decidir si la hipótesis es verdadera o falsa. El proceso de usar la muestra para contrastar si la hipótesis es verdadera (o falsa) se llama prueba estadística de la verdad (o falsedad) de la hipótesis. ¿CÓMO PROCEDEREMOS? 1º) Estableceremos nuestra hipótesis (por ejemplo fijar un valor para un parámetro de una población). 2º) reunimos un número de observaciones (nuestra muestra). 3º) Examinamos los resultados obtenidos para ver si son semejantes o no a la afirmación establecida en nuestra hipótesis. Si la concordancia es grande, aceptaremos la hipótesis. Si la concordancia es pequeña, la rechazaremos. 4º) Para decidir si la concordancia es grande o no, en general, calcularemos el valor de algún estadístico y compararemos el valor obtenido con la distribución muestral de ese estadístico, en el supuesto de que la hipótesis sea verdadera. En cualquier problema de prueba de hipótesis, existen dos hipótesis contradictorias consideradas. La hipótesis nula denotada por H0, es la afirmación que inicialmente se supone cierta (la hipótesis de “creencia previa”). (contiene =, ≥,≤) La hipótesis alternativa denotada por H1, es la aseveración contradictoria a H0. (contiene ≠, >, <). La hipótesis nula será rechazada a favor de la hipótesis alternativa sólo si la evidencia en la muestra sugiere que H0 es falsa. Si la muestra no contradice fuertemente a H0, se continuará creyendo en la verdad de la hipótesis nula. Las dos posibles conclusiones derivadas de un procedimiento de prueba de hipótesis son entonces rechazar H0 o no rechazar H0. Una PRUEBA DE HIPOTESIS ESTADISTICA es un procedimiento sistemático basado en datos muestrales para optar o decidir entre la aceptación o rechazo de la hipótesis nula H0 Por desgracia no hay “certeza” de que no se cometerá una equivocación. De hecho hay dos tipos de error cualquiera de los cuales puede cometerse. ERRORES QUE PODEMOS COMETER Puede ocurrir que: la hipótesis establecida sea verdadera y la consideremos falsa (ERROR DE TIPO I), ó que la hipótesis sea falsa y la consideremos verdadera (ERROR DE TIPO II). Es decir se cometerá Error de Tipo I cuando se rechace una hipótesis verdadera y se cometerá Error de Tipo II cuando se acepte una hipótesis falsa ¿PODEMOS CONTROLAR LA PROBABILIDAD DE COMETER ESTOS ERRORES? La frecuencia con que se cometen estos errores (o la proporción de veces que se cometen estos errores) es, desde luego, muy importante para nosotros, y veremos que esta frecuencia puede controlarse hasta cierto punto. ¡¡¡¡ Queremos controlar la probabilidad de cometer estos errores!!!! ¿EN QUE BASAMOS NUESTRA DECISION DE ACEPTAR O RECHAZAR UNA HIPÓTESIS ESTADÍSTICA? Respuesta: en la información que obtengamos haciendo observaciones y en el riesgo que estemos dispuestos a correr de que nuestra decisión pueda ser errónea. PROPOSITO: DISEÑAR UN PRUEBA PARA DECIDIR ENTRE H0 Y H1. Ejemplo: Supongamos que el peso de las bolsas de harina que vende un determinado molino harinero es una variable aleatoria normal. Para simplificar el problema consideremos conocida la desviación estándar poblacional = 20 kg. El dueño de ese molino afirma que “el peso medio de las bolsas que vende a grandes mercados, es por lo menos de 70 kg”. Un comprador de dichas bolsas sospecha que últimamente, dicho peso medio es inferior a 70 kg. Entonces antes de realizar su próxima compra, decide probar la hipótesis del vendedor, es decir: ≥ 70 kg. Se desea probar H0: ≥ 70 (Vendedor) versus H1: < 70 (Comprador) H0: ≥ 70 es una “hipótesis compuesta” y dado que la distribución muestral de estadístico que utilizaremos para hacer la prueba no queda unívocamente especificada, se ensaya la hipótesis más desfavorable, que en este caso es H0: = 70, pues si ésta se rechaza, también se rechaza que > 70. Las hipótesis a verificar son entonces: H0: = 70 (hipótesis simple) H1: < 70 (hipótesis compuesta) Para decidir si H0 es razonable o no, el comprador toma una muestra aleatoria de n=4 bolsas de harina y en base al resultado de dicha muestra tomará una decisión. Sean x1, x2,...,xn los pesos observados y sea x el peso promedio de la muestra. x es un valor del estadístico X , estimador insesgado de la media verdadera de la población . X es el estadístico de prueba. REGLA DE DECISION Si x < 60 kg, se rechaza la hipótesis nula H0: = 70, y si x ≥ 60, se acepta la hipótesis H0: = 70. x < 60 → Región crítica o región de rechazo de H0 x ≥ 60 → Región de aceptación de H0 Valores críticos: fronteras entre las regiones crítica y de aceptación (Notación: x CRITICO o simplemente x C ) En el ejemplo el valor crítico es : x C = 60 kg. Definición: Los posibles valores del estadístico de prueba que nos hacen rechazar la hipótesis nula, constituyen la región de rechazo o región crítica (RR). Al probar cualquier hipótesis estadística, se tiene 4 posibles situaciones que determinan si la decisión es correcta o equivocada. VERDAD = 70 < 70 H0 verdadera H1 verdadera Se acepta H0 decisión correcta error tipo II DECISION Se rechaza H0 error tipo I decisión correcta Al utilizar una muestra para obtener conclusiones de una población existe el riesgo de llegar a una conclusión incorrecta. Cometemos Error Tipo I si rechazamos H0 cuando en realidad es verdadera. Cometemos Error Tipo II si aceptamos H0 cuando en realidad es falsa. Explicamos el procedimiento y las situaciones planteadas mediante la distribución muestral del estadístico de prueba X . X “cantidad de harina de una bolsa” X tiene una distribución normal, con conocida. = 20 kg, Luego X es normal con X = / n = 20/ 4 = 10 Hay que advertir que hay más de una distribución en juego: a) Si H0 es verdadera X N( 70, X 2 =102); b) Si H1 es verdadera X N( 1 , X 2 = 102) con 1 < 70 ERROR DE TIPO I Dado que la decisión se basa en variables aleatorias, entonces es posible asociar probabilidades con los errores tipo I y II de la Tabla. La probabilidad de cometer Error de tipo I se la designa con la letra griega y se denomina nivel de significación de la prueba. Esto es. = P (error tipo I) = P (rechazar H0 / H0 es verdadera) Calculamos para la región de rechazo (RR) x < 60 = P ( x RR / = 70 ) = P ( x < 60 / = 70 ) = P (Z < 4 20 7060 ) = P( Z < -1) = 0,1587 (i) Luego, el 15,87 % de las muestras aleatorias conducirán al rechazo de H0,cuando ésta sea verdadera (Gráfico 3) ¿Cómo podemos reducir ? Es posible reducir al aumentar la región de aceptación. Por ejemplo, si se toma como región crítica x < 50 y la región de aceptación será x ≥ 50. (Gráfico 4) En este caso el valor de será = P ( X < 50 / = 70 ) =P( Z < -2) = 0,0228 También puede reducirse el valor de incrementando el tamaño de la muestra. Si n = 8, entonces / n = 20/ 8 Si se toma como región crítica x < 50, la región de aceptación será x ≥ 50. = P ( X < 60 / = 70 ) =P( Z < -1,41) = 0,0793 ERROR DE TIPO II La probabilidad de cometer error de tipo II, la cual se denota con . Trabajamos con una muestra de tamaño 4 y las siguientes regiones de rechazo y de aceptación. RR x < 60 RA: x ≥ 60 = P (Error de Tipo II) = P (aceptar H0 / H1 es verdadera) = P ( X RA / = 1 con 1 < 70) Si H1 es verdadera : X N( 1 , 102) con 1 < 70 = P ( X ≥ 60 | = 1 con 1 < 70) = P (Z ≥ 10 60 1 | 1 < 70 ) = (1 ) Para calcular se debe tener una hipótesis alternativa específica 40 50 60 70 80 90 100 H1 : = 1 con 1 < 70 Por ejemplo ¿cómo trabajará el procedimiento de prueba si se desea detectar, esto es, rechazar H0 para un valor medio de = 55 kg? (55) = P ( X ≥ 60 | = 55) = P( Z ≥ 0,5 ) = 0,3085 Calculamos (40)= P(Aceptar H0 | = 40 ) (40) = P ( X ≥ 60 | = 40) = P( Z ≥ 2 ) = 1 - P(Z < 2)= 0,0228 La probabilidad de cometer error de tipo II aumenta rápidamente a medida que el valor verdadero de tiende al valor hipotético. también depende de n. Calculamos (55) cuando n = 8. (55) = P ( X ≥ 60 | = 55) = P( Z > 0,71) = 0,2389 DETERMINACION DE UNA REGION DE RECHAZO (RR) ADECUADA PARA LA PRUEBA ESTADÍSTICA PLANTEADA La frecuencia con que se cometen estos errores (o la proporción de veces que se cometen estos errores) es, desde luego, muy importante para nosotros, y veremos que esta frecuencia puede controlarse hasta cierto punto. Nuestra decisión de aceptar o rechazar una hipótesis se basará: en la información que obtengamos haciendo observaciones, y en el riesgo que estemos dispuestos a correr de que nuestra decisión pueda ser errónea. Intuitivamente establecimos la región de rechazo como RR = { X < x CRITICO } y analizamos distintas posibilidades para dicho punto crítico. Pero, ¿qué valor debería elegirse para C? ¿Dónde tomamos el punto crítico? Si H0: µ = 70 y H1: µ < 70 la Región de Rechazo (RR) será < C Primero analicemos y β si el punto crítico ocupa la posición que se indica en el Gráfico 8. Si movemos c a la izquierda aumenta el error de tipo II y disminuye el error de tipo I. Esta situación puede observarse en el gráfico 9. Los errores de ambos tipos son competitivos, si aumenta uno se disminuye el otro. ¿Hasta dónde movemos c? Tradicionalmente el estadístico controla la tasa de errores tipo I estableciendo el nivel de riesgos que se está dispuesto a tolerar en términos de rechazar una hipótesis nula verdadera. O sea que, puesto que el valor de puede ser elegido por el que realiza el experimento y su elección determinará en parte la aceptación o la no aceptación de la hipótesis, éste debe fijarse antes de comenzar el experimento. Si es de gran importancia rechazar una hipótesis, el riesgo de cometer este error debe ser pequeño. Si es de gran importancia que una hipótesis sea rechazada si existe únicamente una pequeña evidencia en contra, puede convenir elegir un mayor. PROPUESTA DE NEYMAN-PEARSON Para probar H0: = 0 (simple) H1 : = 1 (simple) con 1 < 0, para una prueba de cola izquierda, basados en una muestra aleatoria X1, X2, ..., Xn de una distribución normal con media desconocida y varianza 2 conocida, el procedimiento óptimo se basa en la distribución muestral de X (llamado estadístico de la prueba). Para ello : fije P(cometer Error Tipo I)= pequeño , por ejemplo 0,10; 0,05; 0,01; 0,001, = P ( X < X CRITICO / = 0 ), y elija la región crítica que haga que P(cometer Error Tipo II)= sea mínima. Un convenio que se sigue con frecuencia es establecer el resultado significativo si la hipótesis nula se rechaza con = 0,05 y muy significativo si la hipótesis se rechaza con = 0,01. DETERMINACIÓN DE LA REGIÓN CRÍTICA (RR) PARA UNA PRUEBA PARA LA HIPÓTESIS ALTERNATIVA UNILATERAL < 70 Queremos determinar el punto crítico CRITICO para probar las hipótesis H0: = 70 vs H1: < 70. Si la hipótesis nula es verdadera, tiene distribución normal con media 70 y desviación estándar / n = 10, entonces puede construirse una región crítica basada en el valor de la media muestral calculado. Habitualmente, es más conveniente estandarizar la media muestral y utilizar un estadístico de prueba basado en la distribución normal estándar. Esto es Estadístico de prueba Z = n 70X ~ N (0, 1) Datos: = 20 kg. y n=4 Si fijamos = 0,05 esto me dice que el 5% de todas las muestras me llevarán a rechazar = 70 cuando esto es verdadero. P(ERROR TIPO I) = α P ( RR / = 70 ) P( < CRITICO / = 70) = , Estandarizando P n x Z C 70 = ; y dado que P(Z < - z ) = , luego n 70xC = - z , de donde C = 70 - z / n C = 70 - z0,05 20 / 4 C = 53,55 Región de rechazo: < 53,55 Bajo H0 Regla de la prueba: Con x1, x2, ...xn, calcule y rechace H0 al nivel de significación =0,05 si y solo si < 53,55. Caso contrario, no rechace H0. O equivalentemente Regla de la prueba: Con x1, x2, ...xn, calcule x y calcule el valor del estadístico de prueba zcalculado = n 70x y rechace H0 al nivel de significación = 0,05 si y solo si zcalculado < - z (esto es si zcalculado< - 1,645) . Caso contrario, no rechace H0. Nota: la costumbre es establecer conclusiones con respecto a la hipótesis nula H0, se rechaza H0 o no se rechaza H0. En nuestro ejemplo se seleccionó una muestra aleatoria de tamaño 4 que arrojó un = 51 kg ¿qué decisión se tomó? Regla de Prueba 1: Puesto que = 51 < 53,55 está en la región de rechazo de H0, luego se rechaza H0. al nivel de significación 0,05. Regla de Prueba 2: Con la media muestral calculada = 51 calculamos el valor del estadístico de prueba zcalculado = 645,19,1 420 7051 luego se rechaza H0. al nivel de significación 0,05. En general, para probar las hipótesis sobre la media de una población normal con varianza conocida σ 2 , a partir de una muestra de tamaño n, con un nivel de significación , H0: = 0 vs H1: < 0 el estadístico de la prueba será N(0 , 2 /n) , Z = n X 0 ~ N (0, 1) bajo H0 bajo H0 y la región de rechazo será z < - z (en términos del estadístico de prueba estandarizado o la región de rechazo será < 0 - z / n (en términos del estadístico , con CRITICO = 0 - z / n ) Regla de la prueba: Con x1, x2, ...xn, calcule y rechace H0 al nivel de significación si y solo si < 0 - z / n . Caso contrario, no rechace H0. O equivalentemente Regla de la prueba: Con x1, x2, ...xn, calcule y calcule el valor del estadístico de prueba zcalculado = n x 0 y rechace H0 al nivel de significación si y solo si zcalculado < - z . Caso contrario, no rechace H0. Esta prueba donde la alternativa es unilateral H1: < 0 , recibeel nombre de prueba de hipótesis de cola izquierda o de cola inferior pues la región de rechazo (o región crítica) cae en la cola izquierda de la distribución del estadístico de prueba. O sea que si fijo = 0,05, la mejor región de rechazo (la del mínimo) es la indicada en el siguiente gráfico CÁLCULO DE = P(cometer Error Tipo II) = P (aceptar H0 / H1 es verdadera) = P( ≥ 53,55 / = 1 con 1 < 70) (1) = P 420 55,53 Z 1 ; es una función de 1 con 1 < 70 Para calcular se debe tener una hipótesis alternativa específica; esto es, debe tenerse un valor particular de 1. Por ejemplo, supóngase que es importante rechazar H0 : = 70 cada vez que el peso medio de llenado es menor que 40 kg. Para ello, puede calcularse la probabilidad de un error de tipo II para el valor 1 = 40, y utilizar este resultado para averiguar algo con respecto a la forma en que se desempeñará la prueba. De manera específica, ¿cómo se desempeñará la prueba si se desea detectar, esto es, rechazar H0 para un valor de = 45? Es necesario entonces encontrar la probabilidad de aceptar la hipótesis nula H0 : = 70 cuando el verdadero valor es = 45. O sea que estamos tomando una hipótesis alternativa específica H1 : = 45 que suponemos verdadera. (45) = P( X ≥ 53,55 / = 45 ) = P 420 4555,53 Z = P( Z ≥ 0,855) = 1 - P( Z < 0,855) = 0,1963 (45) = 0,1963 Si la media es realmente 45, aproximadamente el 19,63 % de todas las muestras de tamaño 4 nos llevarán a aceptar = 70 (H0), cuando en realidad = 45 (H1) es verdadera. Calculamos para otros valores de 1 (40) = 0,0877 (55) = 0,5576 En general, para hallar si H0: = 0 vs H1 : = 1 con 1 < 0, para una prueba de cola izquierda, (1 ) = P ( X ≥ CRITICOx / = 1) = P n x Z 1CRITICO , con x CRITICO = 0 - z / n , luego (1 ) = P n zZ 10 puesto que si H1 es verdadera : X N( 1 , 2 /n) y Z = n X 1 ~ N (0, 1) La probabilidad del error de tipo II también depende del tamaño de la muestra n. En general, un aumento en el tamaño de la muestra reduce tanto a como a , siempre y cuando los valores críticos se mantengan constantes. Si el tamaño de la muestra aumenta de n = 4 a n = 8, entonces se obtiene la situación ilustrada en el siguiente gráfico 12. Marcar y para el punto crítico obtenido. ¿A qué conclusiones arribaría? (45) = P( X ≥ 53,55 / = 45 ) P 820 4555,53 Z = P( Z ≥ 1,2092)= 1 - 0,8869 = 0,1131 Gráfico 12 Si el tamaño de la muestra aumenta de n = 4 a n = 10, entonces se obtiene la situación ilustrada en el siguiente gráfico 13. Marcar y para el punto crítico obtenido. ¿A qué conclusiones arribaría? (45) = P( X ≥ 53,55 / = 45 ) P 1020 4555,53 Z = P( Z ≥ 1,35)= 1 - 0,9115 = 0,0885 OBSERVACIONES En general, el analista controla la probabilidad del error de tipo I cuando escoge los valores críticos. Así, usualmente es más fácil para el analista fijar la probabilidad del error tipo I en (casi) cualquier valor deseado. Puesto que el analista puede controlar de manera directa la probabilidad de rechazar de manera errónea H0, siempre puede considerarse el rechazo de la hipótesis nula como una conclusión fuerte. Por otra parte, la probabilidad del error tipo II no es constante, sino que depende del verdadero valor del parámetro. Esta también depende del tamaño de la muestra que se haya seleccionado. Dado que la probabilidad 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 del error tipo II es una función tanto del tamaño de la muestra como del punto en el cual la hipótesis nula es falsa, es costumbre considerar la decisión de aceptar H0 como una conclusión débil, a menos que se sepa que es aceptablemente pequeño. Por consiguiente, más que decir “se acepta H0” ,se prefiere la terminología “incapaz de rechazar H0”. La incapacidad de rechazar H0” implica que no se ha encontrado evidencia suficiente para rechazar a H0”, esto es, para hacer una proposición fuerte. La incapacidad para rechazar H0 no significa que exista necesariamente que exista una probabilidad grande de que H0 sea cierta. Esto simplemente significa que se requieren más datos para alcanzar una conclusión fuerte. Lo anterior puede tener implicaciones importantes para la formulación de hipótesis. POTENCIA DE UNA PRUEBA: Es la probabilidad de rechazar H0, dada una hipótesis alternativa específica verdadera. Si H0: = 0 y H1: = 1 con 1 < 0 CP(1 ) = P (rechazar H0 / H1 es verdadera) = 1 - P ( aceptar H0 / H1 es verdadera) = 1 – (1) En el ejemplo CP(45) = 1 - (45) = 1 – 0,1963 = 0, 8037 Esto quiere decir que si la verdadera media = 45 (H1 verdadera), el 80,37 % de las veces, rechazaremos acertadamente la hipótesis nula en favor de la alternativa. Calculamos la potencia para distintas alternativas H1: = 1 con 1 < 0 Posible valores reales para 1(kg) Potencia 15 0,9999 20 0,9996 25 0,9978 30 0,9907 35 0,9682 40 0,9123 45 0,8037 50 0,6387 55 0,4424 60 0,2595 65 0,1261 70 0,0500 La siguiente figura es un ejemplo de la potencia de la prueba para diversos valores posible de 1 . A esta gráfica se la conoce como CURVA DE POTENCIA. 0,9999 0,9996 0,9978 0,9907 0,9682 0,9123 0,8037 0,6387 0,4424 0,2595 0,1261 0,0500 0,00 0,20 0,40 0,60 0,80 1,00 1,20 10 15 20 25 30 35 40 45 50 55 60 65 70 P o te n c ia Posibles valores para 1 70 Kg CURVA DE POTENCIA PARA UNA HIPOTESIS ALTERNATIVA 1 < 70 aaa Se observa que la potencia de esta prueba de una cola aumenta marcadamente (y se acerca al 100%) según la media de la población toma valores más abajo (lejos) de los 70 kilogramos hipotéticos. Es evidente que para esta prueba de una cola, cuanto menor sea la media real 1 en comparación con la media hipotética, tanto mayor será la potencia para detectar esta disparidad. Por otra parte, para valores de 1 cercanos a 70 kilogramos la potencia es más bien pequeña, puesto que la prueba no puede detectar con efectividad diferencias pequeñas entre la media real de la población y el valor hipotético de 70 kilogramos. Si la media real fuera en realidad de 70 kilogramos, entonces la potencia de la prueba sería igual a , el nivel de significación (que en este ejemplo es 0,05) puesto que la hipótesis nula en realidad sería cierta. En el estudio de la potencia de una prueba estadística se han utilizado una prueba de una cola, un nivel de significación de 0,05 y un tamaño de muestra de 4 bolsas. Teniendo esto en mente se puede determinar el efecto de la prueba sobre la potencia, modificando 1.- El tipo de prueba estadística – una cola contra dos colas. 2.- El nivel de significación . 3.- El tamaño de la muestra n. RESUMEN PRUEBA UNILATERAL DE COLA DERECHA En general, para probar las hipótesis sobre la media de una población normal con varianza conocida σ 2 , a partir de una muestra de tamaño n, con un nivel de significación , H0: = 0 vs H1: > 0 el estadístico de la prueba será X N(0 , 2 /n) , Z = n X 0 ~ N (0, 1) bajo H0 y la región de rechazo será z > - z (en términos del estadístico de prueba estandarizado o la región de rechazo será x > 0 - z / n (en términos del estadístico , con CRITICO = 0 - z / n ) Regla de la prueba: Con x1, x2, ...xn, calcule y rechace H0 al nivel de significación si y solosi > 0 - z / n . Caso contrario, no rechace H0. O equivalentemente Regla de la prueba: Con x1, x2, ...xn, calcule y calcule el valor del estadístico de prueba zcalculado = n x 0 y rechace H0 al nivel de significación si y solo si zcalculado > - z . Caso contrario, no rechace H0. Esta prueba donde la alternativa es unilateral H1: > 0 , recibe el nombre de prueba de hipótesis de cola DERECHA o de cola SUPERIOR pues la región de rechazo (o región crítica) cae en la cola derecha de la distribución del estadístico de prueba. En general, para hallar si H0: = 0 vs H1 : = 1 con 1 > 0, para una prueba de cola derecha, (1 ) = P ( X CRITICOx / = 1) = P n x Z 1CRITICO , con x CRITICO = 0 + z / n , luego (1 ) = P n zZ 10 puesto que si H1 es verdadera : X N( 1 , 2 /n) y Z = n X 1 ~ N (0, 1) PROCEDIMIENTO DE PRUEBA DE HIPOTESIS 1. Establezca las hipótesis nula y alternativa.(H0 y H1) 2. Elija un nivel de significancia fijo. 3. Seleccione un estadístico de prueba adecuado y establezca la región crítica con base en . 4. Rechace H0 si el estadístico de prueba calculado está en la región crítica. De otra manera, no rechace H0. 5. Saque conclusiones. EJEMPLO:
Compartir