Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 PROBABILIDAD Y ESTADISTICA- CONTRASTES (O PRUEBAS) DE HIPOTESIS ESTADISTICAS APUNTES DE CLASE – 14 de Octubre de 2015 Hemos abordado el problema de la estimación de los parámetros desconocidos: proporción, media, varianza, etc. de una población, a partir de los datos de una muestra aleatoria elegida en aquella población. En primer lugar, se estudió la estimación puntual y para mejorarla la estimación por intervalos de confianza, intervalos en los que se espera que se encuentre el verdadero valor del parámetro desconocido θ con un coeficiente de confianza, o nivel de confianza 1 – α. Se explicó también como se mejora la precisión de la estimación, al aumentar el tamaño de la muestra para un mismo valor de α. Muchos problemas de ingeniería, ciencia, administración, etc. requieren comprobar con márgenes de error prefijados, si ciertas hipótesis sobre los valores de los parámetros de una o varias poblaciones, se pueden confirmar o no con los datos experimentales. Este es el objeto de los contrastes (o pruebas) de hipótesis paramétricos. En los problemas de estimación el objetivo es valorar un parámetro desconocido y en los contrastes de hipótesis paramétricos se trata de decidir si se puede aceptar o no si un parámetro toma un valor deter- minado o el mismo valor en dos o más poblaciones, etc. Una Contraste o Prueba de hipótesis estadística es un procedimiento para aceptar o rechazar una hipótesis sobre la población objeto de estudio, utilizando la información obtenida de una muestra aleatoria elegida en aquella población. Si la hipótesis se formula sobre un parámetro de la población, se dice que el contraste es paramétrico, caso contrario el contraste es no paramétrico. ¿Qué entendemos por hipótesis estadística? Hipótesis: Afirmación o proposición que puede ser cierta, pero que no lo es necesariamente. En geometría podría establecerse como hipótesis que la suma de los ángulos de un triángulo es 180º. Me- diante métodos de demostración aceptados decidimos si esta hipótesis es verdadera o falsa. En este caso tenemos una demostración matemática de la hipótesis y, cuando hemos completado la demostración tene- mos la certeza de si la hipótesis es verdadera o falsa. En Estadística las hipótesis están sujetas a verificación en base a datos. Una HIPOTESIS ESTADISTICA es una afirmación o proposición acerca de una o más poblaciones. Específicamente es una afirmación o aseveración: sobre el valor de un solo parámetro (característica de una población o característica de una distribución de probabilidad), Un ejemplo de hipótesis estadística de éste tipo es la afirmación de que = 0,75, donde es el diámetro interno medio verdadero de un cierto tubo de PVC. Otro ejemplo es la proposi- ción p < 0,10, donde p es la proporción de tarjetas de circuito defectuosas entre todas las tarjetas de circuitos producidas por un cierto fabricante. sobre los valores de varios parámetros. Por ejemplo si µ1 y µ2 denotan las medias de las resistencias a la ruptura de dos tipos diferentes de cuerdas, una hipótesis es la afirmación de que µ1 – µ2 = 0 y otra es que µ1 – µ2 > 5. sobre la forma de una distribución de probabilidad completa. Un ejemplo de una hipótesis de este tipo es la afirmación que el “diámetro de los tornillos fabricados por una cierta fábrica tiene una distribución normal”. Hipótesis de esta última clase serán consideradas a posterioridad. La única forma de tener una certeza absoluta de la veracidad o falsedad de una hipótesis estadística puede ser examinar a toda la población. Esto es, con frecuencia impracticable (o imposible), y nos vemos forzados a sacar una muestra de la población y usar la muestra para tomar una decisión de si la hipótesis es verda- dera o falsa. El proceso de usar la muestra para decidir si la hipótesis es verdadera (o falsa) se llama con- traste o prueba estadística de la verdad (o falsedad) de la hipótesis. Procedimiento a seguir: 1º) Estableceremos nuestra hipótesis (por ejemplo fijar un valor para un parámetro de una población). 2º) Reunimos un número de observaciones (nuestra muestra). 3º) Examinamos los resultados obtenidos para ver si son semejantes o no a la afirmación establecida en nuestra hipótesis. Si la concordancia es grande, aceptaremos la hipótesis. Si la concordancia es pequeña, la rechazaremos. 4º) Para decidir si la concordancia es grande o no, en general, calcularemos el valor de algún estadístico y compararemos el valor obtenido con la distribución muestral de ese estadístico, en el supuesto de que la hipótesis sea verdadera. (Devore) En cualquier problema de prueba de hipótesis, existen dos hipótesis contradictorias consideradas. En el ejemplo de los tubos de PVC una podría ser la afirmación de que = 0,75 y la otra ≠ 0,75 o, en el caso de las tarjetas de circuito defectuosas, las dos proposiciones contradictorias podrían ser p ≥ 0,10 y p < 0,10. El objetivo es decidir, con base en información muestral, cuál de las dos hipótesis es la correcta. 2 El problema se puede analizar desde una perspectiva del sistema legal, en el cual se presume la inocencia hasta que se demuestre la culpabilidad. Una hipótesis es una afirmación de que el individuo acusado es inocente. En el sistema judicial, esta es la afirmación que inicialmente se cree que es cierta. Solo de cara a una fuerte evidencia que diga lo contrario el jurado deberá rechazar esta afirmación a favor de la afirmación alternativa de que el acusado es culpable. En este sentido, la pretensión de inocencia es la hipótesis favo- recida o protegida y el trabajo de comprobación recae en aquellos que creen en la pretensión alternativa. Asimismo, al probar hipótesis estadísticas, el problema se formulará de modo que una de las hipótesis sea inicialmente favorecida. Esta hipótesis inicialmente favorecida no será rechazada a favor de la hipótesis alternativa a menos que la evidencia muestral la contradiga y apoye fuertemente la afirmación alternativa. Definición La hipótesis nula denotada por H0, es la afirmación que inicialmente se supone cierta (la hipótesis de “cre- encia previa”). La hipótesis alternativa denotada por H1, es la aseveración contradictoria a H0. La hipótesis nula será rechazada a favor de la hipótesis alternativa sólo si la evidencia en la muestra sugiere que H0 es falsa. Si la muestra no contradice fuertemente a H0, se continuará creyendo en la verdad de la hipótesis nula. Las dos posibles conclusiones derivadas de un procedimiento de prueba de hipótesis son entonces rechazar H0 o no rechazar H0. Un CONTRASTE O PRUEBA DE HIPOTESIS ESTADISTICA es un procedimiento sistemático basado en datos muestrales para optar o decidir entre la aceptación o rechazo de la hipótesis Nula H0. Por consiguiente se podría probar H0 : = 0,75 contra la H1 : ≠ 0,75. Solo si los datos muestrales sugieren fuertemente que es otra diferente de 0,75 deberá ser rechazada la hipótesis nula. Sin semejante eviden- cia, H0 no deberá ser rechazada, puesto que sigue siendo bastante plausible. En ocasiones un investigador no desea aceptar una aseveración particular a menos y hasta que los datos apoyan fuertemente la aseveración. Como ejemplo supóngase que una compañía está considerando aplicar un nuevo tipo de recubrimiento en los cojinetes que fabrica. Se sabe que la vida media de desgaste verda- dera con el recubrimiento actual es de 1000 horas. Si denota la vida media verdadera del nuevo recubri- miento, la compañía no desea cambiar a menos que la evidencia sugiera fuertemente que excede de 1000 horas. Una formulación apropiada del problema implicaría probar H0: = 1000 contra H1 : > 1000. La conclusión de que se justifica un cambio está identificada con H1 y se requeriría evidencia conclusiva para justificar el rechazo de H0 y cambiar al nuevo recubrimiento. La investigación científica a menudo implica tratar de decidir si una teoría actual debe ser reemplazada por una explicación más plausibley satisfactoria del fenómeno investigado. Un método conservador es identifi- car la teoría actual con H0 y la explicación alternativa del investigador con H1. El rechazo de la teoría actual ocurrirá entonces sólo cuando la evidencia es mucho más compatible con la nueva teoría. En muchas situaciones H1 se conoce como “hipótesis del investigador”, puesto que es la afirmación que al investigador le gustaría validar. La hipótesis nula H0 se llama así porque con frecuencia afirma que no hay diferencia entre el verdadero valor del parámetro y el que se quiere contrastar, sugiere que H0 no deberá ser identificada con la hipótesis de ningún cambio (de la opinión actual, del estado actual), ninguna diferencia, ninguna mejora, y así sucesivamente. Supóngase, por ejemplo, que el 10% de todas las tarjetas de circuito producidas por cierto fabricante duran- te un período reciente estaban defectuosas. Un ingeniero ha sugerido un cambio del proceso de producción en la creencia que dará por resultado una reducción en la proporción de tarjetas defectuosas. Sea p la pro- porción verdadera de tarjetas defectuosas que resultan del proceso cambiado. Entonces la hipótesis de investigación en la cual recae el trabajo de comprobación, es la afirmación de que p < 0,10. Por consiguien- te la hipótesis alternativa es H1: p < 0,10 En el tratamiento de la prueba de hipótesis, H0 siempre será formulada como una afirmación de igualdad. Si θ denota el parámetro de interés, la hipótesis nula tendrá la forma H0: θ = θ0, donde θ0 es un número específico llamado valor nulo del parámetro (valor pretendido para θ por la hipótesis nula). Como ejemplo considérese la situación de la tarjeta de circuito que se acaba de discutir. La hipótesis alter- nativa sugerida fue H1: p < 0,10, la afirmación de que la modificación del proceso redujo la proporción de tarjetas defectuosas. Una opción natural de H0 en esta situación es la afirmación de que p 0,10 de acuer- do a la cual el nuevo proceso no es mejor o peor que el actualmente utilizado. En su lugar se considerará H0: p = 0,10 contra H1: p < 0,10. El razonamiento para utilizar esta hipótesis nula simplificada (o simple) es que cualquier procedimiento de decisión razonable para decidir entra la afirmación de que p = 0,10 y H1: p < 0,10 también será razonable para decidir entre la afirmación de que p 0,10 y H1. Se prefiere usar una H0 simple porque tiene ciertos beneficios técnicos, los que en breve serán apa- rentes. 3 La alternativa de la hipótesis nula H0: θ = θ0 se verá como una de las tres siguientes afirmaciones: 1º) H1: θ > θ0 (en cuyo caso la hipótesis nula implícita es θ θ0 ). 2º) H1: θ < θ0 (en cuyo caso la hipótesis nula implícita es θ θ0 ). 3º) H1: θ θ0. Por ejemplo sea σ la desviación estándar de la distribución de diámetros internos (pulgadas) de un cierto tipo de manguito de metal. Si se decidió usar el manguito a menos que la evidencia muestral demuestre conclusivamente que σ > 0,001. La hipótesis apropiada será H0: σ = 0,001 versus H1: σ > 0,001. El número que aparece tanto en H0 como en H1 (separa la alternativa de la nula) se llama valor nulo. Montgomery dice al respecto: “Es importante recordar que las hipótesis siempre son proposiciones sobre la población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor de la po- blación especificado en la hipótesis nula H0: = 0 se determina en una de tres maneras diferentes. Primero, puede ser resultado de la experiencia pasada o del conocimiento del proceso, o incluso de pruebas o experimentos previos. Entonces el objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del parámetro. Segundo, este valor puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo. Aparece una tercera situación cuando el valor del parámetro de la población proviene de consideraciones externas, tales como las especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación, el objetivo usual de la prueba de hipótesis es probar el cumplimiento de las especificaciones”. Por desgracia no hay “certeza” de que no se cometerá una equivocación. De hecho hay dos tipos de error cualquiera de los cuales puede cometerse. Puede ocurrir que la hipótesis nula sea verdadera y la conside- remos falsa (ERROR DE TIPO I), o que la hipótesis nula sea falsa y la consideremos verdadera (ERROR DE TIPO II). Es decir, El error tipo I se define como el rechazo de la hipótesis nula H0 cuando ésta es verdadera. El error tipo II se define como la aceptación de la hipótesis nula H0 cuando ésta es falsa. La frecuencia con que se cometen estos errores (o la proporción de veces que se cometen estos errores) es desde luego muy importante para nosotros y veremos que esta frecuencia puede controlarse hasta cierto punto. (O sea, queremos controlar la probabilidad de cometer estos errores) Nuestra decisión de aceptar o rechazar una hipótesis se basará: en la información que obtenga- mos haciendo observaciones, y en el riesgo que estemos dispuestos a correr de que nuestra deci- sión pueda ser errónea. PROPOSITO: DISEÑAR UN PRUEBA PARA DECIDIR ENTRE H0 Y H1. Ejemplo libro “Probabilidad y Estadística” Gil- Florit: Supongamos que X “el peso de las bolsas de harina que vende un determinado molino harinero” es una variable aleatoria normal. Para simplificar el problema consideremos conocida la desviación estándar poblacional = 20 kg. O sea X ∿ N(, = 20) El dueño de ese molino afirma que el peso medio de las bolsas que vende a grandes mercados, es al me- nos de 70 kg. Un comprador de dichas bolsas sospecha que últimamente, dicho peso medio es inferior a 70 kg. Entonces antes de realizar su próxima compra, decide probar la hipótesis del vendedor, es decir: ≥ 70. A esta hipótesis que se plantea con miras a un posible rechazo, bajo el supuesto que es cierta, se la llama “hipótesis nula” y se la indica con H0. A esta hipótesis nula H0 la confronta la hipótesis alternativa H1 que es la que sostiene el comprador, es de- cir: < 70 kg. Se desea probar H0: ≥ 70 (Vendedor) versus H1: < 70 (Comprador) H0: ≥ 70 es una “hipótesis compuesta” y dado que la distribución muestral de estadístico que utilizare- mos para hacer la prueba no queda unívocamente especificada, se ensaya la hipótesis más desfavorable, que en este caso es H0: = 70, pues si ésta se rechaza, también se rechaza que > 70. Luego las hipótesis a verificar son H0: = 70 (hipótesis simple) H1: < 70 (hipótesis compuesta) 4 Para decidir si H0 es razonable o no, el comprador toma una muestra aleatoria de n=4 bolsas de harina (x1, x2, x3.y x4.) y en base al resultado de dicha muestra tomará una decisión. Para ello calcula valor que asume el estadístico: Como las son variables aleatorias Normales independientes entre sí, entonces: es normal (, 2 /n). Para el ejemplo si H0 es verdad, es N ( , 20 2 /4). Observemos que: 1°) es un estimador insesgado de la media “” que se ensaya. Entonces este estimador o estadístico permite hacer una prueba de hipótesis equivalente al que se plantea. Es decir: H0: = 70 H0: = =70 H1: < 70 es equivalente a: H1: = < 70 2°) tiene un desvío más pequeño que el de la población. 3°) Para decidir sobre H0 en base al resultado de la muestra debemos conocer la distribución de probabilidades del estadístico. En este caso es N ( , 20 2 /4) con = 10 Supongamos que el valor del peso promedio observado en la muestra de 4 bolsas es de 45 kg., en este caso el comprador sospecharíaque el peso medio poblacional “ “ no es de 70 kg., ya que tiene poca densidad de probabilidad en una distribución normal de media = 70. Entonces decide rechazar la hipótesis del vendedor. ¿Cuál hubiera sido la decisión si el promedio muestral observado fuera de 69 kg? El comprador no recha- zaría la hipótesis del vendedor. Un valor de que esté próximo al valor hipotético = 70 kg. es una evidencia de que el valor verdadero de la media es realmente 70 kg., esto es, tal evidencia apoya la hipótesis nula H0. Por otra parte, una media muestral mucho menor que 70 kg constituye una evidencia que apoya la hipótesis alternativa H1. Entonces, ¿a partir de qué valor de se toma la decisión de rechazar H0? El comprador fija una regla de decisión estableciendo una región llamada “región crítica que es la región de rechazo de Ho . Por ejemplo establece como región de rechazo < 60. Las fronteras entre las regiones crítica y de aceptación reciben el nombre de valores críticos (Notación: CRITICO o simplemente C ). En nuestro ejemplo el valor crítico es 60 kg. Luego, si < 60 kg, se rechaza la hipótesis nula H0: = 70, y si ≥ 60, entonces se acepta la hipótesis nula. Esta situación se ilustra en el siguiente gráfico. = 0 1 x 5 REGION DE RECHAZO (RR) REGION DE ACEPTACION (RA) = 60 kg Definición: Los posibles valores del estadístico de prueba que nos hacen rechazar la hipótesis nula, constituyen la región de rechazo o región crítica (RR). El procedimiento de decisión citado puede conducir a una de dos conclusiones erróneas. Por ejemplo, es posible que el verdadero valor de sea igual a 70 kg., sin embargo, para las bolsas de harina de la muestra puede observarse un valor del estadístico de prueba que cae en la región crítica. En este caso la hipóte- sis nula será rechazada a favor de la alternativa H1, cuando de hecho H0 en realidad es verdadera. Este tipo de conclusión errónea se conoce como error tipo I. Ahora supóngase que el verdadero valor de es menor que 70 kg, aunque la media muestra caiga dentro de la región de aceptación. En este caso se acepta H0 cuando esta es falsa. Este tipo de conclusión errónea recibe el nombre de error tipo II. Por lo tanto, al probar cualquier hipótesis estadística, se tiene 4 posibles situaciones que determinan si la decisión es correcta o equivocada. Estas cuatro situaciones se resumen en la siguiente tabla: VERDAD = 70 < 70 H0 verdadera H1 verdadera Se acepta H0 decisión correcta error tipo II DECISION Se rechaza H0 error tipo I decisión correcta Tabla 1 Es decir al utilizar una muestra para obtener conclusiones de una población existe el riesgo de llegar a una conclusión incorrecta. Cometemos Error Tipo I si rechazamos H0 cuando en realidad es verdadera. Cometemos Error Tipo II si aceptamos H0 cuando en realidad es falsa. El procedimiento y las situaciones planteadas pueden explicarse mediante la distribución muestral de , llamado estadístico de prueba. Para ello recordemos que la cantidad de harina de cada bolsa tiene una distribución normal con una desviación estándar conocida = 20 kg, de modo que la distribución de la media muestral es normal con desviación estándar / n = 20/ 4 = 10 Hay que advertir que hay más de una distribución en juego: Si H0 es cierta, la distribución es (1). Si H1 es cierta, la distribución es cualquiera de las (2). Una sola de estas hipótesis es verdadera o cierta a) Si H0 es verdadera N( 70, 10 2 ); (Gráfico 1) Gráfico 1: Distribución Muestral de si Ho es verdadera b) Si H1 es verdadera N( , 10 2 ) con < 70 Gráfico 2 - DISTRIBUCIONES MUESTRALES DE (Bajo H0 la más oscura, bajo H1 las restantes) 6 Se toma una muestra independiente de n observaciones y sean x1, x2,...,xn los números observados en la muestra correspondiente y sea su media aritmética (media muestral) que se muestra en el gráfico 2. En este caso pertenece a la región de aceptación y nos veríamos inclinados a aceptar H0. El indicado es más probable que ocurra bajo la hipótesis H0 que bajo la H1; sería un valor excepcional bajo H1 y un valor corriente bajo H0. Es decir, si H0 es verdadera, una media tal como , mucho menor que 70 kg., se presentará pocas veces. Por eso si la media muestral calculada se aproxima a 70 aceptaremos la hipótesis H0. Si es mucho menor que 70, la rechazaremos. En cualquier lugar que caiga la observación hay posibilidad de equivocarse por- que puede ser que se obtenga una observación excepcional. ERROR DE TIPO I Dado que la decisión se basa en variables aleatorias, entonces es posible asociar probabilidades con los errores tipo I y II de la Tabla 1. La probabilidad de cometer Error de tipo I se la designa con la letra griega y se denomina nivel de significación de la prueba. Esto es. = P (error tipo I) = P (rechazar H0 / H0 es verdadera) Calculamos para la región de rechazo (RR) < 60 y región de aceptación (RA) > 60 = P ( X RR / = 70 ) = P ( X < 60 / = 70 ) = P (Z < 4 20 7060 ) = P( Z < -1) = 0,1587 (i) Luego, el 15,87 % de las muestras aleatorias conducirán al rechazo de H0, cuando ésta sea verdadera (Gráfico 3) ¿Cómo podemos reducir ? Al analizar el gráfico 3 se nota que es posible reducir al aumentar la región de aceptación. Por ejem- plo, si se toma como valor crítico a 50, la región crítica será < 50 y la región de aceptación será ≥ 50. Gráfico 4 En este caso el valor de será = P ( X < 50 / = 70 ) =P( Z < -2) = 0,0228 También puede reducirse el valor de incrementando el tamaño de la muestra. Si n = 8, entonces / n = 20/ 8 RR: < 60 = P ( X < 60 / = 70) = P( Z < - 1,41) = 0,0793 (ii) Comparar (ii) con (i) . Gráfico 5 ERROR DE TIPO II Al evaluar un procedimiento de prueba de hipótesis, también es importante examinar la probabilidad de cometer error de tipo II, la cual se denota con . Trabajamos con una muestra de tamaño 4 y las siguientes regiones de rechazo y de aceptación. RR < 60 RA: ≥ 60 = P (Error de Tipo II) = P (aceptar H0 / H1 es verdadera) = P ( X RA / = 1 con 1 < 70) 7 Si H1 es verdadera : X N( 1 , 10 2 ) con 1 < 70 Luego, = P ( X ≥ 60 | = 1 con 1 < 70) = P (Z ≥ 10 60 1 | 1 < 70 ) Es decir es una función de 1, = (1 ) Para calcular se debe tener una hipótesis alternativa específica; esto es debe tenerse un valor particular de 1. Por ejemplo ¿cómo trabajará el procedimiento de prueba si se desea detectar, esto es, rechazar H0 para un valor medio de = 55 kg? (55) = P ( X ≥ 60 | = 55) = P (Z ≥ 4 20 5560 ) = P( Z ≥ 0,5 ) (55) = 0,3085 ( iii) Gráfico 6 Calculamos ahora (40), esto es la probabilidad de aceptar H0 : = 70 cuando el verdadero valor de es 40; es decir cuando H1 : = 40 es verdadera. (40) = P ( X ≥ 60 | = 40) = P (Z ≥ 4 20 4060 ) = P( Z ≥ 2 ) (40) = 0,0228 (iv) Gráfico 7 La probabilidad de cometer error de tipo II aumenta rápidamente a medida que el valor verdadero de tiende al valor hipotético. Comparar ( iii ) con ( iv ). también depende de n. Calculamos (55) cuando n = 8. (55) = P ( X ≥ 60 | = 55) = P (Z > 8 20 5560 ) = P( Z > 0,71) Luego (55) = 0,2389 ( v) Comparar (iii ) con (v). DETERMINACION DE UNA REGION DE RECHAZO (RR) ADECUADA PARA LA PRUEBA ESTADÍSTICA PLANTEADA La frecuencia con que se cometen estos errores (o la proporción de veces que se cometen estos errores) es, desde luego, muy importante para nosotros, y veremos que esta frecuencia puede controlarse hasta cierto pun- to. Nuestra decisión de aceptar o rechazar una hipótesis se basará: en la información que obtengamos haciendo observaciones, y en el riesgo que estemos dispuestos a correr de que nuestra decisión pueda ser errónea. Intuitivamente establecimos la región de rechazo como RR = { X < x CRITICO } y analizamos distintas po- sibilidades para dicho punto crítico. Pero, ¿qué valor debería elegirse para x C? ¿Dónde tomamos el punto crítico? Si H0: = 70 y H1: < 70 la Región de Rechazo (RR ) será x < x C 8 Primero analicemos y si el punto crítico ocupa la posición que se indica en el Gráfico 8. Si movemos a la izquierda aumenta el error de tipo II y disminuye el error de tipo I. Esta situación puede observarse en el gráfico 9. Gráfico 8 Gráfico 9 Los errores de ambos tipos son competitivos, si aumenta uno se disminuye el otro. ¿Hasta dónde movemos ? Tradicionalmente el estadístico controla la tasa de errores tipo I estableciendo el nivel de riesgos que se está dispuesto a tolerar en términos de rechazar una hipótesis nula verdadera. O sea que, puesto que el valor de puede ser elegido por el que realiza el experimento y su elección determi- nará en parte la aceptación o la no aceptación de la hipótesis, éste debe fijarse antes de comenzar el experi- mento. Si es de gran importancia rechazar una hipótesis, el riesgo de cometer este error debe ser pequeño. Si es de gran importancia que una hipótesis sea rechazada si existe únicamente una pequeña evidencia en contra, puede convenir elegir un mayor. PROPUESTA DE NEYMAN-PEARSON Para probar la hipótesis nula simple H0: = 0 frente a la hipótesis alternativa simple H1 : = 1 con 1 < 0, para una prueba de cola izquierda, basados en una muestra aleatoria X1, X2, ..., Xn de una distribución normal con media desconocida y varianza 2 conocida, el procedimiento óptimo se basa en la distribución muestral de X (llamado estadístico de la prueba). Para ello : fije P(cometer Error Tipo I)= pequeño , por ejemplo 0,10; 0,05; 0,01; 0,001, = P ( X < x CRITICO / = 0 ), y elija la región crítica que haga que P(cometer Error Tipo II)= sea mínima. Un convenio que se sigue con frecuencia es establecer el resultado significativo si la hipótesis nula se rechaza con = 0,05 y muy significativo si la hipótesis nula se rechaza con = 0,01. DETERMINACIÓN DE LA REGIÓN CRÍTICA (RR) PARA UNA PRUEBA PARA LA HIPÓTESIS ALTERNA- TIVA UNILATERAL < 70 Queremos determinar el punto crítico para probar las hipótesis H0: = 70 vs H1: <70 . Si la hipótesis nula es verdadera, X tiene distribución normal con media 70 y desviación estándar / n = 10, entonces puede construirse una región crítica basada en el valor de la media muestral calculado. Habitualmente, es más conveniente estandarizar la media muestral y utilizar un estadístico de prueba basado en la distribución normal estándar. Esto es Estadístico de prueba Z = n 70X ~ N (0, 1) Datos: = 20 kg. y n=4 Si fijamos = 0,05 esto me dice que el 5% de todas las muestras me llevarán a rechazar = 70 cuando esto es verdadero. 10 20 30 40 50 60 70 80 90 100 10 20 30 40 50 60 70 80 90 100 Bajo H0 9 P(ERROR TIPO I) = α P ( x RR / = 70 ) P( x < x CRITICO / = 70) = , Estandarizando P n 368x Z C = ; y dado que P(Z < - z ) = , luego n 70xC = - z , de donde Cx = 70 - z / n Cx = 70 -z0,05 20 / 4 Cx = 53,55 Región de rechazo: x < 53,55 Regla de la prueba: Con x1, x2, ...xn, calcule x y rechace H0 al nivel de significación =0,05 si y solo si x < 53,55. Caso contrario, no rechace H0. O equivalentemente Regla de la prueba: Con x1, x2, ...xn, calcule x y calcule el valor del estadístico de prueba zcalculado = n 70x y rechace H0 al nivel de significación = 0,05 si y solo si zcalculado < - z (esto es si zcalculado< - 1,645) . Caso contrario, no rechace H0. Nota: la costumbre es establecer conclusiones con respecto a la hipótesis nula H0, se rechaza H0 o no se re- chaza H0. En nuestro ejemplo se seleccionó una muestra aleatoria de tamaño 4 que arrojó un x = 51 kg ¿qué decisión se tomó? Regla de Prueba 1: Puesto que x = 51 < 53,55 x está en la región de rechazo de H0, luego se rechaza H0. al nivel de significación 0,05. Regla de Prueba 2: Con la media muestral calculada x = 51 calculamos el valor del estadístico de prueba zcalculado = 645,19,1 420 7051 luego se rechaza H0. al nivel de significación 0,05. En general, para probar las hipótesis sobre la media de una población normal con varianza conocida σ 2 , a par- tir de una muestra de tamaño n ,con un nivel de significación , H0: = 0 vs H1: < 0 el estadístico de la prueba será X ∿ N(0 , 2 /n) , Z = n X 0 ~ N (0, 1) y la región de rechazo será z < - z (en términos del estadístico de prueba estandarizado o la región de rechazo será x < 0 - z / n (en términos del estadístico X , con x CRITICO = 0 - z / n ) Regla de la prueba: Con x1, x2, ...xn, calcule x y rechace H0 al nivel de significación si y solo si x < 0 - z / n . Caso contrario, no rechace H0. O equivalentemente Regla de la prueba: Con x1, x2, ...xn, calcule x y calcule el valor del estadístico de prueba zcalculado = n x 0 y rechace H0 al nivel de significación si y solo si zcalculado < - z . Caso contrario, no rechace H0. bajo H0 bajo H0 10 Esta prueba donde la alternativa es unilateral H1: < 0 , recibe el nombre de prueba de hipótesis de cola izquierda o de cola inferior pues la región de rechazo (o región crítica) cae en la cola izquierda de la distribu- ción del estadístico de prueba. CÁLCULO DE = P(cometer Error Tipo II) = P (aceptar H0 / H1 es verdadera) = P( X ϵ RA / H1 es verdadera) = P( X ≥ 53,55 / = 1 con 1 < 70) (1) = P 420 55,53 Z 1 ; es una función de 1 con 1 < 70 Para calcular se debe tener una hipótesis alternativa específica; esto es, debe tenerse un valor particular de 1 . Por ejemplo, supóngase que es importante rechazar H0 : = 70 cada vez que el peso medio de llenado es menor que 40 kg.. Para ello, puede calcularse la probabilidad de un error de tipo II para el valor 1 = 40, y utilizar este resultado para averiguar algo con respecto a la forma en que se desempeñará la prueba. De manera específica, ¿cómo se desempeñará la prueba si se desea detectar, esto es, rechazar H0 para un valor de = 45? Es necesario entonces encontrar la probabilidad de aceptar la hipótesis nula H0 : = 70 cuan- do el verdadero valor es = 45. O sea que estamos tomando una hipótesis alternativa específica H1 : = 45 que suponemos verdadera. (45) = P( X ≥ 53,55 / = 45 ) P 420 4555,53 Z =P( Z ≥ 0,855)= 1 - P( Z < 0,855) = 0,1963 (45) = 0,1963 (ver Gráfico 10) Si la media es realmente 45, aproximadamente el 19,63 % de todas las muestras de tamaño 4 nos lle- varán a aceptar = 70 (H0), cuando en realidad = 45 (H1) es verdadera. Gráfico 10 Calculamos para otros valores de 1 (40) = 0,0877 (55) = 0,5576 En general, para hallar si H0: = 0 vs H1 : = 1 con 1 < 0, para una prueba de cola izquierda, (1 ) = P ( X ≥ CRITICOx / = 1) = P n x Z 1CRITICO , con x CRITICO = 0 - z / n , luego (1 ) = P n zZ 10 puesto que si H1 es verdadera : X N( 1 , 2 /n) y Z = n X 1 ~ N (0, 1) 11 La probabilidad del error de tipo II también depende del tamaño de la muestra n. En general, un aumento en el tamaño de la muestra reduce tanto a como a , siempre y cuando los valores críticos se mantengan constantes. Si el tamaño de la muestra aumenta de n = 4 a n = 8, entonces se obtiene la situación ilustrada en el si- guiente gráfico 11. Marcar y para el punto crítico obtenido. ¿A qué conclusiones arribaría? (45) = P( X ≥ 53,55 / = 45 ) P 820 4555,53 Z = P( Z ≥ 1,2092)= 1 - 0,8869 = 0,1131 Gráfico 11 Si el tamaño de la muestra aumenta de n = 4 a n = 10, entonces se obtiene la situación ilustrada en el siguiente gráfico 12. Marcar y para el punto crítico obtenido. ¿A qué conclusiones arribaría? (45) = P( X ≥ 53,55 / = 45 ) P 1020 4555,53 Z = P( Z ≥ 1,35)= 1 - 0,9115 = 0,0885 Gráfico 12 Cite conclusiones. OBSERVACIONES En general, el analista controla la probabilidad del error de tipo I cuando escoge los valores críticos. Así, usualmente es más fácil para el analista fijar la probabilidad del error tipo I en (casi) cualquier valor deseado. Puesto que el analista puede controlar de manera directa la probabilidad de rechazar de manera errónea H0 , siempre puede considerarse el rechazo de la hipótesis nula como una conclusión fuerte. Por otra parte, la probabilidad del error tipo II no es constante, sino que depende del verdadero valor del parámetro. Esta también depende del tamaño de la muestra que se haya seleccionado. Dado que la probabili- dad del error tipo II es una función tanto del tamaño de la muestra como del punto en el cual la hipótesis nula es falsa, es costumbre considerar la decisión de aceptar H0 como una conclusión débil, a menos que se sepa que es aceptablemente pequeño. Por consiguiente, más que decir “se acepta H0” ,se prefiere la terminología “incapaz de rechazar H0”. La incapacidad de rechazar H0” implica que no se ha encontrado evidencia suficiente para rechazar a H0”, esto es, para hacer una proposición fuerte. La incapacidad para rechazar H0 no significa que exista necesariamente que exista una probabilidad grande de que H0 sea cierta. Esto simplemente significa 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 12 que se requieren más datos para alcanzar una conclusión fuerte. Lo anterior puede tener implicaciones impor- tantes para la formulación de hipótesis. POTENCIA DE UNA PRUEBA La potencia de una prueba es la probabilidad de rechazar H0, dada una hipótesis alternativa específica verdade- ra. En general si H0: = 0 y H1: = 1 con 1 < 0 CP(1 ) = P (rechazar H0 / H1 es verdadera) = 1 - P ( aceptar H0 / H1 es verdadera) = 1 – (1) En nuestro caso CP(45) ( la potencia para la alternativa H1: = 45) será CP(45) = 1 - (45) = 1 – 0,1963 = 0,8037 Esto quiere decir que si la verdadera media = 45 (H1 verdadera), el 80,37 % de las veces, rechazaremos acertadamente la hipótesis nula en favor de la alternativa. Calculamos la potencia para distintas alternativas H1: = 1 con 1 < 0 Posible valores reales para 1(kg) Potencia 15 0,9999 20 0,9996 25 0,9978 30 0,9907 35 0,9682 40 0,9123 45 0,8037 50 0,6387 55 0,4424 60 0,2595 65 0,1261 70 0,0500 La siguiente figura es un ejemplo de la potencia de la prueba para diversos valores posible de 1 . A es- ta gráfica se la conoce como CURVA DE POTENCIA. Se observa que la potencia de esta prueba de una cola aumenta marcadamente (y se acerca al 100%) según la media de la población toma valores más abajo de los 70 kilogramos hipotéticos. Es evidente que para esta prueba de una cola, cuanto menor sea la media real 1 en comparación con la media hipotética, tanto mayor será la potencia para detectar esta disparidad. Por otra parte, para valores de 1 cercanos a 70 kilogra- mos la potencia es más bien pequeña, puesto que la prueba no puede detectar con efectividad diferencias pe- queñas entre la media real de la población y el valor hipotético de 70 kilogramos. Si la media real fuera en realidad de 70 kilogramos, entonces la potencia de la prueba sería igual a , el nivel de significación (que en este ejemplo es 0,05) puesto que la hipótesis nula en realidad sería cierta. 0,9999 0,9996 0,9978 0,9907 0,9682 0,9123 0,8037 0,6387 0,4424 0,2595 0,1261 0,0500 0,00 0,20 0,40 0,60 0,80 1,00 1,20 10 15 20 25 30 35 40 45 50 55 60 65 70 P o te n c ia Posibles valores para 1 70 Kg CURVA DE POTENCIA PARA UNA HIPOTESIS ALTERNATIVA 1 < 70 aa 13 En el estudio de la potencia de una prueba estadística se han utilizado una prueba de una cola, un nivel de significación de 0,05 y un tamaño de muestra de 4 bolsas. Teniendo esto en mente se puede determinar el efecto de la prueba sobre la potencia, modificando 1.- El tipo de prueba estadística – una cola contra dos colas. 2.- El nivel de significación . 3.- El tamaño de la muestra n. PRUEBA UNILATERAL DE COLA DERECHA En general, para probar las hipótesis sobre la media de una población normal con varianza conocida σ 2 , a par- tir de una muestra de tamaño n, con un nivel de significación , H0: = 0 vs H1: > 0 el estadístico de la prueba será X N (0 , 2 /n) , Z = n X 0 ~ N (0, 1) y la región de rechazo será z > z (en términos del estadístico de prueba estandarizado o la región de rechazo será x > 0 + z / n (en términos del estadístico X , con x CRITICO = 0 + z / n ) Regla de la prueba: Con x1, x2, ...xn, calcule x y rechace H0 al nivel de significación si y solo si x > 0 + z / n . Caso contrario, no rechace H0. O equivalentemente Regla de la prueba: Con x1, x2, ...xn, calcule x y calcule el valor del estadístico de prueba zcalculado = n x 0 y rechace H0 al nivel de significación si y solo si zcalculado > z . Caso contrario, no rechace H0. Esta prueba donde la alternativa es unilateral H1: > 0 , recibe el nombre de prueba de hipótesis de cola derecha pues la región de rechazo (o región crítica) cae en la cola derecha de la distribución del estadístico de prueba. En general, para hallar si H0: = 0 vs H1 : = 1 con 1 > 0, para una prueba de cola derecha, (1 ) = P ( X CRITICOx / = 1) = P n x Z 1CRITICO , con x CRITICO = 0 + z / n , luego (1 ) = P n zZ 10 puesto que si H1 es verdadera : X N( 1 , 2 /n) y Z = n X 1 ~ N (0, 1) bajo H0 bajo H0
Compartir