Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Test de Hipótesis Introducción Toda decisión que tomemos respecto a cierta hipótesis de trabajo “H”-cualquiera sea el ámbito en cuestión- implica que necesariamente estaremos frente a cuatro cursos de acción posibles. Dos de ellos conducirán a decisiones acertadas y los otros dos conducirán a decisiones erróneas. Aceptar una hipótesis verdadera o rechazar una hipótesis falsa constituyen decisiones correctas. En cambio, aceptar una hipótesis falsa o rechazar una hipótesis verdadera conducen a decisiones erróneas. Las cuatro situaciones se ven en el siguiente cuadro H Verdadera H Falsa Aceptar (1) OK (2) Error Rechazar (3) Error (4) OK Pondremos como primer ejemplo un juicio que se lleva a cabo para determinar si el señor Juan Pérez cometió un crimen La hipótesis “H” de base podríamos formularla como sigue “el señor Juan Pérez no cometió el crimen por el cual se lo acusa en el juicio” (Hipótesis que conlleva la presunción de inocencia) Una vez desarrollado el juicio y llegado el punto de tomar la decisión, el juez (o el jurado) se enfrentan a las cuatro situaciones descriptas H Verdadera H Falsa Aceptar 1 / OK (Juan Pérez es inocente y queda libre) 2 / Error (Juan Pérez no es inocente pero queda libre) Rechazar 3 / Error (Juan Pérez es inocente pero queda preso) 4 / OK (Juan Pérez no es inocente y queda preso) Aquí vemos en toda su dimensión la gravedad de cometer cualquiera de los dos errores posibles como dejar a un asesino en libertad o poner en prisión a una persona inocente Pondremos otro ejemplo que se encuentra en debate actualmente en todo el mundo. Hipótesis H: “de continuar con el presente ritmo de consumo global (emisiones de CO2), la civilización va a colapsar debido al calentamiento global” H Verdadera H Falsa Aceptar 1 / OK (bajamos consumo CO2 y evitamos el calentamiento global) 2 / Error (bajamos consumo de CO2 innecesariamente; pues no afecta el calentamiento global) Rechazar 3 / Error (no bajamos consumo de CO2 y colapsamos por subida descontrolada de temperatura global ) 4 / OK (no bajamos consumo de CO2 y no hay consecuencias ambientales) Puede suceder –como en este caso- que de los dos errores posibles uno sea mucho más grave que el otro. En este caso a todas luces es conveniente para la humanidad equivocarse según (2) en lugar de cometer el error indicado en (3) Hay infinidad de decisiones en todos los órdenes de la vida que conllevan estos cuatro caminos posibles. Pasemos ahora al tema específico que nos ocupa que es el de la toma de decisiones respecto de parámetros estadísticos; en general un parámetro cualquiera “Ɵ” Llamaremos hipótesis nula o hipótesis de base “H0” a la hipótesis mediante la cual se iguala el parámetro bajo análisis Ɵ a un valor en particular Ɵ0, es decir H0) Ɵ = Ɵ0 Llamaremos hipótesis alternativa “HA” al valor o conjunto de valores del espacio paramétrico “que queremos controlar” Generalmente son tres los casos que pueden presentarse como hipótesis alternativas HA) Ɵ < Ɵ0 / Ɵ > Ɵ0 / Ɵ ≠ Ɵ0 Pruebas a un extremo (o una cola) H0) Ɵ = Ɵ0 versus HA) Ɵ < Ɵ0 Que se lee “ensayo de igual contra menor” H0) Ɵ = Ɵ0 versus HA) Ɵ > Ɵ0 Que se lee “ensayo de igual contra mayor” Pruebas a dos extremos (o dos colas) H0) Ɵ = Ɵ0 versus HA) Ɵ ≠ Ɵ0 Que se lee “ensayo de igual contra distinto” Formalización de los errores Definimos el error de tipo I o alfa a la probabilidad de rechazar H0 cuando es cierta. El error de tipo II o beta es la probabilidad de aceptar H0 cuando es verdadera HA evaluada en un valor puntual del parámetro perteneciente a HA. Esto quiere decir que hay tantos betas posibles como valores del parámetro en la hipótesis alternativa. La representación gráfica de todos los valores de beta posibles dentro de un test se la llama curva característica o curva operativa. H0 es verdadera H0 es falsa Aceptar H0 Decisión correcta Error de tipo II (β)) Rechazar H0 Error de tipo I (α)) Decisión correcta Error de tipo I α) = P (Rechazar H0 / H0 verdadera) Error de tipo II β) = P (Aceptar H0 / HA verdadera) Procedimiento para realizar un Test de Hipótesis 1.- Formular H0 y HA 2.- Generar una variable de decisión y tomar la muestra de tamaño n 3.- Definir la regla de decisión (zonas de aceptación y rechazo de H0) Valores críticos 4.- Medir riesgos: errores de tipo I y II y curva característica (los pasos 3 y 4 pueden permutarse según el caso) En toda formulación de un Test de Hipótesis entran en juego cuatro elementos, dos de los cuales se fijan a priori, calculando luego los otros dos Los cuatro elementos son: Tamaño de la muestra “n” / Valores críticos / Error tipo I / Error tipo II Ejemplo Tenemos una moneda y queremos determinar si esta “balanceada”, es decir si su probabilidad de cara (o ceca) vale 50% Desarrollemos un Test de Hipótesis El parámetro en cuestión es “p” (P(cara)) Primer paso: La hipótesis nula quedará expresada como sigue H0) p = p0 = 0.50 Para formular la hipótesis alternativa nos preguntamos ¿Qué es lo que queremos controlar? ¿Tenemos particular interés en determinar si p es menor que 0.50? ¿Tenemos particular interés en determinar si p es mayor que 0.50? ¿Tenemos particular interés en determinar si p es cualquier valor distinto de 0.50? Claramente es la última opción, por lo tanto HA) p ≠ 0.50 Segundo paso: Definimos a priori que arrojaremos la moneda 10 veces (n=10) y utilizaremos como variable de decisión la cantidad “r” de caras (éxitos) obtenidas r : Bi (n=10;p) Es decir: r es una variable binomial de parámetros n=10 y p Recordando la función de probabilidad de la Binomial P (XBi= r) = Cn;r * pr * (1-p) n-r con r = 0; 1 ; 2 ; ……; n (nula en otro caso) Tercer paso: Definiremos a priori la siguiente regla de decisión Si 3 ≤ r ≤ 7 aceptaremos H0 Si r ≤ 2 o r ≥ 8 rechazaremos H0 Cuarto paso: Mediremos los errores Error de tipo I α) = P (Rechazar H0 / H0 verdadera) = P (r ≤ 2 o r ≥ 8 / p = 0.50) Reemplazando en la función de probabilidad los parámetros: P (XBi= r) = Cn;r * pr * (1-p) n-r = C10;r * 0.50r * (1-0.50) 10-r P (XBi= r) = C10;r * 0.5010 Por lo tanto α) = P (r ≤ 2 o r ≥ 8 / p = 0.50) = P (r=0) + P (r=1) + P (r=2) + P (r=8) + P (r=9) + P (r=10) ≈ 0.11 Este resultado se interpreta de la siguiente forma: “Tenemos una probabilidad del 11% de concluir que la moneda no está equilibrada cuando en realidad si lo esta” En general alfa debe ser un valor del orden del 10% o menor Error de tipo II β) = P (Aceptar H0 / HA verdadera) Como se puede observar hay infinitos valores que puede tomar “p” cuando HA es verdadera (cualquier p distinto de 0.50) Por lo tanto hay infinitos valores que puede tomar el error de tipo II Calcularemos el error de tipo II para el caso en que p tomara el valor 0.30 β)(p=0.30) = P (Aceptar H0 / p=0.30) = P (3 ≤ r ≤ 7 / p=0.30) Reemplazando los parámetros en la función de probabilidad de la variable Binomial: P (XBi= r) = Cn;r * pr * (1-p) n-r = C10;r * 0.30r * (1-0.30) 10-r Por lo tanto β)(p=0.30) = P (r=3) + P (r=4) + P (r=5) + P (r=6) + P (r=7) ≈ 0.62 Este resultado se interpreta de la siguiente forma: “Tenemos una probabilidad del 62% de concluir que la moneda está equilibrada cuando en realidad su probabilidad de cara vale 0.30” Curva característica En la siguiente tabla se han calculado otros valores de beta para distintos valores de “p”, trazando luego la curva característica La fórmula de cálculo es la que sigue para cada valor de p que se quiera evaluar β)(p) = P (Aceptar H0 / p) = P (3 ≤ r ≤ 7 / p) p Beta 0,2 0,32 0,3 0,62 0,4 0,82 0,49 0,89 0,6 0,82 0,7 0,62 0,8 0,32 0.2 0.3 0.4 0.49 0.6 0.7 0.8 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Beta Beta Notar que en la curva característica el único valor de p que no debe evaluarse es p=0.50 dado que ese valor no pertenece a HA sino a H0
Compartir