Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 UNIVERSIDAD NACIONAL LOS COMECHINGONES Cátedra:Estadística Unidad N°6: Prueba de Hipótesis. 1.-Hipótesis Estadística Es una afirmación o conjetura que se hace sobre una o varias características de la población (parámetros). 2.-Ensayo o prueba de hipótesis Es una regla por medio de cuya aplicación a a veces se rechaza y a veces no una hipótesis postulada (llamada hipótesis nula). La decisión se toma de acuerdo a si las observaciones poseen o no algunas propiedades especificadas por la regla. 3.-Las Hipótesis Nula y Alternativa H0 =Hipótesis Nula: Es la afirmación de que nada está sucediendo , no existe diferencia, no hay cambios en la población. H1=Hipótesis Alternativa: Es la afirmación que el investigador espera sea cierta. El cambio en la población que el investigador está buscando. Si rechazamos H0 ,decimos que los datos son estadísticamente significativos. 4.-El Planteo de las Hipótesis Denotando con ϴ a un parámetro poblacional cualquiera y 𝑎 𝛳 un valor determinado de dicho parámetro ,entonces el planteo es el siguiente: H0: ϴ=𝛳 versus (las opciones excluyentes de H1)son ϴ ≠ 𝛳 alt. bilateral ϴ > 𝛳 𝑎𝑙𝑡. 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑑𝑒𝑟𝑒𝑐ℎ𝑎 ϴ < 𝛳 alt. unilateral izquierda 5.- Procedimiento o pasos para probar una hipótesis estadística Plantear las hipótesis Determinar el nivel de significación (𝛼) o confianza (1-𝛼) ,donde 𝛼 ,es el margen de error que el investigador está dispuesto a cometer. 2 Construir la variable pivotal o estadístico de prueba , bajo la suposición que H0 es cierta. Esto es : 𝑉 = : .Esto es un número para rechazar o no H0 . Formular la Regla de Decisión, a partir del paso anterior. Si el 𝑉 cae en la región de área :1−𝛼 no se rechaza y si cae en la región de área igual a 𝛼 se rechaza la hipótesis nula. Tomar una decisión. 6.-Tipos de errores Error tipo I (e1): Es el error que se comete cuando se rechaza H0 siendo cierta. Error tipo II (e2): Es el error que se comete cuando no se rechaza H0 y es cierta H1 . En la siguiente tabla se resumen los dos tipos de errores: H0 es verdadera H1 es verdadera Sustentar H0 No hay error e2 Sustentar H1 e1 No hay error Donde P(e1)=𝛼 y P(e2)=𝛽 La probabilidad de rechazar la hipótesis nula cuando es falsa es igual a 1–β. Este valor es la potencia de la prueba. OBSERVACIÓN: Analicemos estos dos tipos de errores, mediante un hipotético planteo de hipótesis: H0: µ≥6,2 versus H1:µ<6,2 En la siguiente figura, si se rechaza H0 al 5%, significa que se está aceptando que µ < 6,2 , o sea que la proporción de los resultados de la muestra que ocurriría en la Región de Rechazo si la hipótesis nula fuera verdadera ,es del 5% (ERROR DEL TIPO I) 3 En la segunda figura, si no se rechaza H0, mientras que el valor correcto fuera por ejemplo 3.8, la aceptación sería incorrecta de que la media de la muestra aleatoria supere el valor 5,dado que la media de todas los datos en cuestión es realmente 3.8), con una probabilidad de aproximadamente el 13% ( ERROR DE TIPO II) . 7.-Pruebas de significación de una y de dos colas Que una prueba de significación tenga una o dos colas , tiene relación, con el planteo de la hipótesis alternativa . De modo que si en H1 se plantea la relación ≠, se tienen dos colas que son zonas de rechazo. Mientras que si plantea la relación > ó < , habrá una sola cola , cola derecha en el primer caso e izquierda en el segundo. x y f(X) Región de aceptación Región de rechazo (error de tipo I) 0.05 3.8 6.2 I x y f(X) 0.05 3.8 I 3.05 Rechazo correcto de la hipótesis nula Aceptación incorrecta de la hipótesis nula ( error de tipo II) 3.8 0.12 4 a)El siguiente diagrama representa una prueba de una cola. En este caso ,la región de rechazo está sólo en la cola derecha ( superior) . Ello significa que en H1 se ha planteado la relación “>”. b) El siguiente diagrama representa una prueba de dos colas. Ello significa que en H1 se ha planteado la relación “≠”.Por otra parte , cada una de las colas ,tendrá la mitad del valor de significación 𝛼. 5 8.-El p- valor Una vez obtenida la muestra, se puede calcular una cantidad que sí permite resumir el resultado del experimento de manera objetiva. Esta cantidad es el p-valor que corresponde al nivel de significación más pequeño posible que puede escogerse, para el cual todavía se aceptaría la hipótesis alternativa con las observaciones actuales. Cualquier nivel de significación escogido inferior al p-valor (simbólicamente pv) comporta aceptar H0. Obviamente, al ser una probabilidad, se cumple que: 0 ≤ pv ≤ 1 El p-valor es una medida directa de lo verosímil que resulta obtener una muestra como la actual si es cierta H0. Los valores pequeños indican que es muy infrecuente obtener una muestra como la actual, en cambio, los valores altos que es frecuente. El p-valor se emplea para indicar cuánto (o cuán poco) contradice la muestra actual la hipótesis alternativa. Informar sobre cual es el p-valor tiene la ventaja de permitir que cualquiera decida qué hipótesis acepta basándose en su propio nivel de riesgo α. Esto no es posible cuando se informa, como ha sido tradicional, indicando sólo el resultado de la decisión, es decir, si se acepta o se rechaza H0 con un α fijo. Al proporcionar el p-valor obtenido con la muestra actual, la decisión se hará de acuerdo a la regla siguiente: si pv ≤ α, rechazar H0 , si pv > α, no rechazar H0 Podemos decir que el p –valor se toma como una medida de credibilidad para rechazar o no la hipótesis nula .El siguiente cuadro ayuda a interpretar los valores de p: Interpretación del peso de la evidencia contra H0 Si el valor de es menor que : a)0,10 se tiene alguna evidencia de que H0 no es verdadera. b)0,05 se tiene una fuerte evidencia de que H0 no es verdadera. c)0,01 se tiene una muy fuerte evidencia de que H0 no es verdadera. d)0,001 se tiene una evidencia extremadamente fuerte de que H0 no es verdadera 9.-Modelos de Pruebas de Hipótesis Para la Media Poblacional (µ) H0: 𝜇=𝜇 versus H1 𝜇 ≠ 𝜇 𝜇 > 𝜇 𝜇 < 𝜇 6 El estadístico de prueba es :Z= ̅ /√ ~𝑁(0,1) Cuando la varianza poblacional es desconocida, utilizamos el estimador de la desviación estándar, es decir, reemplazamos s por σ, obteniendo : T= ̅ /√ ~𝑡 . Para la Proporción Poblacional (π) H0: 𝜋=𝑝 versus H1 𝜋 ≠ 𝑝 𝜋 > 𝑝 𝜋 < 𝑝 El estadístico de prueba es :Z= ̅ .( )/ ~𝑁(0,1) donde �̂� = Aquí, si una muestra simple al azar de tamaño n se extrae de una población donde la proporción de éxitos es p , y si n es grande ,entonces : �̂�~𝑁(𝑝, ( ) ) Para la Diferencia de Medias Poblaciones ( donde se tienen dos muestras aleatorias independientes de igual o distinto tamaño). H0: 𝜇 -𝜇 = 0 versus H1 ⎩ ⎪ ⎨ ⎪ ⎧ 𝜇 − 𝜇 ≠ 0 𝜇 − 𝜇 > 0 𝜇 − 𝜇 < 0 El estadístico de prueba es :Z= ̅ ̅ ~𝑁(0,1) Aquí, si tenemos dos muestras aleatorias independientes provenientes de dos poblaciones con distribuciones N(𝜇 , 𝜎 ) 𝑦 N(𝜇 , 𝜎 ), de tamaños n1 y n2 respectivamente .Tenemos que : �̅� − �̅� ~𝑁(𝜇 1 -𝜇 ,𝜎 ( + )) Si las varianzas poblacionales no son conocidas ,pero se suponen iguales, se reemplaza el desvío estándar por sa ,donde ésta es la varianza amalgamada: sa= ( ). ( ). Entonces el estadístico:T= ( ̅ ) ( ) . ~𝑡𝑛1+𝑛2−2 7 Para la Diferencia de Proporciones Poblaciones( donde se tienen dos muestras aleatorias independientes de igual o distinto tamaño) H0: 𝜋 -𝜋 = 0 versus H1 ⎩ ⎪ ⎨ ⎪ ⎧ 𝜋 − 𝜋 ≠ 0 𝜋 − 𝜋 > 0 𝜋 − 𝜋 < 0 El estadístico de prueba es: Z= .( )( 1 𝑛1 + 1𝑛2 ) ~𝑁(0,1) donde �̂� = Para la Diferencia de Muestras Poblacionales (donde se tienen muestras apareadas, esto es, la observación de un conjunto de datos está directamente relacionada con una observación específica en otro conjunto de datos). En un diseño de este tipo, los dos conjuntos deben tener el mismo conjunto de observaciones. H0: 𝜇 = 0 versus H1 ⎩ ⎪ ⎨ ⎪ ⎧ 𝜇 ≠ 0 𝜇 > 0 𝜇 < 0 El estadístico de prueba es: t= /√ t n-1 donde �̅�= ∑ y la desviación estándar de las diferencias es : 𝑠 = ∑ ( )
Compartir