Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
TEST DE HIPÓTESIS En las unidades anteriores vimos como se puede estimar un parámetro a partir de los datos contenidos en una muestra. Puede encontrarse ya sea, un sólo número (estimador puntual), ó, un intervalo de valores posibles (intervalo de confianza). Sin embargo muchos problemas requieren que se tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe el nombre de hipótesis. 1 ¿Qué es una Hipótesis? Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones. Ejemplo: Supongamos que nos interesa saber si la altura media de los estudiantes del curso es de 1,65 m. Esto puede expresarse de manera formal como dos alternativas ó hipótesis. 2 H0: μ = 1,65 m H1: μ 1,65 m La proposición H0: μ = 1,65 se conoce como hipótesis nula; mientras que la proposición H1: μ 1,65 recibe el nombre de hipótesis alternativa. A este procedimiento se lo conoce como prueba de hipótesis bilateral. Podría sólo considerarse un caso en la hipótesis alternativa, o sea, que la hipótesis alternativa especifique valores de μ que pueden ser mayores o menores que 1,65 m, es decir, 3 H0: μ = 1,65 m H1: μ > 1,65 m H0: μ = 1,65 m H1: μ < 1,65 m A este procedimiento se lo conoce como prueba de hipótesis unilateral. Es importante recordar que las hipótesis siempre son proposiciones sobre la población bajo estudio, no proposiciones sobre la muestra. Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el nombre de prueba de hipótesis. Los procedimientos de prueba de hipótesis dependen del empleo de la información contenida en la muestra aleatoria de la población de interés. 4 Si esta información es consistente con la hipótesis, se concluye que esta es verdadera; sin embargo, si esta información es inconsistente con la hipótesis, se concluye que esta es falsa. Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la población. Usualmente esto es imposible, por tanto, es necesario desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la probabilidad de llegar a una conclusión equivocada. 5 La hipótesis alternativa, representada por H1, es la afirmación contradictoria a H0, y ésta, generalmente, es la hipótesis a investigar. La hipótesis nula se rechaza a favor de la hipótesis alternativa, sólo si la evidencia muestral sugiere que H0 es falsa. Si la muestra no contradice decididamente a H0, se continúa creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son: Rechazar H0 No rechazar H0 6 7 8 9 Realidad D ec is ió n H0 es Verdadera H0 es Falsa Aceptar H0 Rechazar H0 Bien Bien Error Error de tipo I de tipo II 10 = P(cometer error de tipo I) = = P(Rechazar H0 y en realidad es H0 Verdadera) = P(cometer error de tipo II) = = P(Aceptar H0 y en realidad es H0 Falsa) Lo que uno quisiera es que y fuesen pequeñas, pero si una disminuye la otra aumenta la fija el experimentador con un valor pequeño: 0,05; 0,01; ... puede tomar cualquier valor grande o pequeño = Nivel de significación del Test 11 Juez ante un acusado: sus dos hipótesis son Inocente o Culpable. ¿Cuál sería H0 y H1? Principio jurídico: Toda persona es inocente hasta que se pruebe que es culpable Los dos posibles errores son: • Decidir culpable y en realidad es inocente • Decidir inocente y en realidad es culpable H0: Inocente H1: Culpable = P(Rechazar H0 si en realidad es H0 Verdadera) = P(Decidir culpable si en realidad es inocente) = pequeña De las dos hipótesis posibles, lo que se quiere probar con más seguridad se debe colocar en H1 12 Llamamos potencia de un test de hipótesis a la probabilidad de no cometer Error de Tipo II. = P(rechazar H0 si en realidad H0 es falsa) Definición de Potencia () = 1 - Es la probabilidad de rechazar H0 si en realidad H0 es falsa. 13 Ejemplo Un laboratorio hace una propaganda en la que dice que el tiempo medio en que su aspirina calma el dolor de cabeza es menor que 15 minutos. Otro laboratorio de la competencia, sospecha que lo que dice la propaganda no es cierto. Quiere decidir si le hace juicio o no acusándolo de propaganda desleal. ¿Qué hipótesis plantearía? X = Tiempo en que la aspirina de la propaganda calma el dolor de cabeza Suposición: X ~ N(m ; s) 14 La propaganda dice: m < 15 Las dos únicas posibilidades son plantear: H0: m 15 H1: m < 15 H0: m 15 H1: m > 15 Decidir m < 15 significa no acusarlo de propaganda desleal Decidir m > 15 significa acusarlo de propaganda desleal m = Tiempo medio en que la aspirina de la propaganda calma el dolor de cabeza 15 = P(Hacer juicio acusándolo de propaganda desleal y en realidad la propaganda es cierta) = P(Decidir m > 15 y en realidad es m 15) = P(Rechazar H0 y en realidad es H0 Verdadera) H0: m 15 H1: m >15 De los dos posibles errores, el de probabilidad será el que queremos controlar, es decir, el que queremos que tenga pequeña probabilidad de ocurrir. 16 • Definir las variables aleatorias. • Establecer las suposiciones necesarias. • Plantear la hipótesis nula y la alternativa. • Definir el estadístico de prueba. • Fijar el nivel de significación (). • Determinar la zona de rechazo, en función de . • Calcular el valor del estadístico de prueba en la muestra • Tomar la decisión. • Interpretar la decisión en términos estadísticos. • Interpretar la decisión en los términos del problema. Procedimiento de test de hipótesis Definiciones Estadístico de prueba Es un valor que se determina a partir de la información de la muestra, es utilizado para decidir si se rechaza o no la hipótesis nula. Valor crítico El punto que divide la región entre el lugar en el que la hipótesis nula es rechazada y no rechazada. 17 18 Test de Gauss para una media Suposición: X ~ N(m ; s) s es conocida m0 es un número conocido depende del problema Estadístico de prueba: Si µ = µ0 entonces Z ~ N(0;1) Para cada una de las posibles situaciones hay que determinar la zona de rechazo H0: m m0 H1: m > m0 H0: m m0 H1: m < m0 H0: m = m0 H1: m m0 n X Z s m0= 19 = P(Rechazar H0 si en realidad es H0 Verdadera) Se rechaza H0 para valores grandes de Z Zona de rechazo: Z.R.: Z ? ? = Z Z.R: Z Z H0: m m0 H1: m > m0 20 = P(Rechazar H0 si en realidad es H0 Verdadera) H0: m m0 H1: m < m0 Se rechaza H0 para valores de Z muy negativos Zona de rechazo: Z.R: Z -? -? = - Z Z.R: Z Z 21 = P(Rechazar H0 si en realidad es H0 Verdadera) H0: m = m0 H1: m m0 Se rechaza H0 para valores de Z muy grandes o muy negativos Zona de rechazo: Z.R. Z -? ó Z ? ? = Z /2 Z.R: Z Z /2 Test de dos colas 22 Test de Gauss para una media Resumen Suposición: X ~ N(m ; s) s es conocida Zona de Rechazo (Z.R.) H0: m m0 H1: m > m0 Z Z H0: m m0 H1: m < m0 Z Z H0: m = m0 H1: m m0 Z Z /2 m0 es un número conocido Estadístico de prueba: n X Z s m0= 23 EJEMPLO Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado, muestra una vida promedio de 71,8 años. Supongamos que la desviación estándar poblacional es 8,9 años. Queremos probar si la vida media hoy en día es mayor a 70 años con base en esa muestra. La muestra parecería indicar que es así, pero, ¿cuál es la probabilidad de que la media de la muestra no refleje la verdadera media de la población? 24 Solución Se trata de una distribución muestral de medias con desviación estándar conocida. Datos μ = 70 años σ = 8,9 años = 71,8 años n = 100 α = 0,05 X 25 Establecemos las hipótesis H0: m ≤ 70 H1: m > 70 Nivel de significación α = 0,05Zα = 1,645 Regla de decisión Si Z ≤ 1,645 no se rechaza H0 Si Z > 1,645 se rechaza H0 1,645μ = 0 26 Cálculos 02,2 100 9,8 708,71 = = = n X Z s m Decisión Como 2,02 > 1,645 se rechaza H0 Conclusión La vida media es mayor que 70 años. 27 Ejemplo de la aspirina (de la dispositiva 14) Se administró la aspirina a 25 personas y se obtuvo una media muestral de 17 minutos. Suponiendo que la varianza poblacional es 36 min2, ¿cuál será la decisión del laboratorio con un nivel de significación del 5%? X = Tiempo (min) en que la aspirina de la propaganda calma el dolor de cabeza Suposición: X ~ N(m ; s) s conocida s = 6 H0: m 15 H1: m >15 n X Z 6 15 = 28 P(Decidir que m >15 si en realidad es m 15) = = 0,05 = 0,05 Z.R. Z Z = 1,645 Zm =1,667 > 1,645 Se rechaza H0 Se decide m > 15 ¿Cuál es la probabilidad de error? “Tiempo medio en que la aspirina de la propaganda calma el dolor de cabeza es mayor que 15 minutos” 667,1 256 1517 Zm = = El laboratorio decide acusarlo de propaganda desleal y la probabilidad de equivocarse en la decisión es 5%. La probabilidad de error de esta afirmación es menor que 5% 29 Justificación que la condición más desfavorable, al determinar la zona de rechazo, ocurre si µ = 15 )1; n/ 15 (N~ n 15X Z s m s = H0: m 15 H1: m > 15 Se determinó como zona de rechazo Z > 1,645 La distribución del estadístico de prueba es: P(error de tipo I) = P(Rechazar H0 si es verdadera) = = P(Z 1,645 si µ < 15) < 0,05 30 ¿Cuál hubiese sido la decisión si = 0,01? Z0,01 = 2,326 Z.R: Z 2,326 Zm = 1,667 < 2,326 Z.R: Z Z No se rechaza H0 con probabilidad de error menor que 0,01 En el test: H0: µ µ0 H1: µ > µ0 Tomar µ = µ0 como valor de m si H0 es verdadera para determinar la zona de rechazo Z Z es correcto porque el verdadero nivel de significación es menor que . 31 P = Nivel Justo de Significación es el menor con el que se rechaza H0 Si con nivel de significación se rechaza H0 es P Si con nivel de significación no se rechaza H0 es P > El tiempo medio en que la aspirina de la propaganda calma el dolor de cabeza es mayor que 15 minutos. P 0,05 32 En el ejemplo, hallar el verdadero valor de P. Z.R: Z Z Zm = 1,667 P = P ( Z Zm siendo Z ~ N(0;1) ) = P ( Z 1,667) = = 1 – F(1,67) = 1 – 0,9525 = 0,0475 P = 0,0475 33 Representación gráfica de , y H0: m m0 H1: m > m0 Z.R.: Z > Z = P(Rechazar H0 si en realidad es H0 Verdadera) = P(Aceptar H0 si en realidad es H0 Falsa) 34 = P(rechazar H0 si en realidad H0 es falsa) = P(Z Z si µ > µ0) 35 Relación entre y m H0: m m0 H1: m > m0 Z.R.: Z Z y n fijos si m está lejos de m0 disminuye 36 Relación entre y H0: m m0 H1: m > m0 Z.R.: Z Z n fijo si disminuye, aumenta 37 Test de Student para una media Suposición: X~N(m ; s) m y s son desconocidos Para aplicar el test de Student para una media es necesario verificar el cumplimiento de los supuestos del modelo. Es decir, debemos verificar que la variable sigue una distribución aproximadamente normal. 38 Test de Normalidad Estos contrastes se realizan para comprobar la hipótesis nula de que la muestra ha sido extraída de una población con distribución normal, se pueden realizar gráfica y analíticamente. El gráfico Q-Q plot representa los datos observados de la variable frente a los datos esperados si la distribución fuera normal. Si los puntos están cerca de la diagonal podemos decir que la distribución es normal. 39 Test de Normalidad en Infostat Prueba de normalidad en InfoStat (Shapiro- Wilks modificado) permite probar si la variable en estudio tiene distribución normal. Las hipótesis de la prueba son: H0: las observaciones tienen distribución normal versus H1: las observaciones no tienen distribución normal 40 Test de Normalidad en Infostat Ejemplo (Nadadoras Experimentador 1) 41 Test de Normalidad en Infostat Ejemplo 8,70 10,42 12,13 13,85 15,57 Cuantiles de una Normal(12,18,4,7951) 8,70 10,42 12,13 13,85 15,57 C u a n ti le s o b s e rv a d o s (P E S O M A S A G R A S A ) n= 10 r= 0,982 (PESO MASA GRASA) Q-Q PLOT 42 Test de Normalidad en Infostat Ejemplo 43 Test de Normalidad en Infostat Ejemplo Shapiro-Wilks (modificado) Variable n Media D.E. W* p(Unilateral D) PESO MASA GRASA 10 12,18 2,19 0,92 0,4872 Como p = 0,4872 (es decir, p > 0,05), no se rechaza H0, la variable sigue una distribución aproximadamente normal. 44 Test de Student para una media Suposición: X~N(m ; s) m y s son desconocidos Estadístico de prueba: Si µ = µ0 entonces, T ~ tn-1 Para cada una de las posibles situaciones hay que determinar la zona de rechazo m0 es un número conocido depende del problema H0: m m0 H1: m > m0 H0: m m0 H1: m < m0 H0: m = m0 H1: m m0 nS X T 0 m = 45 = P(Rechazar H0 si en realidad es H0 Verdadera) H0: m m0 H1: m > m0 Se rechaza H0 para valores grandes de T Zona de rechazo: Z.R.: T > ? ? = tn-1; Z.R: T > tn-1; 46 = P(Rechazar H0 si en realidad es H0 Verdadera) H0: m m0 H1: m < m0 Se rechaza H0 para valores de T muy negativos Zona de rechazo: Z.R: T < -? -? = - tn-1; Z.R: T < tn-1; 47 = P(Rechazar H0 si en realidad es H0 Verdadera) H0: m = m0 H1: m m0 Se rechaza H0 para valores de T muy grandes o muy negativos Zona de rechazo: Z.R. T < -? ó T > ? ? = tn-1; /2 Z.R: T > tn-1; /2 Test de dos colas 48 Test de Student para una media Resumen Suposición: X~N(m ; s) m y s son desconocidos Z.R. H0: m m0 H1: m > m0 T > tn-1; H0: m m0 H1: m < m0 T < - tn-1; H0: m = m0 H1: m m0 T > tn-1; /2 Estadístico de prueba: nS X T 0 m = 49 Suposición: X ~ N(m ; s) s desconocida Ejemplo de la aspirina suponiendo que s es desconocida y que en la muestra resultó s = 6 = 0,05 X = Tiempo (min) en que la aspirina de la propaganda calma el dolor de cabeza H0: m 15 H1: m >15 nS 15X T = nS X T 0 m = 50 Z.R.: T > 1,711 Tm = 1,667 < 1,711 No se rechaza H0 Z.R. T > tn-1; tn-1; = t24; 0,05 = 1,711 ¿Cuál es la probabilidad de error al decidir H0) m 15? 667,1 256 1517 Tm = = Como la decisión es aceptar H0, se comete error si H0 es Falsa. Por lo tanto, la probabilidad de error es β. 51 Como puede tomar cualquier valor se dice: “m no es significativamente mayor que 15” “El tiempo medio en que la aspirina de la propaganda calma el dolor de cabeza no es significativamente mayor que 15 minutos” Juez: Culpable o queda libre por falta de pruebas • Si se rechaza H0 se afirma H1 con P < • Si no se rechaza H0 no se puede decir nada porque la probabilidad de error es 52 Test de hipótesis mediante un intervalo de confianza Para un parámetro desconocido se tiene un intervalo de confianza de nivel 1-: (L1 ; L2) P (L1 < < L2 ) = 1 - Se plantea un test de hipótesis de dos colas para : H0: = 0 H1: 0 0 es conocido Si se toma como regla de decisión: rechazar H0 si 0 no pertence al intervalo de confianza, el nivel de significación de este test es 53 Un investigador está interesado en comparar el efecto de 2 hormonas (A y B) de crecimiento sobre la longitud total alcanzada por una leguminosa. Para ello se tomó una muestra de 20 plantas, asignando al azar 10 a cada hormona. Se quiere determinar si hay diferencias significativas entre los crecimientos producidos por ambas hormonas a un nivel del 5%. Ejemplo 1 (2 muestras) 54 X1 = crecimiento producido por la hormona A sobre la longitud de leguminosas X2 = crecimiento producido por la hormona B sobre la longitud de leguminosas Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes Planteo del problema 55 Se necesita aplicar un test de hipótesis para podertomar la decisión. Se debe usar un Test para diferencia de medias H0: m1 = m2 H1: m1 m2 56 Ejemplo 2 (2 muestras) A 7 pacientes acromegálicos se les realizó una prueba de tolerancia a la glucosa. A cada uno de ellos se le midió la Glucemia (mg/dl) en ayunas y a los 120 minutos después de tomar una dosis de glucosa. Se quiere decidir si, en los pacientes acromegálicos, hay variación en la glucemia media en ayunas y a los 120 minutos. 57 Suposiciones: X2 - X1 ~ N(md ; sd) X1 y X2 no son independientes X1 = Glucemia (mg/dl) en ayunas en pacientes acromegálicos X2 = Glucemia (mg/dl) a los 120 minutos después de tomar una dosis de glucosa en pacientes acromegálicos Planteo del problema H0) m1 = m2 H1) m1 m2 Ambas mediciones se hicieron sobre las mismas personas, X1 y X2 no son independientes, se dice que son muestras apareadas. 58 MUESTRAS INDEPENDIENTES PAREADAS PRUEBAS PARA DIFERENCIA DE MEDIAS 59 Test de Gauss para diferencia de medias en muestras independientes Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes, s1 y s2 conocidas Estadístico de prueba: a valor conocido, generalmente es 0 H0: m1 m2 a H1: m1 - m2 > a H0: m1 m2 a H1: m1 m2 < a H0: m1 m2 = a H1: m1 m2 a 2 2 2 1 2 1 21 nn aXX Z s s = 60 Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes s1 y s2 conocidas Se toma una muestra aleatoria de tamaño n1 de X1 y una muestra de tamaño n2 de X2, independiente de la anterior, entonces s s mm 2 2 2 1 2 1 2121 nn ;N~XX 1;0N~ nn XX 2 2 2 1 2 1 2121 s s mm o bien Propiedad 6.1 Demostración 61 H0: m1 m2 a H1: m1 - m2 > a ¿Cuál es la zona de rechazo? Si H0) es verdadera consideramos m1 m2 = a, entonces Z ~ N(0 ; 1) Se rechaza H0 para valores grandes de Z Zona de rechazo: Z.R.: Z ? Z.R.: Z Z Las otras zonas de rechazo se determinan análogamente 2 2 2 1 2 1 21 nn aXX Z s s = 62 Test de Gauss para diferencia de medias en muestras independientes - Resumen Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes, s1 y s2 conocidas Z.R. H0: m1 m2 a H1: m1 - m2 > a Z Z H0: m1 m2 a H1: m1 m2 < a Z Z H0: m1 m2 = a H1: m1 m2 a Z Z /2 Estadístico de prueba: 2 2 2 1 2 1 21 nn aXX Z ss = 63 La variable aleatoria Y sigue distribución F de Fisher con n1 grados de libertad en el numerador y n2 grados de libertad en el denominador (Y ~ ) , si y sólo si 22 11 n/X n/X Y = X1 ~ ; X2 ~ ; X1 y X2 independientes 21;nn F 2 1n 2 2n Distribución F de Fisher 64 Si Y ~ P( Y > ) = T A B L A 21;nn F ;; 21 nn F Distribución F de Fisher 65 La tabla sólo da los puntos críticos para = 0,01 = 0,05 = 0,10 Si se necesitan puntos críticos para = 0,90 = 0,95 = 0,99 hay que calcularlos a partir de los valores de la tabla utilizando la siguiente propiedad. Distribución F de Fisher 66 12 21 n;n; n;n;1 F 1 F = Propiedad 6.4 67 Si Y ~ tn entonces Y 2 ~ F1 ; n Propiedad 6.5 Demostrar 68 Y ~ tn entonces Demostración nX Z Y / = Z ~ N(0;1) X Z y X son independientes n X Z Y 2 2 = Z2 ~ 2 1 entonces Y2 ~ F1 ; n 69 n;1; 2 n;2/ F)t( = Propiedad 6.6 70 X1 ~ N(μ1;σ1) ; X2 ~ N(μ2;σ2) X1 y X2 independientes S1 2 es la varianza de una muestra aleatoria de X1 de tamaño n1 S2 2 es la varianza de una muestra aleatoria de X2 de tamaño n2 1;12 1 2 2 2 2 2 1 21 ~ nnF S S s s Propiedad 6.7 Demostrar 71 2 12 1 2 11 1 ~ )1( n Sn s Demostración 2 12 2 2 22 2 ~ )1( n Sn s 1;1 2 2 2 2 22 1 2 1 2 11 21 ~ )1( )1( )1( )1( nnF n Sn n Sn s s 72 Test F para comparar dos varianzas Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes H0: s1 2 s2 2 H1: s1 2 > s2 2 H0: s1 2 s2 2 H1: s1 2 < s2 2 H0: s1 2 = s2 2 H1: s1 2 s2 2 Estadístico de prueba: Para determinar las zonas de rechazo se debe conocer la distribución que sigue F si H0 es verdadera 2 2 2 1 S S F = 73 Habíamos visto que si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes y se toma una muestra aleatoria de tamaño n1 de X1 y una muestra de tamaño n2 de X2 , independiente de la anterior, con S1 2 y S2 2 sus varianzas muestrales, entonces 1n;1n2 1 2 2 2 2 2 1 21 F~ S S s s Si H0 es verdadera consideramos s1 2 = s2 2 1n;1n2 2 2 1 21 F~ S S F = 74 = P(Rechazar H0 si en realidad es H0 Verdadera) Se rechaza H0 para valores grandes de F Zona de rechazo: Z.R.: F A H0: s1 2 s2 2 H1: s1 2 > s2 2 ;1n;1n 21 FA = Z.R.: F ;1n;1n 21F 75 H0: s1 2 s2 2 H1: s1 2 < s2 2 Se rechaza H0 para valores pequeños de F Zona de rechazo: Z.R.: F B B = 1;1n;1n 21F Z.R.: F 1;1n;1n 21F 76 H0: s1 2 = s2 2 H1: s1 2 s2 2 Z.R.: F C o F D = P(Rechazar H0 si en realidad es H0 Verdadera) 2/1;1n;1n 21 F C = 2/;1n;1n 21F D = Z.R.: F 2/1;1n;1n 21F 2/;1n;1n 21 F o F 77 En la aplicación práctica de este test surge el inconveniente que la tabla de la distribución F tiene únicamente los puntos críticos para = 0,01; = 0,05 y = 0,10 . Para solucionar este trastorno y utilizar sólo los valores que están en la tabla, se recurre a la siguiente regla práctica: Para determinar las zonas de rechazo limitadas por o por hay que emplear a la fórmula que relaciona F con F 1-. 2/;1n;1n 21 F 2/1;1n;1n 21 F 78 Regla práctica Al plantear el problema, elegir las variables aleatorias de modo que si el test es de una cola sea: nM = tamaño de la muestra de S 2 Mayor nm = tamaño de la muestra de S 2 menor 2 2 menor Mayor m s s F = H0: s1 2 s2 2 H1: s1 2 > s2 2 El estadístico de prueba en la muestra se calcula: 79 Siempre es Fm > 1 y sólo hay que verificar si está o no dentro de la zona de rechazo de la derecha H0: s1 2 s2 2 H1: s1 2 > s2 2 ;1n;1n mM FF Z.R. H0: s1 2 = s2 2 H1: s1 2 s2 2 F 2/;1n;1n mMF Z.R. 80 A un grupo de 18 varones hipertensos delgados se les da un tratamiento con amlodipina. Nueve de ellos toman 5 mg por día y a los otros 10 mg por día. Al cabo de un mes se les realiza una presurometría ambulatoria y se registra el valor de la PAS 7-23hs. Se quiere decidir si la PAS 7-23hs media de los que toman 5 mg, difiere de la de los que toman 10 mg, determinando el nivel justo de significación. Aplicación 81 X1 = PAS 7-23hs de la presurometría ambulatoria de varones hipertensos delgados después de tomar 5mg de amlodipina por día durante un mes X2 = PAS 7-23hs de la presurometría ambulatoria de varones hipertensos delgados después de tomar 10mg de amlodipina por día durante un mes Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes H0) m1 = m2 H1) m1 m2 Se necesita aplicar un test de hipótesis para poder tomar la decisión. Se debe usar un Test para diferencia de medias 82 Cuando se utiliza el test de Student para muestras independientes hay que suponer que s1 = s2 . Se puede aplicar el test de igualdad de varianzas para verificar esta suposición. Se aplicará este test en el ejemplo en que se comparaban las dosis de 5 y 10 mg de amlodipina (Diapositiva 97) H0: s1 = s2 H1: s1 s2 ¿Qué valor de se elige? Como se quiere aceptar H0, la probabilidad de error será . Se elige grande para que sea pequeño. Aplicación 83 = 0,10 Z.R.: F > F8; 8; 0,05 = 3,44 No se rechaza H0 s1 no difiere significativamente de s2 Es válido aplicar el test de Student • Si se rechaza H0 es s1 s2 . No puede aplicarse el test de Student. • Se puede efectuar una transformación a los datos de manera que las varianzas sean homogéneas • Se puede aplicar el test con la corrección de Welch. 2 2 menor Mayor ms s F = 017,1 385,5 431,5 2 2 ==mF 84 Test de Student para dos medias en muestras independientes Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes, s1 = s2 s1 se estima con S1 y s2 se estima con S2, pero s1 = s2 = s ¿cómo se estima s? Con un promedio “pesado” de S1 y S2 que se llama Sp H0: m1 m2 a H1: m1 - m2 > a H0: m1 m2 a H1: m1 m2 < a H0: m1 m2 = a H1: m1 m2 a 85 2nn S)1n(S)1n( S 21 2 22 2 112 p = Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes, s1 = s2 = s Se toma una muestra aleatoria de tamaño n1 de X1 y una muestra de tamaño n2 de X2, independiente de la anterior, S1 2 y S2 2 son sus varianzas muestrales, entonces 2 2nn2 2 p21 21 ~ S)2nn( s pSˆ =s Propiedad 6.2 86 Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes, s1 = s2 = s Se toma una muestra aleatoria de tamaño n1 de X1 y una muestra de tamaño n2 de X2, independiente de la anterior, S1 2 y S2 2 son sus varianzas muestrales. Entonces: 2nn 21 p 2121 21 t~ n 1 n 1 S XX mm Propiedad 6.3 87 Las zonas de rechazo para cada hipótesis alternativa se determinan en forma similar al test de Student para una media, sólo cambian los grados de libertad Si H0 es verdadera consideramos m1 m2 = a, entonces El estadístico de prueba es: 2nn 21 t~T 21 p 21 n 1 n 1 S aXX T = 88 Test de Student para dos medias en muestras independientes Resumen Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes, s1 = s2 2nn S)1n(S)1n( S 21 2 22 2 112 p =Estadístico de prueba H0: m1 m2 a H1: m1 - m2 > a T > H0: m1 m2 a H1: m1 m2 < a T < - H0: m1 m2 = a H1: m1 m2 a T > Z.R. ;2nn 21 t ;2nn 21 t 2/;2nn 21 t 21 21 11 nn S aXX T p = 89 Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes, s1 = s2 H0: m1 = m2 H1: m1 m2 Ejemplo 1 90 Los datos obtenidos fueron: Primero se calculan la media y los desvíos de cada muestra. Parece lógico suponer que s1 = s2 n1 = n2 = 10 Ejemplo 1 (2 muestras) Hormona A Hormona B 10 15 10 11 13 16 12 17 10 18 8 9 12 14 11 12 16 15 15 16 Media 11,7 14,3 s 2,45 2,83 91 2nn S)1n(S)1n( S 21 2 22 2 112 p = Estadístico de prueba: Z.R: T > t18; 0,05/2 = 2,101 Z.R: T > 2,11 = 0,05 Notar que si n1 = n2 entonces es: 2 SS S 2 2 2 12 p = 21 p 21 n 1 n 1 S aXX T = 2/;2nn 21 t 0057,7 18 )83,2.(9)45,2.(9 222 = =ps 92 Tm = 2,1965 > 2,101 Rechazo H0 Existen diferencias significativas entre los crecimientos producidos por ambas hormonas a un nivel del 5%. 1965,2 10 1 10 1 0057,7 3,147,11 = =mT 93 Utilización del paquete estadístico INFOSTAT CRECIMIENTO HORMONA 10 1 10 1 13 1 12 1 10 1 8 1 12 1 11 1 16 1 15 1 15 2 11 2 16 2 17 2 18 2 9 2 14 2 12 2 15 2 16 2 94 Utilización del paquete estadístico INFOSTAT 95 Utilización del paquete estadístico INFOSTAT 1 2 HORMONA 8 10 13 16 19 C R E C IM IE N T O 96 Utilización del paquete estadístico INFOSTAT Prueba T para muestras Independientes Variable:CRECIMIENTO - Clasific:HORMONA - prueba:Bilateral Grupo 1 Grupo 2 1 2 n 10 10 Media 11,70 14,30 Media(1)-Media(2) -2,60 LI(95) -5,09 LS(95) -0,11 pHomVar 0,6757 T -2,20 gl 18 p-valor 0,0415 97 Test de Student para diferencia de medias en muestras pareadas Suposiciones: D ~ N(md ; sd) X1 y X2 se miden en el mismo individuo Se define la variable diferencia: D = X1 - X2 H0: m1 m2 a H1: m1 - m2 > a H0: m1 m2 a H1: m1 m2 < a H0: m1 m2 = a H1: m1 m2 a 98 Si X2 se mide antes de un tratamiento y X1 después, sobre el mismo individuo, D mide el efecto del tratamiento. Suposición: D ~ N(mD; sD) mD = m1 - m2 H0: mD a H1: mD > a H0: mD a H1: mD < a H0: mD = a H1: mD a Las hipótesis escriben en función de mD: Se aplica el Test de Student para una media (mD) ya que sD es desconocida 99 Con los datos de la variable D se efectúa el test Estadístico de prueba: = = n 1i iD n 1 D Z.R. H0: mD a H1: mD > a T tn-1; H0: mD a H1: mD < a T - tn-1; H0: mD = a H1: mD a T tn-1; /2 = = = n 1i 2 n 1i i 2 i 2 D n D D 1n 1 S nS aD T D = 100 Ejemplo 2 (2 muestras) Los datos siguientes corresponden a la prueba de tolerancia a la glucosa realizada en 7 pacientes acromegálicos. Se midió la Glucemia (mg/dl) en ayunas y a los 120 minutos después de tomar una dosis de glucosa. Se quiere decidir si hay variación en la glucemia media. Paciente 1 2 3 4 5 6 7 en ayunas 81 77 85 82 97 86 78 a los 120 minutos 76 84 83 95 92 97 84 X1 = Glucemia (mg/dl) en ayunas X2 = Glucemia (mg/dl) a los 120 minutos Diferencia 5 -7 2 -13 5 -11 -6 101 Suposición: D ~ N(mD; sD) H0) mD = 0 H1) mD 0 Z.R. T tn-1; /2 = 0,05 t6; /2 = 2,447 Z.R. T > 2,447 D = X1 - X2 = variación de la glucemia durante la prueba mD = m1 - m2 nS aD T D = 102 Con los 7 valores de la variable D se calcula la media y el desvío estándar muestral sD = 7,5246 No se rechaza H0 No se halló diferencia significativa entre la glucemia media en ayunas y a los 120 minutos después de tomar la dosis de glucosa. 57,3d = T =1,255 < 2,447 255,1 75246,7 57,3 = =mT 103 Utilización del paquete estadístico INFOSTAT EN AYUNAS A LAS 2 HORAS 81 76 77 84 85 83 82 95 97 92 86 97 78 84 104 Utilización del paquete estadístico INFOSTAT Prueba T (muestras apareadas) Obs(1) Obs(2) N media(dif) DE(dif) T Bilateral EN AYUNAS A LOS 120 MINUTOS 7 -3,57 7,52 -1,26 0,2559 105 Se midió excreción urinaria de 5-HIAA (mg en 24 hs) en pacientes con cardiopatía carcinoide y en un grupo control sin cardiopatía carcinoide. Se obtuvieron los siguientes datos: Decidir si la excreción urinaria de 5-HIAA media es mayor en los pacientes con cardiopatía carcinoide. Ejemplo completo X1 = excreción urinaria de 5-HIAA (mg en 24 hs) en pacientes con cardiopatía carcinoide X2 = excreción urinaria de 5-HIAA (mg en 24 hs) en pacientes sin cardiopatía carcinoide con 63 120 135 180 1270 274 1585 288 350 891 150 603 721 sin 28 32 43 60 73 119 124 153 854 400 588 445 106 Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2 independientes; s1= s2 H0: m1 m2 H1: m1 > m2 El resumen de datos es: con sin Media 510 243 s 482,5 267,7 n 13 12 107 Se sospecha que no se cumple la suposición s1= s2 Se debe efectuar el test F para: H0: s1 = s2 H1: s1 s2 Z.R.: F > F12; 11; 0,05 = 2,79 25,3 7,267 5,482 F 2 2 m == 108 Se rechaza H0 No se puede aplicar el test de Student. ¿Qué se hace? Efectuamos la transformación logaritmo sobre los datos: Esto significa que se toma una nueva variable Y = log X Con los datos transformados, se calculan la media y la varianza muestral y resulta: Se puede efectuar una transformación a los datos o aplicar la corrección de Welch. 109 No se rechaza H0 Se acepta igualdad de varianzas y se puede aplicar el test de Student para las medias con los datos transformados. 221,0 21213 509,011432,012 s 22 2 p = = log con log sin Media 2,521 2,128 s 0,432 0,509 n 13 12 Fm < 2,72 H0: s1 = s2 H1: s1 s2 Z.R.: F > F11; 12; 0,05 = 2,7239,1 432,0 509,0 F 2 2 m == 110 Z.R: T > tn1+n2-2; t23; 0,05 = 1,714 = 0,05 Z.R: T > 1,714 Tm = 2,09 > 1,714 Se rechaza H0 La excreción urinaria de 5-HIAA media en los pacientes con cardiopatía carcinoide es significativamente mayor que en los pacientes sin cardiopatía carcinoide. P < 0,05 09,2 12 1 13 1 221,0 128,2521,2 Tm = = 111 Procedimientos a seguir si no secumplen las suposiciones del test de Student para diferencia de medias en muestras independientes • Hay dos variables aleatorias X1 y X2 • X1 y X2 son normales • X1 y X2 son independientes • Las varianzas de X1 y X2 son iguales Las suposiciones son: 112 Dos Variables Variables Normales Muestras Independientes Test de Student Muestras Independientes Varianzas Iguales ANOVA Métodos no paramétricos Test de muestras pareadas Efectuar una transformación Corrección de Welch NO NO NO NO SI SI SI SI
Compartir