Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística I Cuadernillo N° 9B PRUEBAS DE HIPÓTESIS -2- www.grupolamatriz.com PRUEBAS DE HIPÓTESIS A los supuestos que se hacen sobre los valores de los parámetros de una población se les denomina hipótesis. En una investigación estadística se tiene como propósito verificar la racionalidad de éstos supuestos o hipótesis. Al proceso de verificar la racionalidad de estos supuestos se le denomina prueba de hipótesis. Una prueba de hipótesis es un procedimiento basado en la evidencia muestral y en la teoría de la probabilidad, empleado para determinar si la hipótesis es un enunciado razonable. La estadística inferencial es la encargada de usar información de una muestra aleatoria para llevar a cabo las pruebas de hipótesis. Tipos de Hipótesis: Teniendo en cuenta que un proceso de decisión debe conducir a resultados sin ambigüedades, es necesario que el rango de valores de un parámetro sea particionado en dos hipótesis mutuamente excluyentes y complementarias. HIPÓTESIS PLANTEADA O NULA (Hp) Es el supuesto que se hace acerca del valor de un parámetro, cuya validez será verificada de acuerdo a la evidencia muestral captada. HIPÓTESIS ALTERNANTE (Ha) Es la hipótesis que se debe aceptar en caso de ser rechazada la hipótesis planteada. La prueba de hipótesis es un procedimiento de decisión para establecer la aceptación o rechazo de una hipótesis planteada. Los procedimientos de pruebas de hipótesis se han desarrollado para tomar decisiones sobre las hipótesis planteadas. La decisión que se tome sobre la hipótesis alternante será una consecuencia de la decisión tomada sobre la hipótesis planteada. Los resultados que se derivan de la decisión tomada están sujetos a ciertos niveles de confiabilidad y riesgo, lo cual supone que es también posible tomar decisiones erradas. Pruebas de Hipótesis www.grupolamatriz.com -3- TIPOS DE ERROR Cuando se establece una Hp, se debe tomar una decisión sobre la racionalidad de la misma, ésta puede ser aceptarla o rechazarla. Sin embargo, al conocer a la población real o el verdadero valor del parámetro, la Hp será Verdadera (V) o Falsa (F), esto nos llevará a una de las siguientes situaciones: Si aceptamos Si rechazamos Hp (V) Hp (F) Decisión correcta ERROR TIPO II ERROR TIPO I Decisión correcta. ERROR TIPO I Ocurre al rechazar una hipótesis planteada cuando ésta es realmente Verdadera. La Máxima probabilidad deseada de cometer error tipo I es representada por , esto es: = Máx. P [cometer ERROR TIPO I]. ERROR TIPO II Ocurre al aceptar una hipótesis planteada cuando ésta es realmente Falsa. La probabilidad de cometer error tipo II es representada por : = P [ERROR TIPO II] Consideraciones para y es establecido por el investigador (se define en la Población Hipotética) se determina en base a la distribución real (Población Real) y están inversamente relacionados. Potencia de Prueba Es la probabilidad de rechazar una hipótesis planteada o nula cuando ésta es realmente Falsa. Es decir, es la probabilidad de tomar una decisión correcta cuando Hp es Falsa. Potencia de Prueba = 1 - Región crítica o Región de rechazo Área o región donde se rechaza la Hp. Es el conjunto de valores del estadístico de prueba para los cuales se rechaza Hp. Valor Crítico o Valor Tabular Es el valor o valores que define(n) donde comienza(n) la(s) región(es) crítica(s). Pruebas de Hipótesis -4- www.grupolamatriz.com Nivel de significancia Es la máxima probabilidad que se establece con el fin de hacer mínimo el error tipo I. Es la probabilidad más alta de rechazar Hp cuando es verdadera. Es establecido por el investigador. NOTA: Para el proceso de prueba de hipótesis debemos considerar la siguiente simbología. = Nivel de significación de la prueba. = Parámetro sobre el cual se desea probar un supuesto 1 2 1 2{ , , - , - } 0 = valor hipotético del parámetro. E = Estadístico de prueba a usar (Z, T, 2 , etc.) E1 = Valor tabular o punto crítico izquierdo. E2 = Valor tabular o punto crítico derecho. SUPUESTOS DE LOS PARAMETROS 1. Para la media y la varianza: y 2 i. las observaciones son elegidas aleatoriamente. ii. las observaciones elegidas provienen de una distribución normal. 2. Para comparar medias o variancias: i. las observaciones son elegidas aleatoriamente. ii. las observaciones elegidas provienen de distribuciones normales. iii. las muestras provienen de poblaciones independientes. 3. Para la proporción: i. las observaciones son elegidas aleatoriamente. ii. el tamaño de muestra es grande. 4. Para comparar proporciones: i. las observaciones son elegidas aleatoriamente. ii. el tamaño de las muestras debe ser grande. iii. las muestras provienen de poblaciones independientes. Pruebas de Hipótesis www.grupolamatriz.com -5- Antes de empezar con las pruebas de hipótesis, RECUERDE QUE: MCR MSR = 2 2 X X n − = − 2 2 X X N n . n N 1 = 2 2 X X S S n − = − 2 2 X X S N n S . n N 1 − =2p (1 ) n − − = − 2 p (1 ) N n . n N 1 − = 2 p p(1 p) n − − = − 2 p p(1 p) N n . n N 1 Siendo: n = Tamaño de la muestra N = Tamaño de la población =x Media o Promedio muestral = Media o Promedio poblacional =2xs Varianza muestral = 2 x Varianza poblacional =2 x s Varianza muestral de los promedios muestrales =2 x Varianza de todos los promedios muestrales p = éxito de la proporción en la muestra = éxito de la proporción en la población = 2 p Varianza muestral de las proporciones muestrales =2p Varianza de todas las proporciones muestrales Procedimiento general para realizar una prueba de hipótesis: Ante un evidente supuesto: (parámetro < = > valor), podríamos establecer un orden para llevar a cabo la prueba de hipótesis: 1° Planteamiento de la hipótesis. CASO A: Pruebas bilaterales Hp: = 0; Ha: 0 CASO B: Pruebas Unilaterales a la derecha: Hp: 0 (Hp: = 0); Ha: > 0 CASO C: Pruebas unilaterales a la izquierda: Hp: 0 (Hp: = 0); Ha: < 0 Pruebas de Hipótesis -6- www.grupolamatriz.com /2 1 - Región de Aceptación Región de Rechazo /2 E1 E2 Región de Rechazo 1 - Región de Aceptación E2 Región de Rechazo 1 - Región de Aceptación Región de Rechazo E1 2° Elección del nivel de significación (usar dato según prueba unilateral o bilateral). 3° Determinación de la prueba a usar (E). Establecer los supuestos de la prueba. 4° Obtención de los puntos críticos o valores tabulares. Establecer los criterios de decisión. CASO A: Pruebas bilaterales CASO B: Pruebas Unilaterales a la Derecha CASO C: Pruebas Unilaterales a la Izquierda 5° Cálculo del valor de la prueba. Se obtiene ECAL reemplazando los datos proporcionados en la muestra. 6° Decisión y conclusiones. Se acepta Hp si: 1 CAL 2 E E E Se rechaza Hp si: CAL 1 CAL 2 E E ó E E Se acepta Hp si: ECAL E2 Se rechaza Hp si: ECAL > E2 Se acepta Hp si: ECAL E1 Se rechaza Hp si: ECAL < E1 Pruebas de Hipótesis www.grupolamatriz.com -7- PRUEBAS ESTADÍSTICAS Y VALORES TABULARES [Utilice: 2/= para pruebas bilaterales y = para pruebas unilaterales.] 1. Hipótesis sobre la media poblacional: μ a) Si: 2σ es conocida la prueba estadística es: - = X x X μ Z σ Valores tabulares: 1 (Ω) 2 (1 Ω)Z Z ; Z Z −= = b) Si: 2σ No es conocida la prueba estadística es: − − = (n 1) X X T T S Valores tabulares: 1 (Ω,n 1) 2 (1 Ω,n 1)T T ; T T− − −= = 2. Hipótesissobre la proporción poblacional: − = p p Z Valores tabulares: )1(2)(1 ZZ ;ZZ − == 3. Hipótesis sobre la diferencia de medias: 21 − a) Si: 2 2 1 2 y son conocidas la prueba de hipótesis es: ( ) ( ) x x1 2 1 2 1 2X X μ μ Z σ − − − − = Utilice: − = + 1 2 1 2 2 2 2 X X X X Los valores tabulares son: )1(2)(1 ZZ ;ZZ − == Pruebas de Hipótesis -8- www.grupolamatriz.com b) Si: 2 2 1 2 y No son conocidas pero homogéneas, la prueba de hipótesis es: ( ) ( ) 1 2 1 2 1 2 x x X X μ μ T S − − − − = Utilice: MCR MSR += − 21 2 p 2 2x1x n 1 n 1 SS − − + − − = − 1N nN n 1 1N nN n 1 SS 2 22 21 11 1 2 p 2 2x1x Siendo: 2 2 2 1 1 2 2 p 1 2 (n 1)S (n 1)S S n n 2 − + − = + − (Variancia ponderada muestral) Los valores tabulares son: ( ) ( )1 2 1 21 2Ω,n n 2 1 Ω,n n 2 T T ; T T + − − + − = = c) Si: 2 2 1 2 y No son conocidas pero heterogéneas, la prueba de hipótesis es: − − − − = 1 2 1 2 1 2 x x (X X ) (μ μ ) T S Utilice: − = + 1 2 1 2 2 2 2 X X X X S S S Los valores tabulares son: 1 ( ,λ) 2 (1 ,λ)T T ; T T −= = Siendo el número de grados de libertad: 1 2 1 2 2 2 2 X X 2 2 2 2 X X 1 2 (S S ) (S ) (S ) n 1 n 1 + = + − − Si no es un número entero, lo debemos redondear al entero más cercano. Pruebas de Hipótesis www.grupolamatriz.com -9- 4. Hipótesis sobre la diferencia de proporciones: 21 − La prueba estadística es: Los valores tabulares son: )1(2)(1 ZZ ;ZZ − == Siendo 0 el valor hipotético, se presentan dos casos: i. Si: 0=δ0 se utiliza 21 2211 nn pnpn p + + = Utilice: MCR MSR - - 1 2 2 p p 1 2 1 1 p(1 p)[ ]ˆ n n = + ( ) + = 1N nN n 1 1N nN n 1 p1pˆ 2 22 21 11 1 2 2p1p - - - - - - ii. Si: 0δ 0 Utilice: MCR MSR ( ) ( ) 2 22 1 112 2p1p n p1p + n p1p =σ̂ -- - ( ) ( ) − + = 1N nN n p1p 1N nN n p1p ˆ 2 22 2 22 1 11 1 112 2p1p - - - -- - El valor P El valor-p es el nivel de significancia más pequeño que conduce al rechazo de Hp. * Si valor-p < Se rechaza Hp. * Si valor-p Se acepta Hp. − − − − = 1 2 1 2 1 2 p p (p p ) ( ) Z -10- www.grupolamatriz.com Ejercicios propuestos para la Clase Ejercicio #1 En un estudio realizado en las cadenas de tiendas del Hipermercado Nacional, se eligieron al azar 37 clientes de la ciudad A y 35 clientes de la ciudad B, siendo uno de los objetivos el analizar las compras de víveres mediante tarjetas de crédito. Mediante las muestras tomadas el último fin de semana se encontró la siguiente información sobre los montos de las compras a crédito y el número de clientes que van a cancelar su compra en 3 cuotas: Ciudad n Monto promedio de compra a crédito (soles) Desviación estándar N° de clientes que van a cancelar en tres cuotas A 37 126 53,6 30 B 35 202 72,9 32 Use = 0,05 para pruebas unilaterales y = 0,10 para pruebas bilaterales. a) La gerencia sospecha que la verdadera media de los montos de compra a crédito en víveres de los clientes de la ciudad B es mayor a 200 soles. ¿Qué puede concluir al respecto? b) La gerencia afirma que la verdadera proporción de clientes en la ciudad A que van a cancelar sus compras en tres cuotas es menor a 0,85. ¿Está Ud. de acuerdo con esta afirmación? c) La gerencia sostiene que la verdadera media de los montos de compra a crédito de la ciudad B supera al de la ciudad A en 50 soles. ¿Qué puede Ud. concluir al respecto? Asuma que las varianzas poblacionales son homogéneas. d) ¿Se puede concluir que la verdadera proporción de clientes que van a pagar sus compras en tres cuotas en la ciudad B supera en más de 0,1 al de la ciudad A? Pruebas de Hipótesis www.grupolamatriz.com -11- 5. Prueba para la Media con Datos Pareados o Correlacionados. Cuando se realizan dos mediciones en momentos diferentes para las mismas unidades de muestreo, correspondientes a una misma variable, se generan dos conjuntos de datos que No son independientes entre sí, debido a que los datos están relacionados con el mismo elemento de población. A los pares generados por este mecanismo se les denomina datos pareados y se supone que siguen una distribución normal o aproximadamente normal. Sean: (X1,Y1), (X2,Y2), …..,(Xn,Yn), los “n” datos pareados. Se supone que: Xi N(1, 21 ) y que: Yi N(2, 2 2 ) Además que Xi e Yi No son Independientes, pero si lo son: (Xi,Yi) de (Xj,Yj), para ij. El parámetro en estudio será: = −d X Y Procedimiento (1) Planteamiento: Hp: d ≥ 0 Hp: d ≤ 0 Hp: d = 0 Ha: d < 0 Ha: d > 0 Ha: d 0 (2) Elección del nivel de significancia: “”. (3) Prueba Estadística: − − = d (n 1) d d T T S Siendo: == = − n i i 1 d d X Y n con di = Xi - Yi = 2 2 d d S S n = − = − n 22 i 2 i 1 d d nd S n 1 (4) Punto(s) crítico(s) CRITERIOS DE DECISIÓN (5) Valor de la Prueba: TCAL. (6) Decisión y Conclusiones. Nota: • Se usa T de Student porque no se conoce la varianza poblacional y se supone que se tiene una distribución normal para las diferencias. • Se utiliza solo una muestra aleatoria.
Compartir