Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Ingeniería en Procesos y Calidad Diseño de Experimentos III Cuatrimestre 2021 Grupo 11 Autores: Hanyel Acuña Araya Antonella Alfaro Cruz Yuliet Ramírez Salas Fecha: 13 de octubre, 2021 Capítulo 2. Inferencia sobre dos muestras aleatorias Cuando el parámetro teórico es un valor estándar, este no es frecuentemente conocido bajo las condiciones particulares del experimento, por lo cual es necesario obtener un conjunto de observaciones a partir de las cuales se encuentran las estimaciones, permitiendo hacer inferencia sobre parámetros poblacionales de interés. En este capítulo se expone el problema de comparar parámetros de dos poblaciones a partir de dos muestras aleatorias, la verificación de este tipo de hipótesis se decidirá con base en los datos contenidos en estas, se tratará desde el supuesto de normalidad y el supuesto de no normalidad. Teoría basada en normalidad Si las dos muestras se asumen independientes, la hipótesis nula más frecuente planteada es la igualdad de medias, es decir, H0: µ1 = µ2. En las decisiones que se tomen sobre la hipótesis anterior se deben tener en cuenta varias consideraciones: Inferencia sobre diferencia de medias poblacionales cuando las varianzas son iguales: Supóngase que se tienen dos poblaciones independientes con medias desconocidas µ1 y µ2, y varianzas conocidas σ^2 1 y σ^2 2, respectivamente. Inferencia sobre el cociente de varianzas: Supóngase que se tiene interés en dos poblacionales normales independientes, en los que las medias y varianzas de la población, µ1, σ^2 1, µ2 y σ^2 2, son desconocidas. Inferencia sobre diferencia de medias poblacionales cuando las varianzas son desiguales: Si el modelo es tal que xij, i = 1, 2, j = 1, 2, .., ni (ni > 0) y, además, las muestras son independientes y normalmente distribuidas. Efecto de no normalidad Siguiendo con el supuesto de igualdad de varianzas (es decir, 𝜎2 1 = 𝜎2 2), si además se tiene que I1(x1), I2(x1), I1(x2) y I2(x2) son el sesgo y la curtosis de las dos poblaciones. Se muestra entonces que el parámetro de curtosis tiene un efecto pequeño en la distribución del estadístico t y, cuando las muestras son aproximadamente iguales (es decir, n1 ≈ n2), el parámetro de sesgo cancela cualquier otra aproximación. Por lo tanto, para muestras de igual tamaño el estadístico t es más robusto para el caso de dos muestras que para el caso de una muestra. Esto garantiza para el investigador que en caso balancea do todo sea estimable. Pruebas no paramétricas Su eficiencia asintótica comparada con la t es mayor y más eficiente que la t para distribuciones con colas pesadas. La estadística de Wilcoxon se obtiene de dos formas: La primera es un método que depende de los rangos. Combina las dos muestras en un conjunto de n1 +n2 observaciones. La estadística de Wilcoxon es R1 o R2, o también R1 −R2 cuando n1 = n2, de ahí se sigue que R1 +R2 = ((n1 +n2)(n1 +n2 +1))/2 La segunda forma propuesta por Mann y Whitney (1947) define la estadística de Wilcoxon como donde I(x1i > x2j) =(1 si x1i > x2j 0 si x1i < x2j) i ≠ j. Estimación robusta Sea sume que la función de distribución acumulada para cada población es simétrica alrededor de su mediana. Sea 𝛿 la fracción trimedia, donde sea sume que 𝛿n1 y 𝛿n2 son enteros. La trimedia se define como (Miller 1986) Prueba estadística multivariada para la comparación de dos medias: T 2 -Hotelling Sea la hipótesis de interés H0 : u1 = u2, en la cual se desea evaluar la igualdad de medias multivariadas, por lo que se obtiene el siguiente estadístico de prueba Comparaciones pareadas, estudio de un prueba simultáneo para comparar medias y varianzas Prueba estadística para la comparación simultánea de medias y varianzas, en el caso de comparaciones pareadas asumiendo muestras aleatorias procedentes de poblaciones normales. Prueba de rangos con signo de Wilcoxon para comparaciones pareadas Se calculan las diferencias (xi1 − xi2) para cada uno de los n pares. Se eliminan las diferencias iguales a cero y se reduce, conforme a ello, el número de pares. Se ordenan los valores absolutos de las diferencias, asignado el rango 1 al más pequeño, el rango 2 al siguiente, luego se calcula la suma de los rangos para las diferencias negativas, R − , y, también, para las diferencias positivas, R + .
Compartir