Logo Studenta

Inferência sobre duas amostras

¡Estudia con miles de materiales!

Vista previa del material en texto

Ingeniería en Procesos y Calidad 
Diseño de Experimentos 
 
III Cuatrimestre 2021 
Grupo 11 
 
Autores: 
Hanyel Acuña Araya 
Antonella Alfaro Cruz 
Yuliet Ramírez Salas 
Fecha: 13 de octubre, 2021 
 
Capítulo 2. Inferencia sobre dos muestras aleatorias 
Cuando el parámetro teórico es un valor estándar, este no es frecuentemente conocido bajo 
las condiciones particulares del experimento, por lo cual es necesario obtener un conjunto de 
observaciones a partir de las cuales se encuentran las estimaciones, permitiendo hacer 
inferencia sobre parámetros poblacionales de interés. 
En este capítulo se expone el problema de comparar parámetros de dos poblaciones a partir 
de dos muestras aleatorias, la verificación de este tipo de hipótesis se decidirá con base en 
los datos contenidos en estas, se tratará desde el supuesto de normalidad y el supuesto de no 
normalidad. 
Teoría basada en normalidad 
Si las dos muestras se asumen independientes, la hipótesis nula más frecuente planteada es 
la igualdad de medias, es decir, H0: µ1 = µ2. En las decisiones que se tomen sobre la hipótesis 
anterior se deben tener en cuenta varias consideraciones: 
 Inferencia sobre diferencia de medias poblacionales cuando las varianzas son 
iguales: Supóngase que se tienen dos poblaciones independientes con medias 
desconocidas µ1 y µ2, y varianzas conocidas σ^2 1 y σ^2 2, respectivamente. 
 Inferencia sobre el cociente de varianzas: Supóngase que se tiene interés en dos 
poblacionales normales independientes, en los que las medias y varianzas de la 
población, µ1, σ^2 1, µ2 y σ^2 2, son desconocidas. 
 Inferencia sobre diferencia de medias poblacionales cuando las varianzas son 
desiguales: Si el modelo es tal que xij, i = 1, 2, j = 1, 2, .., ni (ni > 0) y, además, las 
muestras son independientes y normalmente distribuidas. 
 Efecto de no normalidad 
 Siguiendo con el supuesto de igualdad de varianzas (es decir, 𝜎2 1 = 𝜎2 2), si además se 
tiene que I1(x1), I2(x1), I1(x2) y I2(x2) son el sesgo y la curtosis de las dos poblaciones. 
 Se muestra entonces que el parámetro de curtosis tiene un efecto pequeño en la distribución 
del estadístico t y, cuando las muestras son aproximadamente iguales (es decir, n1 ≈ n2), el 
parámetro de sesgo cancela cualquier otra aproximación. Por lo tanto, para muestras de igual 
tamaño el estadístico t es más robusto para el caso de dos muestras que para el caso de una 
muestra. Esto garantiza para el investigador que en caso balancea do todo sea estimable. 
 
 Pruebas no paramétricas 
 Su eficiencia asintótica comparada con la t es mayor y más eficiente que la t para 
distribuciones con colas pesadas. 
 La estadística de Wilcoxon se obtiene de dos formas: 
 La primera es un método que depende de los rangos. Combina las dos muestras en un 
conjunto de n1 +n2 observaciones. 
 La estadística de Wilcoxon es R1 o R2, o también R1 −R2 cuando n1 = n2, de ahí se sigue 
que R1 +R2 = ((n1 +n2)(n1 +n2 +1))/2 
 La segunda forma propuesta por Mann y Whitney (1947) define la estadística de Wilcoxon 
como donde I(x1i > x2j) =(1 si x1i > x2j 0 si x1i < x2j) i ≠ j. 
 
 Estimación robusta 
Sea sume que la función de distribución acumulada para cada población es simétrica 
alrededor de su mediana. Sea 𝛿 la fracción trimedia, donde sea sume que 𝛿n1 y 𝛿n2 son 
enteros. La trimedia se define como (Miller 1986) 
 
Prueba estadística multivariada para la comparación de dos medias: T 2 -Hotelling 
Sea la hipótesis de interés H0 : u1 = u2, en la cual se desea evaluar la igualdad de medias 
multivariadas, por lo que se obtiene el siguiente estadístico de prueba 
 
Comparaciones pareadas, estudio de un prueba simultáneo para comparar medias y 
varianzas 
Prueba estadística para la comparación simultánea de medias y varianzas, en el caso de 
comparaciones pareadas asumiendo muestras aleatorias procedentes de poblaciones 
normales. 
 
Prueba de rangos con signo de Wilcoxon para comparaciones pareadas 
Se calculan las diferencias (xi1 − xi2) para cada uno de los n pares. Se eliminan las diferencias 
iguales a cero y se reduce, conforme a ello, el número de pares. Se ordenan los valores 
absolutos de las diferencias, asignado el rango 1 al más pequeño, el rango 2 al siguiente, 
luego se calcula la suma de los rangos para las diferencias negativas, R − , y, también, para 
las diferencias positivas, R + .

Continuar navegando

Materiales relacionados

3 pag.
1 pag.
3 pag.
3 pag.