Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
448 ❍ CAPÍTULO 11 EL ANÁLISIS DE VARIANZA EL DISEÑO DE UN EXPERIMENTO La forma en que una muestra sea seleccionada se denomina plan de muestreo o diseño experimental y determina la cantidad de información en la muestra. Algunas investiga- ciones comprenden un estudio observacional, en las que el investigador no produce en realidad los datos sino que sólo observa las características de datos que ya existen. Casi todos los estudios muestrales, en donde se reúne información con un cuestionario, caen en esta categoría, el investigador forma un plan para recolectar los datos, llamado plan de muestreo y a continuación utiliza los procedimientos estadísticos apropiados para sacar conclusiones acerca de la población o poblaciones de donde proviene la muestra. Otra investigación comprende la experimentación. El investigador puede delibera- damente imponer una o más condiciones experimentales, en las unidades experimen- tales, para determinar su efecto en la respuesta. Veamos ahora algunos términos nuevos que usaremos para discutir el diseño de un experimento estadístico. Defi nición Una unidad experimental es el objeto en el que se toma una medición (o mediciones). Un factor es una variable independiente cuyos valores son controlados y variados por el experimentador. Un nivel es el escenario de intensidad de un factor. Un tratamiento es una combinación específi ca de niveles de factor. La respuesta es la variable que es medida por el experimentador. Un grupo de personas se divide al azar en un grupo experimental y uno de control. Al grupo de control se le da un examen de aptitud después de haber tomado un desayuno completo; al grupo experimental se le da el mismo examen sin haber tomado ningún desayuno. ¿Cuáles son los factores, niveles y tratamientos en este experimento? Solución Las unidades experimentales son las personas en las que la respuesta (cali- fi cación de examen) se mide. El factor de interés podría describirse como “comida” y tiene dos niveles: “desayuno” y “no desayuno”. Como éste es el único factor controlado por el experimentador, los dos niveles de “desayuno” y “no desayuno” también repre- sentan los tratamientos de interés en el experimento. Suponga que el experimentador del ejemplo 11.1 empezó por seleccionar al azar 20 hombres y 20 mujeres para el experimento. Estos dos grupos se dividieron entonces al azar en 10 cada uno para los grupos experimental y de control. ¿Cuáles son los factores, niveles y tratamientos en este experimento? Solución Ahora hay dos factores de interés para el experimentador y cada factor tiene dos niveles: • “Género” a dos niveles: hombres y mujeres • “Comida” a dos niveles: desayuno y no desayuno En este experimento más complejo, hay cuatro tratamientos, uno para cada combinación específi ca de niveles de factor: hombres sin desayuno, hombres con desayuno, mujeres sin desayuno y mujeres con desayuno. 11.1 E J E M P L O 11.2 E J E M P L O 11.1 Probabilidad_Mendenhall_11.indd 448Probabilidad_Mendenhall_11.indd 448 5/14/10 8:36:02 AM5/14/10 8:36:02 AM www.FreeLibros.me 11.3 LAS SUPOSICIONES PARA UN ANÁLISIS DE VARIANZA ❍ 449 En este capítulo, nos concentraremos en experimentos que han sido diseñados en tres formas diferentes y usaremos una técnica llamada análisis de varianza para juzgar los efectos de varios factores en la respuesta experimental. Dos de estos diseños experimen- tales son extensiones de los diseños no apareados y apareados del capítulo 10. ¿QUÉ ES UN ANÁLISIS DE VARIANZA? Las respuestas que se generan en una situación experimental siempre exhiben cierta cantidad de variabilidad. En un análisis de varianza, se divide la variación total de las mediciones de respuesta en partes que pueden ser atribuidas a varios factores de inte- rés para el experimentador. Si el experimento ha sido debidamente diseñado, estas partes pueden usarse entonces para contestar preguntas acerca de los efectos de los diversos factores en la respuesta de interés. Se puede entender mejor la lógica que sirve de base a un análisis de varianza al ver un experimento sencillo. Considere dos conjuntos de muestras seleccionadas al azar de las poblaciones 1 (�) y 2 (�), cada uno con pares idénticos de medias; x�1 y x�2. Los dos conjuntos se muestran en la fi gura 11.1. ¿Es más fácil detectar la diferencia en las dos medias cuando se vea el conjunto A o el conjunto B? Es probable que esté de acuerdo en que el conjunto A muestra la diferencia mucho más claramente. En el conjunto A, la variabilidad de las mediciones dentro de los grupos (los � y �) es mucho menor que la variabilidad entre los dos grupos. En el conjunto B, hay más variabilidad dentro de los grupos (los � y �), causando que los dos grupos se “mezclen” y hagan más difícil ver la diferencia idéntica en las medias. 11.2 La comparación que ha hecho intuitivamente es formalizada por el análisis de varianza. Es más, el análisis de varianza se puede hacer no sólo para comparar dos medias sino también para hacer comparaciones de más de dos medias poblacionales y para determinar los efectos de varios factores en diseños experimentales más complejos. El análisis de varianza se apoya en estadísticas con distribuciones muestrales que son modeladas por la distribución F de la sección 10.7. LAS SUPOSICIONES PARA UN ANÁLISIS DE VARIANZA Las suposiciones necesarias para un análisis de varianza son semejantes a las requeri- das para las estadísticas t de Student y F del capítulo 10. Cualquiera que sea el diseño experimental empleado para generar los datos, se debe suponer que las observaciones dentro de cada grupo de tratamiento están normalmente distribuidas con una varianza común s2. Al igual que en el capítulo 10, el análisis de procedimientos de varianza es más bien robusto cuando los tamaños muestrales son iguales y cuando los datos son de forma de montículo. Violar la suposición de una varianza común es más serio, en espe- cial cuando los tamaños muestrales no son cercanamente iguales. Conjunto A Conjunto B FIGURA 11.1 Dos conjuntos de muestras con las mismas medias ● 11.3 Probabilidad_Mendenhall_11.indd 449Probabilidad_Mendenhall_11.indd 449 5/14/10 8:36:02 AM5/14/10 8:36:02 AM www.FreeLibros.me 450 ❍ CAPÍTULO 11 EL ANÁLISIS DE VARIANZA SUPOSICIONES PARA ANÁLISIS DE EXAMEN DE VARIANZA Y PROCEDIMIENTOS DE ESTIMACIÓN • Las observaciones dentro de cada población están distribuidas normalmente con una varianza común s2. • Las suposiciones respecto al procedimiento de muestreo son especifi cadas para cada diseño en las secciones que siguen. Este capítulo describe el análisis de varianza para tres diseños experimentales dife- rentes. El primer diseño está basado en muestreo aleatorio independiente de varias poblaciones y es una extensión de la prueba t no pareada del capítulo 10. El segundo es una extensión del diseño de diferencia pareada o pares acoplados y comprende una asignación aleatoria de tratamientos dentro de conjuntos apareados de observaciones. El tercero es un diseño que permite juzgar el efecto de dos factores experimentales en la respuesta. Los procedimientos de muestreo necesarios para cada diseño se vuelven a expresar en sus secciones respectivas. EL DISEÑO COMPLETAMENTE ALEATORIZADO: UNA CLASIFICACIÓN EN UNA DIRECCIÓN Uno de los diseños experimentales más sencillos es el diseño completamente aleato- rizado, en el que muestras aleatorias se seleccionan de manera independiente de cada una de k poblaciones. Este diseño comprende sólo un factor, la población de donde proviene la medición, de aquí la designación como una clasifi cación en una dirección. Hay k niveles diferentes correspondientes a las k poblaciones, que también son los trata- mientos para esta clasifi cación de una dirección. ¿Las k medias poblacionales son todas iguales, o al menos una media es diferente de las otras? ¿Por qué se necesita un nuevo procedimiento, el análisis de varianza, para comparar las medias poblacionalescuando ya se tiene disponible la prueba t de Student? Al com- parar k � 3 medias, se podría probar cada uno de los tres pares de hipótesis: H0 : m1 � m2 H0 : m1 � m3 H0 : m2 � m3 para averiguar dónde están las diferencias. No obstante, se debe recordar que cada prue- ba que se realice está sujeta a la posibilidad de error. Para comparar k � 4 medias, se necesitarían seis pruebas y se necesitarían 10 pruebas para comparar k � 5 medias. Cuantas más pruebas se realicen en un conjunto de mediciones, más probable será que al menos una de las conclusiones sea incorrecta. El análisis de procedimiento de varianza provee una prueba general para juzgar la igualdad de las k medias poblacionales. Una vez que haya determinado si hay en realidad una diferencia en las medias, se puede usar otro procedimiento para averiguar dónde están las diferencias. ¿Cómo se pueden seleccionar estas k muestras aleatorias? A veces las poblaciones existen en realidad y se puede usar un generador computarizado de números aleatorios o una tabla de números aleatorios para seleccionar al azar las muestras. Por ejemplo, en un estudio para comparar los tamaños promedio de reclamaciones de seguro médico en cuatro estados diferentes, se podría usar una base de datos computarizada proporcio- nada por las compañías de seguros médicos para seleccionar muestras aleatorias de los cuatro estados. En otras situaciones, las poblaciones pueden ser hipotéticas y se pueden generar respuestas sólo después de haberse aplicado los tratamientos experimentales. Un investigador está interesado en los efectos de cinco tipos de insecticidas a usar para controlar el gorgojo del algodón en campos algodoneros. Explique cómo poner en 11.4 E J E M P L O 11.3 Probabilidad_Mendenhall_11.indd 450Probabilidad_Mendenhall_11.indd 450 5/14/10 8:36:02 AM5/14/10 8:36:02 AM www.FreeLibros.me 11 EL ANÁLISIS DE VARIANZA 11.1 El diseño de un experimento 11.2 ¿Qué es un análisis de varianza? 11.3 Las suposiciones para un análisis de varianza 11.4 El diseño completamente aleatorizado: una clasificación en una dirección
Compartir