Vista previa del material en texto
Preguntas ordenadas Preguntas ordenadas de fácil a difícil difícil a fácil 24.64 39.29 16.32 32.83 28.02 33.62 34.02 26.63 30.26 33.31 20.60 21.13 26.69 28.90 35.91 26.68 29.49 35.32 26.43 24.23 7.10 32.86 21.06 27.24 32.34 29.34 33.53 28.89 28.71 31.73 30.02 21.96 27.62 42.91 30.20 32.54 25.49 38.81 27.85 30.29 30.72 23. IMC de hombres y mujeres Remítase al conjunto de datos 1 en el Apéndice B y pruebe la aseveración de que el índice de masa corporal (IMC) medio de los hombres es igual al índice de masa corporal medio de las mujeres. 24. Corredores de maratón Remítase al conjunto de datos 8 en el Apéndice B y pruebe la aseveración de que la media de la edad de un corredor hombre en el maratón de la ciudad de Nueva York es igual a la media de la edad de una corredora mujer en ese maratón. En los ejercicios 25 a 28 suponga que las dos muestras son aleatorias simples inde- pendientes, seleccionadas de poblaciones distribuidas normalmente. También suponga que las desviaciones estándar poblacionales son iguales (�1 5 �2) de manera que el error estándar de la diferencia entre las medias se obtiene agrupando las varianzas muestrales. 25. Intervalo de confianza con agrupamiento Realice el ejercicio 7 con la suposición adi- cional de que s1 5 s2. ¿De qué manera se ven afectados los resultados por esta supo- sición adicional? 26. Prueba de hipótesis con agrupamiento Realice el ejercicio 8 con la suposición adicio- nal de que s1 5 s2. ¿De qué manera se ven afectados los resultados por esta suposi- ción adicional? 27. Prueba de hipótesis con agrupamiento Realice el ejercicio 9 con la suposición adicio- nal de que s1 5 s2. ¿De qué manera se ven afectados los resultados por esta suposi- ción adicional? 28. Intervalo de confianza con agrupamiento Realice el ejercicio 10 con la suposición adicional de que s1 5 s2. ¿De qué manera se ven afectados los resultados por esta suposición adicional? 8-3 Más allá de lo básico 29. Efectos de un dato distante a. Remítase al ejercicio 17 e incluya un dato distante consistente en un polizón de 90 años de edad en un viaje de crucero del Queen Mary por la costa oeste. ¿Se afecta drásticamente la prueba de hipótesis por la presencia del dato distante? b. Remítase al ejercicio 19 e incluya un dato distante consistente en un polizón de 5000 años de edad en un viaje de crucero del Queen Mary por la costa oeste. ¿Por qué disminuye el estadístico de prueba t en lugar de incrementarse? 30. Efectos de las unidades de medida ¿De qué manera se ven afectados los resultados del ejercicio 12, si todas las cantidades de nicotina se convierten de miligramos a on- zas? En general, ¿afecta la elección de la escala las conclusiones acerca de la igualdad de dos medias poblacionales y afecta dicha elección al intervalo de confianza? 31. Verificación de una propiedad de las varianzas a. Calcule la varianza para esta población de x valores: 5, 10, 15. (Véase la sección 2-5 para la varianza s2 de una población). 8-3 Inferencias acerca de dos medias: muestras independientes 465 T T 466 CAPÍTULO 8 Inferencias a partir de dos muestras b. Calcule la varianza para esta población de y valores: 1, 2, 3. c. Haga una lista de la población de todas las diferencias posibles x 2 y, y calcule la varianza de esta población. d. Utilice los resultados de los incisos a, b y c para verificar que la varianza de las diferencias entre dos variables aleatorias independientes es la suma de sus varian- zas individuales (Este principio se utiliza para derivar el esta- dístico de prueba y el intervalo de confianza dados en esta sección). e. ¿Cómo se relaciona el rango de las diferencias x 2 y con el rango de los valores x y con el rango de los valores y? 32. Efecto de no variación en una muestra Se realizó un experimento para probar los efec- tos del alcohol. Los niveles de alcohol exhalado se midieron en un grupo de trata- miento de personas que bebieron etanol y en otro grupo al que se administró un place- bo. Los resultados se presentan en la tabla adjunta. Utilice un nivel de significancia de 0.05 para probar la aseveración de que los dos grupos muestrales provienen de pobla- ciones con la misma media. Los resultados se basan en datos de “Effects of Alcohol Intoxication on Risk Taking, Strategy, and Error Rate in Visuomotor Performance”, de Streufert et al., Journal of Applied Psychology, vol. 77, núm. 4. 33. Cálculo de grados de libertad ¿De qué manera se ve afectado el número de grados de libertad en los ejercicios 13 y 14 si se utiliza la fórmula 8-1 en lugar de seleccionar el más chico de n1 2 1 y n2 2 1? Si se utiliza la fórmula 8-1 para el número de grados de libertad en lugar del más pequeño de n1 2 1 y n2 2 1, ¿de qué manera se ven afec- tados el valor P y el ancho del intervalo de confianza? ¿En qué sentido “gl 5 el más chico de n1 2 1 y n2 2 1” es un estimado más conservador del número de grados de libertad que el estimado que se obtiene con la fórmula 8-1? 8-4 Inferencias a partir de datos apareados En la sección 8-3 definimos que dos muestras son independientes si los valores muestrales, seleccionados a partir de una población, no están relacionados, apa- reados ni asociados con los valores muestrales seleccionados a partir de la otra po- blación. La sección 8-3 trató con inferencias acerca de las medias de dos poblacio- nes independientes, y esta sección se enfoca en muestras dependientes, a las que nos referimos como datos apareados. En éstos, existe alguna relación para que ca- da valor en una muestra se aparee con un valor correspondiente en la otra muestra. A continuación se presentan algunos ejemplos típicos de datos apareados: ● Cuando se realiza un experimento para probar la eficacia de una dieta baja en grasas, el peso de cada sujeto se mide una vez antes de la dieta y una vez después de la dieta. ● La eficacia de un programa de entrenamiento para el SAT (prueba de aptitudes académicas) se prueba efectuando a cada sujeto un examen del SAT antes del programa y otro examen del SAT equivalente después del programa. ssx2y 2 5 sx 2 1 sy 2d. Grupo de tratamiento Grupo placebo n1 5 22 n2 5 22 1 5 0.049 2 5 0.000 s1 5 0.015 s2 5 0.000 xx ● La precisión de los pesos reportados se analiza con una muestra de perso- nas cuando, para cada persona, el peso reportado se registra y el peso real se mide. Para tratar con inferencias acerca de medias y datos apareados, abajo se inclu- yen resúmenes de los supuestos relevantes, la notación, el estadístico de prueba de hipótesis y el intervalo de confianza. Puesto que la prueba de hipótesis y el inter- valo de confianza utilizan la misma distribución y el mismo error estándar, son equivalentes en el sentido de que arrojan las mismas conclusiones. En consecuen- cia, la hipótesis nula de que la diferencia de la media es igual a 0 se prueba deter- minando si el intervalo de confianza incluye a 0. [Para pruebas de hipótesis de dos colas construya un intervalo de confianza con un nivel de confianza de 1 2 a; pe- ro para una prueba de hipótesis de una cola, con nivel de significancia a, constru- ya un intervalo de confianza con un nivel de confianza de 1 2 2a. (Véase la tabla 7-2 para casos comunes). Por ejemplo, la aseveración de que la diferencia de la media es mayor que 0 se puede probar con un nivel de significancia de 0.05, cons- truyendo un intervalo de confianza del 90%]. 8-4 Inferencias a partir de datos apareados 467 Supuestos 1. Los datos muestrales consisten en datos apareados. 2. Las muestras son muestras aleatorias simples. 3. Cualquiera o ambas de estas condiciones se satisfacen: el número de datos apa- reados o datos muestrales es grande (n . 30) o los pares de valores tienen dife- rencias que se toman de una población con una distribución aproximadamente normal. (Si existe una desviación radical de la distribución normal, no debemos utilizar los métodos que se estudian en esta sección, pero quizá podamos utili- zar los métodos no paramétricos que se analizan en el capítulo 12). Notación para datos apareadosd 5 diferencia individual entre los dos valores en un solo dato apareado md 5 valor medio de las diferencias d para la población de todos los datos apa- reados 5 valor medio de las diferencias d para los datos muestrales apareados (igual a la media de los valores x 2 y) sd 5 desviación estándar de las diferencias d para la muestra de datos apareados n 5 número de pares de datos Estadístico de prueba de hipótesis para datos apareados donde los grados de libertad 5 n 2 1. Valores P y valores críticos: Tabla A-3 (distribución t) t 5 d 2 md sd!n d continúa Exploración de los conjuntos de datos Como siempre, debemos evitar la aplicación descuidada de cualquier procedi- miento estadístico. Debemos considerar el centro, la variación, la distribución, los datos distantes y cualquier cambio que tenga lugar en el tiempo (CVDDT). Pues- to que queremos ilustrar los métodos de esta sección con cálculos sencillos, los siguientes ejemplos utilizan datos muestrales consistentes en sólo cinco datos apa- reados. Observamos que las temperaturas mínimas reales parecen ser sustancial- mente diferentes de las temperaturas mínimas pronosticadas cinco días antes. Una gráfica cuantilar normal de estas cinco diferencias muestrales sugiere que tienen una distribución que es aproximadamente normal. (Estos cinco datos apareados se tomaron del conjunto de datos 10 en el Apéndice B, y un histograma de la lista completa de las 31 diferencias indica que la población de diferencias tiene una distribución que es aproximadamente normal). Podemos ver que no existen datos distantes. Es particularmente importante considerar los datos distantes puesto que su presencia llega a afectar drásticamente los resultados. EJEMPLO ¿Son precisos los pronósticos de temperatura? La tabla 8-2 incluye cinco temperaturas mínimas reales y las correspondientes temperaturas mínimas que se pronosticaron cinco días antes. Se trata de datos apareados, puesto que cada par de valores representa al mismo día. Las tempe- raturas pronosticadas parecen ser muy diferentes de las temperaturas reales, pero ¿existe suficiente evidencia para concluir que la diferencia media no es de cero? Utilice un nivel de significancia de 0.05 para probar la aseveración de que existe una diferencia entre las temperaturas mínimas reales y las temperaturas mínimas pronosticadas cinco días antes. SOLUCIÓN Seguiremos el mismo método básico de prueba de hipótesis que se introdujo en el capítulo 7, pero utilizaremos el estadístico de prueba de arriba para datos apareados. Paso 1: La aseveración de que existe una diferencia entre las temperaturas mínimas reales y las temperaturas mínimas pronosticadas para cinco días se expresa como md 2 0. Paso 2: Si la aseveración original no es verdadera, tenemos md 5 0. Paso 3: La hipótesis nula debe expresar igualdad y la hipótesis alternativa no puede incluir igualdad, por lo tanto tenemos H0: md 5 0 H1: md 2 0 (Aseveración original) 468 CAPÍTULO 8 Inferencias a partir de dos muestras Intervalos de confianza para datos apareados donde Valores críticos de tA/2: Utilice la tabla A-3 con n 2 1 grados de libertad. E 5 ta>2 sd!n d 2 E , md , d 1 E Investigación en gemelos Los gemelos idénticos se gestan cuando un solo óvulo fertilizado se divide en dos, de manera que ambos gemelos comparten el mismo paquete genético. Actual- mente existe una explosión en la investigación enfocada en este tipo de gemelos. Hablando para el Cen- ter of Study of Multiple Birth, Louis Keith señala que actual- mente “tenemos mucha más ca- pacidad de analizar los datos en gemelos utilizando computadoras con nuevos programas estadísticos instalados de fábrica”. Una meta común de estudios de este tipo es explorar el tema clásico de “natu- raleza contra crianza”. Por ejem- plo, Thomas Bouchard, quien rea- lizó el Minnessota Study of Twins Reared Apart, encontró que el CI es heredado en un 50%260%, mientras que el resto es el resultado de fuerzas externas. Los gemelos idénticos son pares conjugados que proveen mejores resultados permitién- donos reducir la variación genética inevitable con pares no relacionados de personas.