Logo Studenta
¡Estudia con miles de materiales!

Vista previa del material en texto

Preguntas ordenadas Preguntas ordenadas
de fácil a difícil difícil a fácil
24.64 39.29 16.32 32.83 28.02 33.62 34.02 26.63 30.26
33.31 20.60 21.13 26.69 28.90 35.91 26.68 29.49 35.32
26.43 24.23 7.10 32.86 21.06 27.24 32.34 29.34 33.53
28.89 28.71 31.73 30.02 21.96 27.62 42.91 30.20 32.54
25.49 38.81 27.85 30.29 30.72
23. IMC de hombres y mujeres Remítase al conjunto de datos 1 en el Apéndice B y pruebe
la aseveración de que el índice de masa corporal (IMC) medio de los hombres es igual
al índice de masa corporal medio de las mujeres. 
24. Corredores de maratón Remítase al conjunto de datos 8 en el Apéndice B y pruebe
la aseveración de que la media de la edad de un corredor hombre en el maratón de la
ciudad de Nueva York es igual a la media de la edad de una corredora mujer en ese
maratón.
En los ejercicios 25 a 28 suponga que las dos muestras son aleatorias simples inde-
pendientes, seleccionadas de poblaciones distribuidas normalmente. También suponga
que las desviaciones estándar poblacionales son iguales (�1 5 �2) de manera que el
error estándar de la diferencia entre las medias se obtiene agrupando las varianzas
muestrales.
25. Intervalo de confianza con agrupamiento Realice el ejercicio 7 con la suposición adi-
cional de que s1 5 s2. ¿De qué manera se ven afectados los resultados por esta supo-
sición adicional?
26. Prueba de hipótesis con agrupamiento Realice el ejercicio 8 con la suposición adicio-
nal de que s1 5 s2. ¿De qué manera se ven afectados los resultados por esta suposi-
ción adicional?
27. Prueba de hipótesis con agrupamiento Realice el ejercicio 9 con la suposición adicio-
nal de que s1 5 s2. ¿De qué manera se ven afectados los resultados por esta suposi-
ción adicional?
28. Intervalo de confianza con agrupamiento Realice el ejercicio 10 con la suposición
adicional de que s1 5 s2. ¿De qué manera se ven afectados los resultados por esta
suposición adicional?
8-3 Más allá de lo básico
29. Efectos de un dato distante
a. Remítase al ejercicio 17 e incluya un dato distante consistente en un polizón de 90
años de edad en un viaje de crucero del Queen Mary por la costa oeste. ¿Se afecta
drásticamente la prueba de hipótesis por la presencia del dato distante?
b. Remítase al ejercicio 19 e incluya un dato distante consistente en un polizón de
5000 años de edad en un viaje de crucero del Queen Mary por la costa oeste. ¿Por
qué disminuye el estadístico de prueba t en lugar de incrementarse?
30. Efectos de las unidades de medida ¿De qué manera se ven afectados los resultados
del ejercicio 12, si todas las cantidades de nicotina se convierten de miligramos a on-
zas? En general, ¿afecta la elección de la escala las conclusiones acerca de la igualdad
de dos medias poblacionales y afecta dicha elección al intervalo de confianza?
31. Verificación de una propiedad de las varianzas
a. Calcule la varianza para esta población de x valores: 5, 10, 15. (Véase la sección
2-5 para la varianza s2 de una población).
8-3 Inferencias acerca de dos medias: muestras independientes 465
T
T
466 CAPÍTULO 8 Inferencias a partir de dos muestras
b. Calcule la varianza para esta población de y valores: 1, 2, 3.
c. Haga una lista de la población de todas las diferencias posibles x 2 y, y calcule la
varianza de esta población.
d. Utilice los resultados de los incisos a, b y c para verificar que la varianza de las
diferencias entre dos variables aleatorias independientes es la suma de sus varian-
zas individuales (Este principio se utiliza para derivar el esta-
dístico de prueba y el intervalo de confianza dados en esta sección).
e. ¿Cómo se relaciona el rango de las diferencias x 2 y con el rango de los valores x
y con el rango de los valores y?
32. Efecto de no variación en una muestra Se realizó un experimento para probar los efec-
tos del alcohol. Los niveles de alcohol exhalado se midieron en un grupo de trata-
miento de personas que bebieron etanol y en otro grupo al que se administró un place-
bo. Los resultados se presentan en la tabla adjunta. Utilice un nivel de significancia de
0.05 para probar la aseveración de que los dos grupos muestrales provienen de pobla-
ciones con la misma media. Los resultados se basan en datos de “Effects of Alcohol
Intoxication on Risk Taking, Strategy, and Error Rate in Visuomotor Performance”,
de Streufert et al., Journal of Applied Psychology, vol. 77, núm. 4. 
33. Cálculo de grados de libertad ¿De qué manera se ve afectado el número de grados de
libertad en los ejercicios 13 y 14 si se utiliza la fórmula 8-1 en lugar de seleccionar el
más chico de n1 2 1 y n2 2 1? Si se utiliza la fórmula 8-1 para el número de grados
de libertad en lugar del más pequeño de n1 2 1 y n2 2 1, ¿de qué manera se ven afec-
tados el valor P y el ancho del intervalo de confianza? ¿En qué sentido “gl 5 el más
chico de n1 2 1 y n2 2 1” es un estimado más conservador del número de grados de
libertad que el estimado que se obtiene con la fórmula 8-1?
8-4 Inferencias a partir de datos apareados
En la sección 8-3 definimos que dos muestras son independientes si los valores
muestrales, seleccionados a partir de una población, no están relacionados, apa-
reados ni asociados con los valores muestrales seleccionados a partir de la otra po-
blación. La sección 8-3 trató con inferencias acerca de las medias de dos poblacio-
nes independientes, y esta sección se enfoca en muestras dependientes, a las que
nos referimos como datos apareados. En éstos, existe alguna relación para que ca-
da valor en una muestra se aparee con un valor correspondiente en la otra muestra.
A continuación se presentan algunos ejemplos típicos de datos apareados:
● Cuando se realiza un experimento para probar la eficacia de una dieta baja
en grasas, el peso de cada sujeto se mide una vez antes de la dieta y una vez
después de la dieta.
● La eficacia de un programa de entrenamiento para el SAT (prueba de aptitudes
académicas) se prueba efectuando a cada sujeto un examen del SAT antes del
programa y otro examen del SAT equivalente después del programa.
ssx2y
2 5 sx
2 1 sy
2d.
Grupo de tratamiento Grupo placebo
n1 5 22 n2 5 22
1 5 0.049 2 5 0.000
s1 5 0.015 s2 5 0.000
xx
● La precisión de los pesos reportados se analiza con una muestra de perso-
nas cuando, para cada persona, el peso reportado se registra y el peso real
se mide.
Para tratar con inferencias acerca de medias y datos apareados, abajo se inclu-
yen resúmenes de los supuestos relevantes, la notación, el estadístico de prueba de
hipótesis y el intervalo de confianza. Puesto que la prueba de hipótesis y el inter-
valo de confianza utilizan la misma distribución y el mismo error estándar, son
equivalentes en el sentido de que arrojan las mismas conclusiones. En consecuen-
cia, la hipótesis nula de que la diferencia de la media es igual a 0 se prueba deter-
minando si el intervalo de confianza incluye a 0. [Para pruebas de hipótesis de dos
colas construya un intervalo de confianza con un nivel de confianza de 1 2 a; pe-
ro para una prueba de hipótesis de una cola, con nivel de significancia a, constru-
ya un intervalo de confianza con un nivel de confianza de 1 2 2a. (Véase la tabla
7-2 para casos comunes). Por ejemplo, la aseveración de que la diferencia de la
media es mayor que 0 se puede probar con un nivel de significancia de 0.05, cons-
truyendo un intervalo de confianza del 90%].
8-4 Inferencias a partir de datos apareados 467
Supuestos
1. Los datos muestrales consisten en datos apareados.
2. Las muestras son muestras aleatorias simples.
3. Cualquiera o ambas de estas condiciones se satisfacen: el número de datos apa-
reados o datos muestrales es grande (n . 30) o los pares de valores tienen dife-
rencias que se toman de una población con una distribución aproximadamente
normal. (Si existe una desviación radical de la distribución normal, no debemos
utilizar los métodos que se estudian en esta sección, pero quizá podamos utili-
zar los métodos no paramétricos que se analizan en el capítulo 12).
Notación para datos apareadosd 5 diferencia individual entre los dos valores en un solo dato apareado
md 5 valor medio de las diferencias d para la población de todos los datos apa-
reados
5 valor medio de las diferencias d para los datos muestrales apareados (igual a la
media de los valores x 2 y)
sd 5 desviación estándar de las diferencias d para la muestra de datos apareados
n 5 número de pares de datos
Estadístico de prueba de hipótesis para datos apareados
donde los grados de libertad 5 n 2 1.
Valores P y valores críticos: Tabla A-3 (distribución t)
t 5
d 2 md
sd!n
d
continúa
Exploración de los conjuntos de datos
Como siempre, debemos evitar la aplicación descuidada de cualquier procedi-
miento estadístico. Debemos considerar el centro, la variación, la distribución, los
datos distantes y cualquier cambio que tenga lugar en el tiempo (CVDDT). Pues-
to que queremos ilustrar los métodos de esta sección con cálculos sencillos, los
siguientes ejemplos utilizan datos muestrales consistentes en sólo cinco datos apa-
reados. Observamos que las temperaturas mínimas reales parecen ser sustancial-
mente diferentes de las temperaturas mínimas pronosticadas cinco días antes. Una
gráfica cuantilar normal de estas cinco diferencias muestrales sugiere que tienen
una distribución que es aproximadamente normal. (Estos cinco datos apareados se
tomaron del conjunto de datos 10 en el Apéndice B, y un histograma de la lista
completa de las 31 diferencias indica que la población de diferencias tiene una
distribución que es aproximadamente normal). Podemos ver que no existen datos
distantes. Es particularmente importante considerar los datos distantes puesto que
su presencia llega a afectar drásticamente los resultados.
EJEMPLO ¿Son precisos los pronósticos de temperatura? La
tabla 8-2 incluye cinco temperaturas mínimas reales y las correspondientes
temperaturas mínimas que se pronosticaron cinco días antes. Se trata de datos
apareados, puesto que cada par de valores representa al mismo día. Las tempe-
raturas pronosticadas parecen ser muy diferentes de las temperaturas reales,
pero ¿existe suficiente evidencia para concluir que la diferencia media no es de
cero? Utilice un nivel de significancia de 0.05 para probar la aseveración de que
existe una diferencia entre las temperaturas mínimas reales y las temperaturas
mínimas pronosticadas cinco días antes.
SOLUCIÓN Seguiremos el mismo método básico de prueba de hipótesis
que se introdujo en el capítulo 7, pero utilizaremos el estadístico de prueba de
arriba para datos apareados.
Paso 1: La aseveración de que existe una diferencia entre las temperaturas
mínimas reales y las temperaturas mínimas pronosticadas para cinco
días se expresa como md 2 0.
Paso 2: Si la aseveración original no es verdadera, tenemos md 5 0.
Paso 3: La hipótesis nula debe expresar igualdad y la hipótesis alternativa no
puede incluir igualdad, por lo tanto tenemos
H0: md 5 0 H1: md 2 0 (Aseveración original)
468 CAPÍTULO 8 Inferencias a partir de dos muestras
Intervalos de confianza para datos apareados
donde
Valores críticos de tA/2: Utilice la tabla A-3 con n 2 1 grados de libertad.
E 5 ta>2 
sd!n
d 2 E , md , d 1 E
Investigación
en gemelos
Los gemelos idénticos se gestan
cuando un solo óvulo fertilizado
se divide en dos, de manera que
ambos gemelos comparten el
mismo paquete genético. Actual-
mente existe una explosión en la
investigación enfocada en este tipo
de gemelos. Hablando para el Cen-
ter of Study of Multiple Birth,
Louis Keith señala que actual-
mente “tenemos mucha más ca-
pacidad de analizar los datos en
gemelos utilizando computadoras
con nuevos programas estadísticos
instalados de fábrica”. Una meta
común de estudios de este tipo es
explorar el tema clásico de “natu-
raleza contra crianza”. Por ejem-
plo, Thomas Bouchard, quien rea-
lizó el Minnessota Study of
Twins Reared Apart, encontró
que el CI es heredado en un
50%260%, mientras que el resto
es el resultado de fuerzas externas.
Los gemelos idénticos son
pares conjugados que proveen
mejores resultados permitién-
donos reducir la variación
genética inevitable con pares no
relacionados de personas.