Estadistica - Parte Uno-páginas-87

•

SIN SIGLA

Micaela De Leon

14/5/2024

¡Estudia con miles de materiales!

Vista previa del material en texto

a. Calcule un estimado del intervalo de confianza del 95% de la media poblacional.
b. Calcule un estimado del intervalo de confianza del 95% de la desviación estándar
poblacional.
c. Si pasaron varios años y usted quiere realizar una nueva encuesta para estimar la
cantidad media del tiempo que planean conservar sus autos los propietarios de au-
tomóviles, ¿cuántos propietarios de automóviles que se seleccionarían al azar debe
encuestar? Suponga que se quiere una confianza del 99% de que la media muestral
esté dentro de 0.25 años (o tres meses) de la media poblacional y que s 5 3.74
años (con base en el último resultado).
d. Cuando se realiza la encuesta descrita en el inciso c, descubre que el proceso de
encuesta puede simplificarse con un costo sustancialmente reducido si utiliza una
base de datos disponibles que consiste en personas que compraron un automóvil de
la General Motors durante los 10 últimos años. ¿Se obtendrían buenos resultados
de esta población?
3. Estimaciones de encuestas a votantes En una elección presidencial reciente, se en-
cuestó a 611 votantes, de los cuales 308 dijeron que votaron por el candidato que
ganó (según datos del ICR Survey Research Group).
a. Calcule el estimado puntual del porcentaje de votantes que, según ellos, votaron
por el candidato que ganó.
b. Calcule un estimado del intervalo de confianza del 98% del porcentaje de votantes
que, según ellos, votaron por el candidato que ganó.
c. De los que votaron, el 43% realmente votó por el candidato que ganó. ¿Es con-
sistente este resultado con los resultados de la encuesta? ¿Cómo se explicaría una
discrepancia?
4. Estimaciones de facilidad de lectura Remítase al conjunto de datos 14 en el Apéndice B
para las calificaciones de nivel de Flesch-Kincaid para 12 páginas seleccionadas aleato-
riamente que se tomaron de los libros de Tom Clancey, J. K. Rowling y León Tolstoi.
a. Construya un estimado del intervalo de confianza del 95% de la media de la califi-
cación de nivel de Flesch-Kincaid para la población de todas las páginas de El oso
y el dragón, de Tom Clancey.
b. Construya un estimado del intervalo de confianza del 95% de la media de la califi-
cación de nivel de Flesch-Kincaid para la población de todas las páginas de Harry
Potter y la piedra filosofal, de J. K. Rowling.
c. Construya un estimado del intervalo de confianza del 95% de la media de la califi-
cación de nivel de Flesch-Kincaid para la población de todas las páginas de La
guerra y la paz, de León Tolstoi.
d. Compare los intervalos de confianza anteriores. ¿Qué concluye acerca de las califi-
caciones de nivel?
5. Estimar facilidad de lectura El conjunto de datos 14 incluye calificaciones de nivel
de Flesch-Kincaid para obras de Tom Clancey, J. K. Rowling y León Tolstoi. Si usted
quiere estimar la media de la calificación de nivel de Flesch-Kincaid para las pági-
nas de El señor de los anillos, de J. R. R. Tolkien, ¿cuántas páginas debe seleccionar
aleatoriamente si quiere tener una confianza del 90% de que la media muestral está
dentro de 0.5 de la media poblacional? Puesto que las muestras de páginas de Clancey,
Rowling y Tolstoi, en el conjunto de datos 14 obtienen calificaciones de nivel de
Flesch-Kincaid con desviaciones estándar de 2.45, 1.17, y 2.01, suponga que s 5
2.45 para El señor de los anillos.
6. Estimación de variación El conjunto de datos 14 en el Apéndice B incluye las califi-
caciones de nivel de Flesch-Kincaid para 12 páginas que se seleccionaron al azar de
Harry Potter y la piedra filosofal, de J. K. Rowling. Las 12 calificaciones tienen una
desviación estándar de 1.17, y parecen provenir de una población que se distribuye
normalmente. Construya un estimado del intervalo de confianza del 95% de la desvia-
ción estándar s de las calificaciones de nivel de Flesch-Kincaid para todas las páginas
de Harry Potter y la piedra filosofal.
360 CAPÍTULO 6 Estimados y tamaños de muestra
7. Determinación del tamaño de muestra Quiere estimar el porcentaje de estudiantes de
estadística de Estados Unidos que obtienen calificaciones de B o mayores. ¿Cuántos
estudiantes debe encuestar si busca obtener un nivel de confianza del 97% de que el
porcentaje muestral se desvió por no más de dos puntos porcentuales?
8. Política de servicio de alcohol: determinación del tamaño de muestra En una encues-
ta de Gallup de 1004 adultos, el 93% indicaron que los restaurantes y los bares debe-
rían negar el servicio a los clientes que bebieron mucho. Si usted planea realizar una
nueva encuesta para confirmar que el porcentaje continúa siendo correcto, ¿cuántos
adultos seleccionados al azar debe encuestar si desea obtener un nivel de confianza
del 98% de que el margen de error es de cuatro puntos porcentuales?
Ejercicios de repaso acumulativo
1. Análisis de pesos de supermodelos Algunas veces las supermodelos son criticadas
porque sus bajos pesos fomentan hábitos alimenticios no saludables entre las mujeres
jóvenes. Abajo se listan los pesos (en libras) de nueve supermodelos que se seleccio-
naron al azar.
125 (Taylor) 119 (Auermann) 128 (Schiffer) 128 (MacPherson)
119 (Turlington) 127 (Hall) 105 (Moss) 123 (Mazza)
115 (Hume)
Resuelva para cada uno de los incisos siguientes:
a. Media b. Mediana
c. Moda d. Mitad del rango
e. Rango f. Varianza
g. Desviación estándar h. Q1
i. Q2 j. Q3
k. ¿Cuál es el nivel de medición de estos datos (nominal, ordinal, intervalo, razón)?
l. Construya una gráfica de cuadro para los datos.
m. Construya un intervalo de confianza del 99% para la media poblacional.
n. Construya un intervalo de confianza del 99% para la desviación estándar s.
o. Calcule el tamaño de muestra necesario para estimar la media del peso de todas
las modelos, con una confianza del 99% de que la media muestral sea errónea por
no más de 2 lb. Utilice la desviación estándar muestral s del inciso g como un es-
timado de la desviación estándar poblacional s.
p. Cuando se seleccionan al azar mujeres de la población general, sus pesos se distri-
buyen normalmente con una media de 143 lb y una desviación estándar de 29 lb
(según datos de la National Health and Examination Survey). Con base en los valo-
res muestrales dados, ¿parece que los pesos de las supermodelos son sustancial-
mente menores que los pesos de mujeres que se seleccionaron al azar? Explique.
2. Trastorno recesivo del cromosoma X Un experto en genética determinó que, para
ciertas parejas, hay un 0.25 de probabilidad de que cualquier hijo presente un trastor-
no recesivo del cromosoma X.
a. Calcule la probabilidad de que entre 200 de estos hijos, al menos 65 presenten el
trastorno recesivo del cromosoma X.
b. Un estudio subsiguiente de 200 nacimientos reales reveló que 65 de los hijos pre-
sentaron el trastorno recesivo del cromosoma X. Con base en estos resultados
muestrales, construya un intervalo de confianza del 95%, para la proporción de to-
dos estos hijos que presentan el trastorno.
c. Con base en los incisos a y b, ¿parece ser correcta la determinación del experto de
un 0.25 de probabilidad? Explique.
Ejercicios de repaso acumulativo 361
3. Análisis de resultados de encuesta En una encuesta de Gallup, a los sujetos adultos
encuestados se les preguntó: “¿Tiene usted una pistola en su casa?”. De las personas que
respondieron, 413 dijeron que “sí”, y 646 que “no” o que no tenían opinión.
a. ¿Que porcentaje de los que respondieron contestaron “sí”?
b. Construya un estimado del intervalo de confianza del 95%, del porcentaje de to-
dos los adultos que respondieron “sí” cuando se les preguntó si tenían una pistola
en su casa.
c. ¿Podemos concluir con seguridad que menos del 50% de los adultos respondieron
“sí” cuando se les preguntó si tenían una pistola en su casa? ¿Por qué?
d. ¿Cuál sería una respuesta sensible a la crítica de que la encuesta de Gallup no pue-
de ofrecer buenos resultados puesto que el tamaño de la muestra es sólo de 1059
adultos, que se seleccionaron de una enorme población con más de 200 millones
de adultos?
362 CAPÍTULO 6 Estimados y tamaños demuestra
Actividades cooperativas en equipo
1. Actividad fuera de clase Reúna datos muestrales y uti-
lice los métodos de este capítulo para construir estima-
dos de intervalos de confianza de parámetros poblacio-
nales. Aquí están algunas sugerencias de parámetros:
● La proporción de estudiantes de su universidad que
puede levantar una ceja sin levantar la otra. [Dichos
resultados muestrales son fáciles de obtener ya que
los sujetos que se encuestaron tienden a levantar una
ceja (si pueden) cuando los aborda alguien haciendo
preguntas].
● La media de la edad de automóviles que conducen
estudiantes de estadística y/o la media de automóvi-
les que conducen universitarios.
● La media de la edad de los libros de matemáticas y la
media de la edad de los libros de ciencia en la biblio-
teca de su universidad (con base en las fechas de los
derechos de autor).
● La media de la longitud de las palabras en los edito-
riales del New York Times y la media de la longitud de
las palabras de los editoriales de su periódico local.
● La media del tamaño de las palabras en la revista Time,
la revista Newsweek y la revista People.
● La proporción de estudiantes de su universidad capa-
ces de identificar correctamente al presidente, al vice-
presidente y al secretario de Estado de Estados Unidos.
● La proporción de estudiantes de su universidad que
son mayores de 18 años de edad y se registraron en
el padrón electoral.
● La media de la edad de los estudiantes de tiempo
completo en su universidad.
● La proporción de vehículos con motor en su región
que son automóviles.
2. Actividad en clase Forme grupos de tres o cuatro estu-
diantes. Pídales que examinen una revista actual como
Time o Newsweek, y que calculen la proporción de pá-
ginas que incluyen anuncios comerciales. Con base en
los resultados, deben construir un estimado del interva-
lo de confianza de 95%, del porcentaje de todas las pá-
ginas que contienen anuncios comerciales. Comparen
los resultados con otros grupos.
3. Actividad en clase Forme grupos de dos estudiantes.
Primero pídales que calculen el tamaño de muestra que
se requiere para estimar la proporción de veces que una
moneda cae en cara cuando se lanza, suponiendo que
usted busca un nivel de confianza del 80% de que la
proporción muestral está dentro de 0.08 de la propor-
ción poblacional real. Luego, dígales que lancen una
moneda el número requerido de veces y que registren
sus resultados. ¿Qué porcentaje del intervalo de con-
fianza podría contener realmente el valor verdadero de
la proporción de la población, que sabemos que es p 5
0.5? Verifique este último resultado comparando su in-
tervalo de confianza con los intervalos de confianza
que se encontraron en otros grupos.
Muestreo repetido bootstrap Se puede utilizar el método
bootstrap para construir intervalos de confianza en situacio-
nes en las que los métodos tradicionales no pueden (o no de-
ben) utilizarse. Por ejemplo, la siguiente muestra de 10 va-
lores se seleccionó aleatoriamente de una población con una
distribución que se aleja mucho de la normal; por lo tanto, no
se puede utilizar ningún método que requiera una distribu-
ción normal.
2.9 564.2 1.4 4.7 67.6 4.8 51.3 3.6 18.0 3.6
Al querer manejar los datos muestrales de arriba para la
construcción del estimado de un intervalo de confianza de la
media poblacional m, notamos que la muestra es pequeña y
que hay un dato distante. El método bootstrap, que no nece-
sita establecer supuestos de la población original, por lo re-
gular requiere de una computadora para construir una po-
blación bootstrap replicando (duplicando) una muestra
muchas veces. Podemos sustraer de la muestra con reempla-
zo, creando así una aproximación de la población original.
De esta forma, estiramos la muestra “con sus propios boots-
traps” para simular la población original. Utilizando los da-
tos muestrales que se dieron antes, construya un estimado
del intervalo de confianza del 95% de la media poblacional
m, con el método bootstrap como se describe en los siguien-
tes pasos de Minitab.
a. Desarrolle 500 muestras nuevas, cada una de tamaño
10, seleccionando 10 valores con reemplazo de los 10
valores muestrales que se dieron antes. Con Minitab,
primero ingrese los valores muestrales en la columna
C1, luego ingrese las probabilidades de 0.1, 0.1, . . . ,
0.1 (10 veces) en la columna C2. Ahora seleccione
Calc de la barra del menú principal, luego Random
Data, seguida por Discrete. Proceda a generar 500 fi-
las de datos, para guardarse en las columnas C11-C20,
con los valores en C1 y las probabilidades en C2;
para concluir, haga clic en OK.
b. Encuentre las medias de las 500 muestras bootstrap
que se generaron en el inciso a. Seleccione Calc,
Proyecto tecnológico 363
Proyecto tecnológico
Row Statistics y Mean, ingrese las variables de en-
trada de C11-C20 con los resultados a guardarse en
C21 y haga clic en OK.
c. Ordene las 500 medias. Seleccione Manip de la
barra del menú principal, escoja la opción de Sort
y proceda a ordenar la columna C21. Guarde la co-
lumna ordenada en C21 y ordene la columna C21.
Haga clic en OK.
d. Encuentre los percentiles P2.5 y P97.5 para las medias
ordenadas que resultaron del paso anterior. (P2.5 es
la media de los valores 12o y 13o de la lista que se
clasificó en la columna C21; P97.5 es la media de los
valores 487o y 488o en la columna C21). Identifique
el intervalo de confianza resultante sustituyendo los
valores para P2.5 y P97.5 en P2.5 , m , P97.5. ¿Con-
tiene este intervalo de confianza el valor real de m,
que es 148?
Ahora utilice el método bootstrap para encontrar un in-
tervalo de confianza del 95% para la desviación estándar po-
blacional s. [Utilice los mismos pasos que se listan arriba,
pero especifique desviación estándar (Standard Deviation) en
lugar de media (Mean) en el inciso b)]. Compare su resultado
con el intervalo 318.4 , s, 1079.6, que se obtuvo utilizan-
do incorrectamente los métodos descritos en la sección 6-5.
(El uso de los métodos de la sección 6-5 es incorrecto porque
estos métodos requieren que los valores muestrales proven-
gan de una población que se distribuya normalmente, pero
la población no tiene una distribución normal). Este interva-
lo de confianza incorrecto para s no contiene el valor real
de s, que es 232.1. ¿Ofrece el procedimiento bootstrap un
intervalo de confianza para s que contiene a 232.1, verifi-
cando que este método es efectivo?
Un método alternativo al uso de Minitab es utilizar pro-
gramas de cómputo que se diseñen específicamente para
métodos de muestreo repetido bootstrap. El autor recomien-
da Resampling Stats, disponible en Resampling Stats, Inc.,
612 N. Jackson St., Arlington, VA, 22201. Teléfono: (703)
522-2713.
364 CAPÍTULO 6 Estimados y tamaños de muestra
DATOS a la DECISIÓNde los
Pensamiento crítico: rediseño del teclado estándar
La mayoría de los teclados que se utilizan normal-
mente tienen las teclas configuradas en un patrón
estándar del arreglo Qwerty, que se llama así por
la posición de las letras QWERTY en la fila superior.
Con una fecha de desarrollo de 1872, la configu-
ración QWERTY se supuso que obligaba a los me-
canógrafos a escribir más lentamente para que sus
máquinas de escribir se trabaran con menos fre-
cuencia. El teclado Dvorak se desarrolló en 1936 co-
mo una configuración más eficiente con teclas que
se acomodaron de acuerdo con su frecuencia de
uso. Un artículo en la revista Discover sugiere que
usted puede medir la facilidad de escritura utilizan-
do este sistema de calificación por puntos: asigne
a cada letra en la fila superior de letras el valor de
1, a cada letra en la fila media o “de casa” el de 0 y
a cada letra de la fila inferior el de 2. (Véase “Type-
casting”, de Scott Kim, Discover). Aplicando este
sistema de calificación a cada una de las 52 pala-
bras del Preámbulo a la Constitución de Estados
Unidos, obtenemos estos estadísticos para cada
una de las configuraciones de teclado:
Configuración QWERTY: n 5 52, 5 4.4, s 5 2.8
Configuración Dvorak: n5 52, 5 1.7, s 5 1.8
a. Utilice los datos muestrales que se dieron con
los métodos de este capítulo para demostrar
que la configuración Dvorak tiene calificacio-
nes significativamente más bajas, indicando
que la configuración de teclado Dvorak es
más fácil de usar.
b. ¿Hay algún aspecto del sistema de calificación
o de la elección de palabras para la muestra
que pueda afectar la conclusión acerca de
cuál configuración de teclado es más fácil
de usar?
c. Escriba un breve reporte de lo que encontró
y sus conclusiones.
d. Si la configuración de teclado Dvorak es real-
mente más fácil de usar, ¿por qué no se adop-
ta por casi todos los que usan ahora un tecla-
do? ¿Cómo se pueden vencer los obstáculos
para adoptar la configuración Dvorak con la
finalidad de que los que usamos teclados nos
volvamos más eficientes?
x
x
PROYECTO DE INTERNET Intervalos de confianza
Los intervalos de confianza en este capítulo ilustran
un punto importante de la ciencia de la estimación
estadística. A saber, las estimaciones que se basan en
datos muestrales se hacen con ciertos grados de con-
fianza. En el proyecto de Internet para este capítulo,
usted utilizará intervalos de confianza para hacer una
afirmación acerca de la temperatura de donde usted
vive. Vaya al sitio de Internet de este libro de texto:
http:////www.pearsoneducacion.net//triola
Localice el proyecto para este capítulo. Ahí encontra-
rá las instrucciones sobre cómo utilizar Internet para
localizar datos de temperatura que recolectó la estación
meteorológica más cercana a su casa. Con estos datos
a la mano, construirá intervalos de confianza para las
temperaturas durante diferentes periodos e intentará
concebir conclusiones acerca de los cambios de tem-
peratura en su área. Además, aprenderá más acerca
de la relación entre confianza y probabilidad.
¿Qué conceptos de la estadística
utiliza en su trabajo?
Utilizo una variedad de métodos estadísticos
que incluyen métodos paramétricos y no
paramétricos. Sin un firme entendimiento
de la estadística, no sería capaz de probar
si los factores ambientales afectan a los
eventos reproductivos. Utilizo la estadística
para probar hipótesis que genero obser-
vando animales dentro de sus medios natu-
rales. Mientras que la observación nos con-
duce a establecer hipótesis, sólo es posible
responder a las preguntas mediante el uso
de experimentos bien diseñados y ensayos
estadísticos. Para la investigación y la ense-
ñanza en el campo de la ecología, el com-
portamiento animal y la ecotoxicología, el
conocimiento de la estadística es esencial
para obtener un buen trabajo y conservarlo.
¿Podría dar un ejemplo específico de
cómo usó la estadística en el pasado?
La estadística es muy útil en la identificación
de factores que influyen en el comporta-
miento animal. Los pájaros anidan en hábi-
tat particulares, pero nos preguntamos si
anidan aleatoriamente o seleccionan sitios
específicos para sus nidos. Esto es impor-
tante puesto que la conservación requiere
conocer las necesidades de los animales
para crear, proteger y/o manejar ese hábi-
tat. Probé la hipótesis de que las golondri-
nas marinas comunes seleccionaban islas
de pantanos salados particulares. Compa-
rando estadísticamente un amplio rango
de factores ambientales (como son la altu-
ra de la isla, el tamaño de la isla, y el tipo y
densidad de la vegetación) en todas las islas
con el mismo conjunto de factores en las
que anidan las golondrinas marinas, de-
mostramos que estas aves en realidad
seleccionan un conjunto de características
muy específicas. Aunque hay más de 250
islas en la bahía donde este estudio se reali-
zó, sólo 36 reúnen el criterio que usan las
golondrinas. Las aves seleccionan islas que
son suficientemente altas para evitar las
mareas en las tormentas de verano, pero
suficientemente bajas para que los depre-
dadores no puedan sobrevivir durante el
invierno. Las islas que son bastante altas
como para evitar las mareas de las tormen-
tas de invierno a menudo tienen poblaciones
viables de depredadores, tales como los
zorros y los mapaches, que se comerán
los huevos y los pollos de las golondrinas.
¿El conocimiento de la estadística
es esencial para su trabajo?
Una firme comprensión de la estadística es
absolutamente esencial para realizar inves-
tigación con humanos y animales. Con el
uso de pruebas de hipótesis y análisis de
regresión múltiple, es posible comenzar a
identificar y evaluar los factores que afec-
tan comportamientos, tales como el de la
pesca y el consumo de las personas, el sa-
queo de las aves costeras y la construcción
de nidos de las aves marinas.
En términos de estadística, ¿qué
recomendaría a los aspirantes de
empleo en su campo?
Cualquiera que desee estar en el campo de
la biología de conservación, la ecotoxicolo-
gía, el comportamiento animal o ecológico
necesita un amplio rango de habilidades
estadísticas. Dos o tres cursos estarían mejor,
incluyendo estadística general de regresión
y estadística no paramétrica. La naturaleza
de cada problema y las características de
los datos determinarán la estadística que se
requiere; uno no debería limitarse por una
carencia de conocimiento de la estadística.
Joanna Burger
Profesora distinguida de biolo-
gía en Rutgers University y
miembro del Environmental
and Occupational Health
Sciences Institute.
Joanna Burger es docente,
hace investigación y sirve en
muchos comités ambientales
nacionales e internacionales
que tratan con especies en
peligro de extinción, conta-
minantes en la fauna, los
efectos de químicos en el
comportamiento animal y
los efectos de la gente en los
ecosistemas.
“Para la investigación y la enseñanza en el
campo de la ecología, el comportamiento animal y la
ecotoxicología, el conocimiento de la estadística es esencial
para obtener un buen trabajo y conservarlo”.
365