Vista previa del material en texto
a. Calcule un estimado del intervalo de confianza del 95% de la media poblacional. b. Calcule un estimado del intervalo de confianza del 95% de la desviación estándar poblacional. c. Si pasaron varios años y usted quiere realizar una nueva encuesta para estimar la cantidad media del tiempo que planean conservar sus autos los propietarios de au- tomóviles, ¿cuántos propietarios de automóviles que se seleccionarían al azar debe encuestar? Suponga que se quiere una confianza del 99% de que la media muestral esté dentro de 0.25 años (o tres meses) de la media poblacional y que s 5 3.74 años (con base en el último resultado). d. Cuando se realiza la encuesta descrita en el inciso c, descubre que el proceso de encuesta puede simplificarse con un costo sustancialmente reducido si utiliza una base de datos disponibles que consiste en personas que compraron un automóvil de la General Motors durante los 10 últimos años. ¿Se obtendrían buenos resultados de esta población? 3. Estimaciones de encuestas a votantes En una elección presidencial reciente, se en- cuestó a 611 votantes, de los cuales 308 dijeron que votaron por el candidato que ganó (según datos del ICR Survey Research Group). a. Calcule el estimado puntual del porcentaje de votantes que, según ellos, votaron por el candidato que ganó. b. Calcule un estimado del intervalo de confianza del 98% del porcentaje de votantes que, según ellos, votaron por el candidato que ganó. c. De los que votaron, el 43% realmente votó por el candidato que ganó. ¿Es con- sistente este resultado con los resultados de la encuesta? ¿Cómo se explicaría una discrepancia? 4. Estimaciones de facilidad de lectura Remítase al conjunto de datos 14 en el Apéndice B para las calificaciones de nivel de Flesch-Kincaid para 12 páginas seleccionadas aleato- riamente que se tomaron de los libros de Tom Clancey, J. K. Rowling y León Tolstoi. a. Construya un estimado del intervalo de confianza del 95% de la media de la califi- cación de nivel de Flesch-Kincaid para la población de todas las páginas de El oso y el dragón, de Tom Clancey. b. Construya un estimado del intervalo de confianza del 95% de la media de la califi- cación de nivel de Flesch-Kincaid para la población de todas las páginas de Harry Potter y la piedra filosofal, de J. K. Rowling. c. Construya un estimado del intervalo de confianza del 95% de la media de la califi- cación de nivel de Flesch-Kincaid para la población de todas las páginas de La guerra y la paz, de León Tolstoi. d. Compare los intervalos de confianza anteriores. ¿Qué concluye acerca de las califi- caciones de nivel? 5. Estimar facilidad de lectura El conjunto de datos 14 incluye calificaciones de nivel de Flesch-Kincaid para obras de Tom Clancey, J. K. Rowling y León Tolstoi. Si usted quiere estimar la media de la calificación de nivel de Flesch-Kincaid para las pági- nas de El señor de los anillos, de J. R. R. Tolkien, ¿cuántas páginas debe seleccionar aleatoriamente si quiere tener una confianza del 90% de que la media muestral está dentro de 0.5 de la media poblacional? Puesto que las muestras de páginas de Clancey, Rowling y Tolstoi, en el conjunto de datos 14 obtienen calificaciones de nivel de Flesch-Kincaid con desviaciones estándar de 2.45, 1.17, y 2.01, suponga que s 5 2.45 para El señor de los anillos. 6. Estimación de variación El conjunto de datos 14 en el Apéndice B incluye las califi- caciones de nivel de Flesch-Kincaid para 12 páginas que se seleccionaron al azar de Harry Potter y la piedra filosofal, de J. K. Rowling. Las 12 calificaciones tienen una desviación estándar de 1.17, y parecen provenir de una población que se distribuye normalmente. Construya un estimado del intervalo de confianza del 95% de la desvia- ción estándar s de las calificaciones de nivel de Flesch-Kincaid para todas las páginas de Harry Potter y la piedra filosofal. 360 CAPÍTULO 6 Estimados y tamaños de muestra 7. Determinación del tamaño de muestra Quiere estimar el porcentaje de estudiantes de estadística de Estados Unidos que obtienen calificaciones de B o mayores. ¿Cuántos estudiantes debe encuestar si busca obtener un nivel de confianza del 97% de que el porcentaje muestral se desvió por no más de dos puntos porcentuales? 8. Política de servicio de alcohol: determinación del tamaño de muestra En una encues- ta de Gallup de 1004 adultos, el 93% indicaron que los restaurantes y los bares debe- rían negar el servicio a los clientes que bebieron mucho. Si usted planea realizar una nueva encuesta para confirmar que el porcentaje continúa siendo correcto, ¿cuántos adultos seleccionados al azar debe encuestar si desea obtener un nivel de confianza del 98% de que el margen de error es de cuatro puntos porcentuales? Ejercicios de repaso acumulativo 1. Análisis de pesos de supermodelos Algunas veces las supermodelos son criticadas porque sus bajos pesos fomentan hábitos alimenticios no saludables entre las mujeres jóvenes. Abajo se listan los pesos (en libras) de nueve supermodelos que se seleccio- naron al azar. 125 (Taylor) 119 (Auermann) 128 (Schiffer) 128 (MacPherson) 119 (Turlington) 127 (Hall) 105 (Moss) 123 (Mazza) 115 (Hume) Resuelva para cada uno de los incisos siguientes: a. Media b. Mediana c. Moda d. Mitad del rango e. Rango f. Varianza g. Desviación estándar h. Q1 i. Q2 j. Q3 k. ¿Cuál es el nivel de medición de estos datos (nominal, ordinal, intervalo, razón)? l. Construya una gráfica de cuadro para los datos. m. Construya un intervalo de confianza del 99% para la media poblacional. n. Construya un intervalo de confianza del 99% para la desviación estándar s. o. Calcule el tamaño de muestra necesario para estimar la media del peso de todas las modelos, con una confianza del 99% de que la media muestral sea errónea por no más de 2 lb. Utilice la desviación estándar muestral s del inciso g como un es- timado de la desviación estándar poblacional s. p. Cuando se seleccionan al azar mujeres de la población general, sus pesos se distri- buyen normalmente con una media de 143 lb y una desviación estándar de 29 lb (según datos de la National Health and Examination Survey). Con base en los valo- res muestrales dados, ¿parece que los pesos de las supermodelos son sustancial- mente menores que los pesos de mujeres que se seleccionaron al azar? Explique. 2. Trastorno recesivo del cromosoma X Un experto en genética determinó que, para ciertas parejas, hay un 0.25 de probabilidad de que cualquier hijo presente un trastor- no recesivo del cromosoma X. a. Calcule la probabilidad de que entre 200 de estos hijos, al menos 65 presenten el trastorno recesivo del cromosoma X. b. Un estudio subsiguiente de 200 nacimientos reales reveló que 65 de los hijos pre- sentaron el trastorno recesivo del cromosoma X. Con base en estos resultados muestrales, construya un intervalo de confianza del 95%, para la proporción de to- dos estos hijos que presentan el trastorno. c. Con base en los incisos a y b, ¿parece ser correcta la determinación del experto de un 0.25 de probabilidad? Explique. Ejercicios de repaso acumulativo 361 3. Análisis de resultados de encuesta En una encuesta de Gallup, a los sujetos adultos encuestados se les preguntó: “¿Tiene usted una pistola en su casa?”. De las personas que respondieron, 413 dijeron que “sí”, y 646 que “no” o que no tenían opinión. a. ¿Que porcentaje de los que respondieron contestaron “sí”? b. Construya un estimado del intervalo de confianza del 95%, del porcentaje de to- dos los adultos que respondieron “sí” cuando se les preguntó si tenían una pistola en su casa. c. ¿Podemos concluir con seguridad que menos del 50% de los adultos respondieron “sí” cuando se les preguntó si tenían una pistola en su casa? ¿Por qué? d. ¿Cuál sería una respuesta sensible a la crítica de que la encuesta de Gallup no pue- de ofrecer buenos resultados puesto que el tamaño de la muestra es sólo de 1059 adultos, que se seleccionaron de una enorme población con más de 200 millones de adultos? 362 CAPÍTULO 6 Estimados y tamaños demuestra Actividades cooperativas en equipo 1. Actividad fuera de clase Reúna datos muestrales y uti- lice los métodos de este capítulo para construir estima- dos de intervalos de confianza de parámetros poblacio- nales. Aquí están algunas sugerencias de parámetros: ● La proporción de estudiantes de su universidad que puede levantar una ceja sin levantar la otra. [Dichos resultados muestrales son fáciles de obtener ya que los sujetos que se encuestaron tienden a levantar una ceja (si pueden) cuando los aborda alguien haciendo preguntas]. ● La media de la edad de automóviles que conducen estudiantes de estadística y/o la media de automóvi- les que conducen universitarios. ● La media de la edad de los libros de matemáticas y la media de la edad de los libros de ciencia en la biblio- teca de su universidad (con base en las fechas de los derechos de autor). ● La media de la longitud de las palabras en los edito- riales del New York Times y la media de la longitud de las palabras de los editoriales de su periódico local. ● La media del tamaño de las palabras en la revista Time, la revista Newsweek y la revista People. ● La proporción de estudiantes de su universidad capa- ces de identificar correctamente al presidente, al vice- presidente y al secretario de Estado de Estados Unidos. ● La proporción de estudiantes de su universidad que son mayores de 18 años de edad y se registraron en el padrón electoral. ● La media de la edad de los estudiantes de tiempo completo en su universidad. ● La proporción de vehículos con motor en su región que son automóviles. 2. Actividad en clase Forme grupos de tres o cuatro estu- diantes. Pídales que examinen una revista actual como Time o Newsweek, y que calculen la proporción de pá- ginas que incluyen anuncios comerciales. Con base en los resultados, deben construir un estimado del interva- lo de confianza de 95%, del porcentaje de todas las pá- ginas que contienen anuncios comerciales. Comparen los resultados con otros grupos. 3. Actividad en clase Forme grupos de dos estudiantes. Primero pídales que calculen el tamaño de muestra que se requiere para estimar la proporción de veces que una moneda cae en cara cuando se lanza, suponiendo que usted busca un nivel de confianza del 80% de que la proporción muestral está dentro de 0.08 de la propor- ción poblacional real. Luego, dígales que lancen una moneda el número requerido de veces y que registren sus resultados. ¿Qué porcentaje del intervalo de con- fianza podría contener realmente el valor verdadero de la proporción de la población, que sabemos que es p 5 0.5? Verifique este último resultado comparando su in- tervalo de confianza con los intervalos de confianza que se encontraron en otros grupos. Muestreo repetido bootstrap Se puede utilizar el método bootstrap para construir intervalos de confianza en situacio- nes en las que los métodos tradicionales no pueden (o no de- ben) utilizarse. Por ejemplo, la siguiente muestra de 10 va- lores se seleccionó aleatoriamente de una población con una distribución que se aleja mucho de la normal; por lo tanto, no se puede utilizar ningún método que requiera una distribu- ción normal. 2.9 564.2 1.4 4.7 67.6 4.8 51.3 3.6 18.0 3.6 Al querer manejar los datos muestrales de arriba para la construcción del estimado de un intervalo de confianza de la media poblacional m, notamos que la muestra es pequeña y que hay un dato distante. El método bootstrap, que no nece- sita establecer supuestos de la población original, por lo re- gular requiere de una computadora para construir una po- blación bootstrap replicando (duplicando) una muestra muchas veces. Podemos sustraer de la muestra con reempla- zo, creando así una aproximación de la población original. De esta forma, estiramos la muestra “con sus propios boots- traps” para simular la población original. Utilizando los da- tos muestrales que se dieron antes, construya un estimado del intervalo de confianza del 95% de la media poblacional m, con el método bootstrap como se describe en los siguien- tes pasos de Minitab. a. Desarrolle 500 muestras nuevas, cada una de tamaño 10, seleccionando 10 valores con reemplazo de los 10 valores muestrales que se dieron antes. Con Minitab, primero ingrese los valores muestrales en la columna C1, luego ingrese las probabilidades de 0.1, 0.1, . . . , 0.1 (10 veces) en la columna C2. Ahora seleccione Calc de la barra del menú principal, luego Random Data, seguida por Discrete. Proceda a generar 500 fi- las de datos, para guardarse en las columnas C11-C20, con los valores en C1 y las probabilidades en C2; para concluir, haga clic en OK. b. Encuentre las medias de las 500 muestras bootstrap que se generaron en el inciso a. Seleccione Calc, Proyecto tecnológico 363 Proyecto tecnológico Row Statistics y Mean, ingrese las variables de en- trada de C11-C20 con los resultados a guardarse en C21 y haga clic en OK. c. Ordene las 500 medias. Seleccione Manip de la barra del menú principal, escoja la opción de Sort y proceda a ordenar la columna C21. Guarde la co- lumna ordenada en C21 y ordene la columna C21. Haga clic en OK. d. Encuentre los percentiles P2.5 y P97.5 para las medias ordenadas que resultaron del paso anterior. (P2.5 es la media de los valores 12o y 13o de la lista que se clasificó en la columna C21; P97.5 es la media de los valores 487o y 488o en la columna C21). Identifique el intervalo de confianza resultante sustituyendo los valores para P2.5 y P97.5 en P2.5 , m , P97.5. ¿Con- tiene este intervalo de confianza el valor real de m, que es 148? Ahora utilice el método bootstrap para encontrar un in- tervalo de confianza del 95% para la desviación estándar po- blacional s. [Utilice los mismos pasos que se listan arriba, pero especifique desviación estándar (Standard Deviation) en lugar de media (Mean) en el inciso b)]. Compare su resultado con el intervalo 318.4 , s, 1079.6, que se obtuvo utilizan- do incorrectamente los métodos descritos en la sección 6-5. (El uso de los métodos de la sección 6-5 es incorrecto porque estos métodos requieren que los valores muestrales proven- gan de una población que se distribuya normalmente, pero la población no tiene una distribución normal). Este interva- lo de confianza incorrecto para s no contiene el valor real de s, que es 232.1. ¿Ofrece el procedimiento bootstrap un intervalo de confianza para s que contiene a 232.1, verifi- cando que este método es efectivo? Un método alternativo al uso de Minitab es utilizar pro- gramas de cómputo que se diseñen específicamente para métodos de muestreo repetido bootstrap. El autor recomien- da Resampling Stats, disponible en Resampling Stats, Inc., 612 N. Jackson St., Arlington, VA, 22201. Teléfono: (703) 522-2713. 364 CAPÍTULO 6 Estimados y tamaños de muestra DATOS a la DECISIÓNde los Pensamiento crítico: rediseño del teclado estándar La mayoría de los teclados que se utilizan normal- mente tienen las teclas configuradas en un patrón estándar del arreglo Qwerty, que se llama así por la posición de las letras QWERTY en la fila superior. Con una fecha de desarrollo de 1872, la configu- ración QWERTY se supuso que obligaba a los me- canógrafos a escribir más lentamente para que sus máquinas de escribir se trabaran con menos fre- cuencia. El teclado Dvorak se desarrolló en 1936 co- mo una configuración más eficiente con teclas que se acomodaron de acuerdo con su frecuencia de uso. Un artículo en la revista Discover sugiere que usted puede medir la facilidad de escritura utilizan- do este sistema de calificación por puntos: asigne a cada letra en la fila superior de letras el valor de 1, a cada letra en la fila media o “de casa” el de 0 y a cada letra de la fila inferior el de 2. (Véase “Type- casting”, de Scott Kim, Discover). Aplicando este sistema de calificación a cada una de las 52 pala- bras del Preámbulo a la Constitución de Estados Unidos, obtenemos estos estadísticos para cada una de las configuraciones de teclado: Configuración QWERTY: n 5 52, 5 4.4, s 5 2.8 Configuración Dvorak: n5 52, 5 1.7, s 5 1.8 a. Utilice los datos muestrales que se dieron con los métodos de este capítulo para demostrar que la configuración Dvorak tiene calificacio- nes significativamente más bajas, indicando que la configuración de teclado Dvorak es más fácil de usar. b. ¿Hay algún aspecto del sistema de calificación o de la elección de palabras para la muestra que pueda afectar la conclusión acerca de cuál configuración de teclado es más fácil de usar? c. Escriba un breve reporte de lo que encontró y sus conclusiones. d. Si la configuración de teclado Dvorak es real- mente más fácil de usar, ¿por qué no se adop- ta por casi todos los que usan ahora un tecla- do? ¿Cómo se pueden vencer los obstáculos para adoptar la configuración Dvorak con la finalidad de que los que usamos teclados nos volvamos más eficientes? x x PROYECTO DE INTERNET Intervalos de confianza Los intervalos de confianza en este capítulo ilustran un punto importante de la ciencia de la estimación estadística. A saber, las estimaciones que se basan en datos muestrales se hacen con ciertos grados de con- fianza. En el proyecto de Internet para este capítulo, usted utilizará intervalos de confianza para hacer una afirmación acerca de la temperatura de donde usted vive. Vaya al sitio de Internet de este libro de texto: http:////www.pearsoneducacion.net//triola Localice el proyecto para este capítulo. Ahí encontra- rá las instrucciones sobre cómo utilizar Internet para localizar datos de temperatura que recolectó la estación meteorológica más cercana a su casa. Con estos datos a la mano, construirá intervalos de confianza para las temperaturas durante diferentes periodos e intentará concebir conclusiones acerca de los cambios de tem- peratura en su área. Además, aprenderá más acerca de la relación entre confianza y probabilidad. ¿Qué conceptos de la estadística utiliza en su trabajo? Utilizo una variedad de métodos estadísticos que incluyen métodos paramétricos y no paramétricos. Sin un firme entendimiento de la estadística, no sería capaz de probar si los factores ambientales afectan a los eventos reproductivos. Utilizo la estadística para probar hipótesis que genero obser- vando animales dentro de sus medios natu- rales. Mientras que la observación nos con- duce a establecer hipótesis, sólo es posible responder a las preguntas mediante el uso de experimentos bien diseñados y ensayos estadísticos. Para la investigación y la ense- ñanza en el campo de la ecología, el com- portamiento animal y la ecotoxicología, el conocimiento de la estadística es esencial para obtener un buen trabajo y conservarlo. ¿Podría dar un ejemplo específico de cómo usó la estadística en el pasado? La estadística es muy útil en la identificación de factores que influyen en el comporta- miento animal. Los pájaros anidan en hábi- tat particulares, pero nos preguntamos si anidan aleatoriamente o seleccionan sitios específicos para sus nidos. Esto es impor- tante puesto que la conservación requiere conocer las necesidades de los animales para crear, proteger y/o manejar ese hábi- tat. Probé la hipótesis de que las golondri- nas marinas comunes seleccionaban islas de pantanos salados particulares. Compa- rando estadísticamente un amplio rango de factores ambientales (como son la altu- ra de la isla, el tamaño de la isla, y el tipo y densidad de la vegetación) en todas las islas con el mismo conjunto de factores en las que anidan las golondrinas marinas, de- mostramos que estas aves en realidad seleccionan un conjunto de características muy específicas. Aunque hay más de 250 islas en la bahía donde este estudio se reali- zó, sólo 36 reúnen el criterio que usan las golondrinas. Las aves seleccionan islas que son suficientemente altas para evitar las mareas en las tormentas de verano, pero suficientemente bajas para que los depre- dadores no puedan sobrevivir durante el invierno. Las islas que son bastante altas como para evitar las mareas de las tormen- tas de invierno a menudo tienen poblaciones viables de depredadores, tales como los zorros y los mapaches, que se comerán los huevos y los pollos de las golondrinas. ¿El conocimiento de la estadística es esencial para su trabajo? Una firme comprensión de la estadística es absolutamente esencial para realizar inves- tigación con humanos y animales. Con el uso de pruebas de hipótesis y análisis de regresión múltiple, es posible comenzar a identificar y evaluar los factores que afec- tan comportamientos, tales como el de la pesca y el consumo de las personas, el sa- queo de las aves costeras y la construcción de nidos de las aves marinas. En términos de estadística, ¿qué recomendaría a los aspirantes de empleo en su campo? Cualquiera que desee estar en el campo de la biología de conservación, la ecotoxicolo- gía, el comportamiento animal o ecológico necesita un amplio rango de habilidades estadísticas. Dos o tres cursos estarían mejor, incluyendo estadística general de regresión y estadística no paramétrica. La naturaleza de cada problema y las características de los datos determinarán la estadística que se requiere; uno no debería limitarse por una carencia de conocimiento de la estadística. Joanna Burger Profesora distinguida de biolo- gía en Rutgers University y miembro del Environmental and Occupational Health Sciences Institute. Joanna Burger es docente, hace investigación y sirve en muchos comités ambientales nacionales e internacionales que tratan con especies en peligro de extinción, conta- minantes en la fauna, los efectos de químicos en el comportamiento animal y los efectos de la gente en los ecosistemas. “Para la investigación y la enseñanza en el campo de la ecología, el comportamiento animal y la ecotoxicología, el conocimiento de la estadística es esencial para obtener un buen trabajo y conservarlo”. 365