Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
328 ❍ CAPÍTULO 8 ESTIMACIÓN DE MUESTRAS GRANDES 8.8 8.60 Siguiente generación Nacidos entre 1980 y 1990, la Generación Siguiente ha vivido en un mundo posterior a la Guerra Fría y un tiempo de relativa prosperidad económica en Estados Unidos, pero también han conocido el 11 de septiembre y el temor a otro ataque, dos Guerras del Golfo, la tragedia de la Secundaria de Columbine, el huracán Katrina y la creciente polarización de discursos públicos. Más que cualquiera que llegó antes, la Generación Siguiente está comprometida con la tecnología y la gran mayoría depende de ella.15 Suponga que de una encuesta de 500 estudiantes mujeres y 500 hombres de la Generación Siguiente, 345 de las mujeres y 365 de los hombres dijeron que decidieron asistir a la universidad para ganar más dinero. a. Construya un intervalo de confianza de 98% para la diferencia en las proporciones de estudiantes mujeres y hombres que decidieron asistir a la universidad para ganar más dinero. b. ¿Qué significa decir que está “98% seguro”? c. Con base en el intervalo de confianza del inciso a), ¿se puede concluir que hay una diferencia en las proporciones de estudiantes mujeres y hombres que decidieron asistir a la universidad para ganar más dinero? 8.61 ¿Excedrina o Tylenol? En un estudio para comparar los efectos de dos analgésicos se encontró que, de n1 � 200 personas seleccionadas al azar y a las que se dieron instrucciones de usar el primer analgésico, 93% indicaron que alivió su dolor. De n2 � 450 personas seleccionadas al azar para usar el segundo analgésico, 96% indicaron que les alivió el dolor. a. Encuentre un intervalo de confianza de 99% para la diferencia en las proporciones que experimentan alivio por estos dos analgésicos. b. Con base en el intervalo de confianza del inciso a), ¿hay suficiente evidencia para indicar una diferencia en las proporciones que experimentan alivio para los dos analgésicos? Explique. 8.62 Accidentes automovilísticos Los registros del año pasado sobre accidentes automovilísticos, en una sección determinada de carreteras, se clasifi caron de acuerdo a si las pérdidas resultantes eran de $1000 o más y si una lesión física resultó del accidente. Los datos siguen: Menos de $1000 $1000 o más Número de accidentes 32 41 Número donde hubo lesionados 10 23 a. Estime la verdadera proporción de accidentes donde hubo lesionados cuando el daño fue de $1000 o más, para secciones similares de carretera, y encuentre el margen de error. b. Estime la verdadera diferencia en la proporción de accidentes donde hubo lesionados en accidentes con pérdidas menores a $1000 y aquellos con pérdidas de $1000 o más. Use un intervalo de confianza de 95%. LÍMITES DE CONFIANZA A UNA COLA Los intervalos de confianza estudiados en las secciones 8.5-8.7 a veces reciben el nom- bre de intervalos de confianza a dos colas, porque producen límites superiores (UCL) e inferiores (LCL) para el parámetro de interés, pero a veces un experimentador está interesado en sólo uno de estos límites; esto es, necesita sólo un límite superior (o posi- blemente un límite inferior) para el parámetro de interés. En este caso, se puede cons- truir un límite de confianza de una cola para el parámetro de interés, por ejemplo m, p, m1 � m2 o p1 � p2. Cuando la distribución muestral de un estimador puntual es aproximadamente nor- mal, se puede usar un argumento similar al de la sección 8.5 para mostrar que los lími- tes de confianza de una cola, construidos usando las siguientes ecuaciones cuando el tamaño muestral es grande, contendrán el verdadero valor del parámetro de interés (1 � a)100% del tiempo en muestreo repetido. UN LÍMITE INFERIOR DE CONFIANZA (1 � a)100% (LCB) (Estimador puntual) � za × (Error estándar del estimador) UN LÍMITE SUPERIOR DE CONFIANZA (1 � a)100% (UCB) (Estimador puntual) + za × (Error estándar del estimador) Probabilidad_Mendenhall_08.indd 328Probabilidad_Mendenhall_08.indd 328 5/14/10 8:19:36 AM5/14/10 8:19:36 AM www.FreeLibros.me FIGURA 8.13 Valor z para un límite de confi anza de una cola ● f(z) 0 zzα α E J E M P L O 8.12 8.9 El valor z para un límite de confianza de una cola (1 � a)100%, za, localiza un área a en una sola cola de la distribución normal, como se muestra en la figura 8.13. Una corporación planea emitir algunos documentos a corto plazo y espera que el interés que tendrá para pagar no rebasará el 11.5%. Para obtener alguna información acerca de este problema, la corporación vendió 40 documentos, uno a través de cada una de las 40 empresas de corretaje de acciones. La media y desviación estándar para las 40 tasas de interés fueron 10.3% y .31%, respectivamente. Como la corporación está interesada en sólo un límite superior en las tasas de interés, encuentre un límite superior de confianza de 95% para la tasa media de interés que la corporación tendrá que pagar por los docu- mentos. Solución Como el parámetro de interés es m, el estimador puntual es _ x con error estándar SE � s ___ � __ n . El coeficiente de confianza es .95, de modo que a � .05 y z.05 � 1.645. Por lo tanto, el límite superior de confianza de 95% es UCB � _ x � 1.645� s ___ �__ n � � 10.3 � 1.645� .31 ____ �___ 40 � � 10.3 � .0806 � 10.3806 Entonces, se puede estimar que la tasa media de interés que la corporación tendrá que pagar sobre sus documentos será menos al 10.3806%. La corporación no debe preocu- parse por sus tasas de interés que rebasen del 11.5%. ¿Qué tan seguro está usted de esta conclusión? Bastante seguro, porque los intervalos construidos en esta forma contienen a m, el 95% del tiempo. SELECCIÓN DEL TAMAÑO MUESTRAL Diseñar un experimento es en esencia un plan para comprar cierta cantidad de informa- ción. Así como el precio que se paga por un juego de video varía dependiendo de dónde y cuándo se compra, el precio de información estadística varía dependiendo de cómo y dónde se recolecta la información. Al igual que cuando se compra cualquier producto, se debe comprar tanta información estadística como sea posible por el mínimo costo posible. La cantidad total de información relevante en una muestra es controlada por dos factores: • El plan muestral o diseño experimental: el procedimiento para recolectar la información • El tamaño muestral n: la cantidad de información recolectada 8.9 SELECCIÓN DEL TAMAÑO MUESTRAL ❍ 329 Probabilidad_Mendenhall_08.indd 329Probabilidad_Mendenhall_08.indd 329 5/14/10 8:19:36 AM5/14/10 8:19:36 AM www.FreeLibros.me 330 ❍ CAPÍTULO 8 ESTIMACIÓN DE MUESTRAS GRANDES Se puede aumentar la cantidad de información recolectada al aumentar el tamaño mues- tral o quizá al cambiar el tipo de plan muestral o diseño experimental que se utilice. Trataremos el plan muestral más sencillo, es decir, el muestreo aleatorio de una pobla- ción relativamente grande y nos concentraremos en las formas para escoger el tamaño muestral n necesario para comprar una cantidad determinada de información. Un investigador hace poco progreso al planear un experimento antes de encontrar el problema del tamaño muestral. ¿Cuántas mediciones deben incluirse en la muestra? ¿Cuánta información desea comprar el investigador? La cantidad total de información de la muestra afectará la confiabilidad o bondad de las inferencias hechas por el inves- tigador y es esta confiabilidad la que debe él especificar. En un problema de estimación estadística, la precisión de la estimación es medida por el margen de error o el ancho del intervalo de confianza. Como estas dos mediciones son una función del tamaño mues- tral, especificar la precisión determina el tamaño muestral necesario. Por ejemplo, suponga que se desea estimar el promedio de producción diaria m de un proceso químico y se necesita que el margen de error sea menor a 4 toneladas. Esto significa que, aproximadamente 95% del tiempo en muestreo repetido, la distancia entre la media muestral _ x y lamedia poblacional m será menor a 1.96 SE. Se desea que esta cantidad sea menor a 4. Esto es, 1.96 SE � 4 o 1.96� s___ �__ n � � 4 Despejando n, resulta n � 1.4 96 � 2 s 2 o n .24s 2 Si se conoce s, la desviación estándar poblacional, se puede sustituir su valor en la fórmula y despejar n. Si s es desconocida, que suele ser el caso, se puede usar la mejor aproximación disponible: • Una estimación s se obtiene de una muestra previa • Una estimación del rango basada en el conocimiento de las mediciones máximas y mínimas posibles: s � Rango/4 Para este ejemplo, suponga que un estudio previo del proceso químico produjo una des- viación muestral estándar de s � 21 toneladas. Entonces n .24s 2 � .24(21)2 � 105.8 Usando una muestra de tamaño n � 106 o mayor, se puede estar razonablemente seguro (con probabilidad aproximadamente igual a .95) que su estimación del promedio de pro- ducción estará a no más de � 4 toneladas del promedio real de producción. La solución n � 106 es sólo aproximada porque tenía que usarse un valor aproximado de s para calcular el error estándar de la media. Aun cuando esto puede ser molesto, es el mejor método existente para seleccionar el tamaño muestral y es ciertamente mejor que adivinar. A veces los investigadores requieren un nivel de confianza diferente al 95% de con- fianza especificado por el margen de error. En este caso, la mitad del ancho del intervalo de confianza da la medida precisa para su estimación; esto es, el límite B en el error de su estimación es za/2� s___ �__ n � � B Probabilidad_Mendenhall_08.indd 330Probabilidad_Mendenhall_08.indd 330 5/14/10 8:19:36 AM5/14/10 8:19:36 AM www.FreeLibros.me 8 ESTIMACIÓN DE MUESTRAS GRANDES 8.8 Límites de confianza a una cola 8.9 Selección del tamaño muestral
Compartir