Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
77.. INTERVALOS DE CONFIANZA CONTENIDO 7.1 INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA ........................................ .143 7.2 INTERVALOS DE CONFIANZA ......................................................................... .143 7.3 INTERVALOS DE CONFIANZA PARA µ CON VARIANZA CONOCIDA............ 144 7.4 COMPORTAMIENTO DE LOS INTERVALOS DE CONFIANZA ........................ .148 7.5 TAMAÑO DE LA MUESTRA PARA ESTIMAR µ ............................................... .149 7.6 INTERVALOS DE CONFIANZA PARA µ CON VARIANZA DESCONOCIDA... .149 7.7 INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL...... 151 7.8 TAMAÑO DE LA MUESTRA PARA ESTIMAR P ................................................ .151 7.9 INTERV. DE CONFIANZA PARA LA VARIANZA DE UNA POB.NORMAL ........ 153 7.10 EJERCICIOS PROPUESTOS ........................................................................... .155 7.11 EJERCICIOS RESUELTOS................................................................................ 157 G.Carnevali-E.Franchelli-G.Gervasoni 143 7 INTERVALOS DE CONFIANZA 7.1 INTRODUCCIÓN Inferir significa sacar conclusiones. La inferencia estadística nos proporciona métodos para sacar conclusiones sobre una población a partir de los datos que surjan de una muestra de dicha población, utilizando la probabilidad para expresar la fuerza de nuestras conclusiones. Los dos procedimientos más ampliamente utilizados de inferencia estadística son: la construcción de un intervalo de confianza cuando el objetivo sea estimar un parámetro poblacional y la prueba de hipótesis, cuando el objetivo sea tomar una decisión respecto de una hipótesis que se formula sobre el valor de un parámetro poblacional. Los dos tipos de inferencia se basan en las distribuciones de los estadísticos desarrolladas en el capítulo 6. El trabajo que hicimos en el mismo se caracterizó por partir de una población conocida y desde ella observar como se distribuyen los estadísticos: media, varianza y proporción muestral. Como se mencionó, sólo cuando se utiliza el azar para escoger los elementos que conforman una muestra, podemos describir cómo varía el estadístico. Pudimos contestar preguntas como ¿qué tan cercana queda la media de la muestra X , de la media de la población µ? En este capítulo y en el próximo vamos a invertir el argumento. A partir de una muestra conocida que se ha extraído de una población ¿qué se puede concluir acerca de los parámetros desconocidos de la misma? Este proceso involucra una inducción, o inferencia estadística: ir de lo particular (muestra) a lo general (población). Siempre nos basaremos en datos que proceden de una muestra aleatoria simple de una población. Elegiremos para inferir buenos estimadores: estimadores insesgados del parámetro poblacional desconocido y convergentes al mismo (pág. 134, capítulo 6). 7.2 INTERVALOS DE CONFIANZA Si no se conoce el valor de un parámetro poblacional, el mismo se puede estimar a partir de un intervalo de confianza para dicho parámetro. A todo intervalo de confianza, calculado a partir de los datos de una muestra aleatoria, se le fija un nivel de confianza que mide la probabilidad de que el intervalo contenga el verdadero valor del parámetro. Por ejemplo: un intervalo para un parámetro poblacional, calculado con un 95% de confianza, es un intervalo que tiene una probabilidad de 95% de contener el verdadero valor del parámetro. El objetivo de este capítulo es describir los razonamientos utilizados en la construcción de un intervalo de confianza. Podremos estar interesados en estimar µ, σ2 o p, obteniendo una medida de la precisión de la estimación y otra sobre cuál es nuestra confianza de que el resultado sea correcto, como veremos seguidamente. G.Carnevali-E.Franchelli-G.Gervasoni 144 Nos apoyaremos en un ejemplo de estimación del parámetro desconocido µ, cuando los datos son una muestra aleatoria simple de tamaño n. El intervalo se basa en el hecho de que la distribución de la media muestral X es normal o aproximadamente normal, como se vio en el capítulo 6. 7. 3 Intervalo de confianza para la media poblacional con varianza conocida En el capítulo anterior, suponíamos conocida la media poblacional µ y estudiamos para muestras de distintos tamaños, qué tan cerca o lejos podía esperarse encontrar el valor de la media muestral X . Por ejemplo, si se considera una población normal donde µ = 4.5 y la desviación poblacional σ=1, y se extraen muestras de tamaño 100, la variable promedio muestral se distribuye normalmente con esperanza 4.5 y desviación estándar 1/10. En símbolos: X ∼ N (4.5 ; 1/10) ¿Entre qué valores se encuentran el 95 % de los promedios muestrales centrales? Es decir buscamos los valores 21 XyX que satisfagan: 2x .x 541 X 950961961 100 1 54 100 1 54 950 2121 21 .).Z.(P .xZ.xP n σ µxZ n σ µxP .)xXx(P =≤≤− = ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ − ≤≤ − = ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ − ≤≤ − =≤≤ G.Carnevali-E.Franchelli-G.Gervasoni 145 Luego: 696.4x96.1 10 1 4.5-x 304.4x96.1 10 1 4.5-x 2 2 1 1 =⇒= =⇒−= Es decir 0.95)4.696X4.304(P =≤≤ por lo tanto, el 95 % de los promedios muestrales estarán entre 4.304 y 4.696: En general : 950961961 . n σ.µX n σ.µP =⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ +≤≤− Supongamos ahora que la media poblacional µ es desconocida y se conoce la desviación estándar poblacional σ. Entonces, invirtiendo µ por la media muestral X resulta: 950961961 . n σ.Xµ n σ.XP =⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ +≤≤− 1 4,304 4,5 4,696 -1.96 0 1.96 Z X G.Carnevali-E.Franchelli-G.Gervasoni 146 Esta expresión es el intervalo aleatorio, a partir del cual se estima la µ desconocida. Se debe tener cuidado en la interpretación de 1. El promedio poblacional no se ha convertido en una variable, sigue siendo una constante de la población. Los límites del intervalo sí son aleatorios ya que dependen de la variable aleatoria promedio muestral. Cuando se selecciona una muestra, los límites dejan de ser aleatorios dado que obtenemos un valor del promedio de la muestra seleccionada y en consecuencia hablamos de un intervalo de confianza de 95% para el promedio poblacional ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ += n σ1.96x; n σ1.96-x ICµ Aunque en la práctica sólo se selecciona una sola muestra de tamaño n y se calcula el promedio muestral X para dicha muestra, es necesario pensar en el conjunto hipotético de todas las muestras posibles, cada una del mismo tamaño n, a fin de entender el significado del intervalo de confianza. Supongamos las siguientes situaciones para una muestra extraída de tamaño 100: La media muestral resulta igual a 4,35. Luego el intervalo de confianza para µ es: 1960354354 ..100 11.96. n σ1.96X ±=±=± Este intervalo (4.154 ; 4.546) contiene a la media poblacional µ = 4.5. Esta muestra nos llevaría a decir que 4,5 es un valor posible de µ. La media muestral resulta igual a 4.6. El intervalo de confianza obtenido a partir de este valor :(4,404 ; 4.796), también nos llevaría a decir que 4,5 es un valor posible de µ. La media muestral resulta igual a 4.25. El intervalo de confianza obtenido a partir de este valor: (4.052 ; 4.446) no contiene al parámetro; nos llevaría a decir que 4,5 no es un valor posible de µ. La media muestral resulta igual a 4.304. El intervalo de confianza obtenido a partir de este valor: (4.108 ; 4.5) nos llevaría a decir que 4,5 es un valor posible de µ. G.Carnevali-E.Franchelli-G.Gervasoni 147 4.154 4.35 4.546 4 052 4 25 4 446 4.108 4.304 4.5 4.404 4.6 4.796 Todas estas situaciones se pueden visualizar enla figura siguiente: O sea que para algunas muestras, el intervalo de confianza contiene al verdadero valor de µ, mientras que para otras no. En este ejemplo, siempre que x esté situada a una distancia de a lo sumo 0.196 de µ, el intervalo cubrirá al verdadero valor del promedio poblacional y esto sucederá en un 95 % de todas las muestras posibles. La semiamplitud del intervalo de confianza se conoce como error de estimación y es una medida de la precisión de la estimación. En el ejemplo se trabaja con un error de estimación para un intervalo de 95 % de confianza igual a 0.196. 1960 100 1961961 .. n σ.ε === . En la práctica sólo se selecciona una muestra y se desconoce µ. Nunca se sabe con seguridad si el intervalo obtenido incluye la media poblacional. Por ej. si se extrae una muestra y su media resulta igual a 4,6 decimos que tenemos una confianza de 95 % de que la media poblacional desconocida se encuentre en el intervalo (4.404 ; 4.796). Este intervalo es el que varía en función de la muestra que sale seleccionada. El valor del parámetro es único. Si a partir del mismo ejemplo se hubiera trabajado con una confianza de 99%, el error de estimación resultaría 2580 100 1582582 ., n σ.ε === 4.304 4,5 4.696 4.304X 4.253X 4.62X 4.351X = = = = G.Carnevali-E.Franchelli-G.Gervasoni 148 En general, para una confianza de 100 (1-α) % el error de estimación resulta:1 n σzε α= Y el intervalo de confianza para la media poblacional con varianza conocida es: ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ += n σzx; n σz-x IC ααµ Si la población es Normal, no interesa el tamaño de la muestra aleatoria que se selecciona para estimar µ. Si la población no es Normal, se necesita un tamaño de muestra de por lo menos 30 observaciones (Teorema Central del Límite) para usar la expresión anterior del intervalo de confianza. 7.4 Comportamiento de los intervalos de confianza El intervalo de confianza para la media de una población ilustra algunas de las propiedades importantes que son compartidas por todos los intervalos de confianza de uso frecuente. El que realiza dicho intervalo elige el nivel de confianza con que quiere trabajar y el error de estimación depende de esta decisión. Por supuesto que se desearía tener un nivel de confianza alto (significa que casi siempre daremos respuestas correctas) y un error de estimación pequeño (significa que la estimación del parámetro poblacional es bastante precisa); pero no siempre esto se logra alcanzar. El error de estimación para la media de una población que se distribuye normal es: Esta expresión tiene z y σ en el numerador y n en el denominador. Por lo tanto, el error de estimación se hace menor cuando: z es menor. Una z menor es lo mismo que un nivel de confianza menor. Existe una relación directa entre el nivel de confianza y el error de estimación. Para el mismo tamaño de muestra, para tener un error de estimación menor, hay que aceptar una confianza menor. n se hace mayor. Existe una relación inversa entre el tamaño de muestra y el error de estimación. Un incremento del tamaño de la muestra n reduce el error de estimación para un nivel de confianza determinado 1 zα es el valor de la normal estandarizada correspondiente a un nivel de confianza (1- α) elegido en la estimación n σzε α= G.Carnevali-E.Franchelli-G.Gervasoni 149 σ es menor. La desviación estándar σ mide la variación de la población. A diferencia de los puntos anteriores, σ es un parámetro de la población que sólo puede modificarse actuando sobre la población. 7.5 Tamaño de la muestra para estimar µ Siempre es necesario planificar la inferencia conjuntamente con la obtención de los datos. Si el error de estimación para la media es: n σzε α= El tamaño de muestra para un error de estimación ε y un nivel de confianza determinado se deduce de la ecuación anterior, resultando: 2 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛= ε σzn α Es importante tener claro que lo que determina el tamaño de la muestra es el error de estimación y la confianza que se pretende para realizar la estimación y no el tamaño de la población, ya que éste no influye sobre el tamaño de muestra que se necesita para la inferencia. Esta fórmula2 no se puede utilizar ligeramente. En la práctica la obtención de observaciones cuesta tiempo y dinero. Puede ocurrir que el tamaño de la muestra ideal sea inviable por razones económicas y/o de otro tipo. 7.6 Intervalo de confianza para la media con varianza desconocida En el punto anterior estimamos el promedio poblacional suponiendo la desviación estándar poblacional conocida. En la práctica, es poco probable conocer el valor de σ. En el capítulo 6 (pág. 133), vimos que si la población de la cual se extraen las muestras es normal, con media poblacional µ y desvío estándar poblacional σ desconocido, se reemplaza σ por S (desvío muestral) y la estadística ( ) nS/ µX − deja de tener distribución normal estandarizada y tiene una distribución t Student con n-1 grados de libertad, es decir: ( ) nS/ µX − ∼ α;nt 1− 2 Redondea siempre n hacia arriba cuando uses esta fórmula. G.Carnevali-E.Franchelli-G.Gervasoni 150 En el punto 7.3, para obtener un intervalo de confianza para el promedio poblacional cuando σ era conocida trabajamos con la variable normal estandarizada (zα). Ahora trabajaremos con la variable t de Student ( α;nt 1− )3. En consecuencia, para una confianza de 100 (1-α) % el error de estimación resulta: n stε α;n 1−= Y el intervalo de confianza para la media poblacional con varianza desconocida es: ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ += −− n stx; n st-x IC α;nα;nµ 11 Resumen de procedimientos de estimación de intervalos de confianza para la media poblacional 3 Obtener los valores tn-1 en la tabla 2.5 del Apéndice. ¿Es Grande n (n ≥30)? ¿Se conoce el valor de σ? ¿Es aproximadamente normal la población? ¿Se conoce el valor de σ? Usar la desviación estándar de la muestra s para estimar σ Usar la desviación estándar de la muestra s para estimar σ Usar n zx σα± Usar n szα±x Usar n stα±x Aumentar el tamaño de la muestra a n ≥ 30 para determinar un intervalo de confianza Usar n zx σα± Sí Sí Sí Sí No No No No G.Carnevali-E.Franchelli-G.Gervasoni 151 7.7 Intervalo de confianza para la proporción poblacional En el capítulo 6 (punto 6.4, pág. 135) estudiamos la distribución del estadístico frecuencia relativa o proporción muestral. Si n es “suficientemente” grande, la distribución de rf p =ˆ se comporta aproximadamente como una distribución normal con media p y desviación estándar n )p(p −1 , es decir: ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ n p)-p(1;p N menteaproximada es p ) Con el mismo razonamiento que empleamos en la estimación de la media poblacional, el planteo inicial para estimar la proporción poblacional o probabilidad de un suceso cualquiera A, es encontrar dos valores 21 ˆˆ pyp que verifiquen: 95021 .)p̂p̂p̂(P =≤≤ Estandarizando: 950961 1 961 .). n )P(p pp̂.(P =≤ − − ≤− A esta expresión la podemos escribir de la siguiente forma: 95019611961 .) n )p(p.p̂p n )p(p.p̂(P =−+≤≤−− La desviación poblacional de la proporción muestral n pp )1( − queda en función del parámetro desconocido p, sin embargo una solución satisfactoria (para un tamaño de muestra grande: n ≥ 100) es reemplazar p por su estimador p̂ quedando: 95019611961 .) n )p̂(p̂.p̂p n )p̂(p̂.p̂(P =−+≤≤−− Y en consecuencia el Intervalo de confianza para la proporción poblacional para un nivel de confianza de 100 (1- α ) % es: ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −+≤≤ − −=− n )p̂(p̂zp̂p n )p̂(p̂zp̂IC αα)p(,p 11 1 G.Carnevali-E.Franchelli-G.Gervasoni 152 A partir de esta expresión el error de estimación resulta: ε = n ppz ) ˆ1(ˆ − α 7.8 Tamaño de la muestra para estimar p El tamaño de muestra n para un error de estimación ε y un nivel de confianza de 100 (1- α)%, se deduce de la ecuación anterior, resultando : n = )p(p) ε z ( α −12 Para utilizar la fórmula anterior se necesita reemplazar a p por una estimación de la misma. Ésta se puede obtener: • de la estimación de la proporción muestral en una muestra anterior • calculando p̂ en una muestra preliminar (o piloto) Si estas alternativas no son posibles, otra forma para calcular el tamaño de la muestra requerida, es considerar que siempre p.(1 – p) es máximo para p = 0,5. Es decir, que una cota superior para n (para una confianza de 100 (1- α) % y un error ε está dada por: n = ).()ε z ( α 2502 Ejemplo : Una empresa de cable desea conocer qué proporción de sus clientes se informan de las noticias a través de los noticiarios que difunden. Para ello seleccionó una muestra aleatoria de 200 clientes. De las 200 personas, 110 respondieron que se informan a través de los noticieros televisivos. El intervalo obtenido para una confianza de 95% resultó: ).;.(..p.. ).*...p.*...(IC %,p 620480070550070550 200 450550961550 200 45055096155095 =+≤≤−= =+≤≤−= Es decir que con una confianza de 95 % se puede inferir que la proporción de clientes que se informan a través de los noticieros se encuentra entre el 48 y el 62%. La empresa considera que el error de estimación es alto y por lo tanto, este intervalo no le brinda demasiada información. G.Carnevali-E.Franchelli-G.Gervasoni 153 A tal fin decide consultar a más clientes. El tamaño de muestra que lo llevaría a cometer un error de 4%, con la misma confianza, y utilizando la proporción muestral ya obtenida, resulta: 25594450550 040 9611 22 ..*. . .)p̂(p̂ ε zn α =⎟ ⎠ ⎞ ⎜ ⎝ ⎛=−⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = Es decir que se necesita un tamaño de muestra mayor o igual a 595 clientes. 7.9 Intervalo de confianza para la varianza poblacional una distribución normal En el capítulo 6 (punto 6.5, pág 136) estudiamos la distribución de la varianza muestral S2. Si la población de la cual se extraen las muestras es normal, la variable 2 21 σ S)n( − tiene una distribución ji cuadrado ( 2χ ) con (n -1) grados de libertad 2σ S1)(n 2− ∼ 2-1nχ Nuestro planteo inicial es ahora encontrar dos valores de la distribución 2χ )( 22 ba χyχ que verifiquen: P ( 2aχ < 2σ S1)(n 2− < 2bχ ) = 1 - α (Los valores 2 aχ y 2 bχ se obtienen en la tabla 2.6 del Apéndice y dependen del tamaño de la muestra n). Trabajando algebraicamente la expresión anterior obtenemos: P ( 2 2 2 2 2 11 ab S)n(S)n( χχ σ −≤≤− ) = 1- α Es decir que el intervalo de confianza para la varianza poblacional de una población normal (σ2) con una confianza de 100 (1 - α )% resulta : ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ −− =− 2 2 2 2 1 11 2 ab )(, S)n(;S)n(.C.I χχ ασ Ejemplo: En un criadero de peces se crían truchas para aprovisionar ríos y lagos. El peso del pez en el momento que es liberado se puede controlar variando la alimentación. El criadero espera una desviación estándar de 21,5 gramos en el peso de los peces. Para evaluar si el plan de alimentación que se aplica cumple lo deseado, se toma una muestra de 25 peces G.Carnevali-E.Franchelli-G.Gervasoni 154 obteniéndose una desviación para el peso de 28.9 gramos. El intervalo de 95% de confianza para la varianza poblacional resulta: ).;.( . .)(; . .)(.C.I ., 54161627509412 928125 3639 928125 9502 =⎟⎠ ⎞ ⎜ ⎝ ⎛ −− =σ Es decir, que con un 95% de confianza, el desvío estándar poblacional se encuentra en el intervalo (22.57 ; 40.21). Por lo tanto se concluye, con un 95 % de confianza, que el desvío estándar del peso de los peces es superior al deseado por el criadero. G.Carnevali-E.Franchelli-G.Gervasoni 155 7.10 EJERCICIOS PROPUESTOS 1.- En un conocido restaurante se cree que los tiempos de espera (en minutos) de sus clientes se distribuyen de manera normal con una varianza de 22,5 minutos 2. a) Una muestra de 25 clientes reveló un tiempo medio de espera de 13 minutos. Construya el intervalo de confianza del 95 % para la media de la población. b) Suponga que la media de 13 minutos resultó de una muestra de 32 clientes. Encuentre el intervalo de confianza del 95 % para la media de la población. c) ¿Qué efecto tiene un mayor tamaño de muestra sobre el intervalo de confianza? 2.- Se tiene interés en estimar la vida media de un producto nuevo. ¿Qué tan grande debe ser la muestra que debe tomarse para estimar la media, con un error no mayor de 1/10 de la desviación estándar y con una confianza del 90%? 3.- La Cámara de Comercio de una ciudad desea estimar el gasto medio por turista que visita dicha ciudad durante un período determinado. Con ese objetivo se ha elegido una muestra al azar de 100 turistas y se ha hallado que x = 800 $. Se conoce de experiencias anteriores que la desviación estándar de los gastos por turista en ese período es de 120 $. a) Construir un intervalo de 95 % de confianza de para el gasto medio b) ¿Cómo debe modificarse el tamaño de la muestra si se desea aumentar el grado de confianza a 99% sin aumentar el error de estimación obtenido en el punto a)? 4.- Una persona afirma que su curso de preparación para agentes de seguros de vida permite a una compañía contratar más pólizas que la compañía “promedio”. El monto mensual de contratación de todos los agentes de seguros tiene un comportamiento normal con promedio de $100.000. Una muestra de 10 agentes que siguieron el curso de preparación dio los siguientes resultados (en miles de pesos): a) Si Ud. fuera el supervisor de los agentes ¿adoptaría el curso propuesto por esa persona? b) ¿Qué conclusión se puede extraer si se piensa que σ2 = 260? ¿Considera que estos datos son suficientes para obtener una buena conclusión? 5. El departamento de servicio a clientes de la compañía de gas para viviendas desea estimar la dispersión del período que transcurre entre la llegada de una solicitud de servicio y la conexión del mismo. El departamento considera que si la compañía trabajó según lo convenido, la desviación estándar de dicho período no debe ser mayor a 19 días. Se seleccionó una muestra aleatoria de 15 casas a partir de los registros disponibles del año anterior. Los resultados registrados sobre el tiempo transcurrido entre solicitud y conexión fueron: ¿A que conclusión llegará el departamento? (suponga distribución normal para la variable en estudio) 100 120 130 120 125 90 130 135 140 110 114 78 96 137 78 103 117 126 86 99 114 72 104 73 86 G.Carnevali-E.Franchelli-G.Gervasoni 156 6.- Una compañía telefónica desea conocer la proporción de aparatos que necesitan reparación sobre el total de los instalados. ¿Cuál es el mínimo tamaño de muestra necesario para estimar dicha proporción con un error de a los sumo 0,01 y con un coeficiente de confianza igual a 0,95? 7.- Una muestra aleatoria de los puntajes de 100 aspirantes a puestos de mecanógrafos, en una gran compañía de seguros, presentó un puntaje medio de 72,6. El diseñador de la prueba sostiene que los aspirantes calificados deben promediar por lo menos 75 puntos. Suponga que la desviación estándar de los puntajes de la prueba es de 10,5. ¿Puede concluir la compañía de seguros que está contratando aspirantes calificados, teniendo en cuenta los resultados de esta prueba? 8.- La administración de un supermercado desea conocer el tiempo promedio que emplean sus clientes para realizar sus compras. Para obtener dicha información se va a estudiaruna muestra al azar de clientes. A partir de experiencias pasadas en tiendas similares se ha estimado que la desviación estándar de la variable en estudio se encuentra entre 5 y 10 minutos. a) ¿Qué tamaño de muestra aconsejaría si se admite un error de estimación de 1 minuto? (trabaje con 95 % de confianza). b) Suponga que de una muestra al azar de 200 clientes se obtuvo un x = 19,56 minutos y una dispersión del tiempo que los clientes permanecieron en la tienda de 6,6 minutos. En supermercados comparables el tiempo medio empleado por los clientes es de 25 minutos ¿Podría concluirse que la tienda en la cual se realizó el estudio difiere de las otras con respecto al tiempo promedio que emplean los clientes? 9.- Un fabricante de disquetes para computadoras personales está preocupado por el número de sectores dañados que se registran cuando se formatea un disco en una computadora particular. Para investigar sobre las características de la producción, se selecciona una muestra de 100 disquetes de la producción diaria, se les da formato y se registra el tamaño (en miles de bytes) de los sectores dañados de cada disco. En la tabla siguiente se presenta la distribución de frecuencias del tamaño (en miles de bytes) de los sectores dañados en las unidades correspondientes a la muestra seleccionada. a) Estime, en promedio, el tamaño de los sectores dañados de los discos. Interprete los valores hallados. b) El fabricante está preocupado por la proporción de discos cuyos sectores dañados superan los 19.600 bytes. ¿Qué se puede inferir respecto a esto? Sector dañado (en miles de bytes) nº de discos 0.4 < x ≤ 5.2 2 5.2 < x ≤ 10.0 11 10.0 < x ≤ 14.8 12 14.8 < x ≤ 19.6 13 19.6 < x ≤ 24.4 17 24.4 < x ≤ 29.2 13 29.2 < x ≤ 34.0 12 34.0 < x ≤ 38.8 10 38.8 < x ≤ 43.6 9 43.6 < x ≤ 48.4 1 G.Carnevali-E.Franchelli-G.Gervasoni 157 7.11 EJERCICIOS RESUELTOS 1.- Suponga una variable X con distribución normal y Var (X) = 4. Al extraer una muestra de 25 observaciones se obtiene x = 78,3. Obtenga un intervalo de confianza para E(X). a) del 95 % de confianza b) del 99 % de confianza c) Analice los intervalos obtenidos Solución Si X ∼ N(µ,σ) siendo σ conocido, entonces nX σ µ− ∼ N(0,1) El intervalo aleatorio para E(x) es en este caso: IAµ = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ +− n zX n zX σσ ; El valor de z se obtiene de la tabla de la distribución normal y depende del nivel de confianza fijado. a) Para un nivel de confianza de 0,95 el valor de z = 1,96. El intervalo de confianza correspondiente es: ICµ = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ +− 25 296.13.78; 25 296.13.78 ICµ = (77.516 ; 79.084) b) Para un nivel de confianza 0,99; el valor correspondiente de z es 2,58, de donde: ICµ = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ +− 25 258.23.78; 25 258.23.78 ICµ = (77.268 ; 79.332) c) Si comparamos los intervalos obtenidos en a) y b), observamos que al aumentar el nivel de confianza, aumenta la amplitud del intervalo, es decir, el error de estimación (ε) es mayor. Esto significa que disminuye la precisión de la estimación. 2.- Una empresa de alta tecnología desea estimar el número medio de años de educación superior terminados por sus empleados. Una estimación aceptable de la desviación estándar del número de años de educación superior es 1 año. ¿Cuál debe ser el tamaño de la muestra para estimar µ con un error de estimación menor a 0,3 años y un 95 % de confianza? Solución Si suponemos que la variable X: número de años de educación superior terminados, se distribuye normalmente, se tiene 96.195.0 =⇒=⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ <− z n zXP σµ luego ≥⇒== n n z 3.0σε 43 Una vez determinado el tamaño de la muestra y siendo en ésta n ≥ 43, la normalidad de la variable X o su aproximación a la distribución normal es consecuencia del Teorema Central G.Carnevali-E.Franchelli-G.Gervasoni 158 del Límite. Si el n obtenido hubiese sido pequeño, la normalidad de X es válida únicamente si las observaciones realizadas son independientes y provenientes de una población normal (propiedad reproductiva de la distribución normal). 3.- De una población normal N(µ, σ) = N(µ, 4) se extrae una muestra de n = 16 elementos. Se construye un intervalo de confianza para E(X) obteniéndose: ICµ = (7,63; 12,77). Si la media muestral fue 10,2 ¿con qué confianza el intervalo anterior cubre el verdadero valor del parámetro? Solución Para conocer el nivel de confianza se debe encontrar el valor de z de modo que verifique que: 63,7=− n zx σα o bien 77.12=+ n zx σα Para 42.10 == σyx se obtiene para una muestra de 16 elementos un zα= 2.57, luego α = 0.01, por lo tanto el nivel de confianza con que el intervalo cubre el verdadero valor de la media poblacional es del 99 %. 4.- Sea X una variable aleatoria distribuida normalmente. De una muestra de tamaño n = 25 se obtiene x = 125 y s = 3,5. Halle: a) Un intervalo de 95% de confianza para E(X). b) Un intervalo de 95% confianza para σ2. Solución a) Si X ∼ N(µ,σ) siendo σ desconocido, entonces n S X µ− ∼ t n-1 El intervalo aleatorio para E(X) es en este caso: IAµ = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ +− −− n StX n StX nn 11 ; El valor tn-1 se obtiene de la tabla de la distribución t de Student y depende del tamaño de la muestra y del nivel de confianza fijado. En este caso α = 0.05 y n-1= 24, de donde t 24; 0,025 = 2.064 El intervalo de confianza correspondiente es: ICµ = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ +− 25 5.3064.2125; 25 5.3064.2125 ICµ = (123,56 ; 126,45) b) Si X ∼ N(µ,σ) entonces 2 2 )1( σ Sn − ∼ χ2n-1 El intervalo aleatorio para σ2(X) es en este caso: IAσ2 = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ −− 1 2 2 2 )1(;)1( C Sn C Sn G.Carnevali-E.Franchelli-G.Gervasoni 159 Los valores C1 y C2 se obtienen de la tabla de la distribución chi cuadrado y dependen del tamaño de la muestra y del nivel de confianza fijado. En el ejemplo, el intervalo de confianza correspondiente es: ICσ2 = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ 4,12 25,12.24; 37,39 25,12.24 ICσ2 = ( 7,47 ; 23,71 ) 5.- Durante cierta semana una gran tienda observó y registró que 5.750 de las 12.500 personas que entraron en la tienda hicieron por lo menos una compra. Tratando esto como una muestra al azar de todos los clientes potenciales: a) calcular un intervalo de confianza del 99% para la proporción real de personas que entran en la tienda y que hacen por lo menos una compra. Solución Sea el suceso A: una persona que entra a la tienda realiza por lo menos una compra y P(A) = p Se define la variable X: número de personas entre n, que entran a la tienda y realizan por lo menos una compra. La variable aleatoria fA = n X para n suficientemente grande tiende a distribuirse → ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − n pppN )1(; ; para n >100, un intervalo de confianza aproximado del parámetro p es de la forma: ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ − + − − n ff zf n ff zf AAAAAA )1( ; )1( Como fA = 12500 5750 = 0,46 se obtiene ICp = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ +− 12500 54,0.46,058,246,0; 12500 54,046,058,246,0 ICp = (0,45 ; 0,47) 6.- Una fábrica de cera para pisos tiene vendedores en todo el país, que ganaban una comisión promedio de $600 por mes. Con la llegada al mercado de nuevas marcas disminuyó el volumen de ventas y para compensar la pérdida de ingresos se agregó otro producto a los vendedores. La gerencia está interesada en conocer el efecto neto de los dos cambios en la comisión de los vendedores. Se tomó una muestra de 100 vendedores y se obtuvo una G.Carnevali-E.Franchelli-G.Gervasoni 160 comisión promedio de $585 y desvío de $70. Suponiendo que el ingreso por comisión tiene una distribución normal ¿se registraron cambios en el promedio de las comisiones? Solución Para valores grandes del tamaño de muestra (n), la función de densidad de la distribución t de Student tiende a distribuirse como una variable normalestandarizada N (0,1). Siendo en el ejemplo n=100, utilizaremos la distribución normal en lugar de la distribución t para estimar µ. Para ello supondremos σ conocido e igual a s. Para un nivel de confianza de 95% se obtiene para µ el intervalo: [ ]72.598;28.571 100 7096.1585; 100 7096.1585 =⎥ ⎦ ⎤ ⎢ ⎣ ⎡ +− Esto permite concluir con 95% de confianza que el promedio de las comisiones disminuyó a pesar de los cambios introducidos.
Compartir