Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Introducción Intervalos de confianza Dado que los estimativos puntuales pocas veces serán iguales a los parámetros que tratan de estimar, podemos darnos una mayor libertad en su estimación mediante el uso de la "estimación por intervalos" o "intervalos de confianza". Un intervalo de confianza es un intervalo estimado dentro del cual se espera encontrar el valor de un parámetro. Definición: Sea 1-α una probabilidad especificada alta y sean T1 y T2, dos estadísticos tales que P[T1 ≤ θ ≤ T2] = 1- α El intervalo [T1, T2] recibe el nombre de Intervalo de Confianza del 100(1-a)% para el parámetro desconocido θ. Las cantidades T1, T2 reciben el nombre de Limites de confianza inferior y superior, respectivamente, y (1- α) es el Nivel de Confianza asociado con el intervalo. En términos generales la construcción de un intervalo de confianza para un parámetro θ consiste en encontrar un estadístico T y relacionarlo con otra variable aleatoria X* = f(t, θ), donde X* involucra a θ, pero la distribución de X* no depende de θ, ni de ningún otro parámetro no conocido. Entonces T1 y T2 son funciones del estadístico T (estimador de θ). La interpretación de un intervalo de confianza radica en la interpretación de una probabilidad de largo plazo, y es que, si se recopila un número grande de muestras aleatorias y se calcula un intervalo de confianza del 100(1-a)% para el parámetro q para cada una de las muestras, entonces el 100(1- a)% de esos intervalos contienen el valor verdadero de θ. Intervalos de confianza Intervalos de confianza De acuerdo con la interpretación, el nivel de confianza del 100(1-a)% no es tanto un enunciado sobre un intervalo particular sino que pertenece a lo que pasaría si se construyera un número grande de intervalos semejantes. La probabilidad es 1-a de que el intervalo aleatorio contenga el verdadero valor del parámetro desconocido q. El parámetro q es una constante, aunque desconocida, y los intervalos T1 y T2 son variables aleatorias. Construcción de un intervalo de confianza Como ya se mencionó, en términos generales la construcción de un intervalo de confianza para un parámetro q consiste en encontrar un estadístico T y relacionarlo con otra variable aleatoria X* = f(t,q), donde X* involucra a q, pero la distribución de X* no depende de q, ni de ningún otro parámetro no conocido. Entonces T1 y T2 son funciones del estadístico T (estimador de q). Intervalos de confianza Intervalos de confianza Si denotamos por X1, X2, ...Xn la muestra aleatoria con base en la cual se construirá el intervalo de confianza para el parámetro θ. Entonces debemos encontrar un estadístico T = t(X1, X2, ...Xn) y relacionarlo con otra variable aleatoria que cumpla las siguientes condiciones: Condiciones de la variable aleatoria • La variable depende funcionalmente de X1, X2, ...Xn y θ. • La distribución de probabilidad de la variable no depende de θ ni de ningún otro parámetro no conocido. Por ejemplo, si queremos construir un intervalo de confianza para la varianza σ2 de una distribución normal, la variable aleatoria sería (n-1)S²/ σ ², que, aunque es función de σ², tiene una distribución chi cuadrado que no depende de σ². Sea T = t(X1, X2, ...Xn) el estadístico que sirve como estimador del parámetro θ, y sea g(X1, X2, ...Xn, θ) la variable aleatoria asociada con el estadístico T, y sean a y b dos valores constantes tales que P(a < T < b) = 1 – α Haciendo uso de la variable aleatoria asociada con el estadístico T, la anterior probabilidad se puede escribir como: P(c < g(X1, X2, ...Xn,q) < d) = 1 – α Intervalos de confianza Intervalos de confianza Condiciones de la variable aleatoria Donde c y d son las constantes que resultan al transformar a y b de acuerdo la variable aleatoria asociada con el estadístico T. Mediante la manipulación de la desigualdad planteada en la ecuación anterior, se puede despejar el parámetro θ, de tal forma que la desigualdad tenga como valor central el parámetro θ, y los límites queden en función, entre otras variables, del estadístico que sirve como estimador de θ. De lo anterior se obtendría una desigualdad equivalente que podríamos escribir como: P(h1(X1, X2, ...Xn) < θ <h2(X1, X2, ...Xn) = 1 – α Entonces los valores h1(X1, X2, ...Xn) y h2(X1, X2, ...Xn) son los intervalos de confianza para el parámetro θ, y corresponderían a las variables T1 y T2 mencionadas previamente. Para construir un intervalo de confianza para un parámetro desconocido θ se deben tener en cuenta los siguientes pasos: Resumen • Encontrar un estimador puntual T para el parámetro θ, que sea suficiente. • Encontrar una variable aleatoria X* relacionada con el estimador puntual T. • Con base en la distribución de la variable aleatoria asociada con el estadístico y conociendo su distribución muestral se calcula el respectivo intervalo de confianza. Tiene una distribución normal estándar. Por lo tanto, y si a y b son dos valores constantes tales que: P(a < < b) = 1-α Intervalos de confianza Intervalos de confianza Ejemplo Cálculo de un intervalo de confianza para m, con varianza s² conocida. Debemos encontrar dos estadísticos T1 y T2 tales que P[T1 m T2] = 1-a El estadístico a usar corresponde a la media muestral que es el mejor estimador de la media poblacional m. Sabemos que la media muestral se distribuye normalmente con valor esperado m y varianza s², entonces la variable asociada será Conociendo la distribución de la media muetral y la probabilidad anterior se puede expresar como: Intervalos de confianza Intervalos de confianza Ejemplo Sabemos que: Tiene una distribución normal estándar, y la probabilidad es 1-a, entonces queda una probabilidad total de a para los dos extremos, la cual podemos dividir en dos partes, a1 y a2 tales que a1 + a2 = a, a1 para el límite inferior y a2 para el límite superior. Si denotamos por los valores de la distribución normal que tienen probabilidades acumuladas de a1 y 1-a2, respectivamente, entonces la probabilidad dada en la ecuación anterior se puede escribir como: Intervalos de confianza Intervalos de confianza Ejemplo Manipulando la parte inferior de la desigualdad para expresarla en términos de m obtenemos que es equivalente a En forma similar, manipulando la parte superior de la desigualdad obtenemos que Combinando los resultados anteriores, la ecuación anterior de la probabilidad se puede escribir como: Por lo general, los valores a1 y a2 son iguales a a/2, por lo cual la ecuación anterior queda como: Intervalos de confianza Intervalos de confianza Ejemplo Comparando la ecuación anterior con la definición de los intervalos de confianza vemos que los valores corresponden a los límites de los intervalos de confianza T1 y T2 mencionados al definir lo que es un intervalo de confianza. Por lo tanto, el intervalo de confianza está dado por: El intervalo de confianza es aleatorio, ya que sus límites dependen de la media muestral, que es una variable aleatoria. La longitud del intervalo es constante e igual a y lo que varía es el punto medio (se toma la media muestral como pivote). Si para un mismo nivel de confianza queremos reducir el tamaño de intervalo, necesariamente tenemos que usar un tamaño de muestra mayor. Intervalos de confianza Intervalos de confianza Error de estimación Ï - m = El error en la estimación de la media poblacional, definido como Por lo tanto, si denotamos por d el error máximo que estamos dispuestos a admitir en la estimación de la media poblacional m, el tamaño de muestra que debemos usar estará dado por: Ejemplo. Si m representa la longitud media de un eje proveniente de un proceso de producción normal con una varianza de 0.01 cm, y se toman muestras de 16 ejes, cuál será el intervalo de confianza del 95% para el nivel medio del proceso?. Puede considerarse que este proceso tiene un nivel medio de 5.0 cm? Suponga que se toma la muestra aleatoria y los resultados, encm, son los siguientes: Intervalos de confianza Intervalos de confianza Ejemplo Tenemos, entonces la siguiente información: El intervalo de confianza está dado por: (4.92 - 1.96 x 0.1/4, 4.92 + 1.96 x 0.1/4) = (4.87, 4.97) 4.87 < m < 4.97. De acuerdo con el anterior intervalo de confianza, el nivel medio del proceso es algún valor entre 4.87 cm y 4.97 cm, y como el valor de 5.0 cm no está en el intervalo anterior, puede rechazarse la hipótesis de que el nivel medio del proceso sea 5.0 cm. La longitud del intervalo de confianza es 0.1 cm, y el error máximo si estimamos la media poblacional m mediante la media muestral sería de 0.05 cm, con un nivel de confianza del 95%. Si quisiéramos reducir este error a 0.03 cm, deberíamos realizar 43 observaciones, según se desprende la siguiente fórmula: Se puede afirmar que P(4.87 < m < 4.97) = 0.95 n = 16 = 4.92, s = 0.1, Za/2 = Z0.025 = 1.96 Intervalos de confianza Intervalos de confianza Ejemplo Ahora, la longitud del intervalo de confianza varía, para un mismo tamaño de la muestra, dependiendo del nivel de confianza. Para el ejemplo anterior, si consideramos, además del 95%, niveles de confianza del 90% y del 99%, los respectivos intervalos de confianza serían los siguientes: Se observa que para ningún intervalo de confianza, se acepta la hipótesis de que el nivel medio del proceso sea 5.0. Intervalos de confianza Intervalos de confianza Observación Para un mismo tamaño de muestra, y una misma confiabilidad, el intervalo de confianza no es único, dado que la probabilidad a que queda en los extremos se puede desagregar de muy diversas maneras (α1 y α2 pueden tomar diferentes valores tales que debe α1 + α2 = α). Por ejemplo, α = 0.05 podría desagregarse en 0.01 y 0.04, ó 0.02 y 0.03, ó 0.04 y 0.01, ó 0.0 y 0.5, etc. Sin embargo, el intervalo de menor longitud es el correspondiente a α1 = α2 = α/2. Ahora bien, si para un mismo nivel de confianza queremos reducir la longitud del intervalo, necesariamente tenemos que aumentar el tamaño de la muestra. El intervalo de confianza que encontramos para la media m está basado en la distribución de la media Siempre que queramos encontrar el intervalo de confianza para algún otro parámetro cuyo estimador (estadístico) siga una distribución normal, podemos usar el intervalo anterior, cambiando simplemente el estadístico (media muestral) por el estadístico apropiado, y cambiando la desviación estándar de la media dada por por la correspondiente desviación estándar del estadístico. Intervalos de confianza Intervalos de confianza Por ejemplo, si queremos calcular un intervalo de confianza para una diferencia de medias cambiamos por y el intervalo de confianza estaría dado por: Intervalos de confianza para la media Intervalos de confianza Varianza conocida El intervalo de confianza para la media poblacional m cuando la varianza poblacional s² es conocida corresponde al caso que acabamos de presentar y que se resume a continuación. El intervalo de confianza está basado en la media muestral (toma la media muestral como pivote) y en la distribución de la variable normal (0,1) dada por: Teorema. Si es la media muestral de una muestra aleatoria de tamaño n de una población con varianza conocida s², un intervalo de confianza para µ del 100(1-a)% está dado por: Para muestras tomadas de una población normal, o para muestras de tamaño n 30, sin importar la forma que tenga la población, el intervalo de confianza proporciona buenos resultados. Sin embargo, para muestras pequeñas tomadas de poblaciones que no son normales, no es posible esperar que el nivel de confianza 1-a sea exacto. Intervalos de confianza para la media Intervalos de confianza Varianza desconocida Cuando la varianza de una variable aleatoria no es conocida, y se tiene una muestra aleatoria, no se puede usar la distribución normal, sino que en su lugar se debe emplear la distribución t. Es decir, la variable T definida de la siguiente manera sigue una distribución t con n-1 grados de libertad. Si son la media muestral y la desviación estándar de una muestra aleatoria tomada de una distribución normal con varianza s² desconocida, entonces un intervalo de confianza (T1,T2) del 100(1-a)% para µ será aquel que cumpla que: P[T1 m T2] = 1-a De nuevo el estadístico a usar corresponde a la media muestral, entonces la variable asociada será y S que tiene una distribución t con n-1 grados de libertad. Por lo tanto si a y b son dos valores constantes tales que P(a< < b) = 1-a ; Intervalos de confianza para la media Intervalos de confianza Varianza desconocida Si vamos a considerar intervalos de confianza simétricos (a1 = a2 =a/2), entonces la anterior probabilidad puede escribirse como: lo cual a su vez puede expresarse como: Manipulando la parte inferior de la desigualdad para expresarla en términos de m obtenemos que es equivalente a En forma similar, manipulando la parte superior de la desigualdad obtenemos que Intervalos de confianza para la media Intervalos de confianza Varianza desconocida Combinando los resultados anteriores, la ecuación anterior de la probabilidad se puede escribir como Comparando la ecuación anterior con la definición de los intervalos de confianza vemos que los valores corresponden a los límites de los intervalos de confianza T1 y T2 mencionados al definir lo que es un intervalo de confianza. Teorema. Si es la media muestral de una muestra aleatoria de tamaño n de una población con varianza desconocida s², y S² es la varianza muestral, el intervalo de confianza para la media poblacional m está dado por: Intervalos de confianza para la media Intervalos de confianza Varianza desconocida Ejemplo. Considere de nuevo el ejemplo anterior, donde m representa la longitud media de un eje proveniente de un proceso de producción normal, pero con una varianza desconocida, y se toman muestras de 16 ejes, con los siguientes valores: Cuál será el intervalo de confianza del 95% para el nivel medio del proceso?. Puede considerarse que este proceso tiene un nivel medio de 5.0 cm? Niveles de confianza del 90%, 95% y99%. Observación El intervalo de confianza que encontramos para la media m cuando la varianza es desconocida está basado en la distribución t. Por lo tanto, siempre que queramos encontrar el intervalo de confianza para algún otro parámetro cuyo estimador (estadístico) siga una distribución normal y la(s) varianza(s) sea(n) desconocida(s), podemos usar el intervalo anterior, cambiando simplemente el estadístico por el estadístico apropiado, y cambiando el estimativo de la desviación estándar de la media dada por Intervalos de confianza para la media Intervalos de confianza Varianza desconocida Observación por la correspondiente desviación estándar del estadístico. Por ejemplo, si queremos calcular un intervalo de confianza para una diferencia de medias y las varianzas son desconocidas pero iguales, cambiamos por Intervalos de confianza para la diferencia de dos media Intervalos de confianza Sean X11, X12, ... X1n1, una muestra aleatoria de n1 observaciones tomadas de una primera población con valor esperado µ1 y varianza s²1, y X21, X22, ... X2n2 una muestra aleatoria de n2 observaciones tomada de la segunda población con valor esperado µ2 y varianza s²2. Si son las medias muestrales, la estadística es un estimador puntual de µ1 - µ2, y tiene una distribución normal si las dos poblaciones son normales, o aproximadamente normal si cumple con las condiciones del teorema del limite central (tamaños de muestras relativamente grandes). Por lo tanto Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe probar si son iguales o diferentes. Cada uno de estos tres casos se analizarán por separado Intervalos de confianza para la diferenciade dos media Intervalos de confianza Varianza conocida Si las varianzas poblacionales son conocidas, los pasos a seguir para encontrar el intervalo de confianza son los siguientes: El estadístico usado como estimador puntual de la diferencia de medias µ1 - µ2 será T = Que es un estimador suficiente La variable aleatoria asociada con el estimador será la variable normal estándar dada por: Para calcular el intervalo de confianza se debe tener en cuenta la siguiente probabilidad: Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianza conocida Manipulando la expresión anterior en forma similar a como se hizo en los casos de una sola muestra se llega al siguiente teorema que nos define el intervalo de confianza para la diferencia entre dos medias µ1 - µ2 con varianzas conocidas s²1 y s²2. Teorema. Si son las medias de dos muestras aleatorias independientes de tamaño n1 y n2 tomadas de poblaciones que tienen varianzas conocidas s²1 y s²2, respectivamente, entonces un intervalo de confianza del 100(1-a)% para µ1 - µ2 es: Ejemplo. Construya un intervalo de confianza del 97% para la diferencia real entre las duraciones de dos marcas de bombillos, si una muestra de 40 bombillos tomada al azar de la primera marca dio una duración media de 418 horas, y una muestra de 50 bombillos de otra marca dieron una duración media de 402 horas. Las desviaciones estándares de las dos poblaciones son 26 horas y 22 horas, respectivamente. Solución. Tenemos que: s1 = 26, s2 = 22, n1 = 40, n2 = 50, Z0.03 = 1.88.4182,4181 == xx Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianza conocida Ejemplo. El intervalo de confianza es, entonces: El hecho de que ambos límites sean positivos, y por lo tanto no contengan el valor cero indican que ambas marcas no tienen la misma duración media, y sugiere que pueda pensarse que la primera marca de bombillos tenga una duración media superior a la segunda. Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianzas desconocida pero iguales (σ12=σ22=σ2) Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadística para verificar si éstas son iguales o diferentes. Para realizarlo debemos hacer uso de la distribución F, bien sea mediante el cálculo de la probabilidad de que la muestra tomada provenga de dos poblaciones con varianzas iguales, o mediante el uso de un intervalo de confianza para la relación de dos varianzas, según se estudiará más adelante. Si mediante el uso de la distribución F se llega a la conclusión de que las varianzas son iguales, el procedimiento a seguir para el cálculo del intervalo de confianza para la diferencia de dos medias será el siguiente: El estadístico usado como estimador puntual de la diferencia de medias µ1 - µ2 será T = que es un estimador suficiente. La variable aleatoria asociada con el estimador será la variable T definida como: donde es un estimador combinado de s², mejor que por separado Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianzas desconocida pero iguales (σ12=σ22=σ2) Para calcular el intervalo de confianza se debe tener en cuenta la siguiente probabilidad: De nuevo, manipulando la expresión anterior en forma similar a los casos se llega al siguiente teorema que nos define el intervalo de confianza para la diferencia entre dos medias µ1 - µ2 con varianzas desconocidas s²1 y s²2, pero iguales Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianzas desconocida pero iguales (σ12=σ22=σ2) Teorema. Si son las medias y las varianzas de dos muestras aleatorias de tamaños n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100(1-a)% para la diferencia entre medias µ1 - µ2 es: Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianzas desconocida pero iguales (σ12=σ22=σ2) Ejemplo. La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el contenido de nicotina de dos marcas de cigarrillos. Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con varianzas desconocidas, construya un intervalo de confianza del 95% para la diferencia real de nicotina de las dos marcas. Solución. Inicialmente mediante la distribución F debemos verificar si las varianzas son iguales Buscando en la tabla de la distribución F para 7 grados de libertad en el numerador y 9 en el denominador, vemos que el valor de la probabilidad está entre 0.10 y 0.25 (aproximadamente 0.19, mediante interpolación lineal). Como esta probabilidad es muy alta, concluimos que no hay evidencia para rechazar la hipótesis de que las varianzas sean iguales. (σ12=σ22=σ2) Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianzas desconocida pero iguales (σ12=σ22=σ2) Ejemplo Como las varianzas son iguales, calculamos que está dado por: El intervalo de confianza del 95% está dado por (t0.025,16 = 2.12): Debido a que la diferencia real puede ser cero, no se puede concluir que existe una diferencia en el contenido de nicotina de las dos marcas de cigarrillos. Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianzas desconocida pero iguales (σ12=σ22=σ2) Ejercicio. El gerente de una refinería piensa modificar el proceso para producir gasolina a partir de petróleo crudo. El gerente hará la modificación sólo si la gasolina promedio que se obtiene por este nuevo proceso (expresada como un porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con base en experimentos de laboratorio y mediante el empleo de dos muestras aleatorias de tamaño 12, una para cada proceso, la cantidad de gasolina promedio del proceso en uso es de 24.6 con una desviación estándar de 2.3, y para el proceso propuesto fue de 28.2 con una desviación estándar de 2.7. El gerente piensa que los resultados proporcionados por los dos procesos son variables aleatorias independientes normalmente distribuidas con varianzas iguales. Con base en esta evidencia, ¿debe adoptarse el nuevo proceso? Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianzas desconocida pero desiguales (σ12≠σ22) Si mediante el uso de la distribución F se llega a la conclusión de que las varianzas son diferentes, el procedimiento a seguir para el cálculo del intervalo de confianza para la diferencia de dos medias será el siguiente: El estadístico usado como estimador puntual de la diferencia de medias µ1 - µ2 será que es un estimador suficiente La variable aleatoria asociada con el estimador será la variable T definida como: donde El intervalo de confianza esta dado por el siguiente teorema, basado en la distribución t con v grados de libertad. T = Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianzas desconocida pero desiguales (σ12≠σ22) Teorema. Si son las medias y las varianzas de dos muestras aleatorias de tamaños n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas y desiguales, entonces un intervalo de confianza aproximado del 100(1-a)% para la diferencia entre medias µ1 - µ2 es: Intervalos de confianza para la diferencia de dos media Intervalos de confianza Varianzas desconocida pero desiguales (σ12≠σ22) Problema. Cierto metal se produce, por lo común, mediante un proceso estándar. Se desarrolla un nuevo proceso en el que se añade una aleación a la producción del metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de éstos se sometea una tensión hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en kilogramos por centímetro cuadrado: Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e independientes, obtener los intervalos de confianza estimados del 95 y 99% para la diferencia entre los dos procesos. Interprete los resultados. Intervalos de confianza para una proporción θ Intervalos de confianza En muchos análisis debemos obtener proporciones, probabilidades, índices, tasas, tales como la proporción de unidades defectuosas de un proceso, la probabilidad de que un artículo falle, o algún elemento se descomponga. En estos casos es razonable suponer que el análisis de cada elemento es similar a la realización de un experimento de Bernoulli, o que el total de eventos sigue una distribución binomial. El problema que queremos resolver es encontrar un intervalo de confianza para el parámetro q de la distribución binomial, que representa la verdadera proporción de cierto tipo de eventos. El estimativo máximo verosímil de la proporción poblacional q es la proporción muestral definida como P = X/n, donde X se distribuye binomial con los parámetros (n,q). Recordemos que P es un estimador insesgado y suficiente de q, con las siguientes características: Además, si el tamaño de muestra es lo suficientemente grande, y si q no está muy próximo a 0 ó a 1 la distribución de muestreo de la proporción tiende a la distribución normal con los parámetros arriba mencionados. cuando n →. P ~ Intervalos de confianza para una proporción θ Intervalos de confianza Procedimiento Por tanto, la distribución de la variable Z definida a continuación es aproximadamente una distribución normal estándar: El procedimiento para encontrar el intervalo de confianza del 100(1-a)% para la proporción q es el siguiente: El estimador puntual de la proporción poblacional q es la proporción muestral dada por La variable aleatoria asociada es la normal dada por Para el cálculo del intervalo de confianza tenemos en cuenta la siguiente probabilidad: Intervalos de confianza para una proporción θ Intervalos de confianza Procedimiento Manipulado la expresión anterior obtenemos que: Si en el cálculo de la varianza reemplazamos q por su estimativo obtenemos el intervalo de confianza que se presenta a continuación. Teorema. Si P es la proporción de observaciones que pertenecen a una clase de interés en una muestra aleatoria de tamaño n, entonces un intervalo de confianza aproximado de 100(1-a)% para la verdadera proporción q de la población que pertenece a esta clase es: Intervalos de confianza para una proporción θ Intervalos de confianza Ejemplo. Un fabricante asegura a un potencial comprador que el porcentaje defectuoso de su proceso es máximo el 4%. Para comprobar la afirmación del productor, el cliente solicita que se le inspeccione una muestra de 300 artículos de los que hay en el inventario. Al verificar esta muestra se obtienen 18 artículos defectuosos. Podrá el cliente potencial dudar de la afirmación del proveedor? Para verificar la afirmación del productor, construiremos un intervalo de confianza del 95% para la verdadera fracción defectuosa, y la sospecha del cliente (de que la verdadera fracción defectuosa es mayor del 4%) estará apoyada si el respectivo intervalo de confianza se encuentra completamente a la derecha del valor afirmado de q. Tenemos entonces la siguiente información: p=18/300=0.06, n=300, Za/2=1.645 0.037 < q < 0.083 Como el valor de 0.04 se encuentra dentro del intervalo de confianza, entonces no tenemos razones o evidencias para sospechar de la afirmación del productor. Intervalos de confianza para una proporción θ Intervalos de confianza Estimación del tamaño de la muestra n Si queremos estimar el tamaño de muestra que se debe usar para tener una confiabilidad mínima del 100(1-a)% de que el error en la estimación del parámetro q no diferirá de su verdadero valor en una cantidad superior a d, tenemos entonces que: Como el tamaño de la muestra es una función de varianza del estimador y por lo tanto del parámetro q, que es desconocido, y no teniendo ninguna información sobre su valor, entonces podemos usar el valor de q que hace máximo la varianza y que corresponde a 1/2, por lo cual el tamaño de muestra estará dado por: Intervalos de confianza para la diferencia de dos proporción θ1- θ2 Intervalos de confianza Sea X1 el número de eventos de cierto tipo observado en una primera muestra de tamaño n1 tomada de una población binomial, y sea X2 el número de eventos observado en otra muestra de tamaño n2. Entonces X1 y X2 son variables aleatorias binomiales independientes con parámetros (n1, q1) y (n2, q2), tomadas de dos poblaciones grandes, y q1 y q2 son sus dos proporciones respectivas. Además, P1= X1/ n1 y P2= X2/ n2 son estimadores independientes de q1 y q2, respectivamente, y tienden a distribuirse normalmente. Si los tamaños de muestra son suficientemente grandes, la siguiente variable tiene una distribución que es aproximadamente normal estándar. Para encontrar un intervalo de confianza para la diferencia de proporciones q1- q2, el estimador puntual estará dado por P1 - P2, la variable aleatoria asociada será la normal estándar, de acuerdo a lo explicado antes, y el intervalo de confianza estará dado por el siguiente teorema. Teorema. Si P1 y P2 son las proporciones muestrales de dos muestras aleatorias independientes de tamaño n1 y n2 que pertenecen a una clase de interés, entonces un intervalo de confianza aproximado del 100(1-a)% para la diferencia de las proporciones verdaderas q1 - q2 es: Intervalos de confianza para la diferencia de dos proporción θ1- θ2 Intervalos de confianza Ejemplo Considere un proceso de producción que tiene una fracción defectuosa q1, desconocida. A este proceso se le realizan unas mejoras para reducir el porcentaje de defectuosos que está produciendo, y queremos saber si estos cambios sí reducen sustancialmente la proporción de artículos defectuosos del proceso. Para ello, se toma una muestra de 200 artículos del proceso original, y se encuentran 12 defectuosos, y se examinan 150 artículos del nuevo proceso y se observan 6 defectuosos. Cree Usted que los cambios efectuados al proceso han reducido el porcentaje de artículos defectuosos?. Use un nivel de confianza del 95%. Tenemos: n1 = 200, x1 = 12 p1 = 12/200 = 0.06 n2 = 150, x2 = 6 p2 = 6/150 = 0.04 El intervalo de confianza del 95% para la diferencia entre las fracciones defectuosas antes y después de las mejoras realizadas al proceso está dado por: Como la diferencia de cero está incluida en el intervalo de confianza, concluimos que no tenemos evidencia para afirmar que los cambios efectuados al proceso contribuyen a reducir el porcentaje de artículos defectuosos. Intervalos de confianza para la difrencia de dos proporción θ1- θ2 Intervalos de confianza Ejercicio: Cuál hubiera sido la conclusión si las muestras y los resultados hubieran sido los siguientes (observe que las proporciones defectuosas muestrales son las mismas): Tenemos: n1 = 1000, x1 = 60 Þ p1 = 60/1000 = 0.06 n2 = 750, x2 = 30 Þ p2 = 30/750 = 0.04 Ejercicio: Un artículo del New York Times en 1987 reportó que se puede reducir el riesgo de sufrir ataques al corazón ingiriendo aspirina. Para llegar a esta conclusión el cronista se basó en los resultados de un experimento diseñado, en donde participaron dos grupos de personas. A un grupo de 11,034 personas se le suministró una dosis diaria de una pastilla que no contenía ninguna droga (un placebo), y de estos 189 sufrieron posteriormente ataques al corazón, mientras que al otro grupo de 11,037 se les suministró una aspirina, y sólo 104 lo sufrieron. Considera Usted que el cronista del New York Times estaba en lo correcto?. Use un intervalo de confianza. Haga explícitas las suposiciones que considere necesarias. Intervalos de confianzapara la varianza de una distribución normal Intervalos de confianza Si X1, X2, Xn es una muestra aleatoria de tamaño n tomada de una población normal, y si S² es la varianza muestral, entonces S² es un estimador puntual razonable de la varianza poblacional s². Por otra parte, si la población es normal, la distribución muestral de la siguiente variable es una distribución ji-cuadrado con n-1 grados de libertad. Por lo tanto, para obtener un intervalo de confianza del 100(1-a)% para la varianza s2 nos basamos en el estadístico S² y en la distribución chi cuadrado. Por lo tanto, tenemos la siguiente probabilidad: Manipulando las expresiones tenemos que: Intervalos de confianza para la varianza de una distribución normal Intervalos de confianza Teorema. Si S² es la varianza muestral de una muestra aleatoria de n observaciones tomadas de una distribución normal con varianza desconocida s², entonces el intervalo de confianza de 100(1-a)% para s² es: Ejemplo. Un proceso produce cierta clase de cojinetes de bola cuyo diámetro interior es de 3 cm. Se seleccionan en forma aleatoria 12 de estos cojinetes y se miden sus diámetros interiores, y los valores resultantes son los siguientes: 3.01, 3.05, 2.99, 2.99, 3.02, 3.00, 2.98, 2.99, 2.97, 2.97, 3.02 y 3.01. Suponiendo que el diámetro es una variable aleatoria normal, determine un intervalo de confianza para la varianza poblacional. Use un intervalo de confianza del 99%. Solución El intervalo de confianza estará dado por: En el intervalo de confianza para la varianza, el punto medio del intervalo (0.001266) no coincide con el estimador puntual, debido a la no simetría de la distribución chi cuadrado. Intervalos de confianza para la relación de varianzas de dos distribuciones normales Intervalos de confianza Se tienen dos poblaciones normales e independientes con varianzas desconocidas s²1 y s²2, respectivamente. De este par de poblaciones se tienen disponibles dos muestras .aleatorias de tamaños n1 y n2, respectivamente; sean S1² y S2² las varianzas muestrales respectivas. Para hallar el intervalo de confianza del 100(1-a)% para el cociente de dos varianzas sabemos que la siguiente relación tiene una distribución muestral F con n1-1 y n2-1 grados de libertad: Entonces, para construir el intervalo de confianza para la relación de dos varianzas, nos basamos en la siguiente probabilidad: Intervalos de confianza para la relación de varianzas de dos distribuciones normales Intervalos de confianza Si invertimos el término central de la desigualdad anterior, obtenemos lo siguiente: Usando el hecho de que obtenemos el siguiente intervalo de confianza para la relación de dos varianzas. Intervalos de confianza para la relación de varianzas de dos distribuciones normales Intervalos de confianza Teorema. Si son las varianzas de muestras aleatorias independientes tomadas de poblaciones normales, entonces un intervalo de confianza 100(1-a)% para el cociente de dos varianzas está dado por: Ejemplo. Considere de nuevo el problema del contenido de nicotina de dos marcas de cigarrillos. Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con varianzas desconocidas, construya un intervalo de confianza del 98% para la relación de las dos varianzas de los contenidos de nicotina de las dos marcas de cigarrillos. Intervalos de confianza para la relación de varianzas de dos distribuciones normales Intervalos de confianza Ejemplo: Solución. Tenemos que: F0.01,9,7 = 6.72, F0.01,7,9 = 5.61 El intervalo de confianza del 99% par la relación de la varianza de la marca B (la mayor) a la varianza de la marca A está dado por: Intervalos de confianza para observaciones pareadas Intervalos de confianza Cuando se comparan las medias de dos niveles es deseable que las observaciones dentro de cada nivel sean lo más homogéneas posibles. Si existe un efecto debido a factores externos éstos pueden neutralizarse mediante la aplicación del principio de la aleatoriedad. Esto se logra tomando las observaciones en pares. Se supone que las condiciones exteriores son las mismas para cada par, pero pueden variar de un par a otro. Por ejemplo, suponga que se tiene un grupo de personas que se someten a una dieta para reducción de peso, y para cada persona se lleva el registro del peso, en kgs, antes de la dieta, y un tiempo razonable después de haber empezado la dieta. En este caso, el peso de cada persona después de la dieta no es independiente del peso de la misma persona antes de la dieta; por lo tanto estas dos variables están correlacionadas, y si se quiere examinar el efecto de la dieta, se debe llevar el registro del peso para la misma persona antes y después de la dieta. Sean (X11, X21), (X12, X22),...(X1n,X2n) los datos consistentes de n pares; supondremos que las variables aleatorias X1 y X2 tienen Podemos suponer que el conjunto de datos apareados son observaciones de un conjunto independiente de parejas de variables aleatorias provenientes de una distribución normal bivariada (X1 X2) ~f(X1, X2), y que las diferencias D = X1 - X2 se distribuyen normalmente con valor esperado mD y varianza medias µ1 y µ2, y varianzas Intervalos de confianza para observaciones pareadas Intervalos de confianza Sea Dj la diferencia entre las variables aleatorias del j-ésimo par, es decir, Dj = X1j-X2j. El valor esperado y la varianza de la diferencia entre las variables está dado por: Si las variables X1 y X2 se distribuyen normalmente, las diferencias estarán distribuidas también de manera normal con media µD y varianza Para estimar la media y la varianza de la diferencia, se debe tomar una muestra aleatoria de tamaño n, antes y después, calcular la diferencia, y luego la diferencia promedio y la varianza muestral de las diferencias, como se ilustra en el siguiente cuadro. Intervalos de confianza para observaciones pareadas Intervalos de confianza Dada la muestra aleatoria se calculan los siguientes estadísticos que servirán para estimar la media y la varianza de la diferencia Sabemos que la siguiente variable aleatoria sigue una distribución normal estándar: Sin embargo, como no es conocido, lo podemos estimar mediante la varianza muestral en cuyo caso la siguiente variable aleatoria sigue una distribución t con n-1 grados de libertad. Intervalos de confianza para observaciones pareadas Intervalos de confianza Usando la distribución t podemos calcular el intervalo de confianza para la media de observaciones pareadas, el cual está dado por el siguiente teorema. Teorema. Si son la media y la desviación estándar muestrales de la diferencia de n pares aleatorios de mediciones normalmente distribuidas, entonces un intervalo de confianza del 100(1-a)% para la diferencia de medias µD = µ1 -µ2 es: Ejemplo.Se está investigando la utilidad de dos lenguajes de diseño para mejorar las tareas de programación. Se le ha pedido a 12 programadores expertos, familiarizados con los dos lenguajes, que codifiquen una función estándar con ambos lenguajes, y se registra el tiempo requerido, en minutos, para realizar estas dos tareas. Los datos obtenidos son: Intervalos de confianza para observaciones pareadas Intervalos de confianza Ejemplo: Encuentre un intervalo de confianza para la diferencia en los tiempos medios de codificación. Use un nivel de confianza del 95%. Existe alguna evidencia que indique una preferencia por alguno de los dos lenguajes? Tenemos que: El intervalo de confianza está dado por: Dado que la diferencia puede ser cero, se concluye que no hay evidencia para rechazar la hipótesis de que ambos lenguajes requieren el mismo tiempo de programación, y por lo tanto no hay preferencia por ninguno de los dos lenguajes. Diapositiva 1 Diapositiva 2 Diapositiva 3 Diapositiva 4 Diapositiva 5 Diapositiva 6 Diapositiva 7 Diapositiva 8 Diapositiva 9 Diapositiva 10 Diapositiva 11 Diapositiva 12 Diapositiva 13 Diapositiva14 Diapositiva 15 Diapositiva 16 Diapositiva 17 Diapositiva 18 Diapositiva 19 Diapositiva 20 Diapositiva 21 Diapositiva 22 Diapositiva 23 Diapositiva 24 Diapositiva 25 Diapositiva 26 Diapositiva 27 Diapositiva 28 Diapositiva 29 Diapositiva 30 Diapositiva 31 Diapositiva 32 Diapositiva 33 Diapositiva 34 Diapositiva 35 Diapositiva 36 Diapositiva 37 Diapositiva 38 Diapositiva 39 Diapositiva 40 Diapositiva 41 Diapositiva 42 Diapositiva 43 Diapositiva 44 Diapositiva 45 Diapositiva 46 Diapositiva 47 Diapositiva 48 Diapositiva 49 Diapositiva 50 Diapositiva 51
Compartir