Logo Studenta

Intervalos de confianza Resumen

¡Este material tiene más páginas!

Vista previa del material en texto

Introducción
Intervalos de confianza
Dado que los estimativos puntuales pocas veces serán iguales a los parámetros que tratan de 
estimar, podemos darnos una mayor libertad en su estimación mediante el uso de la "estimación 
por intervalos" o "intervalos de confianza".
Un intervalo de confianza es un intervalo estimado dentro del cual se espera encontrar el valor de 
un parámetro. 
Definición:
Sea 1-α una probabilidad especificada alta y sean T1 y T2, dos estadísticos tales que
P[T1 ≤ θ ≤ T2] = 1- α
El intervalo [T1, T2] recibe el nombre de Intervalo de Confianza del 100(1-a)% para el parámetro 
desconocido θ. Las cantidades T1, T2 reciben el nombre de Limites de confianza inferior y 
superior, respectivamente, y (1- α) es el Nivel de Confianza asociado con el intervalo.
En términos generales la construcción de un intervalo de confianza para un parámetro θ consiste en 
encontrar un estadístico T y relacionarlo con otra variable aleatoria X* = f(t, θ), donde X* involucra a 
θ, pero la distribución de X* no depende de θ, ni de ningún otro parámetro no conocido. Entonces 
T1 y T2 son funciones del estadístico T (estimador de θ).
La interpretación de un intervalo de confianza radica en la interpretación de una probabilidad de 
largo plazo, y es que, si se recopila un número grande de muestras aleatorias y se calcula un 
intervalo de confianza del 100(1-a)% para el parámetro q para cada una de las muestras, entonces 
el 100(1- a)% de esos intervalos contienen el valor verdadero de θ.
Intervalos de confianza
Intervalos de confianza
De acuerdo con la interpretación, el nivel de confianza del 100(1-a)% no es tanto un 
enunciado sobre un intervalo particular sino que pertenece a lo que pasaría si se 
construyera un número grande de intervalos semejantes.
La probabilidad es 1-a de que el intervalo aleatorio contenga el verdadero 
valor del parámetro desconocido q. El parámetro q es una constante, aunque 
desconocida, y los intervalos T1 y T2 son variables aleatorias.
Construcción de un intervalo de confianza
Como ya se mencionó, en términos generales la construcción de un intervalo de 
confianza para un parámetro q consiste en encontrar un estadístico T y 
relacionarlo con otra variable aleatoria X* = f(t,q), donde X* involucra a q, pero la 
distribución de X* no depende de q, ni de ningún otro parámetro no conocido. 
Entonces T1 y T2 son funciones del estadístico T (estimador de q). 
Intervalos de confianza
Intervalos de confianza
Si denotamos por X1, X2, ...Xn la muestra aleatoria con base en la cual se construirá el intervalo de 
confianza para el parámetro θ. Entonces debemos encontrar un estadístico T = t(X1, X2, ...Xn) y 
relacionarlo con otra variable aleatoria que cumpla las siguientes condiciones:
Condiciones de la variable aleatoria
• La variable depende funcionalmente de X1, X2, ...Xn y θ.
• La distribución de probabilidad de la variable no depende de θ ni de ningún otro parámetro no 
conocido.
Por ejemplo, si queremos construir un intervalo de confianza para la varianza σ2 de una distribución 
normal, la variable aleatoria sería (n-1)S²/ σ ², que, aunque es función de σ², tiene una distribución chi 
cuadrado que no depende de σ².
Sea T = t(X1, X2, ...Xn) el estadístico que sirve como estimador del parámetro θ, y sea g(X1, X2, ...Xn, 
θ) la variable aleatoria asociada con el estadístico T, y sean a y b dos valores constantes tales que
P(a < T < b) = 1 – α
Haciendo uso de la variable aleatoria asociada con el estadístico T, la anterior probabilidad se puede 
escribir como:
P(c < g(X1, X2, ...Xn,q) < d) = 1 – α
Intervalos de confianza
Intervalos de confianza
Condiciones de la variable aleatoria
Donde c y d son las constantes que resultan al transformar a y b de acuerdo la variable aleatoria 
asociada con el estadístico T. Mediante la manipulación de la desigualdad planteada en la ecuación 
anterior, se puede despejar el parámetro θ, de tal forma que la desigualdad tenga como valor central 
el parámetro θ, y los límites queden en función, entre otras variables, del estadístico que sirve como 
estimador de θ. De lo anterior se obtendría una desigualdad equivalente que podríamos escribir 
como:
P(h1(X1, X2, ...Xn) < θ <h2(X1, X2, ...Xn) = 1 – α
Entonces los valores h1(X1, X2, ...Xn) y h2(X1, X2, ...Xn) son los intervalos de confianza para el 
parámetro θ, y corresponderían a las variables T1 y T2 mencionadas previamente.
Para construir un intervalo de confianza para un parámetro desconocido θ se deben tener en cuenta los 
siguientes pasos:
Resumen
• Encontrar un estimador puntual T para el parámetro θ, que sea suficiente.
• Encontrar una variable aleatoria X* relacionada con el estimador puntual T.
• Con base en la distribución de la variable aleatoria asociada con el estadístico y conociendo su 
distribución muestral se calcula el respectivo intervalo de confianza.
Tiene una distribución normal estándar. Por lo tanto, y si a y b son dos valores constantes 
tales que:
P(a < < b) = 1-α
Intervalos de confianza
Intervalos de confianza
Ejemplo
Cálculo de un intervalo de confianza para m, con varianza s² conocida.
Debemos encontrar dos estadísticos T1 y T2 tales que P[T1  m  T2] = 1-a
El estadístico a usar corresponde a la media muestral que es el mejor estimador de la media 
poblacional m. Sabemos que la media muestral se distribuye normalmente con valor esperado m y 
varianza s², entonces la variable asociada será
Conociendo la distribución de la media muetral y la probabilidad anterior se puede 
expresar como: 
Intervalos de confianza
Intervalos de confianza
Ejemplo
Sabemos que:
Tiene una distribución normal estándar, y la probabilidad es 1-a, entonces queda una 
probabilidad total de a para los dos extremos, la cual podemos dividir en dos partes, a1 y 
a2 tales que a1 + a2 = a, a1 para el límite inferior y a2 para el límite superior.
Si denotamos por 
los valores de la distribución normal que tienen probabilidades acumuladas de a1 y 1-a2, 
respectivamente, entonces la probabilidad dada en la ecuación anterior se puede escribir 
como:
Intervalos de confianza
Intervalos de confianza
Ejemplo
Manipulando la parte inferior de la desigualdad
para expresarla en términos de m obtenemos que es equivalente a 
En forma similar, manipulando la parte superior de la desigualdad obtenemos que 
Combinando los resultados anteriores, la ecuación anterior de la probabilidad se puede 
escribir como:
Por lo general, los valores a1 y a2 son iguales a a/2, por lo cual la ecuación anterior 
queda como:
Intervalos de confianza
Intervalos de confianza
Ejemplo
Comparando la ecuación anterior con la definición de los intervalos de confianza vemos 
que los valores
corresponden a los límites de los intervalos de confianza T1 y T2 mencionados al definir lo 
que es un intervalo de confianza. Por lo tanto, el intervalo de confianza está dado por:
El intervalo de confianza es aleatorio, ya que sus límites dependen de la media 
muestral, que es una variable aleatoria. La longitud del intervalo es constante e igual a
y lo que varía es el punto medio (se toma la media muestral como pivote). Si para un 
mismo nivel de confianza queremos reducir el tamaño de intervalo, 
necesariamente tenemos que usar un tamaño de muestra mayor.
Intervalos de confianza
Intervalos de confianza
Error de estimación
Ï - m = 
El error en la estimación de la media poblacional, definido como
Por lo tanto, si denotamos por d el error máximo que estamos dispuestos a admitir en la 
estimación de la media poblacional m, el tamaño de muestra que debemos usar estará dado 
por:
Ejemplo. Si m representa la longitud media de un eje proveniente de un proceso de 
producción normal con una varianza de 0.01 cm, y se toman muestras de 16 ejes, cuál 
será el intervalo de confianza del 95% para el nivel medio del proceso?. Puede 
considerarse que este proceso tiene un nivel medio de 5.0 cm?
Suponga que se toma la muestra aleatoria y los resultados, encm, son los siguientes:
Intervalos de confianza
Intervalos de confianza
Ejemplo
Tenemos, entonces la siguiente información:
El intervalo de confianza está dado por:
(4.92 - 1.96 x 0.1/4, 4.92 + 1.96 x 0.1/4) = (4.87, 4.97)  4.87 < m < 4.97.
De acuerdo con el anterior intervalo de confianza, el nivel medio del proceso es algún 
valor entre 4.87 cm y 4.97 cm, y como el valor de 5.0 cm no está en el intervalo anterior, 
puede rechazarse la hipótesis de que el nivel medio del proceso sea 5.0 cm. La longitud 
del intervalo de confianza es 0.1 cm, y el error máximo si estimamos la media poblacional
m mediante la media muestral sería de 0.05 cm, con un nivel de confianza del 95%. Si 
quisiéramos reducir este error a 0.03 cm, deberíamos realizar 43 observaciones, según se 
desprende la siguiente fórmula:
Se puede afirmar que P(4.87 < m < 4.97) = 0.95
n = 16 = 4.92, s = 0.1, Za/2 = Z0.025 = 1.96
Intervalos de confianza
Intervalos de confianza
Ejemplo
Ahora, la longitud del intervalo de confianza varía, para un mismo tamaño de la muestra, 
dependiendo del nivel de confianza. Para el ejemplo anterior, si consideramos, además del 
95%, niveles de confianza del 90% y del 99%, los respectivos intervalos de confianza 
serían los siguientes:
Se observa que para ningún intervalo de confianza, se acepta la hipótesis de que 
el nivel medio del proceso sea 5.0.
Intervalos de confianza
Intervalos de confianza
Observación
Para un mismo tamaño de muestra, y una misma confiabilidad, el intervalo de confianza no es 
único, dado que la probabilidad a que queda en los extremos se puede desagregar de muy diversas 
maneras (α1 y α2 pueden tomar diferentes valores tales que debe α1 + α2 = α).
Por ejemplo, α = 0.05 podría desagregarse en 0.01 y 0.04, ó 0.02 y 0.03, ó 0.04 y 0.01, ó 0.0 y 0.5, 
etc. Sin embargo, el intervalo de menor longitud es el correspondiente a α1 = α2 = α/2. 
Ahora bien, si para un mismo nivel de confianza queremos reducir la longitud del intervalo, 
necesariamente tenemos que aumentar el tamaño de la muestra.
El intervalo de confianza que encontramos para la media m está basado en la distribución de la media
Siempre que queramos encontrar el intervalo de confianza para algún otro parámetro
cuyo estimador (estadístico) siga una distribución normal, podemos usar el intervalo 
anterior, cambiando simplemente el estadístico (media muestral) por el estadístico apropiado, 
y cambiando la desviación estándar de la media dada por 
por la correspondiente desviación estándar del estadístico.
Intervalos de confianza
Intervalos de confianza
Por ejemplo, si queremos calcular un intervalo de confianza para una diferencia de 
medias 
cambiamos 
por 
y el intervalo de confianza estaría dado por:
Intervalos de confianza para la media
Intervalos de confianza
Varianza conocida
El intervalo de confianza para la media poblacional m cuando la varianza poblacional s² es 
conocida corresponde al caso que acabamos de presentar y que se resume a continuación.
El intervalo de confianza está basado en la media muestral 
(toma la media muestral como pivote) y en la distribución de la variable normal (0,1) 
dada por:
Teorema. Si 
es la media muestral de una muestra aleatoria de tamaño n de una población con 
varianza conocida s², un intervalo de confianza para µ del 100(1-a)% está dado por: 
Para muestras tomadas de una población normal, o para muestras de tamaño n  30, sin 
importar la forma que tenga la población, el intervalo de confianza proporciona buenos 
resultados. Sin embargo, para muestras pequeñas tomadas de poblaciones que no son 
normales, no es posible esperar que el nivel de confianza 1-a sea exacto.
Intervalos de confianza para la media
Intervalos de confianza
Varianza desconocida
Cuando la varianza de una variable aleatoria no es conocida, y se tiene una muestra 
aleatoria, no se puede usar la distribución normal, sino que en su lugar se debe emplear la 
distribución t. Es decir, la variable T definida de la siguiente manera sigue una distribución t 
con n-1 grados de libertad.
Si 
son la media muestral y la desviación estándar de una muestra aleatoria tomada de una 
distribución normal con varianza s² desconocida, entonces un intervalo de confianza 
(T1,T2) del 100(1-a)% para µ será aquel que cumpla que:
P[T1  m  T2] = 1-a
De nuevo el estadístico a usar corresponde a la media muestral, entonces la variable 
asociada será 
y S
que tiene una distribución t con n-1 grados de libertad. Por lo tanto si a y b son dos 
valores constantes tales que
P(a< < b) = 1-a ; 
Intervalos de confianza para la media
Intervalos de confianza
Varianza desconocida
Si vamos a considerar intervalos de confianza simétricos (a1 = a2 =a/2), entonces la 
anterior probabilidad puede escribirse como: 
lo cual a su vez puede expresarse como:
Manipulando la parte inferior de la desigualdad
para expresarla en términos de m obtenemos que es equivalente a 
En forma similar, manipulando la parte superior de la desigualdad obtenemos que
Intervalos de confianza para la media
Intervalos de confianza
Varianza desconocida
Combinando los resultados anteriores, la ecuación anterior de la probabilidad se puede 
escribir como
Comparando la ecuación anterior con la definición de los intervalos de confianza vemos 
que los valores
corresponden a los límites de los intervalos de confianza T1 y T2 mencionados al definir lo 
que es un intervalo de confianza.
Teorema. Si 
es la media muestral de una muestra aleatoria de tamaño n de una población con 
varianza desconocida s², y S² es la varianza muestral, el intervalo de confianza para la 
media poblacional m está dado por:
Intervalos de confianza para la media
Intervalos de confianza
Varianza desconocida
Ejemplo. Considere de nuevo el ejemplo anterior, donde m representa la longitud media 
de un eje proveniente de un proceso de producción normal, pero con una varianza 
desconocida, y se toman muestras de 16 ejes, con los siguientes valores:
Cuál será el intervalo de confianza del 95% para el nivel medio del proceso?. Puede 
considerarse que este proceso tiene un nivel medio de 5.0 cm? Niveles de confianza del 
90%, 95% y99%.
Observación
El intervalo de confianza que encontramos para la media m cuando la varianza es 
desconocida está basado en la distribución t. Por lo tanto, siempre que queramos 
encontrar el intervalo de confianza para algún otro parámetro cuyo estimador (estadístico) 
siga una distribución normal y la(s) varianza(s) sea(n) desconocida(s), podemos usar el 
intervalo anterior, cambiando simplemente el estadístico 
por el estadístico apropiado, y cambiando el estimativo de la desviación estándar de la 
media dada por 
Intervalos de confianza para la media
Intervalos de confianza
Varianza desconocida
Observación
por la correspondiente desviación estándar del estadístico. Por ejemplo, si queremos 
calcular un intervalo de confianza para una diferencia de medias 
y las varianzas son desconocidas pero iguales, cambiamos 
por 
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Sean X11, X12, ... X1n1, una muestra aleatoria de n1 observaciones tomadas de una 
primera población con valor esperado µ1 y varianza s²1, y X21, X22, ... X2n2 una muestra 
aleatoria de n2 observaciones tomada de la segunda población con valor esperado µ2 y 
varianza s²2. Si
son las medias muestrales, la estadística 
es un estimador puntual de µ1 - µ2, y tiene una distribución normal si las dos poblaciones 
son normales, o aproximadamente normal si cumple con las condiciones del teorema del 
limite central (tamaños de muestras relativamente grandes).
Por lo tanto
Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si 
las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean 
desconocidas, se debe probar si son iguales o diferentes. Cada uno de estos tres casos se 
analizarán por separado
Intervalos de confianza para la diferenciade dos media
Intervalos de confianza
Varianza conocida
Si las varianzas poblacionales son conocidas, los pasos a seguir para encontrar el 
intervalo de confianza son los siguientes:
El estadístico usado como estimador puntual de la diferencia de medias µ1 - µ2 será 
T = 
Que es un estimador suficiente
La variable aleatoria asociada con el estimador será la variable normal estándar dada por:
Para calcular el intervalo de confianza se debe tener en cuenta la siguiente probabilidad:
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianza conocida
Manipulando la expresión anterior en forma similar a como se hizo en los casos de una sola 
muestra se llega al siguiente teorema que nos define el intervalo de confianza para la 
diferencia entre dos medias µ1 - µ2 con varianzas conocidas s²1 y s²2.
Teorema. Si 
son las medias de dos muestras aleatorias independientes de tamaño n1 y n2 tomadas de 
poblaciones que tienen varianzas conocidas s²1 y s²2, respectivamente, entonces un 
intervalo de confianza del 100(1-a)% para µ1 - µ2 es:
Ejemplo. Construya un intervalo de confianza del 97% para la diferencia real entre las 
duraciones de dos marcas de bombillos, si una muestra de 40 bombillos tomada al azar de 
la primera marca dio una duración media de 418 horas, y una muestra de 50 bombillos de 
otra marca dieron una duración media de 402 horas. Las desviaciones estándares de las 
dos poblaciones son 26 horas y 22 horas, respectivamente.
Solución. Tenemos que:
s1 = 26, s2 = 22, n1 = 40, n2 = 50, Z0.03 = 1.88.4182,4181 == xx
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianza conocida
Ejemplo.
El intervalo de confianza es, entonces:
El hecho de que ambos límites sean positivos, y por lo tanto no contengan el valor 
cero indican que ambas marcas no tienen la misma duración media, y sugiere que pueda 
pensarse que la primera marca de bombillos tenga una duración media superior a la 
segunda.
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianzas desconocida pero iguales (σ12=σ22=σ2)
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba 
estadística para verificar si éstas son iguales o diferentes. Para realizarlo debemos hacer 
uso de la distribución F, bien sea mediante el cálculo de la probabilidad de que la muestra 
tomada provenga de dos poblaciones con varianzas iguales, o mediante el uso de un 
intervalo de confianza para la relación de dos varianzas, según se estudiará más adelante.
Si mediante el uso de la distribución F se llega a la conclusión de que las varianzas son 
iguales, el procedimiento a seguir para el cálculo del intervalo de confianza para la 
diferencia de dos medias será el siguiente:
El estadístico usado como estimador puntual de la diferencia de medias µ1 - µ2 será
T = 
que es un estimador suficiente.
La variable aleatoria asociada con el estimador será la variable T definida como:
donde 
es un estimador combinado de s², mejor que por separado
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianzas desconocida pero iguales (σ12=σ22=σ2)
Para calcular el intervalo de confianza se debe tener en cuenta la siguiente probabilidad:
De nuevo, manipulando la expresión anterior en forma similar a los casos se llega al siguiente teorema 
que nos define el intervalo de confianza para la diferencia entre dos medias µ1 - µ2 con varianzas 
desconocidas s²1 y s²2, pero iguales
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianzas desconocida pero iguales (σ12=σ22=σ2)
Teorema. Si 
son las medias y las varianzas de dos muestras aleatorias de tamaños n1 y n2, 
respectivamente, tomadas de dos poblaciones normales e independientes con varianzas 
desconocidas pero iguales, entonces un intervalo de confianza del 100(1-a)% para la 
diferencia entre medias µ1 - µ2 es:
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianzas desconocida pero iguales (σ12=σ22=σ2)
Ejemplo. La siguiente tabla presenta los resultados de dos muestras aleatorias para 
comparar el contenido de nicotina de dos marcas de cigarrillos. 
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de 
poblaciones normales con varianzas desconocidas, construya un intervalo de confianza del 
95% para la diferencia real de nicotina de las dos marcas.
Solución. Inicialmente mediante la distribución F debemos verificar si las varianzas 
son iguales 
Buscando en la tabla de la distribución F para 7 grados de libertad en el numerador y 9 en 
el denominador, vemos que el valor de la probabilidad está entre 0.10 y 0.25 
(aproximadamente 0.19, mediante interpolación lineal). Como esta probabilidad es muy 
alta, concluimos que no hay evidencia para rechazar la hipótesis de que las varianzas sean 
iguales.
(σ12=σ22=σ2)
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianzas desconocida pero iguales (σ12=σ22=σ2)
Ejemplo
Como las varianzas son iguales, calculamos 
que está dado por:
El intervalo de confianza del 95% está dado por (t0.025,16 = 2.12):
Debido a que la diferencia real puede ser cero, no se puede concluir que existe 
una diferencia en el contenido de nicotina de las dos marcas de cigarrillos.
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianzas desconocida pero iguales (σ12=σ22=σ2)
Ejercicio. El gerente de una refinería piensa modificar el proceso para producir gasolina a partir de 
petróleo crudo.
El gerente hará la modificación sólo si la gasolina promedio que se obtiene por este nuevo proceso 
(expresada como un porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con 
base en experimentos de laboratorio y mediante el empleo de dos muestras aleatorias de tamaño 
12, una para cada proceso, la cantidad de gasolina promedio del proceso en uso es de 24.6 con 
una desviación estándar de 2.3, y para el proceso propuesto fue de 28.2 con una desviación 
estándar de 2.7.
El gerente piensa que los resultados proporcionados por los dos procesos son variables aleatorias 
independientes normalmente distribuidas con varianzas iguales. Con base en esta evidencia, 
¿debe adoptarse el nuevo proceso?
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianzas desconocida pero desiguales (σ12≠σ22)
Si mediante el uso de la distribución F se llega a la conclusión de que las varianzas son 
diferentes, el procedimiento a seguir para el cálculo del intervalo de confianza para la 
diferencia de dos medias será el siguiente:
El estadístico usado como estimador puntual de la diferencia de medias µ1 - µ2 será
que es un estimador suficiente
La variable aleatoria asociada con el estimador será la variable T definida como:
donde 
El intervalo de confianza esta dado por el siguiente teorema, basado en la distribución t 
con v grados de libertad.
T =
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianzas desconocida pero desiguales (σ12≠σ22)
Teorema. Si 
son las medias y las varianzas de dos muestras aleatorias de tamaños n1 y n2, 
respectivamente, tomadas de dos poblaciones normales e independientes con varianzas 
desconocidas y desiguales, entonces un intervalo de confianza aproximado del 100(1-a)% 
para la diferencia entre medias µ1 - µ2 es:
Intervalos de confianza para la diferencia de dos media
Intervalos de confianza
Varianzas desconocida pero desiguales (σ12≠σ22)
Problema. Cierto metal se produce, por lo común, mediante un proceso estándar. 
Se desarrolla un nuevo proceso en el que se añade una aleación a la producción del 
metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia 
entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada 
metal se seleccionan 12 ejemplares y cada uno de éstos se sometea una tensión hasta 
que se rompe.
La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en kilogramos por 
centímetro cuadrado:
Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e 
independientes, obtener los intervalos de confianza estimados del 95 y 99% para la 
diferencia entre los dos procesos.
Interprete los resultados.
Intervalos de confianza para una proporción θ
Intervalos de confianza
En muchos análisis debemos obtener proporciones, probabilidades, índices, tasas, tales 
como la proporción de unidades defectuosas de un proceso, la probabilidad de que un 
artículo falle, o algún elemento se descomponga. En estos casos es razonable suponer 
que el análisis de cada elemento es similar a la realización de un experimento de 
Bernoulli, o que el total de eventos sigue una distribución binomial.
El problema que queremos resolver es encontrar un intervalo de confianza para el 
parámetro q de la distribución binomial, que representa la verdadera proporción de 
cierto tipo de eventos. El estimativo máximo verosímil de la proporción poblacional q es 
la proporción muestral definida como P = X/n, donde X se distribuye binomial con los 
parámetros (n,q).
Recordemos que P es un estimador insesgado y suficiente de q, con las siguientes 
características:
Además, si el tamaño de muestra es lo suficientemente grande, y si q no está muy 
próximo a 0 ó a 1 la distribución de muestreo de la proporción tiende a la distribución 
normal con los parámetros arriba mencionados.
cuando n →.
P ~
Intervalos de confianza para una proporción θ
Intervalos de confianza
Procedimiento
Por tanto, la distribución de la variable Z definida a continuación es aproximadamente 
una distribución normal estándar:
El procedimiento para encontrar el intervalo de confianza del 100(1-a)% para la proporción
q es el siguiente: 
El estimador puntual de la proporción poblacional q es la proporción muestral dada por
La variable aleatoria asociada es la normal dada por 
Para el cálculo del intervalo de confianza tenemos en cuenta la siguiente probabilidad:
Intervalos de confianza para una proporción θ
Intervalos de confianza
Procedimiento
Manipulado la expresión anterior obtenemos que:
Si en el cálculo de la varianza reemplazamos q por su estimativo 
obtenemos el intervalo de confianza que se presenta a continuación. 
Teorema. Si P es la proporción de observaciones que pertenecen a una clase de interés 
en una muestra aleatoria de tamaño n, entonces un intervalo de confianza aproximado 
de 100(1-a)% para la verdadera proporción q de la población que pertenece a esta clase 
es:
Intervalos de confianza para una proporción θ
Intervalos de confianza
Ejemplo. Un fabricante asegura a un potencial comprador que el porcentaje defectuoso 
de su proceso es máximo el 4%. Para comprobar la afirmación del productor, el cliente 
solicita que se le inspeccione una muestra de 300 artículos de los que hay en el inventario. 
Al verificar esta muestra se obtienen 18 artículos defectuosos. Podrá el cliente potencial 
dudar de la afirmación del proveedor?
Para verificar la afirmación del productor, construiremos un intervalo de confianza del 
95% para la verdadera fracción defectuosa, y la sospecha del cliente (de que la verdadera 
fracción defectuosa es mayor del 4%) estará apoyada si el respectivo intervalo de 
confianza se encuentra completamente a la derecha del valor afirmado de q.
Tenemos entonces la siguiente información:
p=18/300=0.06, n=300, Za/2=1.645
0.037 < q < 0.083
Como el valor de 0.04 se encuentra dentro del intervalo de confianza, entonces no 
tenemos razones o evidencias para sospechar de la afirmación del productor.
Intervalos de confianza para una proporción θ
Intervalos de confianza
Estimación del tamaño de la muestra n
Si queremos estimar el tamaño de muestra que se debe usar para tener una 
confiabilidad mínima del 100(1-a)% de que el error en la estimación del parámetro q no 
diferirá de su verdadero valor en una cantidad superior a d, tenemos entonces que:
Como el tamaño de la muestra es una función de varianza del estimador y por lo tanto del 
parámetro q, que es desconocido, y no teniendo ninguna información sobre su valor, 
entonces podemos usar el valor de q que hace máximo la varianza y que corresponde a 
1/2, por lo cual el tamaño de muestra estará dado por:
Intervalos de confianza para la diferencia de dos proporción θ1- θ2
Intervalos de confianza
Sea X1 el número de eventos de cierto tipo observado en una primera muestra de tamaño 
n1 tomada de una población binomial, y sea X2 el número de eventos observado en otra 
muestra de tamaño n2. Entonces X1 y X2 son variables aleatorias binomiales independientes 
con parámetros (n1, q1) y (n2, q2), tomadas de dos poblaciones grandes, y q1 y q2 son sus 
dos proporciones respectivas. Además, P1= X1/ n1 y P2= X2/ n2 son estimadores 
independientes de q1 y q2, respectivamente, y tienden a distribuirse normalmente. Si los 
tamaños de muestra son suficientemente grandes, la siguiente variable tiene una 
distribución que es aproximadamente normal estándar.
Para encontrar un intervalo de confianza para la diferencia de proporciones q1- q2, el 
estimador puntual estará dado por P1 - P2, la variable aleatoria asociada será la normal 
estándar, de acuerdo a lo explicado antes, y el intervalo de confianza estará dado por el 
siguiente teorema.
Teorema. Si P1 y P2 son las proporciones muestrales de dos muestras aleatorias 
independientes de tamaño n1 y n2 que pertenecen a una clase de interés, entonces un 
intervalo de confianza aproximado del 100(1-a)% para la diferencia de las proporciones 
verdaderas q1 - q2 es:
Intervalos de confianza para la diferencia de dos proporción θ1- θ2
Intervalos de confianza
Ejemplo
Considere un proceso de producción que tiene una fracción defectuosa q1, desconocida. A 
este proceso se le realizan unas mejoras para reducir el porcentaje de defectuosos que 
está produciendo, y queremos saber si estos cambios sí reducen sustancialmente la 
proporción de artículos defectuosos del proceso.
Para ello, se toma una muestra de 200 artículos del proceso original, y se encuentran 12 
defectuosos, y se examinan 150 artículos del nuevo proceso y se observan 6 defectuosos. 
Cree Usted que los cambios efectuados al proceso han reducido el porcentaje de artículos 
defectuosos?. Use un nivel de confianza del 95%.
Tenemos:
n1 = 200, x1 = 12  p1 = 12/200 = 0.06
n2 = 150, x2 = 6  p2 = 6/150 = 0.04 
El intervalo de confianza del 95% para la diferencia entre las fracciones defectuosas antes 
y después de las mejoras realizadas al proceso está dado por:
Como la diferencia de cero está incluida en el intervalo de confianza, concluimos que no 
tenemos evidencia para afirmar que los cambios efectuados al proceso contribuyen a 
reducir el porcentaje de artículos defectuosos.
Intervalos de confianza para la difrencia de dos proporción θ1- θ2
Intervalos de confianza
Ejercicio: Cuál hubiera sido la conclusión si las muestras y los resultados hubieran sido los 
siguientes (observe que las proporciones defectuosas muestrales son las mismas):
Tenemos:
n1 = 1000, x1 = 60 Þ p1 = 60/1000 = 0.06
n2 = 750, x2 = 30 Þ p2 = 30/750 = 0.04 
Ejercicio: Un artículo del New York Times en 1987 reportó que se puede reducir el riesgo de sufrir 
ataques al corazón ingiriendo aspirina.
Para llegar a esta conclusión el cronista se basó en los resultados de un experimento diseñado, en 
donde participaron dos grupos de personas. A un grupo de 11,034 personas se le suministró una 
dosis diaria de una pastilla que no contenía ninguna droga (un placebo), y de estos 189 sufrieron 
posteriormente ataques al corazón, mientras que al otro grupo de 11,037 se les suministró una 
aspirina, y sólo 104 lo sufrieron.
Considera Usted que el cronista del New York Times estaba en lo correcto?. Use un intervalo de 
confianza. Haga explícitas las suposiciones que considere necesarias. 
Intervalos de confianzapara la varianza de una distribución normal
Intervalos de confianza
Si X1, X2, Xn es una muestra aleatoria de tamaño n tomada de una población normal, y 
si S² es la varianza muestral, entonces S² es un estimador puntual razonable de la 
varianza poblacional s². Por otra parte, si la población es normal, la distribución muestral 
de la siguiente variable es una distribución ji-cuadrado con n-1 grados de libertad.
Por lo tanto, para obtener un intervalo de confianza del 100(1-a)% para la varianza s2 nos 
basamos en el estadístico S² y en la distribución chi cuadrado. Por lo tanto, tenemos la 
siguiente probabilidad:
Manipulando las expresiones tenemos que:
Intervalos de confianza para la varianza de una distribución normal
Intervalos de confianza
Teorema. Si S² es la varianza muestral de una muestra aleatoria de n observaciones 
tomadas de una distribución normal con varianza desconocida s², entonces el intervalo de 
confianza de 100(1-a)% para s² es:
Ejemplo. Un proceso produce cierta clase de cojinetes de bola cuyo diámetro interior es 
de 3 cm. Se seleccionan en forma aleatoria 12 de estos cojinetes y se miden sus 
diámetros interiores, y los valores resultantes son los siguientes: 3.01, 3.05, 2.99, 2.99, 
3.02, 3.00, 2.98, 2.99, 2.97, 2.97, 3.02 y 3.01. Suponiendo que el diámetro es una 
variable aleatoria normal, determine un intervalo de confianza para la varianza poblacional. 
Use un intervalo de confianza del 99%.
Solución
El intervalo de confianza estará dado por:
En el intervalo de confianza para la varianza, el punto medio del intervalo 
(0.001266) no coincide con el estimador puntual, debido a la no simetría de la 
distribución chi cuadrado.
Intervalos de confianza para la relación de varianzas de dos distribuciones normales
Intervalos de confianza
Se tienen dos poblaciones normales e independientes con varianzas desconocidas s²1 y 
s²2, respectivamente. De este par de poblaciones se tienen disponibles dos 
muestras .aleatorias de tamaños n1 y n2, respectivamente; sean S1² y S2² las varianzas 
muestrales respectivas. Para hallar el intervalo de confianza del 100(1-a)% para el 
cociente de dos varianzas sabemos que la siguiente relación tiene una distribución 
muestral F con n1-1 y n2-1 grados de libertad:
Entonces, para construir el intervalo de confianza para la relación de dos varianzas, nos 
basamos en la siguiente probabilidad:
Intervalos de confianza para la relación de varianzas de dos distribuciones normales
Intervalos de confianza
Si invertimos el término central de la desigualdad anterior, obtenemos lo siguiente:
Usando el hecho de que
obtenemos el siguiente intervalo de confianza para la relación de dos varianzas.
Intervalos de confianza para la relación de varianzas de dos distribuciones normales
Intervalos de confianza
Teorema. Si 
son las varianzas de muestras aleatorias independientes tomadas de poblaciones normales, 
entonces un intervalo de confianza 100(1-a)% para el cociente de dos varianzas está dado 
por:
Ejemplo. Considere de nuevo el problema del contenido de nicotina de dos marcas de 
cigarrillos.
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de 
poblaciones normales con varianzas desconocidas, construya un intervalo de confianza del 
98% para la relación de las dos varianzas de los contenidos de nicotina de las dos marcas 
de cigarrillos.
Intervalos de confianza para la relación de varianzas de dos distribuciones normales
Intervalos de confianza
Ejemplo:
Solución. 
Tenemos que: F0.01,9,7 = 6.72, F0.01,7,9 = 5.61
El intervalo de confianza del 99% par la relación de la varianza de la marca B (la mayor) a 
la varianza de la marca A está dado por:
Intervalos de confianza para observaciones pareadas
Intervalos de confianza
Cuando se comparan las medias de dos niveles es deseable que las observaciones dentro 
de cada nivel sean lo más homogéneas posibles. Si existe un efecto debido a factores 
externos éstos pueden neutralizarse mediante la aplicación del principio de la aleatoriedad. 
Esto se logra tomando las observaciones en pares. Se supone que las condiciones 
exteriores son las mismas para cada par, pero pueden variar de un par a otro.
Por ejemplo, suponga que se tiene un grupo de personas que se someten a una dieta 
para reducción de peso, y para cada persona se lleva el registro del peso, en kgs, antes 
de la dieta, y un tiempo razonable después de haber empezado la dieta. En este caso, el 
peso de cada persona después de la dieta no es independiente del peso de la misma 
persona antes de la dieta; por lo tanto estas dos variables están correlacionadas, y si 
se quiere examinar el efecto de la dieta, se debe llevar el registro del peso para la misma 
persona antes y después de la dieta.
Sean (X11, X21), (X12, X22),...(X1n,X2n) los datos consistentes de n pares; supondremos 
que las variables aleatorias X1 y X2 tienen
Podemos suponer que el conjunto de datos apareados son observaciones de un conjunto 
independiente de parejas de variables aleatorias provenientes de una distribución normal 
bivariada (X1 X2) ~f(X1, X2), y que las diferencias D = X1 - X2 se distribuyen normalmente 
con valor esperado mD y varianza 
medias µ1 y µ2, y varianzas
Intervalos de confianza para observaciones pareadas
Intervalos de confianza
Sea Dj la diferencia entre las variables aleatorias del j-ésimo par, es decir, Dj = X1j-X2j. El 
valor esperado y la varianza de la diferencia entre las variables está dado por:
Si las variables X1 y X2 se distribuyen normalmente, las diferencias estarán distribuidas 
también de manera normal con media µD y varianza 
Para estimar la media y la varianza de la diferencia, se debe tomar una muestra aleatoria 
de tamaño n, antes y después, calcular la diferencia, y luego la diferencia promedio y la 
varianza muestral de las diferencias, como se ilustra en el siguiente cuadro. 
Intervalos de confianza para observaciones pareadas
Intervalos de confianza
Dada la muestra aleatoria se calculan los siguientes estadísticos que servirán para estimar 
la media y la varianza de la diferencia
Sabemos que la siguiente variable aleatoria sigue una distribución normal estándar:
Sin embargo, como 
no es conocido, lo podemos estimar mediante la varianza muestral 
en cuyo caso la siguiente variable aleatoria sigue una distribución t con n-1 grados de 
libertad.
Intervalos de confianza para observaciones pareadas
Intervalos de confianza
Usando la distribución t podemos calcular el intervalo de confianza para la media de 
observaciones pareadas, el cual está dado por el siguiente teorema.
Teorema. Si 
son la media y la desviación estándar muestrales de la diferencia de n pares aleatorios de 
mediciones normalmente distribuidas, entonces un intervalo de confianza del 100(1-a)% 
para la diferencia de medias µD = µ1 -µ2 es:
Ejemplo.Se está investigando la utilidad de dos lenguajes de diseño para mejorar las 
tareas de programación. Se le ha pedido a 12 programadores expertos, familiarizados con 
los dos lenguajes, que codifiquen una función estándar con ambos lenguajes, y se registra 
el tiempo requerido, en minutos, para realizar estas dos tareas. Los datos obtenidos son:
Intervalos de confianza para observaciones pareadas
Intervalos de confianza
Ejemplo:
Encuentre un intervalo de confianza para la diferencia en los tiempos medios de 
codificación. Use un nivel de confianza del 95%. Existe alguna evidencia que indique una 
preferencia por alguno de los dos lenguajes?
Tenemos que:
El intervalo de confianza está dado por:
Dado que la diferencia puede ser cero, se concluye que no hay evidencia para rechazar la 
hipótesis de que ambos lenguajes requieren el mismo tiempo de programación, y por lo 
tanto no hay preferencia por ninguno de los dos lenguajes.
	Diapositiva 1
	Diapositiva 2
	Diapositiva 3
	Diapositiva 4
	Diapositiva 5
	Diapositiva 6
	Diapositiva 7
	Diapositiva 8
	Diapositiva 9
	Diapositiva 10
	Diapositiva 11
	Diapositiva 12
	Diapositiva 13
	Diapositiva14
	Diapositiva 15
	Diapositiva 16
	Diapositiva 17
	Diapositiva 18
	Diapositiva 19
	Diapositiva 20
	Diapositiva 21
	Diapositiva 22
	Diapositiva 23
	Diapositiva 24
	Diapositiva 25
	Diapositiva 26
	Diapositiva 27
	Diapositiva 28
	Diapositiva 29
	Diapositiva 30
	Diapositiva 31
	Diapositiva 32
	Diapositiva 33
	Diapositiva 34
	Diapositiva 35
	Diapositiva 36
	Diapositiva 37
	Diapositiva 38
	Diapositiva 39
	Diapositiva 40
	Diapositiva 41
	Diapositiva 42
	Diapositiva 43
	Diapositiva 44
	Diapositiva 45
	Diapositiva 46
	Diapositiva 47
	Diapositiva 48
	Diapositiva 49
	Diapositiva 50
	Diapositiva 51

Continuar navegando