Logo Studenta

Unidad 2 - 3 y 4 - Distribuciones Continuas Z, Chi, t, F - Aplicaciones

¡Este material tiene más páginas!

Vista previa del material en texto

Distribuciones de 
Probabilidad
Para Variables Continuas
Distribución de Probabilidad
■ Una distribución o densidad de probabilidad de una 
variable aleatoria x es la función de distribución de la 
probabilidad de dicha variable
■ Distribuciones probabilidad se identifican como discretas 
o continuas, de acuerdo al tipo de variable.
■ Existen infinitas distribuciones de probabilidad: una por 
cada población, pero hay ciertas distribuciones “modelo”:
◆ Binomial
◆ Hipergeométrica
◆ Multinomial
◆ Poisson
◆ Normal
◆ Chi-cuadrado
◆ t de Student, 
◆ F de Fisher o Snedecor
Variable Continua
Variable Discreta
Distribución Normal
■Importancia práctica de esta distribución teórica:
◆ Muchas variables distribuidas aproximadamente 
Normal, cuya distribución es la base de gran parte de 
la teoría estadística usada por diversas áreas de 
estudio.
◆ Distribución de promedios.
◆ Distribución de errores.
Distribución Normal
APLICACIONES
•Paramétrica:
• Teorema Central del Límite.
• Inferencia por Test de Hipótesis e Intervalos de 
Confianza de Media, Proporciones, Comparación de 
Medias y Proporciones poblacionales.
• Distribución Normal Estándar o Típica.
• Distribuciones Muestrales de la Media, Proporción, 
diferencia de Media y diferencia de Proporciones 
Poblacionales.
Distribución Chi-cuadrado
■ Una Variable con distribución Chi-cuadrado se 
define como la suma de n variables normales 
estandarizadas elevadas al cuadrado.
Distribución Chi-cuadrado
■ Distribución Chi-cuadrado es una función de 
densidad de probabilidad que representa la 
distribución muestral de la varianza.
■ Definimos el estadístico Chi-cuadrado (χ2) como:
Caracteristicas Chi-cuadrado
■ Asimétrica y asintótica al eje x por la derecha;
■ Valores entre de 0 a +∞
■ Área bajo la curva desde 0 a +∞ =1
■ Tiene parámetro δ = n-1 (g.d.l.)
■ Al aumentar n se aproxima a la normal
■ Representa distribución muestral de varianza.
■ Entre las aplicaciones:
◆ Determinación intervalos confianza para varianzas
◆ Pruebas de hipótesis para una varianza
◆ Tablas de contingencia
◆ El ajuste de datos a una distribución determinada
◆ Las pruebas de independencia.
Tabla Distribución χ2
■ Presenta algunos valores 
χ2 para varios δ,
■ Área a su derecha = α.
■ 1ª columna = δ 
■ 1ª fila: áreas en la cola a 
la derecha de χ2 
■ Cuerpo tabla son los 
valores de χ2
Distribución Chi-cuadrado
APLICACIONES
•Paramétrica:
• Inferencia por Test de Hipótesis e Intervalos de 
Confianza de Varianza poblacional.
•No paramétrica:
• Pruebas de Independencia.
• Pruebas de Homogeneidad.
• Bondad de Ajuste a probabilidades teóricas o a 
distribuciones de probabilidad.
Distribución “t” de Student
■ Distribución muestral del promedio se ajusta muy bien a 
la distribución Normal cuando se conoce σ. Si n es 
grande, esto no presenta ningún problema, aun cuando σ 
sea desconocida, por lo que en este caso es razonable 
sustituirla por s. 
■ Sin embargo, en el caso de usar valores de n < 30, o sea 
en el caso de pequeñas muestras, la utilización de la 
distribución Normal no arroja resultados esperados.
Distribución “t” de Student
■ Definiendo el estadístico t:
t = Z
 1/ δ . (Z1
2 + Z2
2 + …..+ Zn
2)
■ Se puede probar que el estadístico t es el valor 
de una variable aleatoria con distribución "t" de 
Student y parámetro δ (grados de libertad) = n-1
■ Una Variable con distribución t de Student se 
define como el cociente entre una variable con 
distribución normal estandarizada y la raíz 
cuadrada de una variable χ 2 dividida por sus 
grados de libertad.
Características Distribución “t”
■ Tiene media igual 0, es asintótica al eje x y su 
dominio va de - ∞ a +∞;
■ El área bajo la curva desde -∞ a +∞ es igual a 1
■ μ = 0, σ2 depende parámetro δ (grados libertad)
■ Varianza > 1, pero se aproxima a 1 cuando n⇒∞
■ Al aumentar n, la distribución “t se aproxima a la 
Normal; n > 30 ó más, excelente aproximación
■ Entre las aplicaciones:
◆ Estimación de intervalos de confianza para medias a 
partir de muestras pequeñas…
◆ Pruebas de hipótesis basadas en muestras < 30.
Tabla de Distribución “t”
■ Valores de tα a la derecha de 
los cuales se encuentra el 
(100 x α)% área de la curva.
■ Localizamos la columna del 
valor de α y fila del valor de 
δ. La intersección de la fila y 
la columna nos dará el valor 
de tα.
Distribución “t” de Student
APLICACIONES
•Paramétrica:
• Inferencia por Test de Hipótesis e Intervalos de 
Confianza de Media poblacional (con Varianza 
poblacional desconocida).
• Comparación de dos Medias Poblacionales con 
Desvíos estándar iguales o desiguales. Otros casos.
• Comparación de más de dos Medias Poblacionales, 
en un análisis de la Varianza (ANOVA). 
Distribución "F” de Snedecor o Fisher
■ Una Variable con distribución F de Fisher se 
define como la razón de dos variables con 
distribuciones Chi-cuadrado, con δ1 y δ2 
respectivamente.
Distribución "F” de Snedecor o Fisher
■ Representa la distribución muestral de la razón 
de dos varianzas. Es decir que se obtiene de la 
razón de dos distribuciones Chi-cuadrado.
■ Definimos el estadístico F como:
■ El cual es el valor de una variable aleatoria que 
tiene distribución F con parámetros δ1=n1-1 y 
δ2=n2-1.
Propiedades de Distribución F
■ Asimétrica, y asintótica al eje x por el lado 
derecho
■ Su dominio va de 0 a +∞
■ Área bajo curva desde 0 a +∞ =1
■ Tiene parámetros δ1=n1-1 y δ2=n2-1.
■ Entre sus aplicaciones:
◆ Pruebas de hipótesis entre 2 varianzas
◆ Análisis de varianza
◆ Análisis de covarianza.
Tabla de Distribución F
■ Tablas independientes 
de valores de F para 
α=0.01 y α=0.05 para 
varias combinaciones de 
δ1 y δ2.
■ Se escoge la tabla para 
la probabilidad deseada 
y se escoge δ1 en la fila 
superior y δ2 en la 1ª 
columna. La intersección 
nos da el valor de F 
deseado.
Distribución "F” de Snedecor o Fisher
APLICACIONES
•Paramétrica:
• Inferencia por Test de Hipótesis e Intervalos de 
Confianza de la diferencia de Varianzas 
poblacionales.
• Comparación de más de dos Medias poblacionales en 
el Análisis de la Varianza (ANOVA).
Ejercicios
■ Distribución t de Student
a) Calcular la probabilidad de obtener un 
valor menor que 2,262 en una distribución 
t con 9 g.d.l.
b) Calcular la probabilidad de obtener un 
valor menor que -1,328 en una 
distribución t con 19 g.d.l.
Ejercicios
■ Distribución Chi cuadrado
a) Calcular la probabilidad de obtener un 
valor mayor de 23,7 en una distribución χ2 
con 14 g.d.l.
b) Buscar el valor de χ2 después del cuál se 
encuentre el 5% del área en una 
distribución Chi-cuadrado con 4 g.d.l.
Ejercicios
■ Distribución F de Snedecor
a) Determine la probabilidad de tener un 
valor de F mayor que 9.28 en una 
distribución F con δ1=3 y δ2=3 g.d.l.
b) Halle el valor crítico de F(0.05) para δ1=3 y 
δ2=15 g.d.l.
Prueba de Hipótesis – Estimación de Varianza
■ El director de tránsito de una ciudad planea 
comprar lamparitas para el alumbrado público. 
Desea que las lámparas no solo tengan larga 
duración, sino también un alto grado de 
uniformidad. Según su experiencia considera que la 
varianza no debiera exceder de 250 hs2. Una 
prueba de 20 lámparas de cierta marca rinde una 
media de 1000 hs. de duración, que se considera 
satisfactoria, pero con una varianza de 300 hs2.
■ ¿Puede decirse que la varianza poblacional excede 
las 250 hs2. con un nivel de significación de 0,05?
■ El director de tránsito de una ciudad planea 
comprar lamparitas para el alumbrado público. 
Desea que las lámparas no solo tengan larga 
duración, sino también un alto grado de 
uniformidad. Según su experiencia considera que la 
varianza no debiera exceder de 250 hs2. Una 
prueba de 20 lámparas de cierta marca rinde una 
media de 1000 hs. de duración, que se considera 
satisfactoria, pero con una varianza de 300 hs2.
■ Contruir el Intervalo de Confianza bilateral con un 
95% de confianza.
Intervalo de Confianza – Estimación de Varianza
Comparaciónde Variancias
■ Los tiempos de manejo medios en dos rutas 
nacionales son muy similares. El tiempo medio en 
la Ruta “A” es de 58,29 minutos y de 59,00 en la 
Ruta “B”. Pero se sospecha que hay diferencia 
respecto de la variación de estos tiempos. Por ello, 
se toma una muestra de 7 vehículos en la ruta A 
que arroja un desvío estándar de 8,9947; y una 
muestra de 8 vehículos en la ruta B arroja un desvío 
estándar de 4,3753.
■ Con α=0,10¿Se podrá concluir que existe diferencia 
en la variabilidad del tiempo de manejo entre los 
vehículos en la ruta A respecto de los de la ruta B?
■ Una industria produce desmalezadoras industriales. En la 
fábrica hay dos procedimientos distintos para montar el 
motor en la máquina. El primer procedimiento es 
tradicional y el segundo moderno industrial. Se realizan 
estudios de tiempos y movimientos, a través de una 
muestra de 5 unidades del primer procedimiento y de 6 
unidades en el segundo. Las medias muestrales resultan 
4 y 5 minutos y los desvíos estándar muestrales son 
respectivamente 2,9155 y 2,0976.
■ Determinar si existe diferencia entre el tiempo medio de 
demora de montaje de motor en las desmalezadores 
entre los dos procedimientos alternativos. Utilizar un nivel 
de significación de 0,10
Comparación de Medias 
(desvíos estandar iguales)
SUPUESTOS DEL MODELO
■Las muestras son tomadas en forma 
independiente.
■Las dos poblaciones siguen una distribución 
Normal.
■Las dos poblaciones tienen desvíos estándar 
iguales.
Estadístico
 t = X1 - X2
 S2p (1/n1 + 1/n2)
■ Los empleados de un laboratorio de pruebas, evalúa la 
absorción de pañuelos de papel. Se está comparando un 
grupo de productos de una marca “T” con otro grupo de 
distinta calidad marca “Z”. Se realizan experimentos de 
absorción de pañuelos de ambas marcas. Los resultados 
obtenidos son:
■ Con un nivel de significación de 0,10, probar si existe 
diferencia entre las cantidades medias de absorción de 
los productos de las dos marcas.
Pañuelos Muestra Media Desvío Estandar
Marca T 9 6,44 3,32
Marca Z 12 9,417 1,621
Comparación de Medias 
(desvíos estandar distintos)
■ Nivel de significación = α = 0,10
Pañuelos Muestra Media Desvío Estandar
Marca T 9 6,44 3,32
Marca Z 12 9,417 1,621
DATOS DEL MODELO
Estadístico
 t = X1 - X2
 S1
2/n1 + S2
2/n2)

Continuar navegando