Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Distribuciones de Probabilidad Para Variables Continuas Distribución de Probabilidad ■ Una distribución o densidad de probabilidad de una variable aleatoria x es la función de distribución de la probabilidad de dicha variable ■ Distribuciones probabilidad se identifican como discretas o continuas, de acuerdo al tipo de variable. ■ Existen infinitas distribuciones de probabilidad: una por cada población, pero hay ciertas distribuciones “modelo”: ◆ Binomial ◆ Hipergeométrica ◆ Multinomial ◆ Poisson ◆ Normal ◆ Chi-cuadrado ◆ t de Student, ◆ F de Fisher o Snedecor Variable Continua Variable Discreta Distribución Normal ■Importancia práctica de esta distribución teórica: ◆ Muchas variables distribuidas aproximadamente Normal, cuya distribución es la base de gran parte de la teoría estadística usada por diversas áreas de estudio. ◆ Distribución de promedios. ◆ Distribución de errores. Distribución Normal APLICACIONES •Paramétrica: • Teorema Central del Límite. • Inferencia por Test de Hipótesis e Intervalos de Confianza de Media, Proporciones, Comparación de Medias y Proporciones poblacionales. • Distribución Normal Estándar o Típica. • Distribuciones Muestrales de la Media, Proporción, diferencia de Media y diferencia de Proporciones Poblacionales. Distribución Chi-cuadrado ■ Una Variable con distribución Chi-cuadrado se define como la suma de n variables normales estandarizadas elevadas al cuadrado. Distribución Chi-cuadrado ■ Distribución Chi-cuadrado es una función de densidad de probabilidad que representa la distribución muestral de la varianza. ■ Definimos el estadístico Chi-cuadrado (χ2) como: Caracteristicas Chi-cuadrado ■ Asimétrica y asintótica al eje x por la derecha; ■ Valores entre de 0 a +∞ ■ Área bajo la curva desde 0 a +∞ =1 ■ Tiene parámetro δ = n-1 (g.d.l.) ■ Al aumentar n se aproxima a la normal ■ Representa distribución muestral de varianza. ■ Entre las aplicaciones: ◆ Determinación intervalos confianza para varianzas ◆ Pruebas de hipótesis para una varianza ◆ Tablas de contingencia ◆ El ajuste de datos a una distribución determinada ◆ Las pruebas de independencia. Tabla Distribución χ2 ■ Presenta algunos valores χ2 para varios δ, ■ Área a su derecha = α. ■ 1ª columna = δ ■ 1ª fila: áreas en la cola a la derecha de χ2 ■ Cuerpo tabla son los valores de χ2 Distribución Chi-cuadrado APLICACIONES •Paramétrica: • Inferencia por Test de Hipótesis e Intervalos de Confianza de Varianza poblacional. •No paramétrica: • Pruebas de Independencia. • Pruebas de Homogeneidad. • Bondad de Ajuste a probabilidades teóricas o a distribuciones de probabilidad. Distribución “t” de Student ■ Distribución muestral del promedio se ajusta muy bien a la distribución Normal cuando se conoce σ. Si n es grande, esto no presenta ningún problema, aun cuando σ sea desconocida, por lo que en este caso es razonable sustituirla por s. ■ Sin embargo, en el caso de usar valores de n < 30, o sea en el caso de pequeñas muestras, la utilización de la distribución Normal no arroja resultados esperados. Distribución “t” de Student ■ Definiendo el estadístico t: t = Z 1/ δ . (Z1 2 + Z2 2 + …..+ Zn 2) ■ Se puede probar que el estadístico t es el valor de una variable aleatoria con distribución "t" de Student y parámetro δ (grados de libertad) = n-1 ■ Una Variable con distribución t de Student se define como el cociente entre una variable con distribución normal estandarizada y la raíz cuadrada de una variable χ 2 dividida por sus grados de libertad. Características Distribución “t” ■ Tiene media igual 0, es asintótica al eje x y su dominio va de - ∞ a +∞; ■ El área bajo la curva desde -∞ a +∞ es igual a 1 ■ μ = 0, σ2 depende parámetro δ (grados libertad) ■ Varianza > 1, pero se aproxima a 1 cuando n⇒∞ ■ Al aumentar n, la distribución “t se aproxima a la Normal; n > 30 ó más, excelente aproximación ■ Entre las aplicaciones: ◆ Estimación de intervalos de confianza para medias a partir de muestras pequeñas… ◆ Pruebas de hipótesis basadas en muestras < 30. Tabla de Distribución “t” ■ Valores de tα a la derecha de los cuales se encuentra el (100 x α)% área de la curva. ■ Localizamos la columna del valor de α y fila del valor de δ. La intersección de la fila y la columna nos dará el valor de tα. Distribución “t” de Student APLICACIONES •Paramétrica: • Inferencia por Test de Hipótesis e Intervalos de Confianza de Media poblacional (con Varianza poblacional desconocida). • Comparación de dos Medias Poblacionales con Desvíos estándar iguales o desiguales. Otros casos. • Comparación de más de dos Medias Poblacionales, en un análisis de la Varianza (ANOVA). Distribución "F” de Snedecor o Fisher ■ Una Variable con distribución F de Fisher se define como la razón de dos variables con distribuciones Chi-cuadrado, con δ1 y δ2 respectivamente. Distribución "F” de Snedecor o Fisher ■ Representa la distribución muestral de la razón de dos varianzas. Es decir que se obtiene de la razón de dos distribuciones Chi-cuadrado. ■ Definimos el estadístico F como: ■ El cual es el valor de una variable aleatoria que tiene distribución F con parámetros δ1=n1-1 y δ2=n2-1. Propiedades de Distribución F ■ Asimétrica, y asintótica al eje x por el lado derecho ■ Su dominio va de 0 a +∞ ■ Área bajo curva desde 0 a +∞ =1 ■ Tiene parámetros δ1=n1-1 y δ2=n2-1. ■ Entre sus aplicaciones: ◆ Pruebas de hipótesis entre 2 varianzas ◆ Análisis de varianza ◆ Análisis de covarianza. Tabla de Distribución F ■ Tablas independientes de valores de F para α=0.01 y α=0.05 para varias combinaciones de δ1 y δ2. ■ Se escoge la tabla para la probabilidad deseada y se escoge δ1 en la fila superior y δ2 en la 1ª columna. La intersección nos da el valor de F deseado. Distribución "F” de Snedecor o Fisher APLICACIONES •Paramétrica: • Inferencia por Test de Hipótesis e Intervalos de Confianza de la diferencia de Varianzas poblacionales. • Comparación de más de dos Medias poblacionales en el Análisis de la Varianza (ANOVA). Ejercicios ■ Distribución t de Student a) Calcular la probabilidad de obtener un valor menor que 2,262 en una distribución t con 9 g.d.l. b) Calcular la probabilidad de obtener un valor menor que -1,328 en una distribución t con 19 g.d.l. Ejercicios ■ Distribución Chi cuadrado a) Calcular la probabilidad de obtener un valor mayor de 23,7 en una distribución χ2 con 14 g.d.l. b) Buscar el valor de χ2 después del cuál se encuentre el 5% del área en una distribución Chi-cuadrado con 4 g.d.l. Ejercicios ■ Distribución F de Snedecor a) Determine la probabilidad de tener un valor de F mayor que 9.28 en una distribución F con δ1=3 y δ2=3 g.d.l. b) Halle el valor crítico de F(0.05) para δ1=3 y δ2=15 g.d.l. Prueba de Hipótesis – Estimación de Varianza ■ El director de tránsito de una ciudad planea comprar lamparitas para el alumbrado público. Desea que las lámparas no solo tengan larga duración, sino también un alto grado de uniformidad. Según su experiencia considera que la varianza no debiera exceder de 250 hs2. Una prueba de 20 lámparas de cierta marca rinde una media de 1000 hs. de duración, que se considera satisfactoria, pero con una varianza de 300 hs2. ■ ¿Puede decirse que la varianza poblacional excede las 250 hs2. con un nivel de significación de 0,05? ■ El director de tránsito de una ciudad planea comprar lamparitas para el alumbrado público. Desea que las lámparas no solo tengan larga duración, sino también un alto grado de uniformidad. Según su experiencia considera que la varianza no debiera exceder de 250 hs2. Una prueba de 20 lámparas de cierta marca rinde una media de 1000 hs. de duración, que se considera satisfactoria, pero con una varianza de 300 hs2. ■ Contruir el Intervalo de Confianza bilateral con un 95% de confianza. Intervalo de Confianza – Estimación de Varianza Comparaciónde Variancias ■ Los tiempos de manejo medios en dos rutas nacionales son muy similares. El tiempo medio en la Ruta “A” es de 58,29 minutos y de 59,00 en la Ruta “B”. Pero se sospecha que hay diferencia respecto de la variación de estos tiempos. Por ello, se toma una muestra de 7 vehículos en la ruta A que arroja un desvío estándar de 8,9947; y una muestra de 8 vehículos en la ruta B arroja un desvío estándar de 4,3753. ■ Con α=0,10¿Se podrá concluir que existe diferencia en la variabilidad del tiempo de manejo entre los vehículos en la ruta A respecto de los de la ruta B? ■ Una industria produce desmalezadoras industriales. En la fábrica hay dos procedimientos distintos para montar el motor en la máquina. El primer procedimiento es tradicional y el segundo moderno industrial. Se realizan estudios de tiempos y movimientos, a través de una muestra de 5 unidades del primer procedimiento y de 6 unidades en el segundo. Las medias muestrales resultan 4 y 5 minutos y los desvíos estándar muestrales son respectivamente 2,9155 y 2,0976. ■ Determinar si existe diferencia entre el tiempo medio de demora de montaje de motor en las desmalezadores entre los dos procedimientos alternativos. Utilizar un nivel de significación de 0,10 Comparación de Medias (desvíos estandar iguales) SUPUESTOS DEL MODELO ■Las muestras son tomadas en forma independiente. ■Las dos poblaciones siguen una distribución Normal. ■Las dos poblaciones tienen desvíos estándar iguales. Estadístico t = X1 - X2 S2p (1/n1 + 1/n2) ■ Los empleados de un laboratorio de pruebas, evalúa la absorción de pañuelos de papel. Se está comparando un grupo de productos de una marca “T” con otro grupo de distinta calidad marca “Z”. Se realizan experimentos de absorción de pañuelos de ambas marcas. Los resultados obtenidos son: ■ Con un nivel de significación de 0,10, probar si existe diferencia entre las cantidades medias de absorción de los productos de las dos marcas. Pañuelos Muestra Media Desvío Estandar Marca T 9 6,44 3,32 Marca Z 12 9,417 1,621 Comparación de Medias (desvíos estandar distintos) ■ Nivel de significación = α = 0,10 Pañuelos Muestra Media Desvío Estandar Marca T 9 6,44 3,32 Marca Z 12 9,417 1,621 DATOS DEL MODELO Estadístico t = X1 - X2 S1 2/n1 + S2 2/n2)
Compartir