Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
14/05/2022 1 cvilchezp DISTRIBUCIONES DE PROBABILIDAD Una distribución de frecuencia muestra las frecuencias de ocurrencia de las observaciones en un conjunto de datos. “Distribución de frecuencia empírica” “Distribución de probabilidad teórica” (determinado a partir de modelo matemático) Modelo teórico para calcular la probabilidad de ocurrencia de un evento. cvilchezp La distribución de probabilidad muestra cómo el conjunto de todos los posibles eventos mutuamente exclusivos está distribuido y pueden ser presentados como una ecuación, una gráfico o una tabla. Se puede considerar a distribución de probabilidad como el equivalente teórico de una distribución de frecuencia relativa empírica, con su propia media y varianza. Una variable, la cual puede tomar diferentes valores con probabilidades dadas, se denomina VARIABLE ALEATORIA (AL AZAR) Una distribución de probabilidad comprende todos los valores que la variable aleatoria puede tomar, con sus probabilidades asociadas. Existe diferentes distribuciones de probabilidad DISCRETA (Finito número de valores posibles) CONTINUA (Infinito número de valores posibles en un rango de valores) 14/05/2022 2 Tipos de Variables Cuantitativas Cualitativas Discretas: Solo toma valores enteros. Continuas: Pueden asumir cualquier valor real dentro de un cierto rango. Nominales: Valores son nombres o códigos sin relación intrínseco entre ellos Ordinales: Valores son nombres o códigos con relación intrínseco entre ellos cvilchezp CONSIDERACIONES IMPORTANTES Los parámetros importantes que describen una variable aleatoria: media (Esperanza, E) y la varianza. Esperanza ̴ Media E(y) = μy Var(y) = σ2y = E[(y – uy) 2] = E(y2) – uy 2 σ = Vσ2 14/05/2022 3 cvilchezp Reglas necesarias a tomar en cuenta cuando una constante es multiplicado o adicionado a una variable, o la suma, entre si, de dos variables: 1. La esperanza de una constante c es el valor de la misma constante: E(c) = c 2. La esperanza de la suma de una constante c a una variable y es la suma de la constante y la esperanza de la variable y: E(c + y) = c + E(y) 3. La esperanza del producto de una constante c y una variable y es igual al producto de la constante y la esperanza de la variable y: E(cy) = cE(y) 4. La esperanza de la suma de dos variables x y y es la suma de las esperanzas de las dos variables: E(x + y) = E(x) + E(y) cvilchezp 5. La varianza de una constante c es 0: Var(c) = 0 6. La varianza del producto de una constante c y una variable y es el producto de la constante al cuadrado multiplicado por la varianza de la variable y: Var(cy) = c2 Var(y) 7. La covarianza de dos variables x y y: Cov(x,y) = E[(x – ux) (y – uy)] = E(xy) – E(x)E(y) = E(xy) - uxuy La covarianza es la variabilidad simultanea de dos variables. 8. La varianza de la suma de dos variables es igual a la suma de las varianzas individuales más el doble de la covarianza: Var(x+y) = Var(x) + Var(y) + 2Cov(x,y) 14/05/2022 4 ZT3034 METODOS ESTADISTICOS APLICADOS A LA CIENCIA ANIMAL www.lamolina.edu.pe cvilchezp Carlos Vílchez Perales, Ph.D. Profesor Principal - Nutrición VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES cvilchezp DISTRIBUCIONES DE PROBABILIDAD DISCRETA Una distribución de probabilidad discreta liga o le asigna una probabilidad a cada posible evento mutuamente excluyente definido por una variable aleatoria discreta. Debe satisfacer: 1. p(xi) > 0; xi ϵ (Rx, Conjunto finito/infinito numerable). (0 < P(x) < 1) 2. Σ p(xi) = 1 (Xi ϵ Rx) Sea X una variable aleatoria discreta: p(xi) = (1/2, si xi = 2; 1/3, si xi = 3; 1/6, si xi = 6) … entonces, p es una correcta función de probabilidad discreta (puntual) en Rx = [2, 3, 6] porque sus valores NO son negativas y su suma es 1. 14/05/2022 5 Ejemplo: Experimento: Lanzar al aire dos monedas. C y S representa, Cara y Sello, respectivamente. Sea y una variable aleatoria definida como el número de caras en un lanzamiento de dos monedas. Los posibles resultados son: 0, 1 y 2. Cuál es la distribución de probabilidad de la variable y? Evento simple = Posible resultado 4 posibles resultados: CC, CS, SC, SS Presentado en una Tabla: Evento Simple Resultado y P(y) E1 CC 2 1/4 E2 CS 1 1/4 E3 SC 1 1/4 E4 SS 0 1/4 De la Tabla se puede observar que: La probabilidad que y = 2 es P(y=2) = P(E1) = ¼ La probabilidad que y = 1 es P(y=1) = P(E2) + P(E3) = ¼ + ¼ = ½ La probabilidad que y = 0 es P(y=0) = P(E4) = ¼ cvilchezp cvilchezp Entonces, la distribución de probabilidad de la variable y es: y P(y) 0 ¼ 1 ½ 2 ¼ Condiciones: 1.- 0 < P(y) < 1 2.- Σ (todo y) = P(y=0) + P(y=1) + P(y=2) = ¼ + ½ + ¼ = 1 14/05/2022 6 cvilchezp Una distribución probabilidad acumulada F(yi) describe la probabilidad que una variable y tiene valores menos que o igual a un valor yi F(yi) = P(y < yi) Para el ejemplo del lanzamiento al aire de dos monedas, cuál es la distribución acumulada??? y P(y) F(y) 0 ¼ ¼ 1 ½ ¾ 2 ¼ 4/4 … la probabilidad F(1) = ¾ denota la probabilidad que y (el número de caras) sea 0 o 1; es decir, que al lanzar dos monedas se tiene al menos un sello (o no se tiene dos caras) cvilchezp DISTRIBUCION BINOMIAL La distribución de probabilidad binomial describe la distribución de diferentes valores de la variable y {0, 1, 2, . . ., n} en un total de n experimentos (pruebas). Características de un experimento binomial: 1. El experimento consiste de n pruebas equivalentes, independientes entre ellos. 2. Existe solo dos resultados posibles de una prueba simple: SI (S) y NO (N), o de manera equivalente, 1 y 0. 3. La probabilidad de obtener S es la misma de prueba a prueba, representado por p. La probabilidad de N se representa por q, de tal manera que p + q = 1. 4. La variable aleatoria y es el número de éxitos en el total de n pruebas. 14/05/2022 7 cvilchezp La distribución de la probabilidad de una variable aleatoria y está determinado por el parámetro y el número de n pruebas: donde: p = es la p de éxito en una simple prueba. q = 1 – p = probabilidad de fracaso en una simple prueba. La Esperanza y la Varianza de una variable binomial: E(y) = np y Var(y) = σ2 = npq cvilchezp La forma de la distribución depende del parámetro p: • Es simétrica solamente cuando p = 0.5. • Es asimétrica en todos los otros casos. n = 8 ; p = 0.5 n = 8 ; p = 0.2 14/05/2022 8 cvilchezp Ejemplo: Determinar la distribución de probabilidad del número de terneras en tres partos consecutivos. Asumir que solo es posible una cría por parto (no mellizo) y que la probabilidad de sea hembra en un parto es p = 0.5 La variable aleatoria y está definida como el número de terneras en tres consecutivos partos. Los posibles resultados serían: ; 0, 1, 2, 3 (MMM, HMM, HHM, HHH) cvilchezp y p(y) 0 (0.5)0 (0.5)3 = 0.125 1 (0.5)1 (0.5)2 = 0.375 2 (0.5)2 (0.51 = 0.375 3 (0.5)3 (0.5)0 = 0.125 3 0 3 1 3 2 3 3 Los posibles valores con sus correspondientes probabilidades : La suma de las probabilidades de todos los posibles valores: Σi p(yi) = 0.125 + 0.375 + 0.375 + 0.125 = 1 Esperanza: u = E(y) = np = (3)(0.5) = 1.5 Varianza: σ2 = var(y) = npq = (3)(0.5)(0.5) = 0.75 0 0.1 0.2 0.3 0.4 0 1 2 3 P ro b ab ili d ad Número deTerneras 14/05/2022 9 cvilchezp La distribución Poisson se refiere a cierto procesos que pueden ser descritos con una variable aleatoria discreta. La letra λ suele representar esa variable y puede, además, asumir valores enteros x (0, 1, 2, 3, etc.). Formula: Donde: λ = representa la variable aleatoria. x = Valor específico (ocurrencias) DISTRIBUCION DE POISSON cvilchezp A menudo, en lugar del número esperado, se conocen las proporciones de éxitos la cual es un estimado de la probabilidad de éxitos en una prueba simple (p). Cuando el valor de p es muy pequeño y el número total de pruebas (n) es grande, la distribución de Poisson se aproxima a la distribuciónbinomial. Una característica de la variable Poisson es que tanto la esperanza como la varianza son iguales al parámetro λ. E(x) = μ = λ y Var(x) = σ2 = λ 14/05/2022 10 cvilchezp En general, la distribución de Poisson se deriva del denominado proceso de Poisson que se asocia al número de ocurrencias de un suceso A en una región continua, que puede ser un tiempo , una superficie o un volumen, cuando la ocurrencia de A en un punto de la región es independiente a la ocurrencia en otro punto. El proceso de Poisson presupone principalmente que: 1. El número de eventos que ocurren en regiones disjuntas son independientes. 2. La probabilidad que un evento ocurra dos o más veces en una región pequeña es virtualmente cero. 3. El parámetro de la distribución del número de eventos que ocurre en una región dada es proporcional al tamaño de la región. cvilchezp Ejemplo 1: Un Profesor-Tutor de la Facultad de Zootecnia atiende en promedio a cinco (5) estudiantes por semana. Cuál es la probabilidad de que en la semana siguiente atienda solamente a tres (3) estudiantes? 1. Media o promedio de atención por semana = λ = 5 estudiantes. 2. Número de éxitos que suceden = x = 3 estudiantes. p(x=3) = 53 * (2.7182)-5 3! p(x=3) = 125 * 1/(2.7182)5 3*2*1 p(x=3) = 0.1404 14.04 % 14/05/2022 11 cvilchezp Ejemplo 2: En una población de ratones de laboratorio 2% presentan cuadros de cáncer. En una muestra de 300 ratones de laboratorio, cuál es la probabilidad de que más de un (1) ratón tenga cáncer? 1. μ = λ = 300 (0.02) = 6 (Esperado, 2% de 300). 2. p( x > 1). p(x > 1) = 1 – [p(x =0) + p(x =1)] 60 * (2.7182)-6 0! 61* (2.7182)-6 1! p(x > 1) = _ _ 1 p(x > 1) = 1 - 0.00248 - 0.01488 = 0.9826 98.26% 14/05/2022 12 cvilchezp DISTRIBUCIONES DE PROBABILIDAD CONTINUAS Relación entre las distribuciones de probabilidad discretas y continuas La curva que define el área se denomina: cvilchezp Propiedades de una distribución de probabilidad continua: 1. Una distribución de probabilidad continua está definida por una función de densidad de probabilidad. 2. El área total bajo la función de densidad de probabilidad es 1 (unidad). 3. La probabilidad de que la variable aleatoria continua está entre ciertos límites es igual al área bajo la función de densidad de probabilidad entre estos límites. 14/05/2022 13 cvilchezp Cálculo de probabilidades a partir de la función de densidad de probabilidad Si la variable de interés es continua, la probabilidad que ese valor esté en un intervalo particular está dado por el área relevante bajo la curva de la función de densidad de probabilidad. Prob {x0 < x < x1} Prob {x < x0} Prob {x > x1} Area = proceso matemático = integración. Tablas Normal, T-Student, Chi-cuadrado, F. cvilchezp DISTRIBUCION NORMAL • La distribución Normal (N), o distribución Gaussiana, es la más importante de las distribuciones continuas debido a su rol en la teoría de muestreo. • Es una distribución teórica. • Las observaciones hechas sobre una determinada variable tienen una distribución de frecuencia empírica la cual es similar a una distribución N. • La propiedad, común con otras distribuciones continuas, de que el área bajo la curva que es definida por su función de densidad de probabilidad es la unidad (1). La distribución N tiene varias propiedades útiles. 14/05/2022 14 cvilchezp PROPIEDADES DE LA DISTRIBUCION NORMAL • La distribución N está descrito completamente por dos parámetros: Media (μ) y la desviación estándar (DE, σ). • Es unimodal. • Es simétrico en relación a su media. • La media, mediana y moda son todos iguales. • Si la DE se mantiene constante, un incremento en el valor de la media mueve la curva horizontalmente hacia la derecha. Una disminución en el valor de la media mueve la curva horizontalmente hacia la izquierda: cvilchezp • Una disminución en la DE hace que la curva se haga más delgada, alta y más aguda. Un incremento en la DE hace que la curva sea más ancha, pequeña y aplanada: • Los límites (μ – σ) y (μ + σ) contienen 68.3 % de la distribución. • Los límites (μ – 1.96σ) y (μ + 1.96σ) contienen 95 % de la distribución. Este hecho es a menudo usado en el cálculo de un rango de referencia (intervalo de referencia). 14/05/2022 15 cvilchezp • Los límites (μ – 2.586σ) y (μ + 2.58σ) contienen 99 % de la distribución cvilchezp Prob {x > x1} AREAS BAJO LA CURVA Y LA DISTRIBUCION NORMAL ESTANDAR (DNS) Calcular la probabilidad que un valor de la variable, x, sea mayor que x1. 1. Reconocer que la probabilidad que x tiene un valor mayor que x1 is igual al área bajo la curva de la distribución N a la derecha de x1. 2. Definir la media y la desviación estándar de la DN (propia): μ y σ. 14/05/2022 16 cvilchezp 3. Convertir esta distribución N en una distribución Normal estándar, la cual tiene una media de 0 y una desviación estándar de 1. Esta es la distribución de una nueva variable, z, llamada Desviación Normal Estandarizada (DNE). En términos generales: Para el caso del ejemplo, la DNE será: cvilchezp Ejemplo 1: Carrera de caballos de pura sangre: Distancia recorrida: 1 200 m. Tiempo promedio en recorrer esa distancia = μ = 75.2 segundos y con una desviación estándar = σ = 2.2 segundos. Determinar la probabilidad de que un caballo de carrera llegue a la meta en menos de 72 segundos?? El valor de z correspondiente a x1 = 72.0 es : z1 = (72.0 – 75.2) / (2.2) = - 1.45 DNE = Simétrica, 0 14/05/2022 17 cvilchezp - 1.45 DNE 1.45 De la Tabla de DNE: para z = 1.45, la probabilidad es 0.1471 (dos colas) Para el caso de ejercicio, solo interesa un lado (inferior) del área total: 0.50 * 0.1471 = 0.0736 Entonces, la probabilidad de que un caballo de carrera recorra 1 200 m en menos de 72 segundos es aproximadamente 7 % 14/05/2022 18 Ejemplo 2: Asumir una distribución N teórica de pesos de terneros de 6 m de edad definido con u = 200 kg y σ = 20 kg. Determinar la proporción teórica de terneros: a) Más de 230 kg. b) Menos de 230 kg. c) Menos de 210 kg y más de 170 kg. a) Proporción de terneros que pesan más de 230 kg. Determinar el valor de la variable normal estándar, z0, que corresponde al valor y0 = 230. z0 = 230 - 200 20 = 1.50 Esto indica que 230 es 1.5 DE por encima de la media 14/05/2022 19 La probabilidad de que y es mayor que y0 es igual a la probabilidad de que z sea mayor que z0 P(y > y0 ) = P(z > z0 ) = P(z > 1.50) = 0.0668 Respuesta: El porcentaje esperado de terneros que pesan más de 230 kg es 6.68% b) Proporción de terneros que pesan menos de 230 kg. Dado que el área total bajo la curva es igual a 1, entonces la probabilidad de que y tenga un valor menor que y0 = 230 kg es: P(y < y0 ) = P(z < z0 ) = 1 – P(z < 1.50) = 1 – 0.0668 = 0.9332 Respuesta: El porcentaje esperado de terneros que pesan menos de 230 kg es 93.32% c) Proporción de terneros que sus pesos estén entre 170 y 210 kg. y1 = 170 kg y2 = 210 kg z1 = 170 - 200 20 = - 1.50 z2 = 210 - 200 20 = 0.50 P(y1 < y < y2 ) = P(170 < y < 210) = P( z1 < z < z2 ) = (-1.5 < z < 0.5) 14/05/2022 20 Recordar que la curva es simétrica, lo que significa que: P(z < - z0 ) = P(z > z0 ) P(z < - 1.5) = P(z > 1.5) P( z > 1.5) = 0.0668 P(z > 0.5) = 0.3085 Entonces: P(170 < y < 210) = P(- 1.5 < z < 0.5) = 1 - [P(z > 1.5) + P(z > 0.5)] = 1 – (0.0668 + 0.3085) = 0.6247 Respuesta: El porcentaje esperado de terneros que pesan entre 170 y 210 kg es 62.47%
Compartir