Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Distribuciones de probabilidad 1 Distribuciones de probabilidad Conocer la distribución de probabilidades para la variable aleatoria proporciona al químico, médico y al investigador herramientas poderosas para simplificar y describir un conjunto de datos, y para llegar a conclusiones acerca de la población de datos sobre la base de una muestra de datos extraídos de la población. Variables aleatorias Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio. Es una distribución de probabilidad o distribución de frecuencias teórica que resume las variaciones en los datos observados. Esta variable aleatoria puede ser discreta o continua. Es discreta si sus valores surgen del proceso de conteo. Número de clientes, pacientes, electores, empleados, empresas, etc. Es continua si sus valores surgen del proceso de medición. Edad, peso, estatura, sueldo. 2 Para iniciar el estudio de las distribuciones de probabilidad, se considera en primer lugar la distribución de probabilidad de una variable discreta, ·la cual se define como sigue: 3 DISTRIBUCION BINOMIAL La distribución binomial es una de las distribuciones mas ampliamente utilizadas en estadística aplicada. La distribuci6n se deriva del procedimiento conocido como ensayo de Bernoulli, nombrado así en honor del matemático suizo James Bernoulli (1654-1705), quien realizó contribuciones importantes en el campo de la probabilidad, incluyendo, particularmente, la distribución binomial . Cuando en un experimento o proceso aleatorio, llamado ensayo, puede ocurrir solo uno de dos resultados mutuamente excluyentes, como vida o muerte, enfermo o sano, masculino o femenino, el ensayo se llama ensayo de Bernoulli. 4 5 Distribución de probabilidad del número posible de águilas que se obtienen al lanzar dos veces una moneda no alterada Núm. Águilas (A) lanzamientos P(A) 0 SS 0.25 1 AS y SA 0.50 2 AA 0.25 Total 1.00 Puede observarse en la tabla que si se lanza dos veces una moneda aparece: n+1 = 2+1 = 3 resultados diferentes y existen maneras diferentes de obtener dichos resultados 6 Fórmula de la distribución binomial Resultados diferentes al lanzar 2 monedas Frecuencia AA AS y SA SS 1 2 1 7 Utilizando el desarrollo del binomio al cuadrado podemos obtener las mismas probabilidades obtenidas en la tabla, antes vistas: donde p = q = ½ = 0.5 = 0.25 + 0,50 + 0.25 = 1 donde cada términos resulta la probabilidad de 2A 1A y 0A respectivamente 8 5A 4A 3A 2A 1A 0A AAAAA AAAAS AAASS AASSS ASSSS SSSSS AAASA AASSA SAASS SASSS AASAA ASSAA SSAAS SSASS ASAAA SSAAA SSSAA SSSAS SAAAA SASAA SSASA SSSSA SAASA SASSA SAAAS ASSSA ASAAS ASSAS AASAS ASASS ASASA SASAS 1/32 5/32 10/32 10/32 5/32 1/32 =1 Si se lanzan 5 veces una moneda por el método de enumeración aparece:: 9 Por el desarrollo del binomio a la quinta potencia tenemos Que sustituyendo los valores p=q= ½ podemos obtener las mismas probabilidades obtenidas en la tabla, antes vista. Asimismo cada término corresponde a las probabilidades de El coeficiente de cada término indica el número de combinaciones de =1 = 5 =10 etc. 5A 4A 3A 2A 1A 0A 10 Por ejemplo, vamos a aplicar la fórmula anterior para resolver 5 sobre 2: El número de combinaciones sin repetición de n elementos tomados de r en r también se llama número combinatorio y se calcula mediante la siguiente fórmula: 11 Si calculamos cada uno de los números combinatorios, el triángulo de Pascal nos queda de la siguiente manera: n=1 1 1 n=2 1 2 1 n=3 1 3 3 1 n=4 1 4 6 4 1 n=5 1 5 10 10 5 1 Estos son los mismo coeficientes, obtenidos por la fórmula de números combinatorios. 12 Si escogemos cualquier término del desarrollo del binomio se puede representar por la fórmula siguiente: Fórmula de la distribución binomial Misma que se ha deducido paso a paso y que tiene la ventaja de utilizarse cuando p=q=1/2 o cuando p ≠ q ≠ ½ Donde: p = probabilidad característica o probabilidad de tener éxito q = 1- p probabilidad de fracaso r = número de éxitos deseados n = número de intentos hechos Media = Varianza = 13 Datos: Fórmula: p=0.26 Sustituyendo: = 1,140x0.017576x0.00598 q=1-p= 0.74 n=20 r=3 Interpretación: Existe una probabilidad del de que una persona adulta seleccionada al azar tenga sobrepeso. 14 b) Tres o más personas. mismos datos. En este caso P(r≥3) = P(r=3) + P(r=4) + P(r=5) +… + P(r=20) De manera directa se requeriría obtener la suma de 18 términos, resultando muy laborioso. Se prefiere hacer el cálculo por complemento, de este modo P(r≥3) = 1 – P(r Entonces P(r≥3) = 1 – [P(r] P(r≥3) = 1 – + P(r≥3) = 1-[0.002425 + 0.0170 + 0.0569] 15 P(r≥3) = 1-[0.076325] P(r≥3) = 0.923675 = 0.9237 ó 92.37% Interpretación: Existe una probabilidad del 92.37% de que al elegir 3 o más personas adultas de EU tengan sobrepeso. c) Menos de 3. P(r<3) = 0.076325 = 0.0763 = 7.63% Interpretación: Existe una probabilidad del 7.63% de que menos de 3 personas adultas de EU tengan sobrepeso d) P(r)= P(r=3) +P(r=4) + …+P(r=7) = 0.1198 + 0.1790 + 0.2012 + 0.1768 + 0.1242 = 0.801 u 80.1% Interpretación: Existe una probabilidad del 80.1% de que entre 3 y 7 personas inclusive tengan sobrepeso. 16 DISTRIBUCION DE POISSON La siguiente distribución discreta a considerar es la distribuci6n de Poisson, Llamada así en honor del matemático francés Simeon Denis Poisson (1781-1840), quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837. Esta distribución ha sido empleada extensamente en biólogía y medicina como modelo de probabilidad. Haight (1), en el capitulo 7 de su libro, presenta un repertorio muy amplio de aplicaciones. Si x es el numero de ocurrencias de algún evento aleatorio en un intervalo de espacio o tiempo o algún volumen de materia), la probabilidad de que x ocurra es dada por 17 18 EJEMPLO 4.4.3 Durante eI estudio de cierto organismo acuático, se tomó un gran numero de muestras de una laguna, y se contó eI numero de organismos en cada muestra. EI numero promedio de organismos encontrados por muestra fue de dos. Suponga que el numero de organismos sigue una distribución de Poisson, y calcule la probabilidad de que la próxima muestra que se tome tenga un organismo o menos. 1.Datos Fórmula: λ=2 x≤1 19 Interpretación: Existe una probabilidad del 40.59% de que se encuentre uno o menos organismos 20 Interpretación: Existe una probabilidad del 18% de que se encuentren 3 organismo en la muestra 21 Ejemplo 1. Suponga que se investiga la seguridad de una peligrosa intersección. Los registros policiacos indican una media de cinco accidentes mensuales en esta intersección. El número de accidentes está distribuido de acuerdo con una distribución de Poisson, y el Departamento de Seguridad de Tránsito desea que calculemos la probabilidad de que en cualquier mes ocurran exactamente 0, 1, 2, 3 o 4 accidentes. Aplicando la fórmula: 22 Podemos calcular la probabilidad de que: a) no ocurran accidentes: b) ocurra exactamente un accidente: c) ocurran exactamente dos accidentes: Datos: λ = 5 Fórmula: Sustitución P(x=0) = = = 0.00674 23 d) Por último, la probabilidad de que ocurran exactamente cuatro accidentes: 0.1755 ó 17.55% P(0) = 0.00674 P(1) = 0.03370 P(2) = 0.08425 P(0≤x≤ 2)= P(0)+ P(1)+ P(2) = 0.12469 Los cálculos responderán a varias preguntas. Si deseamos conocer la probabilidad de tener entre 0 y 2 accidentes mensuales inclusive.Podemos averiguar esto sumando la probabilidad de tener exactamente 0, 1 y 2 accidentes, de la siguiente forma: Existe una probabilidad del 12.469 % de que aparezcan menos de 3 accidentes en esa esquina. Distribuciones de probabilidad continuas DEFINICION: A una función no negativa f(x) se Ie llama distribución de probabilidad (también llamada, algunas veces, función de densidad de probabilidad) para la variable aleatoria continua X, si el área total delimitada por su curva y el eje de las x es igual a 1 y si la subárea delimitada por la curva, el eje de las x, y por las líneas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b. 24 25 DISTRIBUCION NORMAL A continuación se estudia la distribución mas importante en toda la estadística: la distribución normal. La fórmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733. Muchos otros matemáticos destacan en la historia de la distribuci6n normal, incluyendo a Carl Friedrich Gauss (1777-1855). A esta distribución frecuentemente se le llama distribución de Gauss como reconocimiento a las contribuciones de este matemático. La densidad normal esta dada por 25 26 Características de la distribución normal Son las mas importantes para la distribución normal. 1. Es simétrica respecto a su media) Tal como se muestra en la figura 4.6.1, la curva hacia cualquiera de los lados de ~es una imagen de espejo de la del otro lado. 2. La media, la mediana y la moda son todas iguales. 3. EI área total bajo la curva sobre el eje de las x es una unidad de área. Esta característica se deduce del hecho de que la distribución normal es una distribución de probabilidad. Debido a la simetría mencionada anteriormente, 50 por ciento del área esta a la derecha de la perpendicular levantada sobre la media, y el otro 50 por ciento del lado izquierdo. 27 4. Si se levantan perpendiculares a una distancia de una desviación estándar hacia ambos lados de la media, bajo la curva será de 68 por ciento del área total, aproximadamente. A dos desviaciones estándar en ambos lados aproximadamente 95 por ciento del área, y a tres desviaciones estándar, aproximadamente 99.7 del área total estará englobada. Las áreas aludidas se muestran en la figura 4.6.2. 28 m m+1s m+2s m+3s m-1s m-2s m+3s Bajo la curva se tiene alrededor de: 1 σ. 68.26% 2 σ. 95.44% 3 σ. 99.97% 29 29 30 Distribución normal estándar La ultima característica mencionada de la distribución implica que la distribución normal es realmente una familia de distribuciones en la que un miembro se distingue de otro según los valores de µ y σ. EI miembro mas importante de esta familia es la distribución normal estándar o distribución normal unitaria, llamada así en ocasiones porque tiene una media igual a cero y una desviación estándar igual a 1. Esta distribución se puede obtener a partir de la ecuación 4.6.1, creando una variable aleatoria z = (x -µ)/. La ecuación para la distribuci6n normal estándar se escribe: 31 Entonces, en el caso de la normal estandar, para calcular directamente el area entre es necesario calcular la siguiente integral: Afortunadamente, no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse. La tabla D, del apendice, es un ejemplo de estas tablas 32 33 34 z 0 1 2 3 -1 -2 -3 x x+s x+2s x+s3 x-s x-2s x-3s X La desviación estándar sigma representa la distancia de la media al punto de inflexión de la curva normal La Distribución Normal Estándar 34 0.8 P(0 < z < 0.8) = 0.2881. 35 ) 1 ( ) ( ) ( 2 p np X V np X E X X - = = = = s m ,... 1 , 0 ! ) ( = = - x x e x P x l l 0337 . 0 ! 1 ) 1 ( 1 5 = = = - l e x P 08425 . 0 ! 2 ) 2 ( 2 5 = = = - l e x P z=x-m s
Compartir