Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
4.4. VARIABLES ALEATORIAS UNIDIMENSIONALES CONTENIDO 4.3 ALGUNAS DISTRIBUCIONES IMPORTANTES DE PROBABILIDAD... 75 4.3.1 DISTRIBUCION BINOMIAL................................................. 75 4.3.2 DISTRIBUCION HIPERGEOMETRICA............................. 81 4.3.3 DISTRIBUCION DE POISSON............................................... 83 4.3.4 DISTRIBUCIÓN UNIFORME................................................ 88 4.3.5 DISTRIBUCIÓN NORMAL.................................................... 90 4.3.6 DISTRIBUCIÓN EXPONENCIAL......................................... 98 4.3.7. EJERCICIOS RESUELTOS................................................. 101 4.4 FUNCION DE VARIABLE ALEATORIA................................................... 104 4.5 EJERCICIOS PROPUESTOS....................................................................... 106 G.Carnevali-E.Franchelli-G.Gervasoni VARIABLES ALEATORIAS UNIDIMENSIONALES SEGUNDA PARTE 4.3 ALGUNAS DISTRIBUCIONES IMPORTANTES DE PROBABILIDAD Seguidamente se presentan las distribuciones de probabilidad de tres variables aleatorias discretas: 4.3.1 DISTRIBUCION BINOMIAL Se han estudiado numerosas distribuciones de probabilidad que “modelizan” características asociadas a fenómenos que se presentan frecuentemente en la realidad. Una distribución de probabilidad de variable aleatoria discreta que se usa frecuentemente es la distribución binomial. A partir de una experiencia en la que ocurre uno de dos resultados posibles: A o A (llamada experiencia de Bernoulli) y ante n repeticiones independientes de la misma, se define la variable binomial X : nº de veces que ocurre el resultado A en las n repeticiones. • HIPOTESIS DE LA DISTRIBUCION BINOMIAL 1.- Existen n repeticiones idénticas que conducen a uno de dos resultados: éxito o fracaso (A y A ). 2.- La probabilidad de cada resultado permanece constante de repetición en repetición. La probabilidad de uno de estos resultados, llamado éxito, se designa por p (p= P(A)). 3.- Las repeticiones son independientes. Un ejemplo de un experimento binomial es el de lanzar una moneda al aire varias veces. Sólo hay dos resultados posibles en cada tirada (o repetición de la experiencia) de la moneda: cara o cruz. La probabilidad de obtener cara o cruz se mantiene constante de tirada en tirada (0,5 para cada una) y las tiradas son independientes entre sí. Ejemplo Suponga que 0,2 es la probabilidad de que una persona, que se conecta a un sitio específico en un centro comercial en la red www, compre un artículo. Si el sitio tiene en un momento determinado tres personas que se han conectado, ¿cuál es la probabilidad de que exactamente dos personas compren un artículo?. Este es un ejemplo que se puede modalizar por binomial, ya que: sólo hay dos resultados posibles ante cada conexión a la red de una persona: compra (C) o no compra ( C ). La probabilidad de comprar o no comprar se mantiene estable, con una probabilidad histórica de ocurrencia de 0,2 y 0,8 respectivamente. Las conexiones se consideran independientes entre sí. G.Carnevali-E.Franchelli-G.Gervasoni 75 VARIABLES ALEATORIAS UNIDIMENSIONALES Un método gráfico útil para visualizar esta situación es el diagrama de árbol que aparece en la siguiente figura: FIGURA 4.2 Cada rama en la figura 4.2 representa la conexión de una persona (recuerde que se consideran tres). La regla de la multiplicación se usa para calcular la probabilidad de cada manera independiente en la que pueden ocurrir dos compras. Observe que cada manera tiene la misma probabilidad (0,032). La regla de la suma se usa después para calcular la probabilidad final de que dos personas de tres que se conectaron al sitio realicen una compra (0,096). Así la probabilidad final es: 3 . (0,2 . 0,2 . 0,8) = 0,096 La primera parte de este cálculo indica el número de maneras ( 3 ) en las que puede ocurrir el resultado deseado ( dos personas compran un artículo) . El segundo cálculo ( 0,2 . 0,2 . 0,8 ) indica la probabilidad de lograr este resultado usando una de las trayectorias posibles en el diagrama. El resultado final (0,096) es la probabilidad de que al conectarse tres personas al sitio, dos compren un artículo. Este cálculo requiere la fórmula binomial: En general, siendo X : nº de veces que ocurre el resultado A en las n repeticiones. ( ) ( ) xnx ppxXP x n −− == 1 G.Carnevali-E.Franchelli-G.Gervasoni 76 C 0,2 C 0,2 C 0,2 C 0,2 C 0,2 C 0,2 C 0,2 8,0C 8,0C 8,0C 8,0C 8,0C 8,0C 8,0C 0,032 0,032 0,032 8,0C 8,0C VARIABLES ALEATORIAS UNIDIMENSIONALES Distribución de probabilidad de una variable discreta X binomial donde P ( X = x ) = probabilidad de x éxitos en n repeticiones n = número de repeticiones x n = número de maneras de obtener exactamente x éxitos en n repetic. p = probabilidad de éxito en cualquier repetición ( 1 - p ) = probabilidad de fracaso en cualquier repetición Para llegar a la fórmula binomial planteada se considera la variable X: nº de éxitos en n repeticiones de una experiencia ( ε ) y el resultado X = k. Tal resultado aparecería, por ejemplo, si A ocurre en las primeras k repeticiones de ε , mientras que en las últimas n-k repeticiones resultase A , es decir: knK AAAAAAAA − Como todas las repeticiones son independientes, la probabilidad de esta sucesión particular sería: p k (1-p) n-k Pero exactamente la misma probabilidad estaría asociada con cualquier otro resultado para el cual X = k. El número total de tales resultados es igual a k n ya que hay k n ordenamientos distintos de los k A y de los (n-k) A , siendo resultados mutuamente excluyentes. Por lo tanto: ( ) ( ) knppkkXP kn −− == 1 En el ejemplo de la conexión en la red al sitio de un centro comercial, la probabilidad buscada se podría haber calculado de la siguiente forma : Se define la variable X: número de personas que compran entre tres que se conectan. X ∼ Bi ( 3 ; 0,2 ) lo que se lee : la variable aleatoria X se distribuye ( ∼ ) según una distribución binomial ( Bi ) de parámetros 3 ( n ) y 0,2 ( p ) . G.Carnevali-E.Franchelli-G.Gervasoni 77 VARIABLES ALEATORIAS UNIDIMENSIONALES Entonces: ( ) ( ) 096,02,012,02X 232 2 3P =−−= = • PARAMETROS ESTADISTICOS Se demuestra que: ( ) ( ) pnppkXE knk n k k n =− = − = ∑ 1 0 ( ) ( ) ( )[ ] ( )ppnXEXEXV −=−= 1..22 • CALCULO DE PROBABILIDADES BINOMIALES Se pueden calcular por tablas específicas (ver apéndice 2, tabla 2.1), con calculadoras, con algunas planillas de cálculos o con softwares estadísticos. Ejemplo: Una firma comercial posee un gran número de cuentas por cobrar y se conoce que el 10% de estas cuentas están vencidas. Si se escogen aleatoriamente 5 cuentas, calcule la probabilidad de que: a ) exactamente dos cuentas estén vencidas b ) a lo sumo dos cuentas estén vencidas c ) por lo menos una cuenta esté vencida d ) por lo menos una cuenta no esté vencida e ) entre 2 y 4 cuentas estén vencidas • Por tabla De la tabla de probabilidades acumuladas se puede obtener la probabilidad puntual por diferencia de probabilidades acumuladas. Así: X : número de cuentas vencidas en un total de 5 X ∼ Bi ( n , p ) = Bi ( 5 ; 0,10 ) a) P ( X = 2 ) = P ( X ≤ 2 ) - P ( X ≤ 1 ) = F ( 2 ) - F ( 1 ) = 0,991 - 0,918 = 0,073 b) P ( X ≤ 2 ) = F ( 2 ) = 0,991 c) P ( X ≥ 1 ) = 1 - P ( X = 0 ) = 1 - F ( 0 ) = 1 - 0,591 = 0,409 G.Carnevali-E.Franchelli-G.Gervasoni 78 VARIABLES ALEATORIAS UNIDIMENSIONALES d) Calcular la probabilidad de que entre 5 cuentas elegidas al azar, por lo menos una cuenta no esté vencida , es equivalentea calcular la probabilidad de que a lo sumo cuatro estén vencidas, en el ejemplo : P ( X ≤ 4 ) = 1 e) P ( 2 ≤ X ≤ 4 ) = F ( 4 ) - F ( 1 ) = 1 - 0,918 = 0,082 Utilizando EXCEL en Funciones estadísticas el cálculo de las probabilidades binomiales se presenta de la siguiente forma (se consideran los puntos b y a del ejemplo anterior): ASISTENTE PARA FUNCIONES Dist. Binomial VALOR 0,99144 número éxito f (x) 2 ensayos f (x) 5 prob. éxito f (x) 0.10 acumulado f (x) VERDADERO ASISTENTE PARA FUNCIONES Dist. Binomial VALOR 0,0729 número éxito f (x) 2 ensayos f (x) 5 prob. éxito f (x) 0.10 acumulado f (x) FALSO G.Carnevali-E.Franchelli-G.Gervasoni 79 Población Finita Infinita Muestreo con reposición Muestreo sin reposición Tamaño de la muestra inferior al 10% del tamaño de la población ( n/N < 0,1 ) VARIABLES ALEATORIAS UNIDIMENSIONALES Como se puede observar, si se escribe verdadero calcula la probabilidad acumulada, al poner falso calcula la probabilidad puntual. • La distribución binomial es válida si : Ejercicios 1.- Se conoce que el 20% de las cuentas de un Banco tienen saldos superiores a $2.000. Suponga que se eligen 10 cuentas al azar de las muchas cuentas que tiene el Banco. Calcule la probabilidad de que: a ) dos cuentas tengan saldos superiores a $2.000 b ) a lo sumo dos cuentas tengan saldos superiores a $2.000 c ) por lo menos dos cuentas tengan saldos superiores a $2.000 d ) a lo sumo dos cuentas tengan saldos inferiores a $2.000 G.Carnevali-E.Franchelli-G.Gervasoni 80 VARIABLES ALEATORIAS UNIDIMENSIONALES 4.3.2 DISTRIBUCION HIPERGEOMETRICA La distribución binomial no se usa en situaciones en las que la población es finita, el muestreo se realiza sin reposición y el tamaño de la muestra es superior al 10% del tamaño de la población. En estos casos la distribución que se aplica es la distribución hipergeométrica. Sea X: nº de éxitos en n repeticiones. X ∼ Hip.( N , r , n ) ( ) nN xnrNxr C CC xXP , ,, −−== donde: N = tamaño de la población n = tamaño de la muestra r = número de éxitos en la población x = número de éxitos en una muestra para los cuales se calcula la probabilidad C = combinaciones Nota: C N , n es una forma de indicar las combinaciones de N elementos de los cuales se seleccionan n de los mismos. Ejemplo En una reunión hay ocho personas de las cuales 4 son miembros de un sindicato. Se seleccionan al azar tres personas para formar un comité. ¿Cuál es la probabilidad de que exactamente una de ellas sea miembro de un sindicato? Como la población es pequeña y la muestra debe hacerse sin reemplazo, no resulta apropiada la distribución binomial de allí que se usa la distribución hipergeométrica con los siguientes parámetros: N = 8 , n = 3 , r = 4 , x = 1 ; es decir X ∼ Hip. ( 8,4,3 ) X : nº de personas miembros del sindicato en una muestra de 3. y la probabilidad pedida será: C 4,1 C 4,2 P ( X = 1 ) = = 0,429 C 8,3 G.Carnevali-E.Franchelli-G.Gervasoni 81 VARIABLES ALEATORIAS UNIDIMENSIONALES • PARAMETROS ESTADISTICOS Se demuestra que: E ( X ) = n . p siendo N r p = 1 - N n - N ) p - 1 ( . p .n ) X ( V = • CALCULO DE PROBABILIDADES HIPERGEOMETRICAS Utilizando EXCEL en Funciones estadísticas el cálculo de las probabilidades hipergeométricas se presenta de la siguiente forma : ASISTENTE PARA FUNCIONES Dist. Hipergeométrica VALOR 0.42851429 número éxito f (x) 1 muestra f (x) 3 prob. éxito f (x) 4 población f (x) 8 Ejercicios 1.- La seccional A de un determinado sindicato tiene 25 miembros. Quince están a favor de la huelga y 10 no. Se eligen al azar 6 trabajadores. Calcule la probabilidad de que 2 estén a favor de la huelga. 2.-¿Cuál es la probabilidad de que una auditoría bancaria detecte solamente 2 cuentas especiales con irregularidades, si se seleccionan al azar 6 de las 18 cuentas existentes, 8 de las cuales tienen irregularidades ? G.Carnevali-E.Franchelli-G.Gervasoni 82 VARIABLES ALEATORIAS UNIDIMENSIONALES 4.3.3 DISTRIBUCION DE POISSON La distribución de Poisson se usa para modelizar situaciones en las que hay ocurrencias aleatorias de sucesos por unidad de espacio o tiempo y en donde se desea conocer la probabilidad de un número específico de éxitos. Numerosos fenómenos discretos se representan mediante un proceso de Poisson. Se dice que existe un Proceso de Poisson si al considerar un experimento en el que se observa la aparición de sucesos puntuales en un intervalo contínuo (de tiempo, longitud, área, etc.), en cualquier intervalo suficientemente pequeño del intervalo continuo, se verifica que: 1.- La probabilidad de observar exactamente un éxito en el intervalo es estable 2.- La probabilidad de observar exactamente más de un éxito en el intervalo dado, es 0 3.- La ocurrencia de un éxito en cualquier intervalo es estadísticamente independiente de aquella en cualquier otro intervalo. Se define X : número de éxitos en un intervalo. La fórmula para la distribución de Poisson es: ( ) !x exXP x λ−λ== X ∼ Po ( λ ) Distribución de probabilidad de una variable discreta X de Poisson donde λ es el número promedio de ocurrencias por unidad de tiempo o espacio. x es el número de ocurrencias cuya probabilidad se desea conocer e base de los logaritmos naturales La fórmula de la distribución de Poisson muestra que la misma describe una variable aleatoria discreta que puede tomar cualquier valor de una sucesión infinita (x = 0, 1, 2, …… …) • PARAMETROS ESTADISTICOS Puede demostrarse que: ( ) λ !k λ.ekXE 0k kλ == ∑ ∞ = − ( ) ( ) ( )[ ] λXEXEXV 22 =−= G.Carnevali-E.Franchelli-G.Gervasoni 83 VARIABLES ALEATORIAS UNIDIMENSIONALES EJEMPLO Para comprender mejor el proceso de Poisson, supóngase que se analiza la variable número de clientes que llegan a un banco entre las 12 y 13 hs. Cualquier llegada de un cliente es un evento discreto en un punto particular sobre el intervalo continuo de 1 hora. Durante tal intervalo de tiempo puede haber un promedio de 180 llegadas. Para responder cuál es la probabilidad de que en un minuto lleguen exactamente dos clientes, es necesario conocer el número promedio de clientes en un minuto. Si el número promedio de llegadas en una hora es 180, en un minuto será igual a 3 (180 : 60), luego: ( ) 224,0 !2 32 32 === −eXP siendo X = nº de personas que llegan al banco en 1’ Si hubiéramos estado interesados en el nº de personas que llegan al banco en un intervalo de 4’, se debe considerar un promedio de llegadas igual a 4. λ = 4 . 3 = 12. En general, se escribe: Xt : número de éxitos en un intervalo t Xt ∼ Po (λt ) ( ) ( ) !x etxXP tx t λ−λ== En el ejemplo X t = nº de personas que llegan al banco en t’ Xt ∼ Po (3t ) X4 ∼ Po (12 ) • CALCULO DE LAS PROBABILIDADES DE POISSON Lo mismo que lo visto para la distribución binomial, para calcular las probabilidades de Poisson se dispone de tablas estadísticas tabuladas para distintos valores de λ (ver apéndice 2, tablas 2.2 y 2.3), de softwares estadísticos y planillas de cálculos. Ejemplo Una compañía telefónica observa que entranen promedio 3,2 llamadas por minuto en una línea determinada. Suponiendo que el número de llamadas se distribuye según un modelo de Poisson, se puede plantear el cálculo de las siguientes probabilidades para el intervalo de un minuto: a ) probabilidad de que entren exactamente 2 llamadas b ) probabilidad de que entren a lo sumo tres llamadas G.Carnevali-E.Franchelli-G.Gervasoni 84 VARIABLES ALEATORIAS UNIDIMENSIONALES c ) probabilidad de que entren por lo menos tres llamadas d ) probabilidad de que entren entre 2 y 7 llamadas ( incluidos estos valores ) a) Usando la tabla de probabilidades acumuladas (tabla 2.3 del apéndice 2), la probabilidad puntual se puede obtener por diferencia de probabilidades acumuladas. Así: P ( X = 2 ) = P ( X ≤ 2 ) - P ( X ≤ 1 ) = 0,38 - 0,171 = 0,209 b) P ( X ≤ 3 ) = 0,603 c) P ( X ≥ 3 ) = 1 - P ( X ≤ 2 ) = 1 - 0,38 = 0,62 d) P ( 2 ≤ X ≤ 7 ) = P ( X ≤ 7 ) - P ( X ≤ 1 ) = 0,983 - 0,171 = 0,812 Utilizando EXCEL en Funciones estadísticas el cálculo de las probabilidades de Poisson se presenta de la siguiente forma: ASISTENTE PARA FUNCIONES POISSON VALOR 0.379903741 x f (x) 2 media f (x) 3,2 acumulado f (x) VERDADERO ASISTENTE PARA FUNCIONES POISSON VALOR 0,208702484 x f (x) 2 media f (x) 3,2 acumulado f (x) FALSO Como se puede observar si se escribe verdadero calcula la probabilidad acumulada, al poner falso calcula la probabilidad puntual G.Carnevali-E.Franchelli-G.Gervasoni 85 VARIABLES ALEATORIAS UNIDIMENSIONALES Ejercicios 1.- A un muelle de carga llegan camiones en forma aleatoria con un promedio de 1 por hora. ¿cuál es la probabilidad de que en una hora no llegue ningún camión al muelle? 2.- Una casa de créditos recibe en promedio 2,2 solicitudes de préstamos para mejoramiento de la vivienda por semana. Calcule la probabilidad de que en una semana: a) lleguen tres solicitudes de crédito b) llegue por lo menos una solicitud c) lleguen entre 2 y 5 solicitudes (incluidos estos valores) d) lleguen a lo sumo tres solicitudes 3.- La llegada de vehículos a un puesto de peaje sigue un proceso de Poisson con promedio 4 llegadas por minuto. Calcule la probabilidad de que en dos minutos lleguen por lo menos tres vehículos al puesto de peaje. 4.- El número de averías semanales de una computadora es una variable aleatoria que tiene distribución de Poisson con promedio λ = 0,4. ¿Cuál es la probabilidad de que la computadora trabaje sin averías durante dos semanas consecutivas? • APROXIMACION DE POISSON A LA BINOMIAL En problemas de distribución binomial donde n es grande y la probabilidad de éxito p es muy pequeña (o muy grande), se puede demostrar que la distribución binomial se acerca a una distribución de Poisson. Como regla empírica, el uso de la distribución de Poisson es apropiado cuando n > 20 y np ≤ 5 o n.(1 - p) ≤ 5. (En el apéndice 2 se muestra el gráfico de aproximaciones a la binomial). Es decir, si X es una variable distribuida binomialmente con parámetro p (con base en n repeticiones independientes del experimento). Esto es: ( ) ( ) knppkkXP kn −− == 1 y n → ∞ , np = λ (constante) , o equivalente: cuando n → ∞ , p → 0 tal que np → λ ; bajo estas condiciones se tiene : ( ) !k e kXPlim k n λλ− ∞→ == la distribución de Poisson con parámetro λ. EJEMPLO Un 1% de los empleados de una fábrica se ausentan diariamente del trabajo. Si se eligen 70 empleados al azar, ¿cuál es la probabilidad de que sólo 1 esté ausente? X = nº de empleados ausentes en un total de 70 X ∼ Bi (70 ; 0,01) P ( X = 1 ) = 0,35 G.Carnevali-E.Franchelli-G.Gervasoni 86 VARIABLES ALEATORIAS UNIDIMENSIONALES Como n es grande y p chico se puede utilizar la aproximación de Poisson de la siguiente forma: λ = np = 70 . 0,01 = 0,7 y usando la tabla de Poisson, la probabilidad pedida es 0,347 G.Carnevali-E.Franchelli-G.Gervasoni 87 VARIABLES ALEATORIAS UNIDIMENSIONALES A continuación se verán algunas de las distribuciones de variable aleatoria continua de mayor aplicación: 4.3.4 DISTRIBUCIÓN UNIFORME La distribución uniforme describe una variable aleatoria que tiene igual probabilidad de ocurrir en subintervalos de igual tamaño, dentro del campo de definición de la misma. La siguiente figura muestra una distribución uniforme. El intervalo en el que está definida la variable aleatoria es (a, b). La “curva” de probabilidad tiene una altura uniforme en todos los puntos entre a y b. f (x) a c d b X El área del rectángulo es igual a 1, de allí: La probabilidad de que la variable caiga entre cualesquiera dos puntos c y d (véase la figura) es igual a: ( ) ab cddx ab dXcP d c − −= − =≤≤ ∫ 1 • PARAMETROS ESTADISTICOS Se demuestra que: ( ) 2 )( badxxfxXE b a +== ∫ ( ) [ ] ( ) 12 2 22 )()(2 abXEXEX −=−=σ G.Carnevali-E.Franchelli-G.Gervasoni 88 [ ] casootroen xf baxsi ab 0 )( ,1 = ∈ − ab 1 − VARIABLES ALEATORIAS UNIDIMENSIONALES • CALCULO DE PROBABILIDADES UNIFORMES Ejemplo : Se sabe que en una empresa, los años de experiencia de los trabajadores de planta tienen una distribución uniforme con un mínimo de 0 y un máximo de 12,5 años. Se elige un empleado al azar. Determine la probabilidad de que esta persona tenga entre 2,5 y 7,5 años de experiencia en la compañía. La variable aleatoria uniforme se presenta escribiendo: X : años de experiencia de un trabajador X ∼ U ( 0 ; 12,5 ) ⇒ ( ) 5.12 1=xf 7,52,5 0 0,08 0 12,5 años de experiencia 0,4 5,12 5 05,12 5,25,7 dx 12,5 1 ) 7,5 X 2,5 ( 7,5 5,2 P == − − =∫<< = Hay un 40 % de probabilidad de que un empleado de la compañía elegido al azar tenga entre 2.5 y 7.5 años de experiencia. El promedio y la desviación estándar son: ( ) añosxE 25,6 2 5,120 = += ( ) ( ) añosx 61,3 12 205,12 = − =σ La distribución de los años de experiencia en una empresa para los trabajadores de planta tiene un promedio de 6,25 años y una desviación estándar de 3,61 años Ejercicios 1. El tiempo total necesario para procesar una solicitud de préstamo hipotecario en un banco sigue una distribución uniforme entre 5 y 9 días. G.Carnevali-E.Franchelli-G.Gervasoni 89 VARIABLES ALEATORIAS UNIDIMENSIONALES a) ¿Cuál es el tiempo promedio para procesar un préstamo? b) ¿Cuál es la desviación estándar del tiempo de procesamiento de préstamos? c) Determine la probabilidad de que un préstamo tarde más de seis días en ser procesado. d) ¿Cuál es el porcentaje de préstamos procesados en a lo sumo ocho días? 2.- Un semáforo está programado para cambiar de rojo a verde según una distribución uniforme con una media de 45 segundos. La diferencia entre el menor y el mayor número de segundos que tarda la luz en cambiar es de 8 segundos. a) Calcule la desviación estándar de esta distribución. b) Calcule la probabilidad de que la luz tarde por lo menos 43 segundos en cambiar. c) ¿Cuál es la probabilidad de que tarde menos de 43 segundos en cambiar? 4.3.5 DISTRIBUCIÓN NORMAL Muchas observaciones de la vida real se pueden modelizar usando la distribución normal. Si la situación real satisface las condiciones de este importante modelo, se pueden encontrar respuestas valiosas sin necesidad de dedicar demasiado tiempo a costosas observaciones. Son tres las razones por las que la distribución normal es la distribución teórica más importante en la estadística: La distribución normal se aproxima a las distribuciones de frecuencias observadas de muchas medidas naturales y físicas, como coeficientes mentales, pesos, alturas, ventas, vida útil de productos, variabilidad en la producción humana y de las máquinas, etc. La distribución normal se puede usar para aproximar las probabilidades binomiales, de Poisson, etc.,cuando sus parámetros matemáticos alcanzan determinados valores. La distribución normal es una buena aproximación de la distribución de una variable suma de otras variables aleatorias independientes (por ejemplo: medias muestrales, proporciones muestrales, etc); conceptos muy importantes en estadística que se verán más adelante (capítulo 5). La distribución normal es una distribución continua que tiene forma de campana simétrica y está determinada por su promedio y su desviación estándar. La siguiente figura muestra la forma de una distribución normal. La misma tiende a infinito en ambas direcciones a partir de su promedio. G.Carnevali-E.Franchelli-G.Gervasoni 90 VARIABLES ALEATORIAS UNIDIMENSIONALES Esto se corresponde con una probabilidad decreciente de encontrar valores de la característica en estudio mientras más alejados del promedio éstos se encuentren. El área total bajo la curva es igual a 1. El 50% del área está a la derecha del promedio y el otro 50% a la izquierda del mismo (en consecuencia, promedio, mediana y moda son eje de simetría de la distribución). La función de densidad de probabilidad para la distribución normal es: ( ) 2x 2 1 e 2 xf 1 σ µ−− πσ = donde x = cualquier valor de la variable aleatoria continua µ = promedio de la variable aleatoria normal σ = desviación estándar de la variable aleatoria normal Se puede presentar la variable aleatoria normal escribiendo: X ∼ N ( µ , σ ) Si el promedio y la desviación estándar se conocen, la curva normal queda especificada y se pueden encontrar las probabilidades. La probabilidad de que una variable aleatoria tenga un valor entre dos puntos cualesquiera es igual al área bajo la curva entre esos puntos. Ejercicios 1. ¿Cuáles de los siguientes enunciados son verdaderos? Justifique su respuesta. a) La distribución normal es asimétrica. b) Es necesario conocer la esperanza matemática y la desviación estándar para definir una distribución normal específica. c) Cada combinación de promedio y desviación estándar define una distribución normal única. d) La distribución normal se mide en una escala discreta. e) La distribución normal se extiende al infinito en cualquier dirección a partir de la media. f) El área total bajo la curva es igual a 1. g) La probabilidad de que una variable normal tome un valor determinado es distinta de cero. 2. Analice las distribuciones que se presentan en las figuras siguientes. En cada caso especifique la relación entre sus parámetros: G.Carnevali-E.Franchelli-G.Gervasoni 91 VARIABLES ALEATORIAS UNIDIMENSIONALES AREAS BAJO LA CURVA NORMAL Para encontrar el área bajo la curva normal debe integrarse su función de densidad, siendo el cálculo muy complejo. Por otra parte, para disponer de una tabla de áreas bajo esta curva, serían necesarias más de una, ya que el número de distribuciones normales es ilimitado, debiendo corresponder una por cada combinación de media y desviación estándar. Esta situación se puede resolver transformando todas las distribuciones normales en la distribución normal estándar. Una variable cualquiera X se estandariza (como se presentó en el ejercicio 2, pag. 77) al definir: σ µ−= XZ con E( Z ) = 0 y σ (Z) = 1 Cualquier distribución normal se puede convertir en una distribución estándar si se estandariza cada una de sus observaciones en términos de valores z: σ µ−= xz La distribución normal estándar es aquella cuya variable aleatoria Z siempre tiene una media µ = 0 y desviación estándar σ = 1. La variable Z es una transformación lineal de X. Mientras el promedio y la desviación estándar de una variable normal general X pueden adoptar cualquier valor, la variable normal estándar Z es única, con promedio 0 y desviación estándar 1. Una vez que se ha realizado la estandarización de la distribución, las probabilidades asociadas a los sucesos de interés se buscan en la tabla de probabilidades para la N(0,1). Las tabla normal estándar (ver Apéndice tabla 2.4) da las probabilidades acumuladas o áreas bajo la curva normal, para distintos valores de Z. El ejemplo siguiente permitirá visualizar esta operatoria. G.Carnevali-E.Franchelli-G.Gervasoni 92 VARIABLES ALEATORIAS UNIDIMENSIONALES Ejemplos: 1. Una variable normal tiene esperanza matemática igual a 75 y una desviación estándar igual a 6 (se expresa: X ∼ N (75,6). En la figura siguiente se observa que cada valor de la variable X tiene un valor correspondiente en la variable Z. Supongamos que quisiéramos conocer la probabilidad de que la variable X tome valores menores que 81, luego: ( ) ( ) 8413,0 1 Z P 6 75 - 81 ZP81X P =<= <=< Los sucesos ( X < 81 ) y ( Z < 1 ) son sucesos equivalentes y por lo tanto tienen la misma probabilidad. Después de calcular el valor z para la distribución normal estándar, el siguiente paso es usar la tabla normal estándar para buscar la probabilidad planteada. El valor 0,8413 de la probabilidad se obtiene de dicha tabla. La figura siguiente describe la probabilidad buscada La probabilidad del suceso complementario del anterior se obtiene: ( ) ( ) 1587,08413,0181XP181X P =−=<−=> G.Carnevali-E.Franchelli-G.Gervasoni 93 VARIABLES ALEATORIAS UNIDIMENSIONALES La probabilidad de que la variable tome valores entre 69 y 81: ( ) ( ) ( ) 0,6826 0,1587 - 8413.0 1 - Z P - 1 Z P 6 75 - 69 Z P - 6 75 - 81 Z P81X 96 P ==<<= = < <=<< 2. Una variable normal tiene esperanza matemática igual a 500 y una desviación estándar igual a 25. Se desea conocer la probabilidad de que la variable tome valores: a) menores que 535 b) menores que 480 c) mayores que 558 d) mayores que 371 e) entre 461 y 539 ( ) ( ) ( ) ( ) ( ) ( ) - 01020989801322 25 500558558) 2119.080 25 500480480) 9192.041 25 500535535) , , - ,ZP - ZPXPc ,ZP - ZPXPb ,ZP - ZPXPa ==>= >=> =<= <=< =<= <=< ( ) ( ) 1165 25 500371371) - =>= >=> ,ZP - ZPXPd ( ) = < <=<< - 25 500461 25 500539539461) - ZP - ZPXPe ( ) ( ) 881200594094060561561 , , - . , - Z - P , Z P ==<<= 88120194060215612 , - . * - ) , P (Z ó ==<= Utilizando EXCEL en Funciones estadísticas, el cálculo de las probabilidades normales se presenta de la siguiente forma: Si se usa distribución normal estándar: ASISTENTE PARA FUNCIONES G.Carnevali-E.Franchelli-G.Gervasoni 94 VARIABLES ALEATORIAS UNIDIMENSIONALES Distribución normal estándar z Resultado Si se usa distribución normal: ASISTENTE PARA FUNCIONES Distribución normal x media desvío estándar acumulado Resultado 3. Se sabe que el tiempo de almacenamiento de los artículos sigue una distribución normal con promedio 5 semanas y desviación estándar 4 semanas. ¿Cuál es la probabilidad de que un artículo elegido al azar haya estado almacenado entre 2 y 10 semanas?. X: tiempo de almacenamiento de un artículo X ∼ N ( µ , σ ) = N ( 5; 4 ) ( ) ( ) ( ) ( ) =−<−<=<<−=<< 75,025,125,175,0102 ZPZPZPXP = 0,8944 – 0,2266 = 0,6678 Existe una probabilidad igual a 0,6678 de que el artículo elegido al azar tenga un tiempo de almacenamiento entre 2 y 10 semanas. 4. Qué porcentaje de los valores de una curva normal están entre el promedio ± 1 desviación estándar, ± 2 desviaciones estándar, ± 3 desviaciones estándar ? En general, para X ∼ N(µ , σ) ( ) 12 ) - kZ P ( k ) Z P ( - k kXkP)k XP( <=<<=+<<−=<− σµσµσµ k Probabilidad 1 0.6827 2 0.9545 3 0.9973 Esto quiere decir que, si se analiza el caso particular de una variable normal estandarizada,casi la totalidad de las observaciones están en el intervalo (-3 , 3); siendo G.Carnevali-E.Franchelli-G.Gervasoni 95 1.4 535 500 0.919243289 25 VERDADERO 0.919243289 VARIABLES ALEATORIAS UNIDIMENSIONALES muy poco probables los valores de la variable fuera del mismo ( 0,27 % ); lo que justifica el rango de valores z para el que está tabulada. Observación: asociar con la regla empírica (capítulo 2, pag. 33 ). Ejercicios 1.- Una variable aleatoria normal tiene una media de 4.9 y una desviación estándar de 1,2. a) ¿Cuál es la probabilidad de que la variable tome un valor menor que 5,5? b) ¿Cuál es la probabilidad de que la variable tome un valor comprendido entre la esperanza y 6,1? c) ¿Qué porcentaje del área bajo esta curva es mayor que 6? 2.- Las calificaciones de una prueba siguen una distribución normal con µ = 100. Cuál debe ser el valor del desvío estándar si se desea que una persona obtenga una calificación superior a 122,56 con probabilidad 0,08? • APROXIMACION NORMAL A LA DISTRIBUCIÓN BINOMIAL ⇒ como se mencionó en el punto 4.3.3 (pag. 86), si en la distribución binomial, el número de repeticiones n es grande y p pequeño, las probabilidades binomiales se pueden calcular en forma aproximada a través de la distribución de Poisson (en la práctica, cuando n > 20 y np ≤ 5 ó n ( 1 - p ) ≤ 5). ⇒ si el número de repeticiones n es grande, y p un valor cercano a 0.5, entonces la curva normal proporciona una buena aproximación a la distribución binomial, (como regla empírica esta aproximación es apropiada si np > 5) : se aproxima por N ( µ = np ; σ = npq ) En el apéndice 2 se muestra el gráfico de aproximaciones de la Binomial con Poisson y Normal. A LA DISTRIBUCIÓN DE POISSON ⇒ Si X ∼ Po (λ) y λ toma valores grandes (en la práctica λ > 25), entonces la curva normal proporciona una buena aproximación a la distribución de Poisson. se aproxima por N ( µ = λ ; σ = λ ) G.Carnevali-E.Franchelli-G.Gervasoni 96 VARIABLES ALEATORIAS UNIDIMENSIONALES • FACTOR DE CORRECCIÓN POR CONTINUIDAD Cuando se aproxima una distribución de probabilidad de una variable aleatoria discreta (Binomial, Poisson) a la distribución normal (variable aleatoria continua), se hace necesario realizar la corrección por continuidad, asignando intervalos a la distribución continua para representar a los valores discretos. Ejemplo: PB ( X = 30) = PN ( 29,5 < X < 30,5 ) Ejercicios 1. Un vendedor tiene 30 % de probabilidad de concretar una venta con cualquier cliente que llama. Si hace 110 llamadas durante un mes dado, determine la probabilidad de que concrete: a. a lo sumo 40 ventas. b. al menos 30 ventas. 2. El gerente de un restaurante ha estado estudiando si los clientes nuevos regresan en el lapso de un mes. Los datos recogidos revelan que el 60% de los clientes nuevos han regresado. Si llegan 90 clientes nuevos a cenar al restaurante este mes, determine la probabilidad de que al menos 50 regresen al mes siguiente. 3. El número de llamadas telefónicas que llegan a un conmutador sigue una ley de Poisson con promedio 15 llamadas por minuto. Calcule la probabilidad de que en 5 minutos lleguen a lo sumo 90 llamadas. • VERIFICACIÓN DE LA NORMALIDAD Un punto importante a resolver es saber si el fenómeno aleatorio de interés puede describirse mediante alguno de los modelos probabilísticos conocidos. Supóngase que hemos recolectado algunos datos referentes a una variable de interés. Nos gustaría ver si la distribución normal sirve como un buen modelo. Para decidir sobre la bondad del ajuste podemos: 1. Evaluar las propiedades de la normal Mirar un histograma o un diagrama de tallos y hojas buscando característica de falta de normalidad como por ejemplo: celdas vacías, outliers o una pronunciada asimetría. Comparar nuestras observaciones con la regla 68-95-99,7 de la distribución normal. Calcular la media muestral, x , y el desvío estándar muestral, s, y observar si: aproximadamente el 68 % de las observaciones cae en el intervalo ( )sxsx +− , aproximadamente el 95 % de las observaciones cae en el intervalo ( )sxsx 2,2 +− aproximadamente el 99,7 % de las observaciones cae en el intervalo ( )sxsx 3,3 +− G.Carnevali-E.Franchelli-G.Gervasoni 97 VARIABLES ALEATORIAS UNIDIMENSIONALES 2. Hacer gráficos de probabilidad normal Son gráficos bidimensionales de los valores de los datos observados en el eje vertical con los valores de las fractilas correspondientes de una distribución normal estándar en el eje horizontal. Si los datos graficados caen en o cerca de una línea recta imaginaria creciente desde la esquina inferior izquierda hacia la esquina superior derecha, entonces el conjunto de datos tiene una distribución normal (o por lo menos se aproxima). A continuación se presenta el diagrama de probabilidad normal para el ejemplo de la variable continua superficie cubierta de la vivienda (en m2) presentada en el capítulo 2, pag. 16. Como se puede observar, los datos pueden considerarse como provenientes de una distribución normal.1 De acuerdo a la forma que adoptan los datos se concluye con respecto al tipo de distribución que tiene la población de donde provienen. 4.3.6 DISTRIBUCIÓN EXPONENCIAL En el ejemplo de la pag. 83 se definió la variable aleatoria de Poisson: número de clientes que llegan a un banco entre las 12 y 13 hs. Otra variable de interés puede ser el tiempo entre dos llegadas sucesivas. Interesa conocer su distribución. Sea la variable aleatoria T: tiempo entre dos llegadas sucesivas a un banco. La distribución de T puede obtenerse a partir de conocer la distribución del número de clientes que llegan al banco. Por ejemplo: si interesa conocer la probabilidad de que el tiempo entre dos llegadas sucesivas sea mayor que t minutos, ésta podrá derivarse de la distribución de probabilidad de Xt : nº de clientes que llegan al banco en t minutos. La clave para obtener esta relación es el siguiente concepto: el tiempo entre dos llegadas sucesivas es mayor que t, si y sólo si no hay llegadas en esos t minutos. Es decir: 1 Ver archivo xls: “Gráfico de probabilidad normal” en ar.groups.yahoo.com/group/probabilidadyestadístca_isi G.Carnevali-E.Franchelli-G.Gervasoni 98 SUPERFICIE CUBIERTA 60 80 100 120 140 160 -3 -2 -1 0 1 2 3 Valores Z S up er fic ie c ub ie rta VARIABLES ALEATORIAS UNIDIMENSIONALES t t t eteXPtTP λ λ λ −− ====≥ !0 )()0()( 0 Luego: ( )tf t-e dt ) t( F d t-e - 1 ) t ( F t-e - 1 ) t T ( P - 1 ) t (T P == = =≥=≤ λλ λ λ Se obtuvo la función de densidad de T, que es una variable aleatoria continua con distribución exponencial. La obtención de la distribución de T depende sólo de la hipótesis de que el número de llegadas sigue un proceso de Poisson. EJEMPLO Interesa conocer la probabilidad de que el tiempo entre dos llegadas sucesivas a un banco sea mayor que 1 minuto. X1 ∼ Po (λ = 3) P ( T > 1) = P (X1 = 0 ) = 3 03 ! . 0 3 − − = ee = 0,0498 Formalizando se dice que una variable aleatoria continua X tiene distribución exponencial si: ≥λ= λ caso otro en 0 0 x e )x(f x- • PARAMETROS ESTADISTICOS Si la variable aleatoria X tiene una distribución exponencial con parámetro α , entonces ( ) ( ) 2 1XV y 1XE λ = λ = • CALCULO DE PROBABILIDADES Para el ejemplo planteado anteriormente, consideramos: G.Carnevali-E.Franchelli-G.Gervasoni 99 VARIABLES ALEATORIAS UNIDIMENSIONALES X : tiempo entre dos llegadas sucesivas a un banco X ∼ Exp ( 3 minutos-1) 9502,03 1 0 x3 e1dxe)1X(P 3 =−==< −−∫ Utilizando EXCEL en funciones estadísticas, el cálculo de las probabilidades se presenta de la siguiente forma: ASISTENTE PARA FUNCIONES DIST. EXP. X LAMBDA ACUMULADO VALOR = 0,950212932 EJEMPLO 1. En una red decomputadoras, el acceso de los usuarios al sistema se comporta como un proceso de Poisson con un promedio de 25,2 accesos por hora. a) ¿Cuál es la probabilidad de que el tiempo entre dos accesos sucesivos sea superior a seis minutos? Sea Yt: número de accesos al sistema en t minutos. Yt ∼ Po ( λt ) Se conoce Y60 ∼ Po (25,2 acc/1 hora) en consecuencia Y1’ ∼ Po .min1/acc42,060 2,25 = Sea X : tiempo entre dos accesos sucesivos X ∼ Exp ( 0,42 minutos –1) P ( X > 6 ) = e - 0,42 * 6 = 0,0805 b) ¿Cuál es la probabilidad de que el tiempo que transcurre hasta el siguiente acceso esté entre 2 y 3 minutos? P (2 < X < 3) = F (3) – F (2) = (1 – e-0,42*3) – (1 - e-0,42*2) = e -0,42*2 - e-0,42*3 = 0,43 – 0,28 = 0,15 Ejercicios G.Carnevali-E.Franchelli-G.Gervasoni 100 1 3 VERDADERO VARIABLES ALEATORIAS UNIDIMENSIONALES 1. El tiempo entre llegadas de taxis a una parada tiene una distribución exponencial con promedio 10 minutos. ¿Cuál es la probabilidad de que una persona que esté en el cruce tenga que esperar más de una hora para tomar un taxi? 2. Demuestre que si X ∼ Exp ( λ ) → P ( X > s + t / X > s ) = P ( X > t ) para cualquier s,t > 0. (Propiedad de no memoria) 4.3.7. EJERCICIOS RESUELTOS 1.- La sección Control de Calidad de una industria manufacturera realiza un muestreo de aceptación de los lotes que recibe, con el siguiente criterio: de cada lote inspecciona muestras de cinco unidades, si entre ellas encuentra una o más defectuosas rechaza el lote, caso contrario lo acepta. Si el 5 % del lote es defectuoso, ¿cuál es la probabilidad de que sea rechazado? Solución: Sea X: número de unidades defectuosas en un total de 5 Al ser la muestra pequeña con respecto al tamaño de la población y a pesar de que el muestreo se hace sin reposición se puede decir que : X ∼ Bi ( n , p ) = Bi ( 5 , 0,05 ) El lote es rechazado si hay una o más unidades defectuosas entre las cinco observadas, es decir, la probabilidad de que el lote sea rechazado es equivalente a: P ( X ≥ 1 ) = 1 - P ( X = 0 ) = 1 - 0,7738 = 0,2262 2.- El Sr. García es el responsable de la compra de cajas de vino para un restaurante. Periódicamente elige una caja de prueba (12 botellas por caja) para determinar si el proceso de sellado es adecuado. Para esta prueba, selecciona al azar 4 botellas de la caja para catar el vino. Si una caja contiene dos botellas de vino en mal estado, calcule la probabilidad de que precisamente una de ellas aparezca en la muestra del Sr. García. Solución: X : número de botellas en mal estado X ∼ Hiperg ( N , r , n ) = Hiperg ( 12 , 2 , 4 ) C 2 , 1 C 10 , 3 P ( X = 1 ) = = 0,485 C 12 , 4 3.- La comisión de desarrollo económico de una ciudad ha determinado que el número de pequeños negocios que se declaran en quiebra al mes es un proceso de Poisson con promedio 2,6. Calcule la probabilidad de que: a) Ninguno se declare en quiebra el próximo mes b) Tres se declaren en quiebra el próximo mes G.Carnevali-E.Franchelli-G.Gervasoni 101 VARIABLES ALEATORIAS UNIDIMENSIONALES c) Ocurran menos de tres quiebras el siguiente mes d) Uno o más negocios se declaren en quiebra el próximo mes e) Ocurran dos quiebras durante los próximos dos meses Solución: Sea: Xt : número de quiebras de pequeños negocios en t meses Xt ∼ Po ( λ t ) X1 ∼ Po ( 2,6 ) X2 ∼ Po (2,6 * 2 = 5,2) a) P ( X1 = 0 ) = 0,0743 b) P ( X1 = 3 ) = 0,2176 c) P ( X1 < 3 ) = 0,5184 d) P ( X1 ≥ 1 ) = 1 - P ( X1 = 0 ) = 1 - 0,0743 = 0,9257 e) P ( X2 = 2 ) = 0,0746 4.- El tiempo de vuelo entre dos ciudades de una aerolínea sigue una distribución uniforme entre 80 y 100 minutos. a) ¿Cuál es el tiempo de vuelo promedio entre las dos ciudades? b) ¿Qué porcentaje de vuelos puede esperarse que tarden entre 85 y 95 minutos? c) Un servicio aéreo entre las dos ciudades se considera eficiente si por lo menos el 50 % de sus viajes se realiza en menos de 95 minutos. ¿Se puede considerar eficiente el servicio en esta aerolínea? X : tiempo de vuelo (en minutos) X ∼ U ( 80 , 100 ) a) E (X) = 80 + 100 = 90 minutos 2 b) P ( 85 < X < 95 ) = 95 - 85 . = 0,5 ⇒ 50 % de los vuelos tardan entre 85 y 95’ 100 – 80 c) P ( X < 95 ) = 95 – 80 = 15 = 0,75 100 – 80 20 El 75 % de los vuelos tienen tiempos menores de 90’, por los tanto el servicio se considera eficiente. 5.- Las primas de riesgos mensuales (en $) de una compañía de seguros siguen una distribución normal. Se quiere determinar el porcentaje de recibos mensuales que caen dentro del intervalo de $125 a $175, ya que esas cantidades son difíciles de manejar. Para determinar el porcentaje de cuentas en este rango, se calcula el promedio y la desviación estándar de los recibos mensuales de las primas, obteniéndose 100$ y 38$, respectivamente. a) ¿Qué porcentaje de recibos mensuales puede esperarse que caiga dentro del rango de 125 a $175? b) Se predice que dentro de dos años el promedio mensual de la prima se elevará a $150. Suponiendo que la desviación estándar permanece igual, ¿en qué cambiaría este hecho la respuesta al punto a? G.Carnevali-E.Franchelli-G.Gervasoni 102 VARIABLES ALEATORIAS UNIDIMENSIONALES X: valor de la prima de riesgo (en $) X ∼ N (100,38) a) P (125 < X < 175) = P (125 – 100 < Z < 175 – 100) = P (0,66 < Z < 1,97) = 38 38 = F (1,97) – F (0,66) = 0.9756 - 0.7454 = 0.2302 b) X ∼ N ( 150 , 38 ) P (125 < X < 175) = P (125 – 150 < Z < 175 – 150) = P (- 0,66 < Z < 0,66) = 38 38 = 2 * F (0,66) - 1 = 2 * 0.7454 - 1 = 0.4908 Existirá un mayor porcentaje de primas de riesgo con valores en el rango (125, 175) si µ = 150. 6.- El tiempo que transcurre entre las llamadas a una empresa de artículos para plomería tiene una distribución exponencial con un tiempo promedio entre llamadas de 12 minutos. a) ¿Cuál es la probabilidad de que no haya llamadas en un lapso de 1 minuto? b) ¿Cuál es la probabilidad de recibir al menos una llamada en un intervalo de 10 minutos? c) ¿Cuál es la probabilidad de recibir la primera llamada entre cinco y 10 minutos después de abierta la empresa? d) Determinar la amplitud del intervalo de tiempo, de modo tal que la probabilidad de recibir al menos una llamada en ese lapso sea 0,80. X: tiempo entre llamadas E (X) = 12’ → X ∼ Exp (1/ 12) a) Recordar la relación entre Poisson y exponencial: Si X ∼ Exp ( 12 1 ) → Y1 = número de llamadas en 1 minuto Y1∼ Po ( λ ) siendo λ = 1/ 12 ≅ 0,08 Luego: P (Y1 = 0) = e – 0,08 = 0,92 b) Y10 = número de llamadas en 10 minutos Y10 ∼ Po (10 λ) → Y10 ∼ Po (0,8) P (Y10 ≥ 1) = 1 – P (Y10 = 0) = 1 - e – 0,8 = 0,55 c) Recibir la primer llamada entre 5 y 10 minutos después de abierta la empresa es equivalente a decir que el tiempo que transcurre entre la apertura y la primer llamada está en el intervalo (5, 10): P (5 < X < 10) = e - 0,08 *5 – e - 0,08 *10 = 0,67 – 0,45 = 0, 22 d) Yt = número de llamadas en t minutos Yt ∼ Po (t * 0,08) P ( Yt ≥ 1) = 0,80 P ( Yt ≥ 1) = 1 – P (Yt = 0 ) = 0,80 P ( Yt = 0 ) = 0,2 ⇒ t λ = t * 0,08 ≅ 1,6 ⇒ t = 1,6 : 0,08 = 20 minutos G.Carnevali-E.Franchelli-G.Gervasoni 103 VARIABLES ALEATORIAS UNIDIMENSIONALES 4.4 FUNCION DE VARIABLE ALEATORIA En los siguientes ejemplos se considera una variable aleatoria X, con distribución de probabilidad conocida y una variable aleatoria Y, función real de X ⇒ Y = H ( X ). Las probabilidades de sucesos asociados a la variable Y se podrán obtener a partir de la distribución de probabilidad de X si se determinanlos sucesos equivalentes en cuestión. EJEMPLOS X variable aleatoria discreta ; Y variable aleatoria discreta La probabilidad de que una máquina falle en un día cualquiera es 0,05. Si la máquina no tiene fallas durante la semana, se obtiene una utilidad S. Si ocurren 1 ó 2 fallas, se obtiene una utilidad R (R<S). Si ocurren 3 o más fallas, se obtiene una utilidad –L (R, S y L son positivos). Si la máquina falla cualquier día, permanece fuera de uso durante el resto del día. Sea X : número de fallas en 5 días X ∼ Bi ( n,p ) = Bi ( 5;0,05 ) → ( ) knp1kp k)P(X −− == k n Y: utilidad obtenida en una semana de cinco días Y = H (X). La distribución de probabilidad de Y se presenta a continuación: yi sucesos equivalentes Probabilidad S X = 0 P(Y = S) = P ( X = 0 ) = 0,774 R 1 ≤ X ≤ 2 P(Y = R) = P( 1 ≤ X ≤ 2 ) = 0,225 -L X ≥ 3 P(Y = -L) = P( X ≥ 3 ) = 0,001 1 X variable aleatoria continua ; Y variable aleatoria discreta La entrada en un canal de comunicación es una variable aleatoria X distribuida uniformemente en el intervalo (-2,5 ; 1,5 ). La salida Y toma los valores: 0 si x > 1 1/2 si -1 ≤ x ≤ 0 1 si 0 < x ≤ 1 Sea X : entrada en un canal de comunicación X ∼ U (a ; b) = U ( -2,5 ; 1,5 ) → f (x) = 1/ 4 Y: salida del canal de comunicación Y = H ( X ) G.Carnevali-E.Franchelli-G.Gervasoni 104 VARIABLES ALEATORIAS UNIDIMENSIONALES A continuación se presenta la distribución de probabilidad de Y: yi sucesos equivalentes Probabilidad 0 X > 1 ∨ X < -1 P(Y = 0) = P ( X >1) + P ( X <-1) = 0,125 + 0,375 = 0,5 ½ -1 ≤ X ≤ 0 P(Y = ½ ) = P(-1 ≤ X ≤ 0 ) = 0,25 1 0 < X ≤ 1 P(Y = 1 ) = P (0 < X ≤ 1 ) = 0,25 1 G.Carnevali-E.Franchelli-G.Gervasoni 105 VARIABLES ALEATORIAS UNIDIMENSIONALES 4.5 EJERCICIOS PROPUESTOS 1.- Una variable aleatoria continua X tiene distribución de probabilidad: f (x) = 3 x2 0 ≤ x ≤ 1 = 0 en otro caso a) Represente gráficamente f (x). b) Encuentre promedio, mediana y varianza. c) Calcule la probabilidad de que X supere 0,75. 2.- La etiqueta en las cajas de una marca de detergente indica un peso de 800 gramos. Una máquina llena estas cajas donde el contenido de las mismas es una variable aleatoria uniforme en el intervalo (780;820). El control de calidad acepta las cajas llenas con 15 gramos más o menos de la cantidad que indica la etiqueta. a) ¿Cuál es la variabilidad del contenido de las cajas? b) ¿Cuál es la probabilidad de que una caja contenga entre 785 y 795 gramos? c) ¿Cuál es la probabilidad de que una caja no cumpla con el estándar de control de calidad? 3.- El número de llamadas telefónicas que llegan a un conmutador es una variable aleatoria X que se distribuye según una ley de Poisson de parámetro λ = 15 llamadas por minuto. Según el número de llamadas que lleguen puede ser necesario descongestionar el conmutador dirigiendo algunas llamadas a líneas auxiliares. Si el número de llamadas es a lo sumo 15, no se necesita línea auxiliar; si es mayor que 15 pero menor o igual que 25, se necesita una línea; para un número mayor que 25 se utilizan dos líneas auxiliares. a) Encuentre la distribución de probabilidad de la variable aleatoria Y: número de líneas auxiliares necesarias en un minuto. b) Encuentre promedio y desviación estándar de la variable aleatoria Y. 4.- Un artículo puede tener dos defectos D1 y D2. El número de defectos D1 es una variable aleatoria de Poisson con parámetro λ1 = 0,1 y el número de defectos D2 sigue una distribución de Poisson con parámetro λ2 = 0,3. Los defectos son independientes. Un artículo se considera defectuoso cuando presenta al menos uno de los defectos. Calcule la probabilidad de que en una muestra de 50 artículos haya a lo sumo 10 defectuosos. 5.- Una variable aleatoria X se distribuye uniformemente en [– α ; α] , (α > 0). Cada vez que sea posible, determine α que satisfaga: a) P ( X > 1 ) = 1/3 b) P ( X > 1 ) = 1/2 c) P ( X < 1 ) = P ( X > 1 ) 6.- El número de clientes que llegan a una caja de un supermercado es una variable aleatoria de Poisson con promedio 10 clientes en 5 minutos. ¿Cuál es la probabilidad de que transcurran al menos 2 minutos entre dos llegadas sucesivas? G.Carnevali-E.Franchelli-G.Gervasoni 106 VARIABLES ALEATORIAS UNIDIMENSIONALES 7.- Las mediciones repetidas de una cierta magnitud δ, con una determinada técnica, permite afirmar que tales medidas tienen distribución normal con promedio µ = –183,2 unidades y σ = 0,08 unidades. a) ¿Cuál es la probabilidad de que la medición resulte superior a –183? b) Se realizan 10 mediciones de δ, calcule la probabilidad de que sólo dos de ellas superen el valor –183. 8.- El tiempo de funcionamiento sin fallas (en años) de un cierto tipo de componente es una variable aleatoria X con distribución exponencial de parámetro 0,2. a) Calcule la probabilidad de que una componente no tenga fallas durante los dos primeros años de funcionamiento. b) ¿Cuál es la probabilidad de que en un lote de 15 componentes elegidas al azar, por lo menos 11 componentes no tengan fallas durante los dos primeros años de funcionamiento? c) Se sabe de que en un lote de 15 componentes elegidas al azar, por lo menos 11 no tuvieron fallas durante los dos primeros años. Calcule la probabilidad de que en ese período, no hayan tenido fallas exactamente 13 componentes. d) Se arma un lote con cinco componentes elegidas al azar y se las numera del 1 al 5. ¿Cuál es la probabilidad de que sólo las componentes 1 y 2 no tengan fallas durante los dos primeros años de funcionamiento? (En todos los casos llegar al resultado numérico). 9.- Una experiencia aleatoria ε tiene dos resultados posibles (A y A ). Se conoce que P(A) = 0,20. Calcule la probabilidad de que en 10 repeticiones de la experiencia ε : a) haya igual cantidad de resultados A y A . b) la cantidad de resultados A supere la cantidad de resultados A . c) en la cuarta experiencia ocurra el primer resultado A d) en las últimas cuatro experiencias ocurran todos los resultados A 10.- El número de accidentes que ocurren diariamente en un cruce de avenidas es una variable aleatoria con distribución de Poisson con promedio 0,1 accidentes diarios. Calcule, entre los días en los que hubo más de un accidente, la proporción de días en los que hayan ocurrido solamente dos. 11.- Una prueba consta de 50 preguntas con cuatro respuestas alternativas dadas de las cuales sólo una es correcta. Cada pregunta se refiere a un tema específico. Sea “p” la probabilidad de que un alumno haya estudiado el tema. Se sabe que la probabilidad de contestar correctamente una pregunta cuando el alumno estudió el tema es 0,9. Si el alumno no estudió el tema elegirá al azar una de las respuestas alternativas. a) ¿Cuál debe ser el valor de “p” para que la probabilidad de que un alumno responda correctamente una pregunta sea 0,8? b) ¿Cuál es la probabilidad de que el alumno haya estudiado el tema si respondió correctamente la pregunta? c) Si se aprueba con el 80% de respuestas correctas, ¿qué porcentaje de alumnos aprobará? G.Carnevali-E.Franchelli-G.Gervasoni 107 VARIABLES ALEATORIAS UNIDIMENSIONALES 12.- La demanda semanal de copias de un procesador de textos en un negocio de software es una variable aleatoria X con la siguiente distribución de probabilidades: x 0 1 2 3 4 5 6 7 8 9 10 P(X=x) 0,06 0,14 0,16 0,14 0,12 0,10 0,08 0,07 0,06 0,04 0,03 a) Calcule la probabilidad de que en una semana cualquiera se soliciten: i) tres ó más copias ii) por lo menos 2 pero no más de 6 copias b) La política del negocio es tener 8 copias del programa al inicio de cada semana. ¿Cuál es la probabilidad de que, en una semana cualquiera, la demanda supere laoferta? c) Encuentre la función de distribución de probabilidad acumulada F(x) d) Calcule nuevamente las probabilidades del punto a) pero usando la F(x). e) Calcule el promedio, la varianza y la desviación estándar de la variable aleatoria X 13.- Una compañía de procesamiento de datos tiene una macrocomputadora a la cual se accede a través de un gran número de terminales remotas. Un modelo razonable de probabilidad para el tiempo Y (en minutos) transcurrido entre envíos sucesivos de los trabajos a la computadora supone que: F (y) = P(Y < y) = 1 – e–0,5y 0 ≤ y < ∞ a) Calcule los valores numéricos de F (y) para y = 1,0; 2,0 ; ...... hasta que F (y) exceda de 0,98 (aproximadamente) b) Calcule P( Y < 0,75 ) , P ( Y > 4,0 ) y P ( 2,0 < Y < 3,5 ) c) Encuentre la función de densidad de probabilidad f (y) 14.- Un fabricante de cierto tipo de piezas somete cada unidad a una prueba muy rigurosa. De las piezas recién ensambladas, el 84% pasa la prueba sin ninguna modificación. Las que fallan en la prueba inicial son reelaboradas; de éstas, el 75% pasa una segunda prueba. Aquellas piezas que fallan en la segunda prueba se rehacen por segunda vez y se vuelven a probar; 90% de ellas pasan la prueba y el resto se desarman. Defina X como la variable aleatoria: número de veces que debe reprocesarse una pieza seleccionada al azar. a) Especifique el recorrido de la variable X b) Encuentre la distribución de probabilidad de X c) Encuentre promedio, varianza y desviación estándar de la variable X 15.- El operador de una computadora recibe peticiones imprevistas para montar cintas de datos en el sistema. Como política, estas solicitudes deben ser atendidas a la brevedad posible; debido a ello, se tiene que interrumpir el flujo del trabajo programado. Sea la variable aleatoria X : número de solicitudes recibidas en un turno de 9 a 17 horas. Se conoce que la variable X sigue una ley de Poisson con promedio 1,5 solicitud por hora. a) Encuentre la media y la desviación de la variable X b) Calcule P( X > 8 ) c) Encuentre la probabilidad de que el tiempo transcurrido entre dos solicitudes consecutivas sea al menos de dos horas. G.Carnevali-E.Franchelli-G.Gervasoni 108 VARIABLES ALEATORIAS UNIDIMENSIONALES 16.- En una compañía de redes de cómputo se observa la variable aleatoria X: número de interrupciones diarias que tiene la siguiente distribución de probabilidades: Interrupciones 0 1 2 3 4 5 6 P(X=x) 0,32 0,35 0,18 0,08 0,04 0,02 0,01 a) Calcule la probabilidad de en un día dado : i) haya menos de 4 interrupciones ii) haya a lo sumo 4 interrupciones iii) haya por lo menos 4 interrupciones iv) haya 4 interrupciones v) haya más de 4 interrupciones vi) haya entre 2 y 6 interrupciones (incluidos estos valores) b) Calcule el promedio y la desviación estándar de a variable X. Interprete los resultados. 17.- En una concesionaria de autos de la marca XX los registros de garantía de un automóvil nuevo permiten decir que la probabilidad de que un auto nuevo necesite reparación amparada por la garantía durante los primeros 90 días, es de 0,05. Se selecciona al azar una muestra de cinco autos nuevos, a) calcule la probabilidad de que : i) ninguno necesite reparación amparada por la garantía ii) por lo menos uno necesite reparación amparada por la garantía b) encuentre el número promedio de la variable que definió en el punto a) c) Conteste las mismas preguntas del punto a) y b) si la probabilidad de necesitar una reparación amparada por la garantía fuera de 0,10. 18.- Los gastos mensuales en alimentación para familias de cuatro miembros en una ciudad es una variable aleatoria normal con promedio 420$ y desviación estándar 80$. a) ¿ Qué porcentaje de estos gastos : i) es menor que 350$? ii) está entre 250 y 350$? iii) es menor que 250$ o mayor que 450$? b) Determine el cuartil 1 y el cuartil 3 c) ¿Cuáles serían sus respuestas al punto a) si la desviación es de 100$? 19.- Se supone que la calificación obtenida en el examen final de un curso introductorio de estadística es una variable aleatoria con distribución normal con promedio 73 y desviación estándar 8. a) ¿Cuál es la probabilidad de obtener en este examen una calificación no mayor de 91? b) ¿Qué porcentaje de estudiantes obtuvo una calificación entre 65 y 89? c) ¿Cuál fue la calificación superada sólo por el 5% de los estudiantes que hicieron el examen? d) Si el profesor le otorga Promoción al 10% más alto de la clase sin importar la calificación, ¿le conviene a usted una calificación de 81 con este examen o una G.Carnevali-E.Franchelli-G.Gervasoni 109 VARIABLES ALEATORIAS UNIDIMENSIONALES calificación de 68 en un examen diferente en el que el promedio fuera 62 y la desviación estándar 3? 20.- Una oficina que procesa permisos para remodelación de edificios tiene como política que el permiso se entregará sin costo si no está listo al final de 5 días hábiles, a partir de la fecha de la solicitud. Se mide el tiempo de procesamiento a partir del momento en que se recibe la solicitud hasta completar el procesamiento (Suponga que el tiempo tiene distribución normal). a) Si el proceso tiene una media de 3 días y una desviación estándar de 1 día, ¿qué proporción de los permisos serán gratis? b) Si el proceso tiene una media de 2 días y una desviación estándar de 1,5 días, ¿qué proporción de los permisos será gratis? c) ¿En cuál de los dos procesos, (a) ó (b), resultarán más permisos gratis? Explique. d) Para el proceso del punto (a), ¿sería mejor reducir el promedio a 2 días o la desviación estándar a 0,75 días? Explique. 21.- El nivel de llenado de unas botellas de refrescos tiene una distribución normal con media 2 litros y desviación estándar 0,06 litros. Las botellas que contienen menos de 95% del contenido neto anunciado (1,9 en este caso) pueden causar una multa al fabricante por parte de la oficina de protección al consumidor, mientras que las botellas que tienen un contenido neto mayor que 2,1 litros pueden provocar un derrame del exceso al abrirlas. a) ¿Cuál es la probabilidad de que le pongan una multa al fabricante, si se selecciona al azar una botella de la producción? b) ¿Qué proporción de las botellas pueden provocar un derrame al abrirlas? c) ¿Qué cantidad mínima de refresco se espera que contenga 99% de las botellas? d) ¿Entre qué dos valores (con distribución simétrica) se espera encontrar el contenido del 99% de las botellas? e) Suponga que en un esfuerzo por reducir el número de botellas que contienen menos de 1,9 litros, el embotellador arregla la máquina de llenado de manera que la media sea de 2,01 litros. En estas circunstancias, ¿cuáles serían sus respuestas a las preguntas de los puntos a), b) y c)? G.Carnevali-E.Franchelli-G.Gervasoni 110
Compartir