Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Introducción a la Estad́ıstica (Cap. 2, secciones 1 y 2 del Bertsekas) Variables Aleatorias Discretas Rotnitzky, Ferrari, Cersosimo, Smucler Universidad Torcuato Di Tella Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 1 / 52 Variabla Aleatoria. Motivación Considerá el ejemplo de los n = 110 pasajes vendidos para un vuelo con 100 asientos. Suponé que operar�el�avión�cuesta� ������Eólares� el�precio�de�cada�pasaje�es�500�dólares �MPT�QBTBKFT�TPO�OP�SFFNCPMTBCMFT� el�costo�por�cada�pasajero�que�se�queda�sin�volar�es�1100�dólares Suponé que w = (a1, ...., a110) denota un posible resultado de quienes se presentan el d́ıa del vuelo, donde aj = 1 si el pasajero j se presentó el d́ıa del vuelo, y aj = 0 de lo contrario. La ganancia -o pérdida- neta del vuelo es un valor numérico incierto que depende del resultado w de los 110 ensayos Bernoulli. O sea, es una función con dominio el espacio muestral W = {w = (a1, ...., a110) : ai = 0 ó 1} e imágen los números reales R Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 2 / 52 Variable Aleatoria. Definición Definición: Una variable aleatoria es una función del espacio muestral W a los numeros reales R. Es costumbre, aunque no obligatorio, denotar a las variables aleatorias con las últimas letras del abecedario en mayúscula: W ,X ,Y ,Z Ojo! No te confundas, una variable aleatoria no es una variable sino una función El adjetivo aleatoria indica que el valor que toma la función es incierto hasta que no se revela el resultado w del experimento. Por ejemplo: la ganancia neta del vuelo es desconocida hasta no saber quienes se presentan el d́ıa del vuelo. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 3 / 52 Variable Aleatoria. Aclaración Ojo! Cuando escribimos X (con mayúscula) estamos denotando a una función X : W ! R En cambio, cuando escribimos f (x) , x (con minúscula) es el argumento de la función f . Si f : R ! R entonces Y = f (X ) denota la v.a. que se obtiene de la composición de funciones f � X : W ! R O sea, para cada w 2 W, Y (w) = f (X (w)) Otra aclaración notacional: X = x es una abreviatura para el evento {w 2 W : X (w) = x} a X b es una abreviatura para el evento {w 2 W : a X (w) b} Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 4 / 52 Variabla Aleatoria. Ejemplo Veamos como se define la variable aleatoria ”ganancia del vuelo”. El número de pasajeros que se presentan el d́ıa del vuelo es Y (w) = 110  i=1 ai El costo de operar el avión es 40000 dolares. Número de pasajeros que se quedan sin viajar S = max {0,Y � 100} . La ganancia neta del vuelo es la variable aleatoria X = 110⇥ 500� 40000� S ⇥ 1100 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 5 / 52 Variable Aleatoria discreta Hay dos grandes clases de variables aleatorias, las discretas y las continuas. Por ahora definiremos y estudiaremos las v.a. discretas; más adelante, las v.a. continuas. Definición: una variable aleatoria X es discreta si existe un conjunto X finito o infinito numerable tal que X (w) 2 X para todo w en el espacio muestral W. Cuando para todo x 2 X se verifica que P (X = x) 6= 0, entonces al conjunto X se lo llama soporte de la variable aleatoria X . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 6 / 52 Distribución de una variable aleatoria T́ıpicamente,�cuando�definimos�una�variable�aleatoria�X� es�porque�nos� interesa averiguar� la�probabilidad� de�eventos�como�X�=�x� para�algún�x� ó�a��X��b�para algunos�a�y�b� incluyendo�a�=��•�y�b�=�•. Por�ejemplo,�podemos�estar� interesados�en�averiguar� la�probabilidad�de�que� la ganancia�del�vuelo�sea�no�menor�a�9000�dolares: P�(X���9000) &M�OVNFSP�EF�BTJFOUPT�WBDJPT�FT�8�NBY ����: � ��&OUPODFT �podemos�querer�calcular� la�probabilidad�de�queden�vaćıos�entre�tres�y�cinco�asientos: P�(3��W��5) Conocer� la�aśı� llamada� distribución�de�una�variable�aleatoria�X� nos�permite calcular� la�probabilidad�de�cualquier�evento�de� la� forma�X�=�x� ó�a��X��b Hay�muchas� formas�equivalentes�de�definir� la�distribución�de�una�v.a. Para�v.a.� discretas,� la� forma�más�natural�es�a� través�de� la�asi� llamada� función�de probabilidad�de�masa,� también� llamada� función�de�densidad�discreta Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 7 / 52 Función de probabilidad de masa ó función de densidad discreta. Definición: la función de probabilidad de masa ó función de densidad discreta de una v.a. discreta X es la función pX : R ! [0, 1] definida como pX (x) = P (X = x) Observá que pX (x) 6= 0 si y sólo si x está en el soporte de X . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 8 / 52 Propiedades de la función de probabilidad de masa ó función de densidad discreta. Proposición: Si X es una v.a. discreta, entonces 1 pX (x) � 0 2 si X = {x1, x2..., xn} entonces n  j=1 pX (xj ) = 1 3 si X = {x1, x2...} •  j=1 pX (xj ) = 1 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 9 / 52 Propiedades de la función de probabilidad de masa ó función de densidad discreta. Demostración de la proposición: 1 El inciso 1 es trivial pues pX (x) = P (X = x) y P es una probabilidad. 2 si el soporte de X es X = {x1, x2..., xn} entonces 1 = P (X = x1 ó X = x2 2 ó X = x3 ... ó X = xn) = n  j=1 pX (xj ) porque los eventos ”X = x1”, ”X = x2”, ..., ”X = xn” son mutuamente excluyentes. 3 Se demuestra de forma análoga al inciso (2) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 10 / 52 Función de probabilidad de masa: ejemplo Recordá que cuando 110 personas no relacionadas entre śı compraron pasaje para un vuelo, que cada uno se presente o no el d́ıa del vuelo es un ensayo Bernoulli. Luego, si la probabilidad de que cada pasajero se presente el d́ıa del vuelo es 0.9, la probabilidad de que se presenten y pasajeros el d́ıa del vuelo es: P (y éxitos en 110 ensayos Bernoulli i.i.d.) = ✓ 110 y ◆ 0.9y (1� 0.9)110�y Por lo tanto, si Y es la variable aleatoria que representa el número de pasajeros que se presentan el d́ıa del vuelo, entonces su función de probabilidad de masa es pY (y ) = ✓ 110 y ◆ 0.9y (1� 0.9)110�y Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 11 / 52 Gráfico de la función de probabilidad de masa Este es el gráfico de la función de probabilidad de masa pY (y ) = ✓ 110 y ◆ 0.9 y (1� 0.9)110�y Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 12 / 52 Cálculo de probabilidades a partir de la función de probabilidad de masa Si conozco la función pX (·) , entonces puedo calcular, por ejemplo, para números cualesquiera a y b P (a < X b) = P ( X = a+ 1 ó X = a+ 2 ó... ó X = b) = P (X = a+ 1) + ...+ P ( X = b) = pX (a+ 1) + ...+ pX (b) = b  x=a+1 pX (x) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 13 / 52 Función de distribuciónacumulada Como hemos visto en la filmina anterior, el cálculo de P (a < X b) requiere la suma de muchos términos La función de distribución acumulada nos permite hacer ese cálculo con sólo calcular una resta. Definición: la función de distribución acumulada de una variable aleatoria X se define como FX (x) = P (X x) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 14 / 52 Función de distribución acumulada Una vez que conocemos la función de distribución acumulada, podemos calcular P (a < X b) con solo computar una resta, como lo indica la siguiente proposición. Proposición : sea FX (x) la función de distribución acumulada de una v.a. discreta X . Entonces 1 P (a < X b) = FX (b)� FX (a) 2 P (X > a) = 1� FX (a) 3 P (a X b) = FX (b)� FX (a) + pX (a) 4 P (X � a) = 1� FX (a) + pX (a) 5 P (X = a) =salto de FX en a = FX (a)� FX (a�) donde FX � a� � = limx%a FX (x) es el ĺımite por la izquierda Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 15 / 52 Función de distribución acumulada Toda función de distribución acumulada FX (x) de una v.a. discreta X cumple las siguientes propiedades: 1 Es constante de a trozos, con saltos sólo en los valores x del soporte de X 2 Es continua a derecha: limx&a FX (x) = FX (a) 3 limx!�• FX (x) = 0 y limx!+• FX (x) = 1 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 16 / 52 Ejemplo: Función de dist. acumulada Supone que X es la v.a. que cuenta los exitos en 4 ensayos Bernoulli i.i.d. con p = 0.5. El gráfico de FX es: Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 17 / 52 Distribuciones y variables aleatorias con nombre propio. Hay algunas distribuciones que aparecen tan frecuentemente en probabilidad y en anaĺısis estad́ısticos que han sido merecedoras de recibir un nombre propio. Acá veremos 4 de estas distribuciones para v.a. discretas: Bernoulli, Binomial, Uniforme y Poisson Las distribuciones Bernoulli, Binomial y Uniforme te resultarán fáciles de entender porque verás que en realidad ya las hemos derivado, aunque sin darles nombre propio! La distribución Poisson es más complicada y la discutiremos hacia el final de las filminas. En el camino, definiremos el importante concepto gráfico de histograma de una v.a. discreta. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 18 / 52 Distribución y variable aleatoria Bernoulli. Definición: Una variable aleatoria X se llama Bernoulli si su soporte es X = {0, 1}. Su distribución se llama Bernoulli. A p = pX (1) se lo llama parámetro de la distribución. La abreviatura X ⇠ Bernoulli (p) quiere decir que X es una v.a. Bernoulli cuya distribución tiene parámetro p. Lo leemos como ”X tiene distribución Bernoulli con parámetro p” ó ”X sigue una distribución Bernoulli con parámetro p” La v.a. Bernoulli aparece en cualquier ensayo Bernoulli en la que un éxito cuenta 1 y un fracaso cuenta 0. Por ejemplo: la v.a. X1 definida como X1 = 1 si el 1er pasajero se presentó al vuelo y X1 = 0 si no se presentó, es una v.a. Bernoulli Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 19 / 52 Distribución y variable aleatoria Binomial Definición: Una variable aleatoria X se llama Binomial con parámetros n y p si cuantifica el número de éxitos en n ensayos Bernoulli independientes e igualmente distribuidos con P (éxito) = p. Su distribución se llama Binomial y esta definida por la fórmula pX (x) = ✓ n x ◆ px (1� p)n�x La abreviatura X ⇠ Bin (n, p) quiere decir que X es una v.a. Binomial cuya distribución tiene parámetros n, p. Lo leemos como ”X tiene distribución Binomial con parámetros n y p” ó ”X sigue una distribución Binomial con parámetros n y p” La variable Y definida en filminas anteriores como el número de pasajeros que se presentaron al vuelo es una v.a. Binomial con parámetros n = 110 y p = 0.9 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 20 / 52 Histograma de una variable aleatoria discreta Un histograma de probabilidad de una v.a. discreta X es un gráfico de barras, tal que: 1 los posibles valores x1, x2, ... de X están ubicados sobre el eje horizontal 2 sobre cada x en el soporte de X , dibujamos una barra rectangular, con base�de�ancho�i gual�a�BMHVO�I���y�altura�i gual�a�pX�(x)�I� Ejemplo:�el�histograma�de�X�⇠�Bin�(3,�0.5)�DVBOEP�I���es Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 21 / 52 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 22 / 52 Propiedades del histograma El área total ocupada por todas las barras es igual a 1 El área ocupada por la barra sobre un valor x es igual a P (X = x) El área ocupada por las barras de todos los x tales que a x b es igual a P (a X b) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 23 / 52 Ejercicio Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 24 / 52 Ejercicio Inspeccionando el histograma, calculá aproximadamente 1 P (X = 4) 2 P (X < 4) 3 P (X > 5) 4 P (2.5 X < 6.5) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 25 / 52 Distribución y variable aleatoria Uniforme. Definición: Una variable aleatoria discreta X se llama Uniforme si su soporte X es finito y todos los eventos X = x para x 2 X son equiprobables. Su distribución se llama Uniforme con parámetro n = #X . Su función de probabilidad de masa satisface pX (x) = 1 #X para todo x 2 X La abreviatura X ⇠ Unif (n) quiere decir que X es una v.a. Uniforme cuya distribución tiene parámetro n. Lo leemos como ”X tiene distribución Uniforme con parámetro n” ó ”X sigue una distribución Uniforme con parámetro n” Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 26 / 52 Distribución y variable aleatoria Uniforme: ejemplo. De un bolillero con bolillas idénticas numeradas de 1 a 200, sorteamos 1 bolilla. Sea X = el número de la bolilla sorteada Entonces X ⇠ Unif (200) y pX (1) = px (2) = .... = pX (200) = 1 200 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 27 / 52 Histograma de una v.a. Uniforme Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 28 / 52 Distribución y variable aleatoria Poisson. Definición: Una variable aleatoria discreta X se llama Poisson si su soporte X es el conjunto infinito numerable {0, 1, 2, ...} y su función de probabilidad de masa es pX (k) = e�llk k ! para todo k 2 {0, 1, 2, ...} y l > 0 dado Su distribución se llama Poisson con parámetro l. La abreviatura X ⇠ Pois (l) quiere decir que X es una v.a. Poisson cuya distribución tiene parámetro l. Lo leemos como ”X tiene distribución Poisson con parámetro l” ó ”X sigue una distribución Poisson con parámetro l” Rotnitzky, Ferrari, Cersosimo, Smucler (UniversidadTorcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 29 / 52 Motivación de la v.a. Poisson La v.a. Poisson se usa para modelar aproximadamente situaciones en las que X cuenta el número de éxitos en un número n MUY grande de ensayos Bernoulli independientes (o debilmente dependientes) que ocurren durante un peŕıodo fijo de tiempo, donde la probabilidad de éxito de cada ensayo es muy pequeña. Ejemplos: 1 X es el número de emails que recibirás mañana entre las 9 y las 10 de la mañana 2 X es el número de clientes que solicitarán atención de un asesor bancario entre las 14 y 14:30 hs mañana 3 X es el número de visitantes a la página web de Despegar.com durante todo el dia de mañana Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 30 / 52 Interpretación del parámetro de la distribución Poisson Más adelante haremos un desarrollo formal que nos permitirá interpretar rigurosamente al parámetro l Por el momento, pensá que el parámetro l es la ”tasa de ocurrencia” que esperás para los ”éxitos” en el peŕıodo en cuestión. 1 l = 20 quiere decir que esperarás recibir emails con una tasa de 20 emails por hora. 2 l = 9 quiere decir que esperarás recibir 9 pedidos de asesoramiento bancario por hora. 3 l = 500 quiere decir que esperás que Despegar.com reciba 500 visitas por cada 24 hs. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 31 / 52 Gráficos de la fc de prob. de masa de varias v.a. Poisson Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 32 / 52 Gráficos de la fc de prob. de masa de varias v.a. Poisson Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 33 / 52 Gráficos de la fc de prob. de masa de varias v.a. Poisson Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 34 / 52 Histogramas de varias v.a. Poisson Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 35 / 52 Aproximación de la dist. Binomial por la Poisson Antes dijimos que la v.a. Poisson se usa para modelar aproximadamente situaciones en las que X cuenta el número de éxitos en un número n MUY grande de ensayos Bernoulli independientes (o debilmente dependientes) que ocurren durante un peŕıodo fijo de tiempo, donde la probabilidad de éxito de cada ensayo es muy pequeña. La demostración rigurosa de este resultado está fuera del alcance de este curso, pero podemos hacer una demostración del caso particular en el que los ensayos Bernoulli son i.i.d. Proposición: Si X ⇠ Bin (n, pn) y npn ! n!• l entonces cuando n ! •, pX (x) tiende a la función de prob. de masa de una v.a. Pois(l) . En la práctica, este resultado es muy útil porque nos permite calcular aproximadamente probabilidades Binomiales cuando n es grande y p = P (exito) es muy chica. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 36 / 52 Demostración de la Proposición Haremos la demostración para el caso en que npn = l para todo n. pX (x) = ✓ n x ◆ pxn (1� pn) n�x = n (n� 1) · · · (n� x + 1) x ! ✓ l n ◆x ✓ 1� l n ◆n�x = lx x ! ✓ 1� l n ◆n n (n� 1) · · · (n� x + 1) nx ✓ 1� l n ◆�x La demostración finaliza notando que n (n� 1) · · · (n� x + 1) nx = n n n� 1 n ... n� x + 1 n ! n!• 1 ✓ 1� l n ◆�x ! 1 y ✓ 1� l n ◆n ! e�l Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 37 / 52 Aproximación de Binomial por Poisson: ejemplo Suponé que cada diez minutos, 10,000,000 de personas deciden independientemente si visitar o no el sitio de Despegar.com. Suponé que la probabilidad de que una persona visite el sitio en un peŕıodo de 10 minutos es 2/10,000,000. Calculá la probabilidad de que por lo menos tres personas visiten el sitio en los próximos 10 minutos el sitio Solución: Sea X = número de personas que visitará el sitio en los próximos 10 minutos. Entonces X ⇠ Bin (n, p) con n = 10, 000, 000 y p = 2/10, 000, 000. Luego, np = 2 y como n es grande y p es muy chico, podemos usar la aproximacion Pois (2) . Por lo tanto P (X � 3) = 1� P (X 2) ⇡ 1� e�2 � e�22� e�222/2 = 0.32 Para apreciar la utilidad de la aproximación observá que el cálculo preciso de la prob. solicitada es 1� P (X 2) = 1� ✓ n 0 ◆ pn (1� p)0 � ✓ n 1 ◆ pn�1 (1� p)1 � ✓ n 2 ◆ pn�2 (1� p)2 � 1����Y10�7� 10 7 que� involucra�cálculos�enormes�como� ,�etc. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 38 / 52 Cálculo de probabilidades Poisson en R En R podes calcular directamente pX (x) y FX (x) para v.a. Poisson con los siguientes comandos dpois(x,l) : calcula la fc. de prob. de masa pX (x) evaluada en x para una v.a. Pois(l) ppois(x,l) : calcula la fc de dist. acumulada FX (x) evaluada en x para una v.a. Pois(l) Por ejemplo, para el problema de la filmina anterior podŕıamos haber usado 1- ppois(2,2) [1] 0.3233236 Recordá tambien que en R el comando pbinom(x,n,p) calcula la fc de dist. acumulada FX (x) de una v.a. Bin(n, p) Por ejemplo, para el problema de la filmina anterior podŕıamos haber usado 1- pbinom(2,10000000,2/10000000) [1] 0.3233236 Fijate que la aproximación Poisson es excelente, las probabilidades coinciden hasta por lo menos el 7mo d́ıgito decimal. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 39 / 52 Binomial(n,2/n) vs Poisson(2) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 40 / 52 Funciones de variables aleatorias Muchas veces ocurre que uno sabe como calcular la distribución de una v.a. X , pero en realidad uno está interesado en calcular la distribución de Y = g (X ) . Ejemplo: Vas a apostar 1 peso al colorado en la ruleta. Si acertás, ganás un peso, si no, perdés el peso que apostaste. La ruleta tiene 38 slots, 18 negros, 18 rojos y dos sin color (corresponden al 0 y 00). La probabilidad de que aciertes en un tiro es 18/38. Suponé que jugás 10 veces. Llamá Y a la ”ganancia” al final de las 10 jugadas, donde una ganancia negativa significa una pérdida. ¿Cuál es la fc de prob. de masa de Y ? Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 45 / 52 Ganancia en la ruleta Solución: si X cuenta el número de veces que acertaste, entonces ganaste X pesos pero perdiste 10� X pesos, asi que tu ganancia es Y = X � (10� X ) = 2X � 10 = g (X ) Entonces, P (Y = g (x)) = P (X = x) Equivalentemente pY (y) = pX (x) si y = g (x) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 46 / 52 Función de prob. de masa para la ganancia en la ruleta En nuestro problema X ⇠ Bin (10, 18/38), entonces Fc. de prob. de masa para el número de aciertos x pX (x) 0 � 20 38 �10 1 (10 1 ) 18 38 � 20 38 �9 2 (10 2 ) � 18 38 �2 � 20 38 �8 ... 8 (10 8 ) � 18 38 �8 � 20 38 �2 9 (10 9 ) � 18 38 �9 20 38 10 � 18 38 �10 Fc. de prob. de masa para la ganancia y = g (x) pY (y ) -10 � 20 38 �10 -8 (10 1 ) 18 38 � 20 38 �9 -6 (10 2 ) � 18 38 �2 � 20 38 �8 ... 6 (10 8 ) � 18 38 �8� 20 38 �2 8 (10 9 ) � 18 38 �9 20 38 10 � 18 38 �10 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 47 / 52 Función de prob. de masa para la ganancia en la ruleta Observá que la probabilidad de pérdida es mayor que la probabilidad de ganancia: P (Y < 0) > P (Y > 0) . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 48 / 52 Funciones de variables aleatorias, otro ejemplo Ejemplo: Recordá el problema de la sobreventa de pasajes. Y = número de pasajeros que se presentan el d́ıa del vuelo. Y ⇠ Bin (110, 0.9). El número de asientos ocupados es Z = min {100,Y } Ahora Z = z , Y = z si 0 z < 100 porque cuando z < 100 se ocupan exactamente z asientos si y solo si se presentan exactamente z pasajeros. Entonces, P (Z = z) = P (Y = z) para todo 0 z < 100 Por otro lado, Z = 100 , 100 Y 110 porque se ocupan 100 asientos si se presentan por lo menos 100 pasajeros. Entonces, P (Z = 100) = P (100 Y 110) y por lo tanto P (Z = 100) = P (Y = 100) + P (Y = 101) + ...+ P (Y = 110) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 49 / 52 Funciones de variables aleatorias, otro ejemplo La función de probabilidad de masa de la v.a. que registra el número de asientos ocupados es pZ (z) = 8 < : (110z )0.9 z (1� 0.9)110�z si 0 z < 100 Â110m=100 ( 110 m )0.9 m (1� 0.9)110�m si z = 100 Fc. de prob. de masa para el número de presencias y pY (y ) 0 0.1 110 1 (110 1 )0.9 (0.1)109 . . . . . . 99 (110 99 ) (0.9)99 (0.1)101 100 (110 100 ) (0.9)100 (0.1)10 . . . 110 (0.9)110 Fc. de prob. de masa para el número de asientos ocupados z = g (y ) pz (z) 0 0.1 110 1 (110 1 )0.9 (0.1)109 . . . . . . 99 (110 99 ) (0.9)99 (0.1)101 100 (110 100 ) (0.9)100 (0.1)10 +...+ (0.9)110 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 50 / 52 Fc. de prob. de masa del número de asientos ocupados Z La función de probabilidad de masa de la v.a. que registra el número de asientos ocupados es pZ (z) = 8 < : (110z )0.9 z (1� 0.9)110�z si 0 z < 100 Â110m=100 ( 110 m )0.9 m (1� 0.9)110�m si z = 100 Su gráfico es Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 51 / 52 Fórmula de cambio de variable Si te fijás como calculamos la fc de prob. de masa de las nuevas v.a. en los ejemplos anteriores te convencerás de la validez de la próxima proposición que enunciaremos sin demostrar. Proposición: Si X es una v.a. discreta con soporte X y g : R ! R entonces, Y = g (X ) es una v.a. discreta con soporte Y = {y : y = g (x) para algún x 2 X} y con función de probabilidad de masa pY (y) =  x2X :g (x)=y pX (x) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 52 / 52
Compartir