Slides 5 - Variables Aleatorias Discretas

Estadística

•
SIN SIGLA

tecnologo
15/10/2023
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Estadística

5644 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
Introducción a la Estad́ıstica
(Cap. 2, secciones 1 y 2 del Bertsekas)
Variables Aleatorias Discretas
Rotnitzky, Ferrari, Cersosimo, Smucler
Universidad Torcuato Di Tella
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 1 / 52
 
Variabla Aleatoria. Motivación
Considerá el ejemplo de los n = 110 pasajes vendidos para un vuelo con 100
asientos.
Suponé que
operar�el�avión�cuesta� ������Eólares�
el�precio�de�cada�pasaje�es�500�dólares
�MPT�QBTBKFT�TPO�OP�SFFNCPMTBCMFT�
el�costo�por�cada�pasajero�que�se�queda�sin�volar�es�1100�dólares
Suponé que w = (a1, ...., a110) denota un posible resultado de quienes se presentan
el d́ıa del vuelo, donde
aj = 1 si el pasajero j se presentó el d́ıa del vuelo, y aj = 0 de lo contrario.
La ganancia -o pérdida- neta del vuelo es un valor numérico incierto que depende
del resultado w de los 110 ensayos Bernoulli.
O sea, es una función con dominio el espacio muestral
W = {w = (a1, ...., a110) : ai = 0 ó 1}
e imágen los números reales R
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 2 / 52
Variable Aleatoria. Definición
Definición: Una variable aleatoria es una función del espacio muestral W a
los numeros reales R.
Es costumbre, aunque no obligatorio, denotar a las variables aleatorias con
las últimas letras del abecedario en mayúscula:
W ,X ,Y ,Z
Ojo! No te confundas, una variable aleatoria no es una variable sino una
función
El adjetivo aleatoria indica que el valor que toma la función es incierto hasta
que no se revela el resultado w del experimento.
Por ejemplo: la ganancia neta del vuelo es desconocida hasta no saber
quienes se presentan el d́ıa del vuelo.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 3 / 52
Variable Aleatoria. Aclaración
Ojo! Cuando escribimos X (con mayúscula) estamos denotando a una
función
X : W ! R
En cambio, cuando escribimos f (x) , x (con minúscula) es el argumento de
la función f .
Si f : R ! R entonces Y = f (X ) denota la v.a. que se obtiene de la
composición de funciones
f � X : W ! R
O sea, para cada w 2 W,
Y (w) = f (X (w))
Otra aclaración notacional:
X = x es una abreviatura para el evento {w 2 W : X (w) = x}
a  X  b es una abreviatura para el evento {w 2 W : a  X (w)  b}
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 4 / 52
Variabla Aleatoria. Ejemplo
Veamos como se define la variable aleatoria ”ganancia del vuelo”.
El número de pasajeros que se presentan el d́ıa del vuelo es
Y (w) =
110
Â
i=1
ai
El costo de operar el avión es 40000 dolares.
Número de pasajeros que se quedan sin viajar
S = max {0,Y � 100} .
La ganancia neta del vuelo es la variable aleatoria
X = 110⇥ 500� 40000� S ⇥ 1100
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 5 / 52
Variable Aleatoria discreta
Hay dos grandes clases de variables aleatorias, las discretas y las continuas.
Por ahora definiremos y estudiaremos las v.a. discretas; más adelante, las
v.a. continuas.
Definición: una variable aleatoria X es discreta si existe un conjunto X
finito o infinito numerable tal que X (w) 2 X para todo w en el espacio
muestral W.
Cuando para todo x 2 X se verifica que P (X = x) 6= 0, entonces al
conjunto X se lo llama soporte de la variable aleatoria X .
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 6 / 52
Distribución de una variable aleatoria
T́ıpicamente,�cuando�definimos�una�variable�aleatoria�X� es�porque�nos� interesa
averiguar� la�probabilidad� de�eventos�como�X�=�x� para�algún�x� ó�a��X��b�para
algunos�a�y�b� incluyendo�a�=��•�y�b�=�•.
Por�ejemplo,�podemos�estar� interesados�en�averiguar� la�probabilidad�de�que� la
ganancia�del�vuelo�sea�no�menor�a�9000�dolares:
P�(X���9000)
&M�OVNFSP�EF�BTJFOUPT�WBDJPT�FT�8�NBY	����:
�
��&OUPODFT
�podemos�querer�calcular�
la�probabilidad�de�queden�vaćıos�entre�tres�y�cinco�asientos:
P�(3��W��5)
Conocer� la�aśı� llamada� distribución�de�una�variable�aleatoria�X� nos�permite
calcular� la�probabilidad�de�cualquier�evento�de� la� forma�X�=�x� ó�a��X��b
Hay�muchas� formas�equivalentes�de�definir� la�distribución�de�una�v.a.
Para�v.a.� discretas,� la� forma�más�natural�es�a� través�de� la�asi� llamada� función�de
probabilidad�de�masa,� también� llamada� función�de�densidad�discreta
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 7 / 52
Función de probabilidad de masa ó función de densidad
discreta.
Definición: la función de probabilidad de masa ó función de densidad
discreta de una v.a. discreta X es la función
pX : R ! [0, 1]
definida como
pX (x) = P (X = x)
Observá que pX (x) 6= 0 si y sólo si x está en el soporte de X .
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 8 / 52
Propiedades de la función de probabilidad de masa ó
función de densidad discreta.
Proposición: Si X es una v.a. discreta, entonces
1 pX (x) � 0
2 si X = {x1, x2..., xn} entonces
n
Â
j=1
pX (xj ) = 1
3 si X = {x1, x2...}
•
Â
j=1
pX (xj ) = 1
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 9 / 52
Propiedades de la función de probabilidad de masa ó
función de densidad discreta.
Demostración de la proposición:
1 El inciso 1 es trivial pues pX (x) = P (X = x) y P es una probabilidad.
2 si el soporte de X es X = {x1, x2..., xn} entonces
1 = P (X = x1 ó X = x2 2 ó X = x3 ... ó X = xn)
=
n
Â
j=1
pX (xj )
porque los eventos ”X = x1”, ”X = x2”, ..., ”X = xn” son mutuamente
excluyentes.
3 Se demuestra de forma análoga al inciso (2)
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 10 / 52
Función de probabilidad de masa: ejemplo
Recordá que cuando 110 personas no relacionadas entre śı compraron pasaje para
un vuelo, que cada uno se presente o no el d́ıa del vuelo es un ensayo Bernoulli.
Luego, si la probabilidad de que cada pasajero se presente el d́ıa del vuelo es 0.9,
la probabilidad de que se presenten y pasajeros el d́ıa del vuelo es:
P (y éxitos en 110 ensayos Bernoulli i.i.d.) =
✓
110
y
◆
0.9y (1� 0.9)110�y
Por lo tanto, si Y es la variable aleatoria que representa el número de pasajeros
que se presentan el d́ıa del vuelo, entonces su función de probabilidad de masa es
pY (y ) =
✓
110
y
◆
0.9y (1� 0.9)110�y
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 11 / 52
Gráfico de la función de probabilidad de masa
Este es el gráfico de la función de probabilidad de masa
pY (y ) =
✓
110
y
◆
0.9
y (1� 0.9)110�y
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 12 / 52
Cálculo de probabilidades a partir de la función de
probabilidad de masa
Si conozco la función pX (·) , entonces puedo calcular, por ejemplo, para
números cualesquiera a y b
P (a < X  b) = P ( X = a+ 1 ó X = a+ 2 ó... ó X = b)
= P (X = a+ 1) + ...+ P ( X = b)
= pX (a+ 1) + ...+ pX (b)
=
b
Â
x=a+1
pX (x)
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 13 / 52
Función de distribuciónacumulada
Como hemos visto en la filmina anterior, el cálculo de P (a < X  b)
requiere la suma de muchos términos
La función de distribución acumulada nos permite hacer ese cálculo con sólo
calcular una resta.
Definición: la función de distribución acumulada de una variable aleatoria
X se define como
FX (x) = P (X  x)
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 14 / 52
Función de distribución acumulada
Una vez que conocemos la función de distribución acumulada, podemos
calcular P (a < X  b) con solo computar una resta, como lo indica la
siguiente proposición.
Proposición : sea FX (x) la función de distribución acumulada de una v.a.
discreta X . Entonces
1 P (a < X  b) = FX (b)� FX (a)
2 P (X > a) = 1� FX (a)
3 P (a  X  b) = FX (b)� FX (a) + pX (a)
4 P (X � a) = 1� FX (a) + pX (a)
5 P (X = a) =salto de FX en a = FX (a)� FX (a�)
donde FX
�
a�
�
= limx%a FX (x) es el ĺımite por la izquierda
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 15 / 52
Función de distribución acumulada
Toda función de distribución acumulada FX (x) de una v.a. discreta X
cumple las siguientes propiedades:
1 Es constante de a trozos, con saltos sólo en los valores x del soporte de
X
2 Es continua a derecha: limx&a FX (x) = FX (a)
3 limx!�• FX (x) = 0 y limx!+• FX (x) = 1
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 16 / 52
Ejemplo: Función de dist. acumulada
Supone que X es la v.a. que cuenta los exitos en 4 ensayos Bernoulli i.i.d.
con p = 0.5.
El gráfico de FX es:
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 17 / 52
Distribuciones y variables aleatorias con nombre propio.
Hay algunas distribuciones que aparecen tan frecuentemente en probabilidad
y en anaĺısis estad́ısticos que han sido merecedoras de recibir un nombre
propio.
Acá veremos 4 de estas distribuciones para v.a. discretas: Bernoulli,
Binomial, Uniforme y Poisson
Las distribuciones Bernoulli, Binomial y Uniforme te resultarán fáciles de
entender porque verás que en realidad ya las hemos derivado, aunque sin
darles nombre propio!
La distribución Poisson es más complicada y la discutiremos hacia el final de
las filminas.
En el camino, definiremos el importante concepto gráfico de histograma de
una v.a. discreta.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 18 / 52
Distribución y variable aleatoria Bernoulli.
Definición: Una variable aleatoria X se llama Bernoulli si su soporte es
X = {0, 1}. Su distribución se llama Bernoulli. A p = pX (1) se lo llama
parámetro de la distribución.
La abreviatura
X ⇠ Bernoulli (p)
quiere decir que X es una v.a. Bernoulli cuya distribución tiene parámetro
p. Lo leemos como ”X tiene distribución Bernoulli con parámetro p” ó ”X
sigue una distribución Bernoulli con parámetro p”
La v.a. Bernoulli aparece en cualquier ensayo Bernoulli en la que un éxito
cuenta 1 y un fracaso cuenta 0.
Por ejemplo: la v.a. X1 definida como X1 = 1 si el 1er pasajero se
presentó al vuelo y X1 = 0 si no se presentó, es una v.a. Bernoulli
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 19 / 52
Distribución y variable aleatoria Binomial
Definición: Una variable aleatoria X se llama Binomial con parámetros n y
p si cuantifica el número de éxitos en n ensayos Bernoulli independientes e
igualmente distribuidos con P (éxito) = p. Su distribución se llama
Binomial y esta definida por la fórmula
pX (x) =
✓
n
x
◆
px (1� p)n�x
La abreviatura
X ⇠ Bin (n, p)
quiere decir que X es una v.a. Binomial cuya distribución tiene parámetros
n, p. Lo leemos como ”X tiene distribución Binomial con parámetros n y p”
ó ”X sigue una distribución Binomial con parámetros n y p”
La variable Y definida en filminas anteriores como el número de pasajeros
que se presentaron al vuelo es una v.a. Binomial con parámetros n = 110 y
p = 0.9
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 20 / 52
Histograma de una variable aleatoria discreta
Un histograma de probabilidad de una v.a. discreta X es un gráfico de
barras, tal que:
1 los posibles valores x1, x2, ... de X están ubicados sobre el eje horizontal
2 sobre cada x en el soporte de X , dibujamos una barra rectangular, con
base�de�ancho�i gual�a�BMHVO�I���y�altura�i gual�a�pX�(x)�I�
Ejemplo:�el�histograma�de�X�⇠�Bin�(3,�0.5)�DVBOEP�I���es
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 21 / 52
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 22 / 52
Propiedades del histograma
El área total ocupada por todas las barras es igual a 1
El área ocupada por la barra sobre un valor x es igual a P (X = x)
El área ocupada por las barras de todos los x tales que a  x  b es igual a
P (a  X  b)
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 23 / 52
Ejercicio
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 24 / 52
Ejercicio
Inspeccionando el histograma, calculá aproximadamente
1 P (X = 4)
2 P (X < 4)
3 P (X > 5)
4 P (2.5  X < 6.5)
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 25 / 52
Distribución y variable aleatoria Uniforme.
Definición: Una variable aleatoria discreta X se llama Uniforme si su
soporte X es finito y todos los eventos X = x para x 2 X son
equiprobables. Su distribución se llama Uniforme con parámetro n = #X .
Su función de probabilidad de masa satisface
pX (x) =
1
#X para todo x 2 X
La abreviatura
X ⇠ Unif (n)
quiere decir que X es una v.a. Uniforme cuya distribución tiene parámetro
n. Lo leemos como ”X tiene distribución Uniforme con parámetro n” ó ”X
sigue una distribución Uniforme con parámetro n”
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 26 / 52
Distribución y variable aleatoria Uniforme: ejemplo.
De un bolillero con bolillas idénticas numeradas de 1 a 200, sorteamos 1
bolilla.
Sea
X = el número de la bolilla sorteada
Entonces
X ⇠ Unif (200)
y
pX (1) = px (2) = .... = pX (200) =
1
200
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 27 / 52
Histograma de una v.a. Uniforme
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 28 / 52
Distribución y variable aleatoria Poisson.
Definición: Una variable aleatoria discreta X se llama Poisson si su soporte
X es el conjunto infinito numerable {0, 1, 2, ...} y su función de probabilidad
de masa es
pX (k) =
e�llk
k !
para todo k 2 {0, 1, 2, ...} y l > 0 dado
Su distribución se llama Poisson con parámetro l.
La abreviatura
X ⇠ Pois (l)
quiere decir que X es una v.a. Poisson cuya distribución tiene parámetro l.
Lo leemos como ”X tiene distribución Poisson con parámetro l” ó ”X
sigue una distribución Poisson con parámetro l”
Rotnitzky, Ferrari, Cersosimo, Smucler (UniversidadTorcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 29 / 52
Motivación de la v.a. Poisson
La v.a. Poisson se usa para modelar aproximadamente situaciones en las que X
cuenta el número de éxitos en un número n MUY grande de ensayos Bernoulli
independientes (o debilmente dependientes) que ocurren durante un peŕıodo fijo de
tiempo, donde la probabilidad de éxito de cada ensayo es muy pequeña.
Ejemplos:
1 X es el número de emails que recibirás mañana entre las 9 y las 10 de la
mañana
2 X es el número de clientes que solicitarán atención de un asesor bancario
entre las 14 y 14:30 hs mañana
3 X es el número de visitantes a la página web de Despegar.com durante todo
el dia de mañana
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 30 / 52
Interpretación del parámetro de la distribución Poisson
Más adelante haremos un desarrollo formal que nos permitirá interpretar
rigurosamente al parámetro l
Por el momento, pensá que el parámetro l es la ”tasa de ocurrencia” que esperás
para los ”éxitos” en el peŕıodo en cuestión.
1 l = 20 quiere decir que esperarás recibir emails con una tasa de 20 emails
por hora.
2 l = 9 quiere decir que esperarás recibir 9 pedidos de asesoramiento bancario
por hora.
3 l = 500 quiere decir que esperás que Despegar.com reciba 500 visitas por
cada 24 hs.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 31 / 52
Gráficos de la fc de prob. de masa de varias v.a. Poisson
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 32 / 52
Gráficos de la fc de prob. de masa de varias v.a. Poisson
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 33 / 52
Gráficos de la fc de prob. de masa de varias v.a. Poisson
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 34 / 52
Histogramas de varias v.a. Poisson
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 35 / 52
Aproximación de la dist. Binomial por la Poisson
Antes dijimos que la v.a. Poisson se usa para modelar aproximadamente
situaciones en las que X cuenta el número de éxitos en un número n MUY grande
de ensayos Bernoulli independientes (o debilmente dependientes) que ocurren
durante un peŕıodo fijo de tiempo, donde la probabilidad de éxito de cada ensayo
es muy pequeña.
La demostración rigurosa de este resultado está fuera del alcance de este curso,
pero podemos hacer una demostración del caso particular en el que los ensayos
Bernoulli son i.i.d.
Proposición: Si X ⇠ Bin (n, pn) y npn !
n!•
l entonces cuando n ! •, pX (x)
tiende a la función de prob. de masa de una v.a. Pois(l) .
En la práctica, este resultado es muy útil porque nos permite calcular
aproximadamente probabilidades Binomiales cuando n es grande y p = P (exito) es
muy chica.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 36 / 52
Demostración de la Proposición
Haremos la demostración para el caso en que npn = l para todo n.
pX (x) =
✓
n
x
◆
pxn (1� pn)
n�x
=
n (n� 1) · · · (n� x + 1)
x !
✓
l
n
◆x ✓
1� l
n
◆n�x
=
lx
x !
✓
1� l
n
◆n n (n� 1) · · · (n� x + 1)
nx
✓
1� l
n
◆�x
La demostración finaliza notando que
n (n� 1) · · · (n� x + 1)
nx
=
n
n
n� 1
n
...
n� x + 1
n
!
n!•
1
✓
1� l
n
◆�x
! 1
y ✓
1� l
n
◆n
! e�l
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 37 / 52
Aproximación de Binomial por Poisson: ejemplo
Suponé que cada diez minutos, 10,000,000 de personas deciden
independientemente si visitar o no el sitio de Despegar.com. Suponé que la
probabilidad de que una persona visite el sitio en un peŕıodo de 10 minutos es
2/10,000,000. Calculá la probabilidad de que por lo menos tres personas visiten el
sitio en los próximos 10 minutos el sitio
Solución: Sea X = número de personas que visitará el sitio en los próximos 10
minutos. Entonces X ⇠ Bin (n, p) con n = 10, 000, 000 y p = 2/10, 000, 000.
Luego, np = 2 y como n es grande y p es muy chico, podemos usar la
aproximacion Pois (2) . Por lo tanto
P (X � 3) = 1� P (X  2)
⇡ 1� e�2 � e�22� e�222/2
= 0.32
Para apreciar la utilidad de la aproximación observá que el cálculo preciso de la
prob. solicitada es
1� P (X  2) = 1�
✓
n
0
◆
pn (1� p)0 �
✓
n
1
◆
pn�1 (1� p)1 �
✓
n
2
◆
pn�2 (1� p)2
�
1����Y10�7�
10
7
que� involucra�cálculos�enormes�como� ,�etc.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 38 / 52
Cálculo de probabilidades Poisson en R
En R podes calcular directamente pX (x) y FX (x) para v.a. Poisson con los
siguientes comandos
dpois(x,l) : calcula la fc. de prob. de masa pX (x) evaluada en x para una v.a.
Pois(l)
ppois(x,l) : calcula la fc de dist. acumulada FX (x) evaluada en x para una
v.a. Pois(l)
Por ejemplo, para el problema de la filmina anterior podŕıamos haber usado
1- ppois(2,2)
[1] 0.3233236
Recordá tambien que en R el comando pbinom(x,n,p) calcula la fc de dist.
acumulada FX (x) de una v.a. Bin(n, p)
Por ejemplo, para el problema de la filmina anterior podŕıamos haber usado
1- pbinom(2,10000000,2/10000000)
[1] 0.3233236
Fijate que la aproximación Poisson es excelente, las probabilidades coinciden hasta
por lo menos el 7mo d́ıgito decimal.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 39 / 52
Binomial(n,2/n) vs Poisson(2)
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 40 / 52
Funciones de variables aleatorias
Muchas veces ocurre que uno sabe como calcular la distribución de una v.a.
X , pero en realidad uno está interesado en calcular la distribución de
Y = g (X ) .
Ejemplo: Vas a apostar 1 peso al colorado en la ruleta. Si acertás, ganás un
peso, si no, perdés el peso que apostaste.
La ruleta tiene 38 slots, 18 negros, 18 rojos y dos sin color (corresponden al
0 y 00).
La probabilidad de que aciertes en un tiro es 18/38.
Suponé que jugás 10 veces. Llamá Y a la ”ganancia” al final de las 10
jugadas, donde una ganancia negativa significa una pérdida.
¿Cuál es la fc de prob. de masa de Y ?
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 45 / 52
Ganancia en la ruleta
Solución: si X cuenta el número de veces que acertaste, entonces ganaste
X pesos pero perdiste 10� X pesos, asi que tu ganancia es
Y = X � (10� X )
= 2X � 10
= g (X )
Entonces,
P (Y = g (x)) = P (X = x)
Equivalentemente
pY (y) = pX (x) si y = g (x)
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 46 / 52
Función de prob. de masa para la ganancia en la ruleta
En nuestro problema X ⇠ Bin (10, 18/38), entonces
Fc. de prob. de masa
para el número de aciertos
x pX (x)
0
�
20
38
�10
1 (10
1
) 18
38
�
20
38
�9
2 (10
2
)
�
18
38
�2 � 20
38
�8
...
8 (10
8
)
�
18
38
�8 � 20
38
�2
9 (10
9
)
�
18
38
�9 20
38
10
�
18
38
�10
Fc. de prob. de masa
para la ganancia
y = g (x) pY (y )
-10
�
20
38
�10
-8 (10
1
) 18
38
�
20
38
�9
-6 (10
2
)
�
18
38
�2 � 20
38
�8
...
6 (10
8
)
�
18
38
�8� 20
38
�2
8 (10
9
)
�
18
38
�9 20
38
10
�
18
38
�10
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 47 / 52
Función de prob. de masa para la ganancia en la ruleta
Observá que la probabilidad de pérdida es mayor que la probabilidad de ganancia:
P (Y < 0) > P (Y > 0) .
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 48 / 52
Funciones de variables aleatorias, otro ejemplo
Ejemplo: Recordá el problema de la sobreventa de pasajes.
Y = número de pasajeros que se presentan el d́ıa del vuelo. Y ⇠ Bin (110, 0.9).
El número de asientos ocupados es
Z = min {100,Y }
Ahora
Z = z , Y = z si 0  z < 100
porque cuando z < 100 se ocupan exactamente z asientos si y solo si se presentan
exactamente z pasajeros. Entonces,
P (Z = z) = P (Y = z) para todo 0  z < 100
Por otro lado,
Z = 100 , 100  Y  110
porque se ocupan 100 asientos si se presentan por lo menos 100 pasajeros.
Entonces, P (Z = 100) = P (100  Y  110) y por lo tanto
P (Z = 100) = P (Y = 100) + P (Y = 101) + ...+ P (Y = 110)
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 49 / 52
Funciones de variables aleatorias, otro ejemplo
La función de probabilidad de masa de la v.a. que registra el número de asientos
ocupados es
pZ (z) =
8
<
:
(110z )0.9
z (1� 0.9)110�z si 0  z < 100
Â110m=100 (
110
m )0.9
m (1� 0.9)110�m si z = 100
Fc. de prob. de masa
para el número de presencias
y pY (y )
0 0.1
110
1 (110
1
)0.9 (0.1)109
.
.
.
.
.
.
99 (110
99
) (0.9)99 (0.1)101
100 (110
100
) (0.9)100 (0.1)10
.
.
.
110 (0.9)110
Fc. de prob. de masa
para el número de asientos ocupados
z = g (y ) pz (z)
0 0.1
110
1 (110
1
)0.9 (0.1)109
.
.
.
.
.
.
99 (110
99
) (0.9)99 (0.1)101
100 (110
100
) (0.9)100 (0.1)10 +...+ (0.9)110
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 50 / 52
Fc. de prob. de masa del número de asientos ocupados Z
La función de probabilidad de masa de la v.a. que registra el número de asientos
ocupados es
pZ (z) =
8
<
:
(110z )0.9
z (1� 0.9)110�z si 0  z < 100
Â110m=100 (
110
m )0.9
m (1� 0.9)110�m si z = 100
Su gráfico es
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 51 / 52
Fórmula de cambio de variable
Si te fijás como calculamos la fc de prob. de masa de las nuevas v.a. en los
ejemplos anteriores te convencerás de la validez de la próxima proposición
que enunciaremos sin demostrar.
Proposición: Si X es una v.a. discreta con soporte X y g : R ! R
entonces, Y = g (X ) es una v.a. discreta con soporte
Y = {y : y = g (x) para algún x 2 X}
y con función de probabilidad de masa
pY (y) = Â
x2X :g (x)=y
pX (x)
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducción a la Estad́ıstica(Cap. 2, secciones 1 y 2 del Bertsekas) 52 / 52