Logo Studenta

Distribuição de Bernoulli e Binomial

¡Estudia con miles de materiales!

Vista previa del material en texto

Lectura 8: Distribución de Bernoulli y binomial
Estadística
Noviembre 21, 2014
1. Distribución de Bernoulli
La distribución de Bernoulli es usada para modelar experimentos con dos posibles resul-
tados: “éxito” y “fracaso”. Como explicamos anteriormente, se codifican con 1 y 0 respecti-
vamente. Esta distribucion se emplea para determinar la probabilidad de realizar X ensayos
para observar el primer éxito.
Definición Distribución de Bernoulli. Una variable aleatoria X tiene una distribución
de Bernoulli con parámetro p, donde 0 ≤ p ≤ 1, si su función de probabilidad de masa está
dada por:
fX (x) = p
x (1− p)1−x , x ∈ {0, 1}
o alternativamente:
fX (1) = P (X = 1) = p y fX (0) = P (X = 0) = 1− p
Ejemplo 1. Si X ∼ Ber(p), pruebe que EX = p y Var (X) = p(1− p).
La distribucion de Bernoulli puede ser usada para determinar la probabilidad de que por
ejemplo una línea de transmisión del sistema de potencia falle cuando la probabilidad de
falla de una línea es pL. Este tipo de análisis fue realizado en nuestra tarea # 3. Allí, cada
1
experimento —el de observar si una línea falla o no— es un ensayo de Bernoulli porque
puede resultar en Y = 1 (éxito) o Y = 0 (fracaso). Por lo tanto, tendríamos que la pmf de Y
sería fY (y) = pyL (1− pL)
1−y con y = 0, 1. Otra manera de expresar lo anterior es decir que
Y ∼ Ber(p).
1.1. Proceso de Bernoulli
Sin embargo, si los ensayos de Bernoulli son repetidos, podemos tener lo que se conoce
como un proceso de Bernoulli [2]. Un proceso de Bernoulli debe cumplir con las siguientes
propiedades:
1. El experimento consiste de ensayos repetidos.
2. Cada ensayo resulta en un éxito o fracaso.
3. La probabilidad de éxito p permanece constante entre ensayos.
4. Los ensayos repetidos son independientes.
Asi que si se tienen NL líneas de transmisión, donde cada una tiene la misma probabilidad
de falla, tenemos un proceso de Bernoulli. Obviamente, si se supone que cada línea de
transmisión falla independiente de las demás, i.e., el éxito o fracaso en la observación de
la línea j no afecta lo que se observe para la línea j + 1.
2. Distribución binomial
Finalmente, cuando se tiene un proceso de Bernoulli de n ensayos, es interesante pre-
guntarse por el número de éxitos que se pueden obtener en el proceso. Por ejemplo, la
probabilidad de que exactamente 2 líneas de transmisión fallen es
(
NL
2
)
p2L (1− pL)
NL−2. Pa-
ra generalizar este resultado (número de éxitos en un proceso de Bernoulli), estudiaremos la
distribución binomial.
2
Definición Distribución Binomial. El número X de éxitos (cada uno con probabilidad
p) en n ensayos de Bernoulli tiene una distribución Binomial, y su función de probabilidad
de masa está dada por:
fX (x) =
(
n
x
)
px (1− p)n−x .
Entonces se dice que X ∼ Bin(n, p).
Ejemplo 2. Un examen de selección múltiple consta de 10 preguntas cada una con 4 opciones
de respuesta. Para pasar el examen se necesita responder correctamente al menos el 60% de
las preguntas. Un estudiante que no está preparado para tomar el examen decide ayudarse
del azar para ganar la prueba. Asuma que la probabilidad de “adivinar” la respuesta es 0.25.
Calcule:
(a) la probabilidad de ganar el examen. Si 52 estudiantes usan la misma estrategia para
responder el examen, cuántos de ellos se espera que ganen el examen?;
(b) la probabilidad de ganar el examen sabiendo que el estudiante ha decidido prepararse
para aumentar a 0.75 la probabilidad de responder correctamente una pregunta. Con-
cluya.
Ejemplo 3. Si X ∼ Bin(n, p), pruebe que EX = np y Var (X) = np(1− p).
La Fig. 1 muestra la pmf para X ∼ Bin(10, p). Observe que los datos se aglomeran en
forma de campana alrededor de la media 10 p, y la distribución presenta asimetría cuando
p 6= 1/2. Cuando p < 1/2, hay asimetría positiva, y cuando p > 1/2, hay asimetría negativa.
El código en R es el siguiente:
x <- c(0, 1)
p <- c(0.1, 0.5, 0.9)
colors <- c("red", "blue", "darkgreen")
labels <- c("p = 0.5", "p = 0.2", "p = 0.8")
y <- 0 : 10
3
0 2 4 6 8 10
0.
00
0.
05
0.
10
0.
15
0.
20
0.
25
0.
30
0.
35
x
P
(X
 =
 x
)
●
●
●
●
●
●
● ● ● ● ●● ● ● ●
●
●
●
●
●
●
●
Distribuciones con n = 10
p = 0.5
p = 0.2
p = 0.8
Figura 1: pmf de X ∼ Bin(10, p)
n = 10 ;
FOR <- c(0.5, 0.2, 0.8)
plot(y, dbinom(y,n,FOR[1]), type = "h", ylim=c(0,.35), lwd = 2, col = colors[1],
xlab = "x", ylab = "P(X = x)")
for (i in 2:3)
{
lines(y, dbinom(y,n,FOR[i]), type = "p", lwd=2, col=colors[i])
}
legend("topright", inset=.05, title= "Distribuciones con n = 10", labels,
lwd = 2, pch = c(0,1,1), lty = c(1,0,0), col = colors)
Y en la Fig. 2 se presenta la cdf de la distribución binomal para diferentes valores de p.
Observe que ésta está definida no solo para el dominio de X sino también para todos los
valores de la recta. El código en R se muestra a continuación:
4
x <- c(0, 1)
p <- c(0.1, 0.5, 0.9)
colors <- c("red", "blue", "darkgreen")
labels <- c("p = 0.5", "p = 0.2", "p = 0.8")
y <- 0 : 10
n = 10 ;
FOR <- c(0.5, 0.2, 0.8)
plot(y, pbinom(y,n,FOR[1]), type = "s", lwd=2, col=colors[1], xlab = "x",
ylab = "P(X <= x)")
for (i in 2:3)
{
lines(y, pbinom(y,n,FOR[i]), type = "s", lwd=2, col=colors[i])
}
legend("bottomright", inset=.05, title= "Distribuciones con n = 10",
labels, lwd=2, lty = c(1,1,1), col = colors)
Ejemplo 4. (Problema 61 del capítulo 3 de [1]). Un estudiante que está tratando de escribir
un ensayo para un curso tiene la opción de dos temas, A y B. Si selecciona el tema A, el
estudiante pedirá dos libros mediante préstamo interbiblioteca, mientras que si selecciona el
tema B, el estudiante pedirá cuatro libros. El estudiante cree que un buen ensayo necesita
recibir y utilizar por lo menos la mitad de los libros pedidos para uno u otro tema seleccio-
nado. Si la probabilidad de que un libro pedido mediante préstamo interbiblioteca llegue a
tiempo es de .9 y los libros llegan independientemente uno de otro:
(a) Qué tema deberá seleccionar el estudiante para incrementar al máximo la probabilidad
de escribir un buen ensayo?
(b) Qué pasa si la probabilidad de que lleguen los libros es de sólo .5 en lugar de .9?
5
0 2 4 6 8 10
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
x
P
(X
 <
=
 x
)
Distribuciones con n = 10
p = 0.5
p = 0.2
p = 0.8
Figura 2: cdf de X ∼ Bin(10, p)
Ejemplo 5. Un sistema de potencia se compone de 80 unidades generadoras. Para cada una
de las tasas de falla (probabilidad de falla) de 6%, 3%, y 1%, calcule la probabilidad de
tener (a) 0, (b) 2, (c) 5, y (d) 10 unidades por fuera de servicio durante el mismo intervalo
de tiempo.
Solución. El enunciado del problema satisface las condiciones del proceso de Bernoulli, por
lo tanto, el número de unidades por fuera de servicio tiene distribución binomial. Por lo tanto,
X ∼ Bin(80, p) con p = 0.06, 0.03, y 0.01. La Fig. 3 muestra las distribuciones resultantes
para diferentes probabilidades de falla p. A continuación se muestran los resultados de las
probabilidades solicitadas:
(a) Con p = 0.06:
P (X = 0) =
(
80
0
)
0,060(0,94)80 = 0,0070
6
0 5 10 15
0.
0
0.
1
0.
2
0.
3
0.
4
x
P
(X
 =
 x
)
●
●
●
●
●
●
●
● ● ● ● ● ● ● ● ●
●
●
●
●
● ●
●
●
●
●
●
● ● ● ● ●
p = 0.01
p = 0.03
p = 0.06
Figura 3: Distribuciones de salida de operacion de la unidad generadora con diferentes p
Con p = 0.03:
P (X = 0) =
(
80
0
)
0,030(0,97)80 = 0,0874
Con p = 0.01:
P (X = 0) =
(
80
0
)
0,010(0,99)80 = 0,4475
(b) Con p = 0.06:
P (X = 2) =
(
80
2
)
0,062(0,94)78 = 0,0912
Con p = 0.03:
P (X = 2) =
(
80
2
)
0,032(0,97)78 = 0,2643
Con p = 0.01:
P (X = 2) =
(
80
2
)
0,012(0,99)78 = 0,1443
7
(c) Con p = 0.06:
P (X = 5) =
(
80
5
)
0,065(0,94)75 = 0,1804
Con p = 0.03:
P (X = 5) =
(
80
5
)
0,035(0,97)75 = 0,0595
Con p = 0.01:
P (X = 5) =
(
80
5
)
0,015(0,99)75 = 0,0011
(d) Con p = 0.06:
P (X = 10) =
(
80
10
)
0,0610(0,94)70 = 0,0131
Con p = 0.03:
P (X = 10) =
(
80
10
)
0,0310(0,97)70 = 0,0001
Con p = 0.01:
P (X =10) =
(
80
10
)
0,0110(0,99)70 = 0,0000
Como se acaba de analizar, cuando la tasa de falla es pequeña, se incrementan las proba-
bilidades para número de fallas pequenos; y cuando la tasa de falla es grande, se incrementan
las probabilidades para número de fallas más altos. Es decir, a medida que la tasa de fallas
aumenta, también se espera un aumento en el número de fallas.
Ejemplo 6. (Ejercicio 112 del capítulo 3 de [1]) Los individuos A y B comienzan a jugar
una secuencia de partidas de ajedrez. Sean pA y pB las probabilidades de que A y B ganen
una partida. Suponga que nunca empatan (pA + pB = 1) y que los resultados de partidas
sucesivas son independientes. Jugarán hasta que uno de ellos gane 10 partidas. Sea X el
número de partidas jugadas.
(a) Obtenga la función de probabilidad de masa (pmf) para X.
(b) Grafique la pmf usando R asumiendo que los individuos tienen la misma probabilidad
de ganar.
8
10 12 14 16 18
0.
00
0.
05
0.
10
0.
15
0.
20
x
P
(X
 =
 x
)
Figura 4: pmf del ejemplo del ajedrez
Solución. (a) Realizado en clase.
(b) El código en R que genera la Fig. 4 es el siguiente:
rm(x,pmf,p)
p = 0.5 ; # probabilidad de que uno de los dos gane una partida individual
x = 10:19
pmf = choose(x-1,x-10) * ((p)*(1-p))^(x-10) * (p^(20-x) + (1-p)^(20-x))
plot(x, pmf, type = "h", lwd=2, ylim=c(0,max(pmf)+0.05), xlab = "x",
ylab = "P(X = x)")
Referencias
[1] Jay L. Devore. Probabilidad y estadistica para ingenieria y ciencias, Octava edicion.
Cengage Learning, Julio 2011.
9
[2] Ronald E. Walpole, Raymond H. Myers, Sharon L. Myers, and Keying Ye. Probability &
statistics for engineers & scientists, 9th ed. Pearson, 2011.
10

Otros materiales

Materiales relacionados

137 pag.
Capitulo 2 y 3

User badge image

Apuntes Generales

222 pag.
113 pag.
Problemario-ProbEstadistica

IPN

User badge image

Todos los Materiales