Resumen variables aleatorias

Probabilidad y Estadística

•
IPN

alternum
31/7/2023
¡Estudia con miles de materiales!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Probabilidad y Estadística

29.778 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
Variables aleatorias
DEFINICIÓN
En temas anteriores, se han estudiado las variables estad́ısticas, que representaban el conjunto
de resultados observados al realizar un experimento aleatorio, presentando para cada valor su
frecuencia, esto es, el número de veces que sucede cada resultado.
Sin embargo, antes de realizar un experimento aleatorio no se puede predecir con exactitud
qué resultados se van a observar, sino que, como mucho, se puede describir cuáles van a ser los
resultados posibles y con qué probabilidad puede ocurrir cada uno de ellos. En muchas ocasiones,
nos interesa más que el resultado completo del experimento, una función real de los resultados.
Tales funciones cuyos valores dependen de los posibles resultados de un experimento aleatorio,
se llaman variables aleatorias. En todo proceso de observación o experimento aleatorio podemos
definir una variable aleatoria asignando a cada resultado del experimento un número:
• si el resultado del experimento es numérico porque contamos o medimos, los posibles valores
de la variable coinciden con los resultados del experimento.
• si el resultado del experimento es cualitativo, hacemos corresponder a cada resultado un
número siguiendo algún criterio.
Una variable aleatoria X es una función definida sobre el espacio muestral Ω (conjunto de los
resultados de un experimento aleatorio) que toma valores en el cuerpo de los números reales IR,
es decir
X : Ω → IR
Una variable aleatoria puede ser discreta o continua según sea el rango de esta aplicación.
• Una variable aleatoria es discreta si toma un número de valores finito o infinito numerable.
Estas variables corresponden a experimentos en los que se cuenta el número de veces que ha
ocurrido un suceso.
• Una variable aleatoria es continua cuando puede tomar cualquier valor de un intervalo real
de la forma (a, b), (a,∞), (−∞, b), (−∞, +∞) o uniones de ellos. Por ejemplo, el peso de
una persona, el tiempo de duración de un suceso, etc.
VARIABLES ALEATORIAS DISCRETAS
Para la descripción de una variable aleatoria discreta, se especifican los posibles valores de la
variable con sus respectivas probabilidades.
Sea X una variable aleatoria que toma valores x1, x2, . . . , xn, . . .. Entenderemos por P (X = xi)
como la probabilidad del suceso
X−1(xi) = {w ∈ Ω : X(w) = xi} = A ∈ Q.
Por ejemplo, en el experimento consistente en lanzar dos monedas, el espacio muestral es
Ω = {(c, c), (c, f), (f, c), (f, f)}, donde c representa cara y f representa cruz. Sobre este espacio
se puede definir la función X : Ω → IR dada por X(w) = ”número de caras que aparecen”. Ésta
es una variable aleatoria discreta, ya que toma los valores
X(f, f) = 0; X(c, f) = X(f, c) = 1; X(c, c) = 2
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 1
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
y las probabilidades con que toma estos valores serán
P (X = 0) =
1
4
; P (X = 1) =
2
4
; P (X = 2) =
1
4
.
La tabla formada por los valores que toma la variable junto con sus probabilidades, recibe el
nombre de distribución o función de probabilidad de la variable.
Muchas veces interesa conocer con qué probabilidad una variable aleatoria toma valores que no
sobrepasan un determinado número real x, es decir, la probabilidad acumulada de que la variable
tome valores inferiores a ese x.
La función de distribución de una variable aleatoria discreta X se define por
F (x) = P (X ≤ x) =
∑
xi≤x
P (X = xi)
Caracteŕısticas de la función de distribución:
• F (x) está definida para todos los números reales.
• 0 ≤ F (x) ≤ 1, puesto que está definida a través de una probabilidad.
• lim
x→−∞
F (x) = 0
• lim
x→∞
F (x) = 1
• Gráficamente, F (x) es una función escalonada(constante a trozos), cuyos saltos se producen
en los valores que toma la variable.
La función de distribución para la variable X=”número de caras que aparecen al lanzar dos
veces una moneda” es:
F (x) =









0 si x < 0
1/4 si 0 ≤ x < 1
3/4 si 1 ≤ x < 2
1 si x ≥ 2
En ocasiones, resulta cómodo utilizar la función de distribución para el cálculo de probabili-
dades. Analizemos distintos casos:
• P (X ≤ x) = F (x), por definición.
• P (X > x) = 1 − P (X ≤ x) = 1 − F (x)
• Si consideramos n, m ∈ IN, valores que toma la variable X, se verifica
P (n < X ≤ m) = P (X ≤ m) − P (X ≤ n) = F (m) − F (n)
• Como P (n ≤ X ≤ m) = P (n − 1 < X ≤ m) = F (m) − F (n − 1).
• Para k ∈ IN cualquiera de los valores de la variable, se tiene
P (X = k) = P (k ≤ X ≤ k) = P (k − 1 < X ≤ k) = F (k) − F (k − 1)
La función de probabilidad de una variable aleatoria discreta es un modelo teórico de la dis-
tribución de frecuencia relativa de los resultados de un experimento aleatorio. Por tanto, se
pueden describir los datos del experimento con medidas descriptivas numéricas similares a las que
se trataron en Estad́ıstica Descriptiva.
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 2
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
Sea X una variable aleatoria discreta que toma valores x1, x2, . . . , xn, . . .. El valor esperado o
esperanza matemática es la medida de centralización más utilizada y se obtiene promediando cada
posible valor por su probabilidad.
µ = E(X) =
∑
i
xiP (X = xi)
donde el sumatorio va extendido a todos los posibles valores que tome la variable.
Asimismo, se define la varianza como
σ2
X
=
∑
i
(xi − µ)2P (X = xi) =
∑
i
x2
i
P (X = xi) − µ2
Igual que en el caso de Estad́ıstica Descriptiva, se define la desviación t́ıpica como la ráız
cuadrada positiva de la varianza.
VARIABLES ALEATORIAS CONTINUAS
En las variable continuas, hay que observar que la probabilidad de que la variable tome un
valor particular se considera igual a cero. Se supone que no es posible conocer el valor exacto de
una variable continua, ya que medir su valor consiste en clasificarlo dentro de un intervalo.
Las variables aleatorias continuas se describen por medio de una función real de variable
real, a la que se denomina función de densidad, que surge como la generalización de las curvas
de frecuencias asociadas a los histogramas, cuando la amplitud de los intervalos se considera
infinitamente pequeña.
Llamaremos función de densidad de una variable aleatoria X a una función real f(x) no
negativa (f(x) ≥ 0) tal que
∫
+∞
−∞
f(x) dx = 1
y de forma que es posible calcular la probabilidad de que X tome valores en un cierto intervalo
[a, b], por integración
P (a < X < b) =
∫
b
a
f(x) dx.
Conviene resaltar de nuevo que en variables aleatorias continuas se mide la probabilidad de
intervalos y que la probabilidad de que la variable tome un valor concreto se considera cero. Por
lo tanto,
∫
b
a
f(x) dx = P (a < X < b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a ≤ X ≤ b)
La función de distribución de X se define igual que para variables discretas. Viene dada
por F (x) = P (X ≤ x), ahora bien, la forma de acumular probabilidades está ahora asociada a
acumular áreas de la función de densidad
F (x) =
∫
x
−∞
f(t) dt.
Las caracteŕısticas de la función de distribución para variables continuas son similares a las del
caso discreto, con la diferencia fundamental de que en el caso continuo, la función de distribución
es una función continua en todo IR.
Si pensamos en el teorema Fundamental del Cálculo, obtenemos cómo ”recuperar” la función
de densidad, conociendo la de distribución
f(x) = F ′(x).
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 3
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
Lo que implica, si aplicamos la regla de Barrow,
P (a < X < b) =
∫
b
a
f(x) dx = F (b) − F (a).
En el caso continuo, la fórmula del valor esperado o esperanza matemática queda
µ = E(X) =
∫
+∞
−∞
xf(x) dx
donde f(x) es la función de densidad de la variable aleatoria X.
Análogamente, para la varianza
σ2
X
=
∫
+∞−∞
(x − µ)2f(x) dx =
∫
+∞
−∞
x2f(x) dx − µ2
MODELOS PROBABILÍSTICOS
Con frecuencia, al considerar variables aleatorias distintas, asociadas incluso a experimentos
aleatorios diferentes, se observa que las distribuciones de probabilidad son, en esencia, similares. Se
pueden, por tanto, considerar modelos de distribuciones de probabilidad, aplicables a numerosas
situaciones reales. Nuestra intención ahora es exponer las condiciones teóricas que caracterizan a
la situación que se desea modelar, para, a partir de ellas, razonar la forma de la correspondiente
función de probabilidad o de la función de densidad, según se estén considerando variables que,
por sus caracteŕısticas, se pueden clasificar como discretas o continuas. Ahora bien, ante una
situación real, es responsabilidad del observador, decidir qué modelo teórico es el adecuado para
describir el problema.
Distribuciones discretas
Distribución uniforme discreta
Una variable aleatoria discreta X que toma n valores enteros equiprobables recibe el nombre
de variable uniforme discreta. Si la variable toma valores 1, 2, . . . , n, sus probabilidades asociadas
serán
P (X = k) =
1
n
para todo k ∈ {1, 2, . . . , n}
Su media y varianza son
µ =
n + 1
2
σ2 =
n2 − 1
12
Distribución de Bernoulli
Consideremos un experimento aleatorio que admite sólo dos resultados posibles excluyentes:
suceso A (éxito) con probabilidad P (A) = p y
suceso Ac (fracaso) con probabilidad P (Ac) = 1 − p = q.
La realización de un experimento de este tipo recibe el nombre de prueba de Bernoulli.
Asociada una prueba de Bernoulli, se puede definir una variable aleatoria discreta X=”número
de éxitos al realizar una prueba de Bernoulli”, que toma el valor 0, cuando ocurre el suceso Ac
con probabilidad q y el valor 1, cuando ocurre el suceso A, con probabilidad p. La función de
probabilidad de esta variable se puede escribir, por tanto:
P (X = k) = pkq1−k para k = 0, 1.
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 4
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
Su media y varianza son
µ = p σ2 = p q
Distribución binomial
Supongamos que se realizan n pruebas de Bernoulli independientes, es decir, la probabilidad
de éxito, p, es la misma en todas las pruebas. Por ejemplo, si se lanza un dado tres veces, la
probabilidad de sacar un seis es igual a 1/6, en los tres lanzamientos. A la variable aleatoria
discreta
X = ”número de veces que ocurre el suceso A (éxito) en las n pruebas”
se la denomina variable aleatoria binomial de parámetros n y p. Los valores que toma la variable
X son los éxitos que se pueden producir cuando repito el mismo experimento n veces, luego iŕıan
desde 0 éxitos hasta n éxitos. La variable tomará el valor k arbitrario, cuando se produzcan k
éxitos y n − k fracasos. La probabilidad de k éxitos es pk y la de n − k fracasos es (1 − p)n−k,
luego la probabilidad de un resultado elemental con k éxitos y n − k fracasos será pk(1 − p)n−k.
Ahora bien, los k éxitos se pueden producir de varias formas distintas a lo largo de las n pruebas:
pueden ocurrir en las k primeras pruebas o en las k últimas o un éxito en la primera prueba y los
k−1 fracasos, todos seguidos al final o...Hay que contar el número de subconjuntos de k elementos
que se pueden formar con las n pruebas, esto es,
(
n
k
)
. Por lo tanto, si se denota por q a 1 − p, la
función de probabilidad de esta variable será
P (X = k)=
(
n
k
)
pkqn−k
para k = 0, 1, 2, . . . , n.
Para indicar que una variable X es una binomial de parámetros n y p, se escribirá X ∼ B(n, p).
Su media y varianza son
µ = np σ2 = np q.
Los valores de P (X = k) se encuentran tabulados para algunos valores de p entre 0 y 0.5.
Si el valor de p es mayor que 0.5, entonces hay que tener en cuenta la denominada propiedad de
simetŕıa: dado un experimento de Bernoulli repetido n veces, se consideran las variables aleatorias
X=” número de éxitos en las n pruebas” (X ∼ B(n, p)) e
Y =” número de fracasos en las n pruebas” (Y ∼ B(n, q)).
Entonces,
P (X = k) = P (Y = n − k).
Distribución de Poisson
Éste es un modelo probabiĺıstico útil para describir el número de veces que ocurre un determi-
nado suceso a lo largo de una unidad de tiempo, área, volumen, etc., establecido. Una situación
caracteŕıstica de este tipo se da cuando se observa la cola que se forma en determinados servicios.
El número de clientes que llegan a una caja de un supermercado en un cuarto de hora, el número
de pacientes que llegan a la sala de urgencias de un hospital en una hora, el número de trabajos
que recibe una impresora en red de una empresa por minuto, son variables cuya distribución se
puede describir con este modelo probabiĺıstico. Todas ellas tienen ciertas caracteŕısticas comunes:
el número de clientes, pacientes o trabajos por unidad de tiempo es independiente del número de
los mismos que llegan en otra unidad de tiempo; la probabilidad de que un cliente, paciente o
trabajo llegue en una unidad de tiempo es la misma para todas las unidades.
Si se denota por la letra griega λ al número esperado de ocurrencias de un suceso por unidad de
tiempo, área, volumen, etc., la variable aleatoria X=”número de veces que ocurre un determinado
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 5
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
suceso por unidad de tiempo, área, volumen, etc.” se dice que sigue una distribución de probabilidad
de Poisson de parámetro λ. Puede tomar todos los valores enteros 0, 1, 2, . . . con probabilidades
P (X = k) =
λk
k!
e−λ, para k = 0, 1, 2, . . . .
Su media y varianza son
µ = λ σ2 = λ
Esta distribución es una buena aproximación de la binomial cuando n es grande y p pequeña,
a saber, cuando p ≤ 0.1 y np < 5.
Distribuciones continuas
Distribución uniforme continua
Una variable aleatoria continua X que toma valores en un intervalo acotado de los números
reales sigue una distribución uniforme cuando la probabilidad de que la variable tome valores en
cualquier subintervalo del mismo, es proporcional a la longitud de dicho subintervalo, con lo que
la probabilidad asociada a dos subintervalos de igual longitud es la misma. En tal caso, si [a, b]
es el intervalo de la recta real en la que la variable toma valores, la función de densidad es
f(x) =
{
1
b−a
si x ∈ [a, b]
0 en el resto
Por tanto, su función de distribución es
F (x) =





0 si x < a
x−a
b−a
si x ∈ [a, b]
1 si x > b
Obsérvese que la probabilidad de cualquier subintervalo [x1, x2] ⊆ [a, b] viene dada por
P (x1 ≤ X ≤ x2) =
∫
x2
x1
1
b − adx =
x2 − x1
b − a
Un cálculo simple muestra que la media y varianza de la variable uniforme continua son
µ =
a + b
2
σ2 =
(b − a)2
12
Distribución normal
Sin duda, es la más importante de todos los modelos probabiĺısticos, pues su aplicación se
extiende a numerosos campos de la naturaleza, la industria, la Economı́a, etc. Tiene su origen
en la modelización de la distribución de frecuencias relativas de errores cometidos al efectuar
repetidas veces una medición.
Una variable continua X se dice que tiene una distribución normal de media µ y desviación
t́ıpica σ y se representa por X ∼ N(µ, σ), si puede tomar cualquier valor de los números reales y
su función de densidad es
f(x) =
1
σ
√
2π
e−
1
2
(x−µ)2
σ2
La función de densidad f(x) presenta un máximo en x = µ, dos puntos de inflexión en x = µ−σ
y x = µ + σ y tiene al eje OX como aśıntota. Su gráfica es simétrica respecto a la recta x = µ.
Al tratarse de una variable continua, para calcular probabilidades asociadas a la normal, por
ejemplo
P (x1 ≤ X ≤ x2) =
∫
x2
x1
1
σ
√
2π
e−
1
2
(x−µ)2
σ2
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 6
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
habŕıa que calcular la integral anterior, pero ésto no puede hacerse anaĺıticamente, sino que habŕıa
que emplear métodos de integraciónnumérica. El recurso que queda es tabular las dististas
probabilidades posibles, pero como depende de los valores de los parámetros µ y σ, en principio,
seŕıa necesario construir una tabla distinta para cada par de valores. Sin embargo la tipificación
de una variable normal de parámetros µ y σ, da lugar a otra variable normal, ésta, de media 0 y
desviación t́ıpica 1.
Si una variable X es N(µ, σ), la nueva variable
Z =
X − µ
σ
sigue también una distribución normal de media 0 y desviación t́ıpica 1, es decir Z es N(0, 1). A
la variable Z se le denomina variable tipificada de X y a la curva de su función de densidad curva
normal estándar o tipificada.
La distribución de la variable normal de media 0 y desviación t́ıpica 1 se encuentra tabulada.
En las tablas aparecen áreas bajo la curva normal, a la derecha de un punto zα. Por zα se
representa el valor de la abcisa que tiene a la derecha un área bajo la curva normal igual a α, es
decir
P (Z ≥ zα) = α.
Habitualmente, sólo se encuentran tabulados valores de Z positivos o áreas α ≤ 0.5. Para valores
de Z menores que cero, debido a la simetŕıa se tendrá en cuenta que si −zα ≤ 0, entonces
P (Z ≤ −zα) = P (Z ≥ zα).
Para las áreas a la izquierda, se tiene que P (Z ≤ zα) = 1 − P (Z ≥ zα) = 1 − α.
Por otra parte, para calcular probabilidades asociadas a intervalos, distinguimos los casos
siguientes:
a) si a, b ≥ 0, entonces P (a ≤ Z ≤ b) = P (Z ≥ a) − P (Z ≥ b)
b) si −a,−b ≤ 0, entonces P (−a ≤ Z ≤ −b) = P (a ≤ Z ≤ b) y se calculaŕıa como el caso
anterior
c) si −a ≤ 0 y b ≥ 0, entonces
P (−a ≤ Z ≤ b) = 1 − [P (Z ≤ −a) + P (Z ≥ b)] = 1 − [P (Z ≥ a) + P (Z ≥ b)]
La gran utilidad de la variable tipificada Z es que nos permite calcular áreas (y por tanto
probabilidades) de cualquier distribución normal. Si X es N(µ, σ) entonces
P (a ≤ X ≤ b) = P
(
a − µ
σ
≤ X − µ
σ
≤ b − µ
σ
)
= P
(
a − µ
σ
≤ Z ≤ b − µ
σ
)
.
Si X es una variable binomial de parámetros n y p, entonces si n es grande y ni p ni q son
próximos a cero, podemos considerar que X sigue aproximadamente una distribución N(np,
√
npq).
Por tanto, la variable tipificada correspondiente
Z =
X − np√
npq
es N(0, 1).
Se puede afirmar que la aproximación es suficientemente buena cuando np > 5, si p ≤ 0.5, o
bien nq > 5, si p > 0.5.
Hay que tener en cuenta que para utilizar correctamente esta transformación de una variable
discreta X (con distribución binomial) en una variable continua Z (con distribución normal) es
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 7
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
necesario hacer una corrección de continuidad. Téngase en cuenta que P (X = a), saldŕıa siempre
igual a cero. Ésto se evita identificando el suceso {X = a} con {a − 0.5 ≤ X ≤ a + 0.5}, es decir
P (X = a) = P (a − 0.5 ≤ X ≤ a + 0.5) = P (a − 0.5 ≤ N(np,√npq) ≤ a + 0.5) =
P
(
a − 0.5 − np√
npq
≤ Z ≤ a + 0.5 − np√
npq
)
Esta corrección puede extenderse a cualquier intervalo de forma que
P (a ≤ X ≤ b) = P (a − 0.5 ≤ N(np,√npq) ≤ b + 0.5)
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 8