7-Variables aleatorias - Gonzalo Sosa_

•
Outros

Desafío Instagram Dos
29/6/2023
¡Estudia con miles de materiales!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Otros

103.018 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
Estadística y Análisis de Datos 
 
 
1 
VARIABLES ALEATORIAS 
INTRODUCCIÓN 
En muchas ocasiones no interesa saber exactamente el resultado de un experimento aleatorio 
particular sino una característica numérico del mismo. El concepto de variable aleatoria permite 
modelar este tipo de situaciones. 
 
Variables aleatorias 
Hasta ahora, dado un espacio de probabilidad (S, A, P), hemos asignado probabilidades a sucesos 
mediante la probabilidad P. sin embargo, en muchos casos, no interesa exactamente el resultado de un 
experimento sino alguna característica numérica del mismo. Por ejemplo: 
Al arrojar dos dados balanceados interesa obtener suma 5, no si en particular salió el para (2; 3) o (1; 
4). 
En el tiro al blanco el conjunto de resultados posibles es S = {(x; y) / x, y  R} donde x, y son abscisa y 
ordenada, respectivamente, del punto donde pegó el tiro tomando como origen el punto del blanco (0; 
0). Sin embargo, no interesa exactamente en qué punto cayó el tiro sino la distancia del mismo al 
blanco, esto es, el número real √x2 + y2. 
 
Definición. Sea (S, A, P) un espacio de probabilidad. Una variable aleatoria es una función X: S  R. 
 
Observación: las variables aleatorias se denotan con letras mayúsculas, mientras que las minúsculas 
corresponderán a cantidades no aleatorias, es decir constantes. El resultado de un experimento se 
representa con la letra griega . Así que X() representa aquel número real que en la variable 
aleatoria X está asociado al resultado . 
{X = x} = {/ X() = x} 
Por lo tanto podemos asignar probabilidades a los posibles valores de la variable aleatoria. 
P(X = x) = P({/ X() = x}) 
 
Veamos algunos ejemplos de variables aleatorias 
Ejemplo: En un juego se arrojan tres monedas equilibradas y se asignan puntos en función de la 
cantidad de caras obtenidas. 
El experimento aleatorio de interés resulta 
: Arrojar tres monedas equilibradas al aire y anotar los resultados obtenidos 
El espacio muestral asociado al experimento resulta S = {CCC; CCS; CSC; CSS; SSS; SSC; SCS; SCC} donde 
C: cara y S: ceca 
Sea X la variable aleatoria 
X : número de caras obtenidas 
Asignemos a cada uno de los sucesos elementales S el valor real que le corresponde bajo X: 
 X() 
CCC 3 
CCS 2 
CSC 2 
CSS 1 
SSS 0 
SSC 1 
SCS 1 
SCC 2 
Vemos que X toma los valores 0; 1; 2 o 3 entonces Im(X) = {0; 1; 2; 3}. 
Las probabilidades de obtener cada una de las cantidades de caras posibles al arrojar una moneda tres 
veces son: 
P(X = 0) = P({SSS}) = 
1
8
 
 
P(X = 1) = P({CSS; SSC; SCS}) = 
3
8
 
Estadística y Análisis de Datos 
 
 
2 
P(X = 2) = P({CCS;CSC; SCC}) = 
3
8
 
P(X = 3) = P({CCC}) = 
1
8
 
Como es de esperar la suma de las probabilidades P(X = x) sobre todos los valores posibles x es 1, esto 
es 
∑P(X = x)= 
1
8
+
3
8
+
3
8
+
1
8
= 1
3
x=0
 
dado que los sucesos {X = x}, x  {0; 1; 2; 3} forman una partición de S. 
 
FUNCIÓN DE DISTRIBUCIÓN 
Definición. Sea (S, A, P) un espacio de probabilidad y X una variable aleatoria sobre él. Se llama 
función de distribución de X a la función F: R  [0; 1] dada por F(x) = P(X  x) 
 
Ejemplo: consideramos el Ejemplo 1 donde Im(X) = {0, 1, 2, 3}. Analicemos la función de distribución F 
para diferentes valores de xR. 
x < 0 : {X  x} =   F(x) = 0 
0  x < 1 : {X  x} = {X = 0}  F(x) = 
1
8
 
1  x < 2 : {X  x} = ⋃ {X=x}1x = 0  F(x) = 
1
8
+
3
8
=
1
2
 
2  x < 3 : {X  x} = ⋃ {X=x}2x = 0  F(x) = 
1
8
+
3
8
+
3
8
=
7
8
 
3  x : {X  x} = ⋃ {X=x}3x = 0  F(x) = 
1
8
+
3
8
+
3
8
+
1
8
= 1 
Luego 
F(x)=
{
 
 
 
 
 
 
0 si x<0
1
8
si 0≤x<1
1
2
si 1≤x<2
7
8
si 2≤x<3
1 si x≥3
 
La siguiente figura muestra el gráfico de la función de distribución F. 
 
PROPIEDADES 
Teorema 1. Sea X una variable aleatoria sobre el espacio de probabilidad (S, A, P). Sea F la función de 
distribución de X. Sean a y b números reales que verifican a < b. 
I. P(a < X  b) = F(b) – F(a) 
 
Estadística y Análisis de Datos 
 
 
3 
II. P(a  X  b) = F(b) – F(a) + P(X =a) 
III. P(a  X < b) = F(b) – F(a) – P(X =b) + P(X =a) 
IV. P(a < X < b) = F(b) – F(a) – P(X =b) 
 
Teorema 2. Sea X una variable aleatoria sobre el espacio de probabilidad (S, A, P). Sea F la función de 
distribución de X. Entonces: 
F es no decreciente, esto es, si x < y  F(x)  F(y) 
 
Teorema 3. Sea X una variable aleatoria sobre el espacio de probabilidad (S, A, P). Sea F la función de 
distribución de X. Entonces: 
I. lim F(x) = 1 II. lim F(x) = 0 
 x+ x  
 
Teorema 4. Sea X una variable aleatoria sobre el espacio de probabilidad (S, A, P). Sea F la función de 
distribución de X. Para cada a real tenemos: 
I. lim F(x) = F(a) II. lim F(x) = F(a)  P(X=a) 
 xa+ xa 
El primer límite nos dice que F es continua a la derecha en cada punto a, debido a que F(x)  F(a) 
cuando xa por la derecha. Por otra parte, el segundo límite nos dice que cuando xa por la 
izquierda, F(x) tenderá a F(a) si y solo si la probabilidad P(X = a) es cero. Si P(X=a) no es cero, la 
gráfica de F tiene una discontinuidad de salto en a. 
 
DEMOSTRACIÓN 
La existencia de los límites resulta inmediatamente de la 
monotonía y acotación de F. Vamos a demostrar que los 
límites tienen los valores indicados. A tal fin utilizamos la 
igualdad I. Del Teorema 1. 
Si x>a escribimos: F(x) = F(a) + P(a < X  x) (1) 
En cambio, si x<a, escribimos: F(x) = F(a)  P(x < X  a) (2) 
Haciendo xa+ en (1) encontramos 
lim F(x) = F(a) + lim P(a < X  x) 
xa+ xa+ 
mientras que si xa en (2), obtenemos: 
lim F(x) = F(a)  lim P(x < X  a) 
xa xa 
Por lo tanto, para demostrar I. y II. Debemos establecer dos 
igualdades: 
lim P(a < X  x) = 0 (3) 
xa+ 
lim P(x < X  a) = P(X=a) (4) 
xa 
Intuitivamente pueden establecerse así: cuando xa+, el intervalo semiabierto (a; x] tiende a 
confundirse con el conjunto vacío. Esto es, la intersección de todos los intervalos semiabiertos (a; x], 
para x>a, es vacía. Por otra parte, cuando xa el intervalo semiabierto (x; a] tiende a confundirse con 
el punto a. La intersección de todos los intervalos (x; a] para x<a es el conjunto {a}. Por consiguiente, si 
la probabilidad se comporta de manera continua, las igualdades (3) y (4) deben ser ciertas. 
 
 
F(x) 
1 
 
 
a x 
lim F(x) = F(a) 
xa
+
 
lim F(x) 
xa

 
Salto P(X=a) 
Estadística y Análisis de Datos 
 
 
4 
Variables aleatorias discretas 
Definición. Una variable aleatoria X sobre un espacio de probabilidad (S, A, P) se denomina discreta 
si toma un conjunto finito o numerable de valores, es decir, si Im(X) es un conjunto finito o numerable. 
 
Son ejemplos de variables aleatorias discretas: 
X: número de caras al arrojar tres monedas 
Y: mayor de los números obtenidos al extraer tres bolillas de una urna con veinte bolillas numeradas 
de 1 a 20 
Z: número de tiradas de una monedad hasta obtener cara 
dado que 
Im(X) = {0, 1, 2, 3} Im(Y) = {3, 4,… , 20} Im(Z) = N 
 
Definición. Sea X una variable aleatoria discreta sobre un espacio de probabilidad (S, A, P). Se llama 
función de probabilidad puntual de la variable aleatoria X a la función p: R  [0, 1] dada por 
p= {
P(X=x) si x ∈ Im(X)
0 si x  Im(X)
 
 
Ejemplo 1: Consideremos el experimento que consiste en arrojar una dado y observar el puntaje 
obtenido. El espacio muestral es S = {1, 2, 3, 4, 5, 6} 
Y sea X() =  para  = 1, 2, 3, 4, 5, 6 
Supongamos que el dado es equilibrado y elijamos por lo tanto la medida equiprobable como medida 
de probabilidad. Entonces: 
P(X = 1) = P[X(1)] = P({1}) = 
1
6
 
P(X = 2) = P[X(2)] = P({2}) = 
1
6
 
P(X = 3) = P[X(3)] = P({3}) = 
1
6
 
P(X = 4) = P[X(4)] = P({4}) = 
1
6
 
P(X = 5) = P[X(5)] = P({5}) = 
1
6
 
P(X = 6) = P[X(6)] = P({6}) = 
1
6
 
Por lo tanto 
p= {
1
6
si x ∈ {1, 2, 3, 4, 5, 6}
0 si x  {1, 2, 3, 4, 5, 6}
 
 
 
Podemos elaborar la siguiente tabla: 
 
 
Notación usual 
 
 
Representación gráfica de la distribución deprobabilidad 
 
 
 
 
 
 
 
 
 
 
 
 1 2 3 4 5 6 
X() 1 2 3 4 5 6 
P[X()] 1/6 1/6 1/6 1/6 1/6 1/6 
x 1 2 3 4 5 6 
P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6 
 1 2 3 4 5 6 X 
p(x) 
 
 
 
 
 
1/6 
Estadística y Análisis de Datos 
 
 
5 
Si queremos calcular, por ejemplo, P(2  X  5), tenemos: 
P(2  X  5) = P(X=2) + P(X=3) + P(X=4) + P(X=5) = 
1
6
 + 
1
6
 + 
1
6
 + 
1
6
 = 
4
6
 = 
2
3
 ya que los sucesos del segundo 
miembro son excluyentes. 
 
Ejemplo 2: Un supervisor en una planta manufacturera tiene tres hombres y tres mujeres trabajando 
para él y desea escoger dos trabajadores para un trabajo especial. No queriendo mostrar sesgo en su 
selección, decide seleccionar los dos trabajadores al azar. Sea X el número de mujeres en su selección. 
Encuentre la distribución de probabilidad para X. 
El supervisor puede seleccionar dos trabajadores de entre seis en 





2
6
= 15 formas. Entonces, existen 
15 resultados posibles que suponemos son igualmente probables porque se empleó muestreo 
aleatorio. Así, P(Ei)= 15
1 , para i = 1, 2, ..., 15. Los valores para X que tienen probabilidad diferente de 
cero son 0, 1 y 2. El número de formas de seleccionar X = 0 mujeres es 











2
3
0
3
 porque el supervisor 
debe seleccionar cero trabajadores de las tres mujeres y dos de los tres hombres. Entonces, hay 












2
3
0
3
 = 1.3 = 3 resultados posibles en el evento X = 0, y 
p(0) = P(X = 0) =
5
1
15
3
15
2
3
0
3












 
De igual manera, 
p(1) = P(X = 1) =
5
3
15
9
15
1
3
1
3












 
p(2) = P(X = 2) =
5
1
15
3
15
0
3
2
3












 
Entonces 
p= {
(3𝑥).(
3
2−𝑥)
(62)
si x ∈ {0, 1, 2}
0 si x  {0, 1, 2}
 
 
Graficamos la distribución 
 
 
 
 
 
 
 
 
 
Se puede observar que las probabilidades asociadas con todos los valores distintos de una variable 
aleatoria discreta suman 1. 
 
Teorema. Sea X una variable aleatoria discreta sobre un espacio de probabilidad (S, A, P), lo siguiente 
debe ser verdadero: 
1. 0  pj  1 para toda xj. 
2. 1p j  j , donde la sumatoria es para todos los valores de xj con probabilidad distinta de cero. 
Definición. Sea X una variable aleatoria discreta sobre un espacio de probabilidad (S, A, P). Llamamos 
función de distribución de una variable discreta X a la función: 
F(x) = P(X  x) = ∑ p
jxj≤x
 
 
p(x) 
 
 
 
 
 
 
0 1 2 x 
Estadística y Análisis de Datos 
 
 
6 
Variables aleatorias continuas 
Existen muchas situaciones prácticas en las que las variables de interés toman valores en un conjunto 
no numerable de puntos: 
Tiempo de vida de un determinado producto. 
Suma de dos puntos elegidos al azar de un intervalo. 
En tales casos, no es posible asignar una probabilidad positiva a cada uno de los valores de la variable 
de forma que la suma de esas probabilidades sea la unidad como ocurre en el caso discreto. Así, el 
tratamiento probabilístico de este tipo de variables es diferente al de las variables discretas. 
Aunque la clase de variables de este tipo es más amplia, vamos a estudiar ahora un tipo particular, las 
denominadas variables absolutamente continuas, a las que es usual llamar simplemente de tipo 
continuo o continuas. 
 
Definición. Una variable aleatoria X sobre un espacio de probabilidad (S, A, P) es continua si su 
función de distribución es continua en todo R y derivable, y con derivada continua, salvo en a lo sumo 
un conjunto numerable de puntos. Esto es equivalente a que exista f: R  R no negativa e integrable 
tal que: 
F(x) = P(X ≤ x) = ∫ f(t)dt ∀x ∈ R
x
−
 
La función f se denomina función de densidad de la variable aleatoria X. 
 
Observación. Si consideramos el teorema 4 de Función de distribución, decir que una variable 
aleatoria X es continua equivale a decir que la probabilidad de que X tome exactamente el valor xR es 
nula. 
 
Teorema. Propiedades de una función de densidad. Si f es una función de densidad para una variable 
aleatoria continua, entonces: 
1. f(x) 0 para todo x. 
2. 1dxf(x) 


 
3. F(x) = ∫ f(t) dt
x

 
4. P(a < X  b) = ∫ f(x) dx
b
a
 
5. f(x) = 
x
F
d
d
 
 
Para las variables aleatorias discretas las suma de todas las probabilidades P(X = xj) es igual a 1, la 
fórmula (2) es la versión de la misma propiedad adaptada a variables aleatorias continuas. También 
existe una estrecha analogía entre las fórmulas: F(x) = P(X  x) = ∑ pjxj≤x y F(x) = P(X  x) = 
∫ f(t) dt
x

 . La función de densidad f desempeña, para las distribuciones continuas, el mismo papel que 
la función de probabilidad puntual p para distribuciones discretas, la integración reemplaza la suma 
en el cálculo de las probabilidades. Existe, sin embargo, una diferencia importante, en el caso discreto 
p(xj) es la probabilidad de que X = xj , pero en el continuo f(x) no es la probabilidad de que X = x, en 
efecto esta probabilidad es cero debido a que F es continua para todo x, lo que equivale a que para una 
distribución continua es: P(a < X  b) = P(a  X  b) = P(a  X < b) = P(a < X < b) 
 
Ejemplo 1: El pH de muestras de agua para un lago específico es una variable aleatoria X con función 
de densidad de probabilidad dada por 
 f(x)= { 
3
8
∙(7− x)2 5 ≤ x ≤ 7
0 en caso contrario
 
Estadística y Análisis de Datos 
 
 
7 
Verificamos que f es una función de densidad: 
1. Si x[5; 7] : f(x) = 
3
8
∙ (7 − x)
2
  0 
 Si x[5; 7] : f(x) = 0 
 Por lo tanto, f(x)  0 para todo x 
2. ∫ f(x)dx = ∫ f(x)dx + ∫ f(x)dx + ∫ f(x)dx =
+∞
7
7
5
5
−∞
+∞
−∞
 
=∫ 0 ∙ dx + ∫ 
3
8
∙ (7  x)2 dx + ∫ 0 ∙ dx =
+∞
7
7
5
5
−∞
 
=∫ 
3
8
∙ (49 x + x2)dx
7
5
=
3
8
∙ ∫ (49 x + x2)dx
7
5
= 
=
3
8
∙ {[49x]5
7  [14 ∙
x2
2
]
5
7
+ [
x3
3
]
5
7
} = 
= 
3
8
∙ [98 − 168 +
218
3
] = 1 
 
 
 
La función de distribución de la variable aleatoria X es: 
F(x) =
{
 
 
 
 
0 si x < 5
3
8
∙ (
x3
3
− 7x2 + 49x −
335
3
) si 5 ≤ x ≤ 7
1 si x > 7
 
 
En efecto: 
Sea x < 5: 
F(x) = ∫ 0 dx
x
−
= 0 
Sea 5  x  7: 
F(x) = ∫ 
3
8
∙(7− x)2 dx
x
5
=
3
8
∙ (
x3
3
− 7x2 + 49x −
335
3
) 
 
Sea x > 7: 
F(x) = ∫ 
3
8
∙(7− x)2 dx
7
5
= 1 
Estadística y Análisis de Datos 
 
 
8 
 
 
¿Esperaría ver con frecuencia una medición de pH debajo de 5,5? ¿Por qué? 
Para dar respuesta a esta pregunta debemos calcular P(X<5,5) para lo cual podemos utilizar la función 
de densidad o la función de distribución. 
Si utilizamos la función de densidad: 
P(X<5,5) = ∫
3
8
∙ (7  x)
2
dx = 
5,5 
5
0,5781 
Esta probabilidad es el área sombreada de la Figura siguiente: 
 
 
 
Si utilizamos la función de distribución: 
P(X<5,5) = F(5,5) = 
3
8
∙ (49 ∙ 5,5 7 ∙ 5,52 +
5,53
3
  
335
3
) = 0,5781 
La probabilidad es un valor de ordenada. 
 
 
 
Estadística y Análisis de Datos 
 
 
9 
EL VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA 
La distribución de probabilidad para una variable es un modelo teórico para la distribución empírica 
de datos asociados, con una población real. Si el modelo es una representación precisa de la 
naturaleza, las distribuciones teóricas y empíricas son equivalentes, de manera que se trata de hallar la 
media y la varianza para una variable aleatoria y por lo tanto adquirir medidas numéricas descriptivas, 
parámetros, para la distribución de probabilidad. 
 
Definición: Sea X una variable aleatoria discretas sobre un espacio de probabilidad (S, A, P) con 
función de probabilidad puntual p. Denominamos esperanza matemática de X a 
E(X) = ∑xj. pj
j
=∑xj. pj

𝑗=1
 
si la serie converge absolutamente. 
Definición: Sea X una variable aleatoria continua sobre un espacio de probabilidad (S, A, P) con 
función de densidad de probabilidad f. Denominamos esperanza matemática de X a 
E(X) = ∫ x. f(x)dx
+∞
−∞si la integral es absolutamente convergente. 
 
Ejemplo: Retomando el ejemplo 1 donde la distribución de probabilidad de la variable aleatoria X es: 
 
 
 
𝐸(𝑋) = 1 ∙
1
6
+ 2 ∙
1
6
+ 3 ∙
1
6
+ 4 ∙
1
6
+ 5 ∙
1
6
+ 6 ∙
1
6
=
7
2
 
E(X) no es el valor más probable ya que 
7
2
 ni siquiera es un valor posible de la variable aleatoria X, de 
esta manera. La interpretación adecuada para E(X) es considerar que si se realizara el experimento 
aleatorio en cuestión un número grande de veces y se promediaran los resultados obtenidos, se 
obtendría en promedio el valor de E(X), en este caso, 
7
2
. 
 
Ejemplo: Retomando el ejemplo 1 de variable aleatoria continua. 
E(X) = ∫ x ∙
3
8
∙ (7 − x)2
7
5
= ∫
3
8
x. (49 − 14x + x2) = ∫ (
147
8
x − 
21
4
x2 + 
3
8
x3) =
7
5
7
5
 
= |
147
16
x2 − 
7
4
x3 + 
3
32
x4|
5
7
= 
2401
32
 − 
2225
32
 = 
11
2
= 5,5 
Propiedades: 
Supongamos que, en los siguientes casos, las esperanzas mencionadas existen. 
1. Sea X = c donde c es una constante. Entonces E(X)=c 
2. Sean X una variable aleatoria y a; b constantes. Entonces: 
E(a.X + b) = E(a.X) + E(b) = a.E(X) + b 
3. Sean X1, X2 variables aleatorias. Entonces: 
x 1 2 3 4 5 6 
P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6 
Estadística y Análisis de Datos 
 
 
10 
E(X1 + X2) = E(X1) + E(X2) 
4. Sean X1, X2, …, Xn variables aleatorias. Entonces: 
E(∑Xi
n
i=1
) =∑E(Xi)
n
i=1
 
5. Sean X1, X2 variables aleatorias independientes. Entonces E(X1X2) = E(X1).E(X2) 
 
ESPERANZA MATEMÁTICA DE UNA FUNCIÓN DE VARIABLE ALEATORIA X 
Definición: Sea Y variable aleatoria cuya distribución depende de una variable aleatoria X, es decir Y = 
𝑔(X), entonces definimos: 
E(Y) =⏞ 
DEF.
 E[g(X)]={
∑ g(xj). pjj
∫ g(x). f(x)dx
+∞
−∞
 
 
VARIANZA DE UNA VARIABLE ALEATORIA 
Definición: Sea X una variable aleatoria sobre un espacio de probabilidad (S, A, P) tal que E(X) existe. 
Llamamos varianza de X a 
 D2(X) = E [(X  E(X))2] 
si esta esperanza existe. Llamamos desviación típica o estándar de X a la raíz cuadrada positiva de 
D2(X). 
 
Propiedades: 
Supongamos que, en los siguientes casos, las esperanzas mencionadas existen. 
1. Sea X = c donde c es una constante. Entonces D2(X) = 0 
2. Sean X una variable aleatoria y a una constante. Entonces D2 (aX) = a2D2 (X) 
3. Sean X una variable aleatoria y a una constante. Entonces D2 (X + a) = D2 (X) 
4. Sean X1, X2 variables aleatorias independientes. Entonces D2(X1 + X2) = D2(X1) + D2(X2) 
5. Sean X1, X2, …, Xn variables aleatorias independientes. Entonces 
D2 (∑Xi
n
i=1
) =∑D2(Xi)
n
i=1
 
6. D2(X) = E(X2)  [E(X)]2 
 
Propiedades: 
1. D(X)≥0 
2. Si Y = a.X + b ⇒D(Y) = |a|.D(X) 
 
BIBLIOGRAFÍA 
1. Walpole, Ronal E.; Myres Raymond H. Probabilidad y Estadística. Mc.Graw –Hill. 1992. 
2. Mendenhall, W.; Wackerly, D.; Scheaffer, R. Estadística Matemática con Aplicaciones. Grupo 
Editorial Iberoamericana. 1994.