Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística y Análisis de Datos 1 VARIABLES ALEATORIAS INTRODUCCIÓN En muchas ocasiones no interesa saber exactamente el resultado de un experimento aleatorio particular sino una característica numérico del mismo. El concepto de variable aleatoria permite modelar este tipo de situaciones. Variables aleatorias Hasta ahora, dado un espacio de probabilidad (S, A, P), hemos asignado probabilidades a sucesos mediante la probabilidad P. sin embargo, en muchos casos, no interesa exactamente el resultado de un experimento sino alguna característica numérica del mismo. Por ejemplo: Al arrojar dos dados balanceados interesa obtener suma 5, no si en particular salió el para (2; 3) o (1; 4). En el tiro al blanco el conjunto de resultados posibles es S = {(x; y) / x, y R} donde x, y son abscisa y ordenada, respectivamente, del punto donde pegó el tiro tomando como origen el punto del blanco (0; 0). Sin embargo, no interesa exactamente en qué punto cayó el tiro sino la distancia del mismo al blanco, esto es, el número real √x2 + y2. Definición. Sea (S, A, P) un espacio de probabilidad. Una variable aleatoria es una función X: S R. Observación: las variables aleatorias se denotan con letras mayúsculas, mientras que las minúsculas corresponderán a cantidades no aleatorias, es decir constantes. El resultado de un experimento se representa con la letra griega . Así que X() representa aquel número real que en la variable aleatoria X está asociado al resultado . {X = x} = {/ X() = x} Por lo tanto podemos asignar probabilidades a los posibles valores de la variable aleatoria. P(X = x) = P({/ X() = x}) Veamos algunos ejemplos de variables aleatorias Ejemplo: En un juego se arrojan tres monedas equilibradas y se asignan puntos en función de la cantidad de caras obtenidas. El experimento aleatorio de interés resulta : Arrojar tres monedas equilibradas al aire y anotar los resultados obtenidos El espacio muestral asociado al experimento resulta S = {CCC; CCS; CSC; CSS; SSS; SSC; SCS; SCC} donde C: cara y S: ceca Sea X la variable aleatoria X : número de caras obtenidas Asignemos a cada uno de los sucesos elementales S el valor real que le corresponde bajo X: X() CCC 3 CCS 2 CSC 2 CSS 1 SSS 0 SSC 1 SCS 1 SCC 2 Vemos que X toma los valores 0; 1; 2 o 3 entonces Im(X) = {0; 1; 2; 3}. Las probabilidades de obtener cada una de las cantidades de caras posibles al arrojar una moneda tres veces son: P(X = 0) = P({SSS}) = 1 8 P(X = 1) = P({CSS; SSC; SCS}) = 3 8 Estadística y Análisis de Datos 2 P(X = 2) = P({CCS;CSC; SCC}) = 3 8 P(X = 3) = P({CCC}) = 1 8 Como es de esperar la suma de las probabilidades P(X = x) sobre todos los valores posibles x es 1, esto es ∑P(X = x)= 1 8 + 3 8 + 3 8 + 1 8 = 1 3 x=0 dado que los sucesos {X = x}, x {0; 1; 2; 3} forman una partición de S. FUNCIÓN DE DISTRIBUCIÓN Definición. Sea (S, A, P) un espacio de probabilidad y X una variable aleatoria sobre él. Se llama función de distribución de X a la función F: R [0; 1] dada por F(x) = P(X x) Ejemplo: consideramos el Ejemplo 1 donde Im(X) = {0, 1, 2, 3}. Analicemos la función de distribución F para diferentes valores de xR. x < 0 : {X x} = F(x) = 0 0 x < 1 : {X x} = {X = 0} F(x) = 1 8 1 x < 2 : {X x} = ⋃ {X=x}1x = 0 F(x) = 1 8 + 3 8 = 1 2 2 x < 3 : {X x} = ⋃ {X=x}2x = 0 F(x) = 1 8 + 3 8 + 3 8 = 7 8 3 x : {X x} = ⋃ {X=x}3x = 0 F(x) = 1 8 + 3 8 + 3 8 + 1 8 = 1 Luego F(x)= { 0 si x<0 1 8 si 0≤x<1 1 2 si 1≤x<2 7 8 si 2≤x<3 1 si x≥3 La siguiente figura muestra el gráfico de la función de distribución F. PROPIEDADES Teorema 1. Sea X una variable aleatoria sobre el espacio de probabilidad (S, A, P). Sea F la función de distribución de X. Sean a y b números reales que verifican a < b. I. P(a < X b) = F(b) – F(a) Estadística y Análisis de Datos 3 II. P(a X b) = F(b) – F(a) + P(X =a) III. P(a X < b) = F(b) – F(a) – P(X =b) + P(X =a) IV. P(a < X < b) = F(b) – F(a) – P(X =b) Teorema 2. Sea X una variable aleatoria sobre el espacio de probabilidad (S, A, P). Sea F la función de distribución de X. Entonces: F es no decreciente, esto es, si x < y F(x) F(y) Teorema 3. Sea X una variable aleatoria sobre el espacio de probabilidad (S, A, P). Sea F la función de distribución de X. Entonces: I. lim F(x) = 1 II. lim F(x) = 0 x+ x Teorema 4. Sea X una variable aleatoria sobre el espacio de probabilidad (S, A, P). Sea F la función de distribución de X. Para cada a real tenemos: I. lim F(x) = F(a) II. lim F(x) = F(a) P(X=a) xa+ xa El primer límite nos dice que F es continua a la derecha en cada punto a, debido a que F(x) F(a) cuando xa por la derecha. Por otra parte, el segundo límite nos dice que cuando xa por la izquierda, F(x) tenderá a F(a) si y solo si la probabilidad P(X = a) es cero. Si P(X=a) no es cero, la gráfica de F tiene una discontinuidad de salto en a. DEMOSTRACIÓN La existencia de los límites resulta inmediatamente de la monotonía y acotación de F. Vamos a demostrar que los límites tienen los valores indicados. A tal fin utilizamos la igualdad I. Del Teorema 1. Si x>a escribimos: F(x) = F(a) + P(a < X x) (1) En cambio, si x<a, escribimos: F(x) = F(a) P(x < X a) (2) Haciendo xa+ en (1) encontramos lim F(x) = F(a) + lim P(a < X x) xa+ xa+ mientras que si xa en (2), obtenemos: lim F(x) = F(a) lim P(x < X a) xa xa Por lo tanto, para demostrar I. y II. Debemos establecer dos igualdades: lim P(a < X x) = 0 (3) xa+ lim P(x < X a) = P(X=a) (4) xa Intuitivamente pueden establecerse así: cuando xa+, el intervalo semiabierto (a; x] tiende a confundirse con el conjunto vacío. Esto es, la intersección de todos los intervalos semiabiertos (a; x], para x>a, es vacía. Por otra parte, cuando xa el intervalo semiabierto (x; a] tiende a confundirse con el punto a. La intersección de todos los intervalos (x; a] para x<a es el conjunto {a}. Por consiguiente, si la probabilidad se comporta de manera continua, las igualdades (3) y (4) deben ser ciertas. F(x) 1 a x lim F(x) = F(a) xa + lim F(x) xa Salto P(X=a) Estadística y Análisis de Datos 4 Variables aleatorias discretas Definición. Una variable aleatoria X sobre un espacio de probabilidad (S, A, P) se denomina discreta si toma un conjunto finito o numerable de valores, es decir, si Im(X) es un conjunto finito o numerable. Son ejemplos de variables aleatorias discretas: X: número de caras al arrojar tres monedas Y: mayor de los números obtenidos al extraer tres bolillas de una urna con veinte bolillas numeradas de 1 a 20 Z: número de tiradas de una monedad hasta obtener cara dado que Im(X) = {0, 1, 2, 3} Im(Y) = {3, 4,… , 20} Im(Z) = N Definición. Sea X una variable aleatoria discreta sobre un espacio de probabilidad (S, A, P). Se llama función de probabilidad puntual de la variable aleatoria X a la función p: R [0, 1] dada por p= { P(X=x) si x ∈ Im(X) 0 si x Im(X) Ejemplo 1: Consideremos el experimento que consiste en arrojar una dado y observar el puntaje obtenido. El espacio muestral es S = {1, 2, 3, 4, 5, 6} Y sea X() = para = 1, 2, 3, 4, 5, 6 Supongamos que el dado es equilibrado y elijamos por lo tanto la medida equiprobable como medida de probabilidad. Entonces: P(X = 1) = P[X(1)] = P({1}) = 1 6 P(X = 2) = P[X(2)] = P({2}) = 1 6 P(X = 3) = P[X(3)] = P({3}) = 1 6 P(X = 4) = P[X(4)] = P({4}) = 1 6 P(X = 5) = P[X(5)] = P({5}) = 1 6 P(X = 6) = P[X(6)] = P({6}) = 1 6 Por lo tanto p= { 1 6 si x ∈ {1, 2, 3, 4, 5, 6} 0 si x {1, 2, 3, 4, 5, 6} Podemos elaborar la siguiente tabla: Notación usual Representación gráfica de la distribución deprobabilidad 1 2 3 4 5 6 X() 1 2 3 4 5 6 P[X()] 1/6 1/6 1/6 1/6 1/6 1/6 x 1 2 3 4 5 6 P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6 1 2 3 4 5 6 X p(x) 1/6 Estadística y Análisis de Datos 5 Si queremos calcular, por ejemplo, P(2 X 5), tenemos: P(2 X 5) = P(X=2) + P(X=3) + P(X=4) + P(X=5) = 1 6 + 1 6 + 1 6 + 1 6 = 4 6 = 2 3 ya que los sucesos del segundo miembro son excluyentes. Ejemplo 2: Un supervisor en una planta manufacturera tiene tres hombres y tres mujeres trabajando para él y desea escoger dos trabajadores para un trabajo especial. No queriendo mostrar sesgo en su selección, decide seleccionar los dos trabajadores al azar. Sea X el número de mujeres en su selección. Encuentre la distribución de probabilidad para X. El supervisor puede seleccionar dos trabajadores de entre seis en 2 6 = 15 formas. Entonces, existen 15 resultados posibles que suponemos son igualmente probables porque se empleó muestreo aleatorio. Así, P(Ei)= 15 1 , para i = 1, 2, ..., 15. Los valores para X que tienen probabilidad diferente de cero son 0, 1 y 2. El número de formas de seleccionar X = 0 mujeres es 2 3 0 3 porque el supervisor debe seleccionar cero trabajadores de las tres mujeres y dos de los tres hombres. Entonces, hay 2 3 0 3 = 1.3 = 3 resultados posibles en el evento X = 0, y p(0) = P(X = 0) = 5 1 15 3 15 2 3 0 3 De igual manera, p(1) = P(X = 1) = 5 3 15 9 15 1 3 1 3 p(2) = P(X = 2) = 5 1 15 3 15 0 3 2 3 Entonces p= { (3𝑥).( 3 2−𝑥) (62) si x ∈ {0, 1, 2} 0 si x {0, 1, 2} Graficamos la distribución Se puede observar que las probabilidades asociadas con todos los valores distintos de una variable aleatoria discreta suman 1. Teorema. Sea X una variable aleatoria discreta sobre un espacio de probabilidad (S, A, P), lo siguiente debe ser verdadero: 1. 0 pj 1 para toda xj. 2. 1p j j , donde la sumatoria es para todos los valores de xj con probabilidad distinta de cero. Definición. Sea X una variable aleatoria discreta sobre un espacio de probabilidad (S, A, P). Llamamos función de distribución de una variable discreta X a la función: F(x) = P(X x) = ∑ p jxj≤x p(x) 0 1 2 x Estadística y Análisis de Datos 6 Variables aleatorias continuas Existen muchas situaciones prácticas en las que las variables de interés toman valores en un conjunto no numerable de puntos: Tiempo de vida de un determinado producto. Suma de dos puntos elegidos al azar de un intervalo. En tales casos, no es posible asignar una probabilidad positiva a cada uno de los valores de la variable de forma que la suma de esas probabilidades sea la unidad como ocurre en el caso discreto. Así, el tratamiento probabilístico de este tipo de variables es diferente al de las variables discretas. Aunque la clase de variables de este tipo es más amplia, vamos a estudiar ahora un tipo particular, las denominadas variables absolutamente continuas, a las que es usual llamar simplemente de tipo continuo o continuas. Definición. Una variable aleatoria X sobre un espacio de probabilidad (S, A, P) es continua si su función de distribución es continua en todo R y derivable, y con derivada continua, salvo en a lo sumo un conjunto numerable de puntos. Esto es equivalente a que exista f: R R no negativa e integrable tal que: F(x) = P(X ≤ x) = ∫ f(t)dt ∀x ∈ R x − La función f se denomina función de densidad de la variable aleatoria X. Observación. Si consideramos el teorema 4 de Función de distribución, decir que una variable aleatoria X es continua equivale a decir que la probabilidad de que X tome exactamente el valor xR es nula. Teorema. Propiedades de una función de densidad. Si f es una función de densidad para una variable aleatoria continua, entonces: 1. f(x) 0 para todo x. 2. 1dxf(x) 3. F(x) = ∫ f(t) dt x 4. P(a < X b) = ∫ f(x) dx b a 5. f(x) = x F d d Para las variables aleatorias discretas las suma de todas las probabilidades P(X = xj) es igual a 1, la fórmula (2) es la versión de la misma propiedad adaptada a variables aleatorias continuas. También existe una estrecha analogía entre las fórmulas: F(x) = P(X x) = ∑ pjxj≤x y F(x) = P(X x) = ∫ f(t) dt x . La función de densidad f desempeña, para las distribuciones continuas, el mismo papel que la función de probabilidad puntual p para distribuciones discretas, la integración reemplaza la suma en el cálculo de las probabilidades. Existe, sin embargo, una diferencia importante, en el caso discreto p(xj) es la probabilidad de que X = xj , pero en el continuo f(x) no es la probabilidad de que X = x, en efecto esta probabilidad es cero debido a que F es continua para todo x, lo que equivale a que para una distribución continua es: P(a < X b) = P(a X b) = P(a X < b) = P(a < X < b) Ejemplo 1: El pH de muestras de agua para un lago específico es una variable aleatoria X con función de densidad de probabilidad dada por f(x)= { 3 8 ∙(7− x)2 5 ≤ x ≤ 7 0 en caso contrario Estadística y Análisis de Datos 7 Verificamos que f es una función de densidad: 1. Si x[5; 7] : f(x) = 3 8 ∙ (7 − x) 2 0 Si x[5; 7] : f(x) = 0 Por lo tanto, f(x) 0 para todo x 2. ∫ f(x)dx = ∫ f(x)dx + ∫ f(x)dx + ∫ f(x)dx = +∞ 7 7 5 5 −∞ +∞ −∞ =∫ 0 ∙ dx + ∫ 3 8 ∙ (7 x)2 dx + ∫ 0 ∙ dx = +∞ 7 7 5 5 −∞ =∫ 3 8 ∙ (49 x + x2)dx 7 5 = 3 8 ∙ ∫ (49 x + x2)dx 7 5 = = 3 8 ∙ {[49x]5 7 [14 ∙ x2 2 ] 5 7 + [ x3 3 ] 5 7 } = = 3 8 ∙ [98 − 168 + 218 3 ] = 1 La función de distribución de la variable aleatoria X es: F(x) = { 0 si x < 5 3 8 ∙ ( x3 3 − 7x2 + 49x − 335 3 ) si 5 ≤ x ≤ 7 1 si x > 7 En efecto: Sea x < 5: F(x) = ∫ 0 dx x − = 0 Sea 5 x 7: F(x) = ∫ 3 8 ∙(7− x)2 dx x 5 = 3 8 ∙ ( x3 3 − 7x2 + 49x − 335 3 ) Sea x > 7: F(x) = ∫ 3 8 ∙(7− x)2 dx 7 5 = 1 Estadística y Análisis de Datos 8 ¿Esperaría ver con frecuencia una medición de pH debajo de 5,5? ¿Por qué? Para dar respuesta a esta pregunta debemos calcular P(X<5,5) para lo cual podemos utilizar la función de densidad o la función de distribución. Si utilizamos la función de densidad: P(X<5,5) = ∫ 3 8 ∙ (7 x) 2 dx = 5,5 5 0,5781 Esta probabilidad es el área sombreada de la Figura siguiente: Si utilizamos la función de distribución: P(X<5,5) = F(5,5) = 3 8 ∙ (49 ∙ 5,5 7 ∙ 5,52 + 5,53 3 335 3 ) = 0,5781 La probabilidad es un valor de ordenada. Estadística y Análisis de Datos 9 EL VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA La distribución de probabilidad para una variable es un modelo teórico para la distribución empírica de datos asociados, con una población real. Si el modelo es una representación precisa de la naturaleza, las distribuciones teóricas y empíricas son equivalentes, de manera que se trata de hallar la media y la varianza para una variable aleatoria y por lo tanto adquirir medidas numéricas descriptivas, parámetros, para la distribución de probabilidad. Definición: Sea X una variable aleatoria discretas sobre un espacio de probabilidad (S, A, P) con función de probabilidad puntual p. Denominamos esperanza matemática de X a E(X) = ∑xj. pj j =∑xj. pj 𝑗=1 si la serie converge absolutamente. Definición: Sea X una variable aleatoria continua sobre un espacio de probabilidad (S, A, P) con función de densidad de probabilidad f. Denominamos esperanza matemática de X a E(X) = ∫ x. f(x)dx +∞ −∞si la integral es absolutamente convergente. Ejemplo: Retomando el ejemplo 1 donde la distribución de probabilidad de la variable aleatoria X es: 𝐸(𝑋) = 1 ∙ 1 6 + 2 ∙ 1 6 + 3 ∙ 1 6 + 4 ∙ 1 6 + 5 ∙ 1 6 + 6 ∙ 1 6 = 7 2 E(X) no es el valor más probable ya que 7 2 ni siquiera es un valor posible de la variable aleatoria X, de esta manera. La interpretación adecuada para E(X) es considerar que si se realizara el experimento aleatorio en cuestión un número grande de veces y se promediaran los resultados obtenidos, se obtendría en promedio el valor de E(X), en este caso, 7 2 . Ejemplo: Retomando el ejemplo 1 de variable aleatoria continua. E(X) = ∫ x ∙ 3 8 ∙ (7 − x)2 7 5 = ∫ 3 8 x. (49 − 14x + x2) = ∫ ( 147 8 x − 21 4 x2 + 3 8 x3) = 7 5 7 5 = | 147 16 x2 − 7 4 x3 + 3 32 x4| 5 7 = 2401 32 − 2225 32 = 11 2 = 5,5 Propiedades: Supongamos que, en los siguientes casos, las esperanzas mencionadas existen. 1. Sea X = c donde c es una constante. Entonces E(X)=c 2. Sean X una variable aleatoria y a; b constantes. Entonces: E(a.X + b) = E(a.X) + E(b) = a.E(X) + b 3. Sean X1, X2 variables aleatorias. Entonces: x 1 2 3 4 5 6 P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6 Estadística y Análisis de Datos 10 E(X1 + X2) = E(X1) + E(X2) 4. Sean X1, X2, …, Xn variables aleatorias. Entonces: E(∑Xi n i=1 ) =∑E(Xi) n i=1 5. Sean X1, X2 variables aleatorias independientes. Entonces E(X1X2) = E(X1).E(X2) ESPERANZA MATEMÁTICA DE UNA FUNCIÓN DE VARIABLE ALEATORIA X Definición: Sea Y variable aleatoria cuya distribución depende de una variable aleatoria X, es decir Y = 𝑔(X), entonces definimos: E(Y) =⏞ DEF. E[g(X)]={ ∑ g(xj). pjj ∫ g(x). f(x)dx +∞ −∞ VARIANZA DE UNA VARIABLE ALEATORIA Definición: Sea X una variable aleatoria sobre un espacio de probabilidad (S, A, P) tal que E(X) existe. Llamamos varianza de X a D2(X) = E [(X E(X))2] si esta esperanza existe. Llamamos desviación típica o estándar de X a la raíz cuadrada positiva de D2(X). Propiedades: Supongamos que, en los siguientes casos, las esperanzas mencionadas existen. 1. Sea X = c donde c es una constante. Entonces D2(X) = 0 2. Sean X una variable aleatoria y a una constante. Entonces D2 (aX) = a2D2 (X) 3. Sean X una variable aleatoria y a una constante. Entonces D2 (X + a) = D2 (X) 4. Sean X1, X2 variables aleatorias independientes. Entonces D2(X1 + X2) = D2(X1) + D2(X2) 5. Sean X1, X2, …, Xn variables aleatorias independientes. Entonces D2 (∑Xi n i=1 ) =∑D2(Xi) n i=1 6. D2(X) = E(X2) [E(X)]2 Propiedades: 1. D(X)≥0 2. Si Y = a.X + b ⇒D(Y) = |a|.D(X) BIBLIOGRAFÍA 1. Walpole, Ronal E.; Myres Raymond H. Probabilidad y Estadística. Mc.Graw –Hill. 1992. 2. Mendenhall, W.; Wackerly, D.; Scheaffer, R. Estadística Matemática con Aplicaciones. Grupo Editorial Iberoamericana. 1994.
Compartir