Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Introduccion a la Estad́ıstica (Cap 3. secciones 1 a 3 del Bertsekas) Variables Aleatorias Continuas Rotnitzky, Ferrari, Cersosimo, Smucler Universidad Torcuato Di Tella Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 1 / 55 Breve recuento del descubrimiento de la distribución normal Abraham De Moivre fue un probabilista del siglo XVIII que entre otras tareas, trabajaba como consultor de apostadores en juegos de azar. Sus trabajos de consultoŕıa para juegos de azar requeŕıan hacer cálculos engorrosos de probabilidades. En muchos casos, estas tareas requeŕıan cálculos engorrosos de probabilidades de eventos relacionados con la distribución binomial Por ejemplo, para calcular la probabilidad de que salgan 7 o más caras en 12 tiros de una moneda balanceada De Moivre necesitaba calcular P (X � 7) = = ✓ 12 7 ◆✓ 1 2 ◆12�7 ✓ 1 2 ◆7 + ✓ 12 8 ◆✓ 1 2 ◆12�8 ✓ 1 2 ◆8 + ...+ ✓ 12 12 ◆✓ 1 2 ◆0 ✓ 1 2 ◆12 = ✓ 12 7 ◆ + ✓ 12 8 ◆ + ...+ ✓ 12 12 ◆� ⇥ ✓ 1 2 ◆12 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 2 / 55 La aproximación de De Moivre De Moivre, notó que a para X ⇠ Bin (n, 1/2) , a medida que n aumentaba, la forma del histograma de X se aproximaba más y más a una curva suave con una forma muy espećıfica parecida a la de una campana. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 3 / 55 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 4 / 55 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 5 / 55 La aproximación de De Moivre De Moivre razonó entonces que si supiera la forma de la curva suave, podŕıa evitar los cálculos engorrosos aproximando la probabilidad del evento de interés con el área bajo la curva suave sobre el intervalo correspondiente a dicho evento. Bin (50, 0.8) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 6 / 55 La aproximación de De Moivre En 1738, De Moivre desarrolló unos cálculos de los cuales esencialmente pod́ıa desprenderse que la fórmula de la curva aproximante era y = 1p 2ps2 e� 1 2s2 (x�µ)2 siendo µ = np y s2 = np (1� p) Tres cuartos de siglo más tarde, concretamente en 1809, otro matemático brillante llamado Karl Gauss arribó a la misma curva pero por otro camino. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 7 / 55 El modelo de Galileo para el error de medición En el siglo XVII Galileo Galilei hab́ıa notado que sus mediciones astronómicas de la distancia desde el centro de la tierra a una estrella teńıan errores, es decir no eran siempre iguales. Estos errores ocurŕıan, entre otras cosas, porque los instrumentos de medición eran imperfectos, porque sus observaciones tampoco eran precisas, y porque las condiciones ambientales no eran siempre idénticas. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 8 / 55 El modelo de Galileo para el error de medición Galileo planteó un modelo para los errores de sus mediciones que traducido al lenguaje moderno era el siguiente. Modelo: El error cometido en una medición de la distancia de la Tierra a una estrella es una variable aleatoria: que puede tomar cualquier valor real, con distribución simétrica alrededor de 0, es decir, con igual probabilidad de caer en (�b,�a) que en (a, b). con mayor probabilidad de tomar valores absolutos pequeños que grandes Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 9 / 55 El modelo de Gauss para el error de medición Gauss adoptó las tres suposiciones de Galileo pero le agregó la siguiente suposición adicional: dadas n mediciones en condiciones similares de la misma distancia, el valor ”más probable” de la distancia real es el promedio aritmético de las n mediciones. Increiblemente, con esta sola suposición adicional el joven Gauss dedujo que si X representa el error aleatorio de una medición, entonces la probabilidad de que X caiga entre a y b debe ser igual a P (a X b) = Z b a 1p 2ps2 e� 1 2s2 (x�µ)2dx para µ = 0 y algún s > 0 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 10 / 55 La distribución Normal y el Teorema Central del Ĺımite Al año siguiente de la publicación de Gauss, otro brillante probabilista, Pierre-Simon Laplace, descubrió un resultado maravilloso, conocido como el Teorema Central del Limite -TCL- llamado aśı por su obicuidad en la probabilidad y estad́ıstica. Este teorema explica el misterioso resultado de Gauss. Pronto estudiaremos formalmente el TCL pero por ahora alcanza decir que del Teorema se desprende esencialmente que cualquier fenómeno aleatorio X que puede suponerse como el resultado de la suma aritmética de cantidades que cuantifican muchos fenómenos aleatorios independientes satisface que P (a X b) se puede aproximar por el área entre a y b bajo una curva normal para un cierto valor de µ y s. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 11 / 55 La distribución Normal y el Teorema Central del Ĺımite El TCL explica el resultado de Gauss si partimos de la premisa que el error de una medición astronómica es el resultado de la suma aritmética de muchos errores atómicos que actúan independientemente, por ejemplo: los errores en los distintos engranajes del instrumento de medición, las distintas percepciones del observador, las condiciones ambientales, etc. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 12 / 55 La distribución Normal y el Teorema Central del Ĺımite Con el correr de los años la comunidad cient́ıfica comprendió que la curva de De Moivre y Gauss aproximaba muy bien la distribución de las variables aleatorias que representaban mediciones de muchos feńomenos aleatorios que ocurren en la naturaleza y en el comportamiento humano con valores espećıficos de µ y s2 para cada fenómeno. Por esta razón, hoy en d́ıa a la función fX (x) = 1p 2ps2 e� 1 2s2 (x�µ)2 se la conoce como curva o distribución normal. Si estás interesado en leer sobre la historia de la distribución normal, te recomiendo el art́ıculo que encontrarás en https://www.maa.org/sites/default/files/pdf/upload library/22/Allendoerfer/stahl96.pdf Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 13 / 55 Caracteŕısticas de la curva Normal Es una curva suave (posee infinitas derivadas en cada valor de x) Toma valores positivos en toda la recta real, pero asigna valores muy pequeños, casi nulos, a x que difieren de µ en más de ±3s. Es unimodal, es decir tiene un solo máximo local, que por lo tanto es máximo global, y que se atiene en el valor x = µ Es simétrica alrededor de µ El valor de s controla la dispersión de la curva alrededor de µ. Tiene puntos de inflexión, pasando de cóncava a convexa o viceversa, en x = µ � s y x = µ + s El área bajo la curva sobre toda la recta real es igual a 1. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap3. secciones 1 a 3 del Bertsekas) 14 / 55 La curva Normal Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 15 / 55 Variable aleatoria y distribución Normal Definición: una variable aleatoria X tiene una distribución Normal o Gaussiana con media µ y desv́ıo estandard s si X puede tomar cualquier valor en la recta real y para cualquier a< b, P (a X b) = Z b a fX (x) dx siendo fX (x) = 1p 2ps2 e� 1 2s2 (x�µ)2 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 16 / 55 Variable aleatoria y distribución Normal Para indicar que X es una v.a. Normal con media µ y desv́ıo estandard s escribimos X ⇠ N � µ, s2 � La función fX (x) = 1p 2ps2 e� 1 2s2 (x�µ)2 se denomina función de densidad de la distribución Normal. Cuando µ = 0 y s = 1, se dice que X tiene una distribución Normal Estandard . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 17 / 55 Variable aleatoria y distribución Normal Si X ⇠ N � µ, s2 � , entonces X es una variable aleatoria continua pues puede tomar valores en cualquier punto de (�•,+•). Muchas variables X que estudiamos en econoḿıa, finanzas y negocios, por ejemplo la demanda mensual X de un cierto árticulo en un comercio el logaritmo del ingreso mensual X de un hogar elegido al azar en una región del páıs el retorno mensual X de un cierto portafolio de inversión a menudo se las modela asumiendo que tienen una distribución aproximadamente normal, esto es P (a X b) ⇡ Z b a fX (x) dx para fX (x) = 1p 2ps2 e � 1 2s2 (x�µ)2 y para cierto µ y s > 0. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 18 / 55 Cálculo de probabilidades bajo la distribución Normal Cuando fX (x) es la densidad de una variable aleatoria con distribución N � µ, s2 � , P (a X b) = Z b a fX (x) dx Recordá que la integral entre a y b de una función es el área bajo la curva para todos los x entre a y b. Por ejemplo, si a = �2.43, b = 1.81 y fX es la densidad de una Normal estandard, entonces R b a fX (x) dx es el área pintada de celeste en el siguiente gráfico Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 19 / 55 Cálculo de probabilidades bajo la distribución Normal Lamentablemente, para fX la densidad de una distribución normal, la integral no se puede resolver anaĺıticamente, es decir, no hay una fórmula para el resultado de integrar entre a y b a fX (x). Sin embargo, existen muchas formas prácticas de calcular los valores de la aśı llamada distribución acumulada FX (u) = P (X u) = Z u �• fX (x) dx Una vez que sabemos calcular P (X u) para cualquier u, podemos calcular P (a X b) con la fórmula P (a X b) = FX (b)� FX (a) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 20 / 55 Variable aleatoria y distribución Normal Las distribución acumulada FX (u) de la Normal Estandard se puede calcular por medio de: tablas�que�aparecen�en� los�apendices�de�casi�todos� los� libros� introductorios�de�estadistica Excel�(Add-In�“Analysis�ToolPak”) distintos�paquetes�con�software�para� realizar�analisis�estad́ıstico�como� Stata,�R,�SAS,�SPSS calculadores�disponibles�gratuitamente�en� la�web,�por�ejemplo IUUQ���EBWJENMBOF�DPN�IZQFSTUBU�[@UBCMF�IUNM Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 21 / 55 Cálculo para la distribución Normal en R Hay dos tipos de cálculos que podemos realizar faćılmente en R. Cálculo 1: Dado x , calcular P(X x) =?. Cálculo 2: Dado p, calcular P(X ?) = p. Para calcular P (X x) cuando X ⇠ N � mu, sigma2 � usamos pnorm(x, mu, sigma) Por ejemplo, para calcular P (X 2) cuando X ⇠ N � 3, 12 � usamos pnorm(2,3,1) [1] 0.1586553 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 22 / 55 Cuantil de una distribución Definición: para cualquier variable aleatoria X continua, se denomina cuantil p de la distribución de X al valor q que resuelve la ecuación P (X q) = p Es decir el cuantil p de X es aquel valor tal que la probabilidad de que X este por debajo de ese valor es igual a p. Al cuantil p = 0.5 se lo denomina la mediana de X vemos entonces que el comando en R qnorm(p, mu, sigma) calcula el cuantil p de una v.a. X ⇠ N � mu, sigma 2 � Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 23 / 55 Función lineal de una v.a. Normal Teorema: si X ⇠ N � µ, s2 � entonces Z = aX + b ⇠ N � aµ + b, a2s2 � . Por ejemplo, si X ⇠ N � 1, 1 2 � entonces Z = 2X + 3 ⇠ N � 5, 2 2 � En particular, si X ⇠ N � µ, s2 � ) Z = X � µ s ⇠ N (0, 1) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 24 / 55 Función lineal de una v.a. Normal El teorema de la filmina anterior tiene importantes consecuencias prácticas. Veamos algunas 1. Si una v.a. medida en una cierta escala sigue una distribución normal entonces, cuando la medimos en otra escala también sigue una distribución normal -con otra media y desv́ıo estandard- siempre que el cambio de escala sea lineal. Supongamos que el peso medido en kg de una persona elegida al azar de una cierta población es una variable aleatoria X ⇠ N � µ, s2 � . Llamá Y al peso de la misma persona, pero expresado en gramos. Entonces Y = 1000X luego Y ⇠ N ⇣ 1000µ, 10002s2 ⌘ 2. A la transformación X ! X�µs se la llama habitualmente ”estandardización” de la v.a.� X�.� 4J� 9¦� �ϯ��L�FOUPODFT�9�����Lϯ �RVJFSF�EFDJS�RVF�9�TF�FODVFOUSB�B�L�EFTWJPT�FTUBOEBSE� QPS� BSSJCB� TJ� L� FT�QPTJUJWP �P�QPS� BCBKP� TJ� L� FT�OFHBUJWP �EF� MB�NFEJB��� Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 25 / 55 Ejemplo de un uso real de la v.a. Normal Ejemplo: Suponé que, en base a registros anteriores, la demanda mensual de pares de botas de cuero en el mes de Julio a tu fábrica es una v.a. X que podés razonablemente asumir que sigue aproximadamente una distribución N � 1500, 100 2 � . Problema 1: [Calcular P(X x) =? para un x dado]. Si durante el mes de Julio produćıs 1600 pares de botas, ¿cuál es la probabilidad de satisfacer la demanda? Problema 2: [Calcular P(X ?) = p para un p dado]. ¿Cuántos pares de botas debés producir para que la probabilidad de satisfacer la demanda durante el mes de Julio sea 0.95? Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 26 / 55 Solución al problema 1 Queremos calcular p = P (X 1600) sabiendo que X ⇠ N � 1500, 100 2 � . En R, encontramos la solución con el comando pnorm(1600,1500,100) [1] 0.8413447 La probabilidad de satisfacer la demanda es 0.84 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 27 / 55 Solución al problema 2 Queremos calcular el valor x tal que P (X x) = 0.95. En R, encontramos la solución con el comando qnorm(0.95,1500,100) [1] 1664.485 Concluimos que necesitamos 1665 botas para que la probabilidad de cubrir la demanda sea 0.95 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3del Bertsekas) 29 / 55 Variable aleatoria y distribución uniforme continua La variable aleatoria normal no es la única v.a. continua. A continuación estudiaremos otra motivándola con el siguiente ejemplo. Ejemplo. Supongamos que los subtes de una cierta ĺınea llegan a una estación cada 10 minutos. Juan arriba a la estación en un momento dado cualquiera. ¿Cuál es la probabilidad de que tenga que esperar menos de 3 minutos a que arribe el tren? Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 32 / 55 Solución al ejemplo Llamemos X a los minutos que transcurrieron desde que pasó el último tren hasta que llegó Juan. X puede tomar cualquier valor en el intervalo (0, 10) . Luego es una variable cont́ınua. Deseamos calcular P (X > 7) . Sin más información que la que conocemos, no hay razón para pensar que sea más probable que X esté en el intervalo (0, 1) que en el intervalo (1, 2) . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 33 / 55 Variable aleatoria y distribución uniforme continua Más generalmente, para dos subintervalos cualesquiera, (a, b) y (c , d) de (0, 10) de la misma longitud, los eventos X 2 (a, b) y X 2 (c , d) deben ser equiprobables, o sea P (a X b) = P (c X d) Es posible deducir que ésta condición de igualdad implica que para cualquier a < b, debe necesariamente ocurrir que P (a X b) = b� a 10 Luego, la respuesta es P (X > 7) = P (7 < X 10) = P (7 X 10) = 10� 7 10 = 0.3 Notá que P (7 < X 10) = P (7 X 10) porque P (X = 7) = 7�710 = 0 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 34 / 55 Variable aleatoria y distribución uniforme continua P (a X b) = b� a 10 si 0 a < b 10 Notá que para todo 0 a < b 10 P (a X b) = Z b a fX (x) dx donde fX (x) = 1 10 = 1 longitud del intervalo [0, 10] Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 35 / 55 Variable aleatoria y distribución uniforme cont́ınua Observá que si definimos fX (x) = ⇢ 1 10 si 0 x 10 0 de otro modo entonces para cualquier a < b, (no necesariamente 0 a ni b 10) P (a X b) = Z b a fX (x) dx Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 36 / 55 Variable aleatoria y distribución uniforme continua Por ejemplo, si a < 0 < b < 10, entonces P (a X b) = Z b a fX (x) dx = Z 0 a fX (x) dx + Z b 0 fX (x) dx = Z 0 a 0dx | {z } =0 + Z b 0 1 10 dx = 1 10 (b� 0) = P (0 < X < b) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 37 / 55 Variable aleatoria y distribución uniforme continua Definición: Una variable aleatoria continua X es uniforme sobre un intervalo [L,U ] cuando se verifica que para todo a < b P (a X b) = Z b a fX (x) dx donde fX (x) = ⇢ 1 U�L si L x U 0 de otro modo Cuando X es uniforme sobre un intervalo [L,U ] lo abreviamos como X ⇠ Unif (L,U) La función fX (x) definida arriba se llama función de densidad de una v.a. Unif (L,U) . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 38 / 55 Variable aleatoria y distribución uniforme continua El gráfico de la función fX (x) es Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 39 / 55 Variable aleatoria y distribución uniforme continua Notá que debido a que (a, b) y (c , d) son dos intervalos con igual longitud, entonces P (a < X < b) = P (c < X < d) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 40 / 55 Variable aleatoria cont́ınuas y función de densidad Para las v.a. normales y uniformes, hemos visto que existe una cierta función fx (x) tal que para todo a < b, P (a X b) = Z b a fX (x) dx La situación es más general: t́ıpicamente, cuando una variable aleatoria es continua (no necesariamente uniforme o normal), existe una función fX (x) tal que para cualquier a < b podemos calcular P (a X b) como en la ecuación anterior. Definición: Decimos que fX (x) es la función de densidad de una variable aleatoria continua X cuando para cualquier a < b se verifica que P (a X b) = Z b a fX (x) dx Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 41 / 55 Variable aleatoria cont́ınuas y función de densidad Notemos que para cualquier v.a. con alguna densidad fX (x) se verifica que P (X = c) = 0 para cualquier constante c pues P (X = c) = P (c X c) = Z c c fX (x) dx = 0 Propiedades de una función de densidad fX (x): fX (x) � 0 para todo x R • �• fX (x) dx = 1 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 42 / 55 Función de distribución acumulada Definción: dada una variable aleatoria X cualquiera (continua o discreta) la función de distribución acumulada se define como FX (x) = P (X x) Resultado: P (a < X b) = F (b)� F (a) Demostracion: sea B = (�•, b] y A = (�•, a]. Entonces B �A = (a, b] y por lo tanto P (a < X b) = P (X 2 B � A) = P (X 2 B)� P (X 2 A) = P (X b)� P (X a) = F (b)� F (a) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 43 / 55 Función de distribución acumulada Notemos que si X es una v.a. continua con densidad fX (x) su función de distribución acumulada satisface FX (x) = Z x �• fX (u) du Ejemplo: si X ⇠ Unif (L,U) entonces FX (x) = 8 < : 0 si x < L x�L U�L si L x < U 1 si x > U pues, por ejemplo, si L x < U, FX (x) = Z x �• fX (u) du = Z L �• fX (u) du + Z x L fX (u) du = Z L �• 0du + Z x L 1 U � Ldu = x � L U � L Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 44 / 55 Esperanza de una v. a. continua Definición: si X es una v.a. continua con densidad fX (x) , la esperanza de X se define como E (X ) = Z • �• xfX (x) dx siempre que la integral exista, es decir, siempre queR • �• |x | fX (x) dx < •. Si R • �• |x | fX (x) dx = • entonces diremos que la esperanza de X no existe. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 45 / 55 Esperanza de una v. a. continua A E (X ) también se la denomina: Media de X Valor medio de X Al igual que para v. a. discretas, E (X ) ocupa un lugar espećıfico en el gráfico de la función de densidad fX (x) . Concretamente, si imaginamos que en el gráfico de fX (x) , el área bajo la curva de densidad esta ocupada por una superficie de peso homogéneo sobre el eje horizontal, entonces E (X ) es el punto del eje horizontal donde la superficie se equilibra, es decir, es el baricentro o centro de gravedad del eje que sostiene la superficie. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 46 / 55 Esperanza de v.a. Normal y Uniforme si X ⇠ N � µ, s2 � entonces E (X ) = µ si X ⇠ Unif (L,U) entonces E (X ) = U + L 2 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 47 / 55 Esperanza dev.a. Normal y Uniforme Demostración de la fórmula de la esperanza para X ⇠ Unif (L,U) E (X ) = Z • �• xfX (x) dx = Z L �• xfX (x) dx | {z } =0 + Z U L xfX (x) dx + Z • U xfX (x) dx | {z } =0 = Z U L x 1 U � Ldx = 1 U � L Z U L xdx = 1 U � L � U2 � L2 � /2 = 1 U � L (U � L) (U + L) /2 = (U + L) /2 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 48 / 55 Esperanza de una función de una v.a. cont́ınua Teorema: Supongamos que X es una v.a. continua e Y = g (X ) para alguna función g . Entonces, si R • �• |g (x)| fX (x) dx < •, E (Y ) = Z • �• g (x) fX (x) dx Si R • �• |g (x)| fX (x) dx = • entonces la esperanza de Y no existe. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 49 / 55 Esperanza de una función lineal de una v.a. cont́ınua Teorema: Supongamos que X es una v.a. continua tal que E (X ) existe y supongamos que Y = a+ bX para algunas constantes a y b. Entonces E (Y ) = a+ bE (X ) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 50 / 55 Demostración del teorema E (Y ) = Z (a+ bx) fX (x) dx = Z • �• afX (x) dx + Z • �• bxfX (x) dx = a Z • �• fX (x) dx | {z } =1 + b Z • �• xfX (x) dx | {z } =E (X ) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 51 / 55 Ejemplo de esperanza de una función lineal de una v.a. cont́ınua Ejemplo 1: Un vendedor de una tienda de electrodomesticos recibe un sueldo mensual fijo de $5000 más el 8% del monto total de todas las ventas que genera durante el mes. Supongamos que el monto total de las ventas generadas en enero por el vendedor es una variable aleatoria X con media $600.000. Cual es la esperanza del sueldo de enero del vendedor? Solucion: Sea Y el sueldo en pesos de enero del vendedor. Entonces Y = 5000+ 0.08X Luego, E (Y ) = 5000+ 0.08E (X ) = 5000+ 0.08⇥ 600000 = 53000 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 52 / 55 Varianza y desv́ıo estandard de una v.a. continua Definición: La varianza y el desv́ıo estandard de una variable aleatoria continua X se definen respectivamente como var (X ) = E h (X � E (X ))2 i SD (X ) = q var (X ) Cuando E h (X � E (X ))2 i no existe, entonces var (X ) = SD (X ) = •. Al igual que para variables aleatorias discretas, la varianza de una v.a. continua mide el cuadrado de la dispersión promedio de la v.a. alrededor de la media. También al igual que para v.a. discretas, la varianza de una v.a. continua se puede cacular como var (X ) = E � X 2 � � [E (X )]2 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 53 / 55 Varianza de v.a. Normales y Uniformes si X ⇠ n � µ, s2 � entonces var (X ) = s2 si X ⇠ Unif (L,U) entonces var (X ) = (U � L)2 12 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 54 / 55 Varianza de una función lineal de una v.a. cont́ınua Resultado: Si X es una v.a. continua e Y = a+ bX , entonces var (Y ) = b2var (X ) Ejemplo: supongamos que X es la ganancia o pérdida anual por cada 100$ invertidos en una acción. Si var (X ) = 16, ¿cuál es la varianza de la ganancia de una inversión de 300$? Solución: para una inversión de 300$ la ganancia es 3X . Luego, la varianza de la ganancia es var (3X ) = 9var (X ) = 9⇥ 16 = 144 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap 3. secciones 1 a 3 del Bertsekas) 55 / 55
Compartir