Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Introduccion a la Estad́ıstica (Cap. 2, sección 2.4 del Bertsekas) Esperanza y Varianza Rotnitzky, Ferrari, Cersosimo, Smucler Universidad Torcuato Di Tella Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 1� / 6 2 Esperanza y Varianza. Motivación La función de prob. de masa de una v.a. codifica las probabilidades de todos los posibles valores de una v.a. La esperanza y la varianza son dos caracteŕısticas muy informativas acerca de la distribución de una v.a. La esperanza caracteriza el baricentro del histograma. La ráız cuadrada de la varianza, llamada el desv́ıo estándard, caracteriza la dispersión del histograma alrededor de la esperanza. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 2� /� 6 Esperanza. Motivación Recodá el ejemplo de la ganancia en el juego de ruleta cuya fc de prob. de masa es, redondeando, y -10 -8 -6 -4 -2 0 2 4 6 8 10 pY (y ) 0.002 0.015 0.059 0.143 0.225 0.243 0.182 0.094 0.032 0.006 0.001 Todos los d́ıas hay mucha gente, que como vos, hace 10 apuestas de 1 peso al colorado. La interpretación frecuentista de la prob. nos dice que de toda esa gente, alrededor del 0.2% tendrá una ganancia de -10 pesos, o sea una pérdida de 10 pesos. 1.5% tendrá una ganancia de -8 pesos 5.9% tendrá una ganancia de -6 pesos ... 3.2% tendrá una ganancia de 6 pesos 0.6% tendrá una ganancia de 8 pesos 0.1% tendrá una ganancia de 10 pesos Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 3� /� 2 Esperanza. Motivación Entonces con N jugadores habrá, aproximadamente, una ganancia de Ganancia total ⇡ N ⇥ {(�10)⇥ 0.002+ (�8)⇥ 0.015+ ....+ 8⇥ 0.006+ 10⇥ 0.001} = N ⇥ (  y2Y y pY (y ) ) Por lo tanto Promedio de la Ganancia = Ganancia total / N ⇡  y2Y y pY (y ) = �0.526 El valor Ây2Y y pY (y ) = �0.526 es la ganancia media o promedio por jugador ”a la larga” (o sea la pérdida promedio por jugador es 0.526). Observá que como Ây2Y pY (y ) = 1, entonces Ây2Y y pY (y ) es un promedio ponderado , donde el peso de cada y es la probabilidad P (Y = y ) . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 4� /� 2 Esperanza. Motivación Definición: La esperanza de una variable aleatoria discreta X con soporte X se define como E (X ) =  x2X x pX (x) Observaciones: Si el soporte X es infinito, entonces E (X ) existe si y sólo si Âx2X |x | pX (x) < •. E (X ) es un promedio ponderado de todos los posibles valores de X . E (X ) puede no estar en el soporte de X . Por ejemplo, para la ganancia de las apuestas a la ruleta, el soporte de X es X = {�10,�8,�6, ..., 6, 8, 10} pero E (X ) = �0.526 no está en X . E (X ) es el baricentro del histograma de X E (X ) también se llama la media de X Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 5� /� 2 Esperanza como baricentro del histograma Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 6� / 6 2 Esperanza. Repaso de la intrerpretación frecuentista Suponé que durante muchos d́ıas hacés, cada d́ıa, 10 apuestas de 1 peso al colorado en la ruleta. La interpretación frecuentista de la prob. nos dice que de todos esos d́ıas, en alrededor del 0.2% tendrás una ganancia de -10 pesos, o sea una pérdida de 10 pesos. 1.5% tendrás una ganancia de -8 pesos 5.9% tendrás una ganancia de -6 pesos ... 3.2% tendrás una ganancia de 6 pesos 0.6% tendrás una ganancia de 8 pesos 0.1% tendrás una ganancia de 10 pesos Luego, tu ganancia promedio será, aproximadamente, E (Y ) = (�10)⇥ 0.002+ (�8)⇥ 0.015+ ....+ 8⇥ 0.006+ 10⇥ 0.001 = �0.526 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 7� / 6 2 Esperanza. Repaso de la intrerpretación frecuentista Tu ganancia promedio será, aproximadamente, E (Y ) = (�10)⇥ 0.002+ (�8)⇥ 0.015+ ....+ 8⇥ 0.006+ 10⇥ 0.001 = �0.526 Ésto no quiere decir que en un d́ıa particular vayas a perder 0.526 pesos, de hecho esa pérdida no puede ocurrir nunca porque -0.526 no está en el soporte de Y . En cualquier d́ıa la probabilidad de que tu ganancia sea positiva es P (Y > 0) = pY (2) + pY (4) + pY (6) + pY (8) + pY (10) = 0.182+ 0.094+ 0.032+ 0.006+ 0.001 = 0.315 La banca, en cambio, tiene una ganancia promedio por jugador de 0.526 pesos. Luego, si juegan N jugadores, la banca tendrá una ganancia de alrededor de N ⇥ 0.526$. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 8�� 6 2 Esperanza. Otro ejemplo Los sitios de crowdfunding ayudan a reunir inversores a pequeña escala (retail investor) para la financiación de start-ups. Las estad́ısticas indican que, al cabo de 12 meses, de los start-ups que reciben un crowdfunding inicial de 10,000 dólares de c/pequeño inversor: 50% irá a la quiebra 30% requerirá otra inyección de 10000 dólares de c/pequeño inversor. Al cabo de otros 6 meses: 50% irá a la quiebra 50% recibirá una inyección importante de capital de grandes inversores (venture capital). 20% recibirá una inyección importante de venture capital. De los que reciben en algún momento capital de grandes inversores 2/3 irán a la quiebra 1/3 resultará en un negocio exitoso, otorgando una pago a c/pequeño inversor de 150,000 dólares Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 9� /� 6 Esperanza. Otro ejemplo Sos un pequeño inversionista y estás pensando en invertir 10000 dólares en una start-up. 1 ¿Cuáles son los posibles valores del retorno neto de tu inversión? 2 ¿Qué probabilidades tienen cada uno de los posibles retornos netos? 3 ¿Cuál es la esperanza de tu retorno neto? Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 10� /� 2 Esperanza. Otro ejemplo Sea X =” retorno neto de tu inversión”. 1 Los posibles valores del retorno neto conforman el soporte de X . Éstos son -20k, -10k, 130k y 140k 2 Las probabilidades de los posibles retornos definen la fc de probabilidad de masa de X x -20k -10k 130k 140k pX (x) 0.3⇥ 0.5+ 0.3⇥ 0.5⇥ 0.67 0.5+ 0.2⇥ 0.67 0.3⇥ 0.5⇥ 0.33 0.2⇥ 0.33 = 0.250 5 = 0.634 = 0.049 5 = 0.066 3 La esperanza de tu retorno neto, en unidades de mil, es E (X ) = (�20k)⇥ 0.250 5+ (�10k)⇥ 0.634+ 130k ⇥ 0.049 5+ 140k ⇥ 0.066 = 4. 325k Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 11� /� 2 Histograma del retorno neto y su esperanza Observá que los altos retornos de pequeña probabilidad empujan a la esperanza hacia la derecha del histograma y hacen que resulte en un valor positivo El histograma ilustra que esta inversión es de alto riesgo, porque por más que la esperanza sea positiva, hay una chance muy alta de que tu retorno sea negativo. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 12� /6 2 Esperanza de una constante. Proposición: si X = c es una constante, entonces E (X ) = c Demostración: si X = c entonces P (X = c) = 1. Luego, el soporte de X es X = {c} y E (X ) =  x2X x pX (x) = c pX (c) = c ⇥ 1 = c Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 13� /6 2 Esperanza de una funciónde una v.a. Proposición: si Y = g (X ) donde g : R ! R y X es una v.a. discreta con soporte en X , entonces E (Y ) =  x2X g (x) pX (x) Demostración: el soporte de Y es el conjunto Y = {y : y = g (x) para algún x 2 X} Luego E (Y ) =  y2Y yP (Y = y ) =  y2Y y 8 < :  x2X :g (x)=y P (X = x) 9 = ; =  y2Y  x2X :g (x)=y g (x)P (X = x) =  x2X g (x) pX (x) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 14� /6 2 Esperanza de una función lineal de una v.a. Corolario de la proposición: sean a y b constantes y X una v.a.. Entonces, si E (X ) existe, E (aX + b) = aE (X ) + b Demostración: sea g (x) = ax + b. Entonces, por la proposición de la filmina anterior, E (aX + b) = E [g (X )] =  x2X g (x) pX (x) =  x2X (ax + b) pX (x) =  x2X (axpX (x) + bpX (x)) = a  x2X xpX (x) | {z } =E (X ) + b  x2X pX (x) | {z } =1 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 15� /6 2 Esperanza de la suma de v.a. Proposición: Si X e Y son v.a. tales que E (X ) y E (Y ) existen. Entonces E (X + Y ) = E (X ) + E (Y ) La demostración de esta proposición la posponemos hasta cuando estudiemos distribuciones conjuntas de vectores aleatorios. Sin embargo, podemos dar una intuición de esta propiedad invocando la interpretación frecuentista de probabilidad. Imaginá que pudieras repetir infinitamente el experimento aleatorio que da lugar a X e Y llama X n e Y n y � X + Y � n a los promedios de los resultados de X , Y y (X + Y ) en los primeros n experimentos. Entonces � X + Y � n = X n + Y n # = # # E (X + Y ) = E (X ) + E (Y ) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 16� /6 2 Esperanza de una v.a. Bernoulli Proposición: la esperanza de una v.a. Bernoulli X ⇠ Ber (p) es igual a la probabilidad de éxito p. Demostración: E (X ) =  x2X xpX (x) = 1⇥ pX (1) + 0⇥ pX (0) = 1⇥ p + 0 = p Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 17� /6 2 Esperanza de una v.a. Binomial Proposición: la esperanza de una v.a. Binomial X ⇠ Bin (n, p) es igual a np Demostración: Como X ⇠ Bin (n, p) entonces se puede escribir como X = Ânj=1 Xj donde Xj ⇠ Ber (p) . Luego E (X ) = E n  j=1 Xj ! = n  j=1 E (Xj ) = n  j=1 p = np Observá que la segunda igualdad es cierta por la proposición que vimos anteriormente que afirma que la esperanza de una suma de v.a. es la suma de las esperanzas. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 18� /6 2 Ejemplo del uso de las proposiciones para facilitar cálculos En el ejemplo de las 10 apuestas al colorado en la ruleta vimos que la ganancia Y era igual a Y = 2X � 10 donde X ⇠ Bin (10, 18/38) es el número de tiros en los que la ruleta cae en colorado. En las primeras filminas calculamos la esperanza E (Y ) de la ganancia Y , calculando primero la fc de prob de masa pY (y ) y luego aplicando la definición de esperanza. Ahora veremos como las proposiciones de las filminas anteriores nos ofrecen un atajo que nos lleva a E (Y ) con muy pocos cálculos. 1 Como X ⇠ Bin (10, 18/38) entonces E (X ) = 10⇥ 18/38 2 Como Y = 2X � 10 es una fc lineal de X , entonces E (Y ) = 2E (X )� 10 = 2⇥ (10⇥ 18/38)� 10 = �0.526 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 19� /6 2 Esperanza de una función no lineal de X Hemos visto que para g (x) = ax + b vale que E [g (X )] = g [E (X )] Esta relación NO VALE cuando g (x) es una función NO LINEAL de x Por ejemplo, para g (x) = 2X , E h 2X i 6= 2E (X ) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 20� /6 2 Esperanza de una v.a. Uniforme Proposición: la esperanza de una v.a. Uniforme X ⇠ Unif (n) es igual al promedio de todos los valores de su soporte. Demostración: Como X ⇠ Unif (n) entonces su soporte X tiene n elementos y P (X = x) = 1/n para todo x en X . Luego E (X ) =  x2X xpX (x) =  x2X x 1 n = promedio de los x 2 X Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 21� /6 2 Esperanza de una v.a. Poisson Proposición: la esperanza de una v.a. Poisson X ⇠ Pois (l) es igual a l Demostración: E (X ) = •  x=0 xpX (x) = •  x=� xe�l lx x ! = e�l •  x=1 lx (x � 1)! = le�l •  x=0 lx x ! = le�lel = l Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 22� /6 2 Histogramas de v.a. Poisson con sus esperanzas Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 23� /6 2 Varianza y desv́ıo estándard: motivación Suponé que en el problema del crowdfunding un pequeño inversor llamado Juan decide invertir el doble de lo que vas invertir vos, esto es: inicialmente invierte 20000 dólares y, en caso de que haga falta, inyectará otros 20000 dólares. Llamá Z al retorno de la inversión de Juan. La fcn de prob. de masa de Z es Z -40k -20k 260k 280k pZ (z) 0.3⇥ 0.5+ 0.3⇥ 0.5⇥ 0.67 0.5+ 0.2⇥ 0.67 0.3⇥ 0.5⇥ 0.33 0.2⇥ 0.33 = 0.250 5 = 0.634 = 0.049 5 = 0.066 Recordá que tu retorno X teńıa fcn de prob. de masa X -20k -10k 130k 140k pX (x) 0.3⇥ 0.5+ 0.3⇥ 0.5⇥ 0.67 0.5+ 0.2⇥ 0.67 0.3⇥ 0.5⇥ 0.33 0.2⇥ 0.33 = 0.250 5 = 0.634 = 0.049 5 = 0.066 La esperanza E (Z ) del retorno de Juan es igual a E (Z ) = 2E (X ) = 8.65k pues Z = 2X . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 24� /6 2 Varianza y desv́ıo estándard: motivación La esperanza del retorno de Juan es el doble que la esperanza de tu retorno. Sin embargo, Juan arriesga más capital que vos. Su inversión es más riesgosa que la tuya porque si bien puede ganar más, también puede perder más que vos. El retorno de la inversión de Juan está más disperso alrededor de su esperanza ¿Cómo podemos medir esa dispersión? El desv́ıo estándard de una v.a. mide la dispersión de la distribución de una v.a. alrededor de su esperanza. El desv́ıo estándard se define como la ráız cuadrada de la varianza En las próximas filminas definiremos estas medidas. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 25� /6 2 Varianza y desv́ıo estándard: definiciones Definición: 1 La varianza de una v.a. X se define como Var (X ) = E h (X � E (X ))2 i . 2 El desv́ıo estándard de una v.a. X se escribe como SD (X ) y se define como SD (X ) = r E h (X � E (X ))2 i Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 26�� 62 Varianza y desv́ıo estándard: observaciones La varianza de una v.a. X discreta con soporte X se calcula como Var (X ) =  x2X (x � E (X ))2 pX (x) O sea, para calcular Var (X ) : 1ero calculamos la esperanza de X ,E (X ) 2do, para cada x en el soporte de X , calculamos el cuadrado del desv́ıo de x alrededor de E (X ) : (x � E (X ))2 3ero, calculamos el promedio ponderado de los cuadrados de los desv́ıos con ponderaciones iguales a P (X = x) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 27�� 62 Varianza y desv́ıo estándard: unidades de medición La varianzaes el promedio ponderado de las distancias al cuadrado de cada posible valor de X a la media de X con ponderaciones iguales a las probabilidades de esos resultados. Entonces la varianza se expresa en unidades al cuadrado, por ejemplo, dólares2, pesos2, etc El desv́ıo estándard se expresa en la unidad original, por ejemplo, dólares, pesos, etc . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 28�� 62 Varianza y desv́ıo estándard: ejemplo Recordá que para tu inversión el retorno teńıa distribución X -20k -10k 130k 140k pX (x) 0.250 5 0.634 0.049 5 0.066 y la esperanza del retorno de tu inversión era E (X ) = 4.325k Entonces, la varianza de tu retorno es Var (X ) = (�20� 4.325)2 k2 ⇥ 0.250 5+ (�10� 4.325)2 k2 ⇥ 0.634 + (130� 4.325)2 k2 ⇥ 0.049 5+ (140� 4.325)2 k2 ⇥ 0.066 = 2275k2 El desv́ıo estándard de tu retorno es SD (X ) = p 2275k = 47.697k Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 29�� 62 Varianza y desv́ıo estándard: ejemplo Para la inversión de Juan el retorno teńıa distribución Z -40k -20k 260k 280k pZ (z) 0.250 5 0.634 0.049 5 0.066 y la esperanza del retorno de su inversión era E (Z ) = 8.65k Entonces, la varianza del retorno de Juan es Var�(Z�)�=�(�40����.�5)2�k2�⇥�0.250�5�+�(�20����.�5)2�k2�⇥�0.634 +�(260����.�5)2�k2�⇥�0.049�5�+�(280����.�5)2�k2�⇥�0.066�=� 9100k2 El desv́ıo estándard de tu retorno es SD (Z ) = p 9100k = 95.394k Observá que el desv́ıo estándard del retorno de Juan es el doble que el desv́ıo estándard de tu retorno Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 30 62 Varianza y desv́ıo estándard: ejemplo Observá que los retornos de Juan están más dispersos que tus retornos Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 31�� 62 Expresión alternativa para la varianza Proposición: la varianza de una v.a. X admite la siguiente expresión alternativa Var (X ) = E ⇣ X 2 ⌘ � E (X )2 Demostración: llamemos µ = E (X ) . Entonces Var (X ) = E ⇣ (X � µ)2 ⌘ = E ⇣ X 2 � 2µX + E (X )2 ⌘ = E ⇣ X 2 ⌘ � 2µE (X ) + E ⇣ µ2 ⌘ = E ⇣ X 2 ⌘ � 2µE (X ) + µ2 pq µ2 es una constante = E ⇣ X 2 ⌘ � 2µ2 + µ2 = E ⇣ X 2 ⌘ � µ2 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 32�� 62 Cálculo alternativo de la varianza La expresión Var (X ) = E ⇣ X 2 ⌘ � E (X )2 implica que podemos tambien calcular a la varianza de X usando la fórmula Var (X ) =  x2X x2pX (x)�  x2X xpX (x) !2 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 33�� 62 Propiedades de la varianza y del desv́ıo estándard Proposición: para toda constantes a y b 1 Var (X + b) = Var (X ) 2 Var (aX ) = a2Var (X ) 3 SD (X + b) = SD (X ) 4 SD (aX ) = |a| SD (X ) 5 Var (X ) = 0 si y solo si X es una constante c . Intuiciones la primera y la tercera afirmación son ciertas porque el sumar o restar una constante a una v.a. hace que el todas las barras del histograma se corran la misma cantidad a derecha o a izquierda. Esto cambia el baricentro del histograma pero no su dispersión. la cuarta afirmación surge porque el multiplicar por una constante a a una v.a. hace que el baricentro se multiplique por la constante pero tambien, expande o contrae el histograma proporcionalmente a |a| . la quinta afirmación es porque el histograma de una constante no tiene dispersión, tiene una sola barra de altura 1 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 34�� 62 Cambios del histograma bajo transformaciones lineales: ejemplo de las apuestas al colorado Observá que el histograma de 2X se obtiene a partir del hist. de X , primero corriendo la media a 2 veces la media de X y luego expandiendo las barras. El histograma de 2X � 10 se obtiene simplemente corriendo 10 unidades hacia la izquierda todas las barras del histograma de 2X . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 35�� 62 Dependencia de la varianza y el desv́ıo estándard en la escala de medición Suponé�que�en�el�ejemplo�de�crowdfunding,�calculás�el� retorno�de� tu� inversión�en� pesos,�en�vez�de�en�dólares. Suponiendo�que�el�cambio�es�1�dolar�=� ����pesos,�si�expresamos�al� retorno�en� pesos�como� la�v.a.� U� tenemos�que U�=����X Luego SD�(U)�=�����SD�(X�) O�sea,�el�desv́ıo�estándard�de�tu�retorno�expresado�en�pesos�es�����veces�mayor�que�el� desv́ıo�estándard�expresado�en�dólares. Quiere�decir�esto�que�el� riesgo�es�mayor�en�pesos�que�en�dólares? NO!!!� El�cambio�de�desv́ıo� fue�consecuencia�de�un�mero�cambio�de�escala�de� medición. Moraleja:� cuando�uses�el�desv́ıo�estándard�para�comparar� la�dispersión�de�distintas� variables,�por�ej.� inversiones,� rentas,�etc,�asegurate�de�usar� la�misma�escala�de� medición,�por�ej.�moneda,�para� todas� las�variables. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 36�� 62 Ejemplo del uso de las propiedades en la práctica Volviendo al ejemplo del crowdfunding, el retorno neto de Juan Z es el doble que tu retorno neto X , es decir Z = 2X Luego, Var (Z ) = Var (2X ) = 22Var (X ) = 4Var (X ) y SD (Z ) = SD (2X ) = 2SD (X ) = 2SD (X ) Si aumentás el monto de tu inversión al doble, el desv́ıo de tu retorno - y por ende el riesgo de tu inversión - también aumenta el doble. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 37�� 62 Sensibilidad de la esperanza y la varianza a valores extremos Suponé que en el ejemplo de crowdfunding, el árbol de probabilidad es porque�de�aquellas�start-ups�que�resultan�en�éxito�luego�de�recibir�Venture�Capital�sin� requerir�una�segunda�inyección�de�pequeño�capital,�hay�un�2%�que�paga�15,0�0,000�� dólares�en�vez�de�150,000�dólares. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 38 62 Sensibilidad de la esperanza y la varianza a valores extremos Llamá Y al retorno en esta nueva situación. La fc. de prob. de masa de Y es Y -20k -10k 130k 140k 15000k pY (y ) 0.2505 0.634 0.049 5 0.065 0.001 Observá que ahora la inversión tiene una probabilidad minúscula (0.001) de darte un retorno enorme (15,000k). Veamos como se comparan E (Y ) ,Var (Y ) con E (X ) ,Var (X ) Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 39�� 62 Sensibilidad de la esperanza y la varianza a valores extremos La esperanza del retorno en esta nueva situación es E (Y ) = (�20k)⇥ 0.250 5+ (�10k)⇥ 0.634+ 130k ⇥ 0.049 5+ 140k ⇥ 0.065+ 15000k ⇥ 0.001 = 19.185k O�sea,�ahora� la�esperanza�del� retorno�es�19�185k�dólares.� Comparala�con� la� esperanza�del� retorno�en� la�situación�anterior,� la�cual�era�4�325k�dólares. El�valor�at́ıpico�de�15000k�alteró�notablemente� la�esperanza�del� retorno,�dando� ahora� la� falsa� impresión�de�que� la� inversión�mejoró�notablemente,�cuando�en� realidad�ese�no�es�el�caso,�porque� la�prob.� de�que�el� retorno�sea�15000k�es�apenas� 0.001. Moraleja:� la�esperanza�es�sensible�a�valores�at́ıpicos�en� la�distribución�de�una�v.a. No� te� f́ıes�de� la�esperanza�como�medida�de� resumen�de� la� tendencia�central�de� la� v.a.� si� la�distribución� tiene�valores�at́ıpicos! Rotnitzky, Ferrari,Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 40 62 Sensibilidad de la esperanza y la varianza a valores extremos La varianza y el desv́ıo estándard también son sensibles a valores at́ıpicos. Por ejemplo, la varianza y el desv́ıo estándard del retorno para la nueva inversión son Var (X ) = (�20� 19.185)2 k2 ⇥ 0.250 5+ (�10� 19.185)2 k2 ⇥ 0.634 + (130� 19.185)2 k2 ⇥ 0.049 5+ (140� 19.185)2 k2 ⇥ 0.065 + (15000� 19.185)2 k2 ⇥ 0.001 = 226910k2 SD (X ) = p 226910 = 476.35k O�sea,�ahora�el�desv́ıo�del�retorno�es�476350�dólares,�comparado�con����������� dólares�de�la�inversión�anterior. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 41 62 Varianza de una v.a. Bernoulli Proposición: la varianza de una v.a. X ⇠ Ber (p) es igual a Var (X ) = p (1� p) Demostración: recordemos que E (X ) = p. Entonces, Var (X ) =  x2X (x � E (X ))2 pX (x) = (1� E (X ))2 p + (0� E (X ))2 (1� p) = (1� p)2 p + p2 (1� p) = (1� p) p⇥ [(1� p) + p]| {z } =1 = (1� p) p Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 42�� 62 Varianza de una v.a. Binomial Proposición: la varianza de una v.a. X ⇠ Bin (n, p) es igual a Var (X ) = np (1� p) Demostración: la posponemos hasta más adelante, cuando veamos el tema ”independencia de variables aleatorias” Veamos como cambia con n la dispersion en los histogramas de una v.a. binomial Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 43�� 62 Dispersión de una v.a. Binomial: cambios con p para un mismo n Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 44�� 62 Varianza de una v.a. Poisson Proposición: la varianza de una v.a. X ⇠ Pois (l) es igual a Var (X ) = l Demostración: no la haremos Veamos como cambia con l la dispersion en los histogramas de v.a. Poisson Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) 45�� 62 La paradoja de San Petersburgo Considerá el siguiente juego: 1 Para participar del juego deberás pagar C pesos, que la banca se los queda. 2 Vas a tirar una moneda equilibrada hasta la 1era vez que caiga en cara. 3 La banca te va a pagar 2N pesos, donde N =número de tiros que hiciste ¿Cuál es la esperanza de N ? ¿Cuál es el precio justo C en el sentido de que ”a la larga”, es decir con mucha gente jugando, la banca no pierda ni gane dinero? Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) ��� /� 62 La paradoja de San Petersburgo Solución: sea Aj =el tiro j es cara. Los eventos A1,A2, ... son independientes, y P (Aj ) = P ⇣ Acj ⌘ = 0.5 P (N = n) = P (Ac1 \ ...\ Acn�1 \ An) = (0.5)n Luego, usando propiedades de la serie geométrica (si no las conocés, no te preocupes y aceptá el resultado; lo importante es que sepas plantear la fórmula para la esperanza). E (N) = •  n=1 n⇥ (0.5)n = 2 Por otro lado, la banca te va a pagar Y = 2N . Luego, el precio justo C debeŕıa ser E (Y ). Sin embargo, E (Y ) = •  n=1 2nP (N = n) = •  n=1 2n (0.5)n = • Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) �� /� 62 La paradoja de San Petersburgo Observá que E � 2N � 6= 2E (N) pues E ⇣ 2N ⌘ = • y 2E (N) = 4 Para entender por qué E (Y ) = • recordá que la esperanza es el baricentro del histograma de Y = 2N . El histograma de Y = 2N no tiene baricentro porque Y toma valores enormemente altos con una probabilidad que, aunque despreciable, ”escala” con estos valores: por ejemplo, Y toma el valor 2100 con prob 1/2100. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) ��� /� 62 La paradoja de San Petersburgo El ejemplo, conocido como la Paradoja de San Petersburgo, nos advierte que debemos tener precaución en el uso de esperanzas de v.a. con soporte infinito para la toma de decisiones. En este ejemplo: Observando que E (Y ) = •, uno podŕıa decidir pagar cualquier precio desorbitantemente alto C para jugar, porque no importa cual fuera ese precio, la esperanza de la ganancia seŕıa • ya que E (Y )� C = • � C = •. La ”trampa” está en que como el dinero que tiene la banca es finito, el juego que en realidad estará dispuesta a jugar la banca contra vos tendrá finalización al cabo de un número pre-fijado de jugadas. Por ejemplo, suponé que el juego termina indefectiblemente en el tiro 40, si es que no terminó antes. Entonces, la esperanza del pago que recibirás será E (Y ) = 40  n=1 2 nP (N = n) + •  n=41 0⇥ P (N = n) = 40  n=1 2 n (0.5)n = 40 Observá como cambia abruptamente la esperanza del pago, de • a 40 !!! Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica(Cap. 2, sección 2.4 del Bertsekas) ��� /� 62
Compartir