Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Introduccion a la Estad́ıstica Probabilidad y sus propiedades Rotnitzky, Ferrari, Cersosimo, Smucler Universidad Torcuato Di Tella Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 1 / 41 Grandes volúmenes de datos La revolución de ”Big Data”: avances en las tecnoloǵıas de información permiten que grandes cantidades de datos esten disponibles para ser analizados e interpretados. Registros de transacciones : de cajeros, comercios, transacciones con tarjetas de débito y crédito, de scans de códigos de barra. Estad́ısticas públicas: gobierno abierto, series económicas, estad́ısticas de salud (electronic health records), de justicia. Mercado de acciones : series temporales del valor de acciones o de derivados financieros. Datos satelitales, internet: GPS, páginas visitadas en internet, uso de redes sociales, items comprados en Mercado Libre. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 2 / 41 La Estad́ıstica y los grandes volúmenes de datos La Estad́ıstica nos enseña como organizar, analizar e interpretar datos para evaluar: Descripciones del estado de situación tasa de desempleo, obesidad, inflación, apoyo a un candidato poĺıtico. Relaciones de causa-efecto, evaluaciones de impacto impacto en las ventas de una estrategia de marketing, impacto en la calidad educativa de una mejora en el salario docente. Predicciones a futuro finanzas: riesgo de una estrategia de inversión. marketing : Market Basket Analysis: si un usuario compró pasajes, le ofrecemos una valija? credit scoring : riesgo de no pago de un préstamo bancario. econoḿıa: inflación, desempleo, crecimiento del PBI. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 3 / 41 Incertidumbre Un buen análisis de datos nos ayuda a tomar decisiones racionales e inteligentes frente a incertidumbre sobre el futuro. Además, el análisis de datos tambien está generalmente sujeto a incertidumbre(y sesgos): Cuán confiable es una encuesta sobre apoyo al aborto basada en tan solo 2000 personas? Cuán confiable es un calculo sobre la efectividad de una estrategia de marketing si mi calculo fue basado en un estudio piloto en un grupo seleccionado de clientes? Cuán confiable es una predicción sobre el futuro del valor de la acción de una empresa en un mercado volatil? Cuán confiable es una predicción sobre la capacidad de pago de un solicitante de credito bancario si mi cálculo esta basado en apenas algunas caracteŕısticas del cliente? Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 4 / 41 Probabilidad La probabilidad de un evento incierto es un valor numérico que cuantifica la posibilidad de ocurrencia del evento. La Teoria de Probabilidad es la rama de la matemática que nos da reglas para operar con probabilidades y razonar coherentemente frente a la incertidumbre. Es la herramienta esencial para Cuantificar la confiabilidad de los resultados de un análisis de datos. Esto es llamado inferencia estad́ıstica. La toma de decisiones racionales frente a la incertidumbre. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 5 / 41 En este curso veremos Teoŕıa de la Probabilidad Algunos elementos básicos de la Inferencia Estad́ıstica. Más sobre Estad́ıstica en el próximo curso de la serie Análisis Estad́ıstico. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 6 / 41 Primeras nociones de Probabilidad Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 7 / 41 Espacio Muestral Espacio muestral W : es el conjunto de todos los resultados posibles para una situación incierta dada. w : denota un elemento genérico de W. Situacion incierta Espacio Muestral W 1 El clima mañana {lluvioso, nublado, soleado} 2 La temperatura en grados centigrados mañana [�5, 45] 3 La tendencia del dolar mañana {sube, baja, estable} 4 El precio del dolar mañana cualquier numero racional en [0,•) 5 El resultado del partido de River el domingo {gana, pierde, empata} 6 Mi estado de humor al finalizar esta clase {optimista, pesimista, ambivalente} 7 El número en el que caera un tiro de un dado {1, 2, 3, 4, 5, 6} 8 Los resultados de dos tiros de una moneda {(c, c) , (c, s) , (s, c) , (s, s)} 9 El número de tiros al arco hasta que emboque un tiro {1, 2, 3, 4, 5, ...} 10 El número de d́ıas hasta que Racing salga campeón {1, 2, 3, ...} 11 El número de alumnos que aprobará esta materia {0, 1, 2, 3, ..., 50} (con 50 alumnos) 12 La cifra en la posicion decimal 50 del numero p⇤⇤⇤ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} 1, 2, 3, 4, 5, 6, 10 y 11 son situaciones inciertas ”no experimentables” o no ”repetibles” 7, 8 y 9 son situaciones inciertas ”experimentables” o ”repetibles” 12 es incierta para ”mi” pero puede no serlo para otras personas Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 8 / 41 Eventos Evento : cualquier subconjunto del espacio muestral, denotado en general con letras mayúscula A,B ,C , etc. Situacion incierta Espacio Muestral W Ejemplo de un evento Como subconjunto de W En palabras Clima mañana {lluvia, nube, sol} {nube, sol} no llueve Temperatura mañana [�5, 45] (25, 45] arriba de 25� Tendencia del dolar {sube , baja, estable} {estable} estable Precio del dolar racionales en [0,•) racionales en [0, 20.5] entre 0 y 20.50 Partido de River {gana, pierde, empata} {gana, empata} no pierde Mi estado de humor {opt., pes., amb.} {opt., pes., amb.} cualquiera El tiro de un dado {1, 2, 3, 4, 5, 6} {2, 4, 6} sale par Dos tiros de una moneda {(c, c) , (c, s) , (s, c) , (s, s)} {(c, c) , (s, s)} salen tipos iguales Tiros hasta que emboque {1, 2, 3, 4, 5, ...} {10, 11, 12, 13, ...} por lo menos 10 Dias a Racing campeón {1, 2, 3, ...} {1, 2, ..., 99} menos de 100 Alumnos que aprobaran {0, 1, 2, 3, ..., 50} {26, 27, ..., 50} más de la mitad 50 cifra decimal de p {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} {1, 3, 5, 7, 9} impar NOTA: W es el evento ”cierto” de que el resultado incierto esta dentro de los resultados posibles Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 9 / 41 Eventos mutuamente excluyentes Dos eventos A y B son mutuamente excluyentes (disjuntos) si nunca pueden ocurrir simultáneamente . Con conjuntos: A y B son mutuamente excluyentes si A\ B = ∆ Situacion incierta Eventos excluyentes Eventos no excluyentes Clima mañana A = {nube} ,B = {sol} A = {no llueve},B= {no sol} El tiro de un dado A ={par},B={impar} A={par},B= {mayor que 5} Tiros hasta que emboque A = {10 o más},B= {5 o menos} A={10 o más},B= {20 o menos} Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 10 / 41 Probabilidad: intuición Cuantificaremos a la plausibilidad de un events en una escala del 0 al 1, de modo tal que: 1 cuantifica la plausibilidad de ocurrencia de un evento ”cierto”. 0 cuantifica la plausibilidad de ocurrencia de un evento ”imposible”. Qué propiedad ”razonable” debeŕıa satisfacer una medida de plausibilidad? Si A y B son eventos mutuamente excluyentes , es razonable pedir que nuestra medida de plausibilidad se comporte de modo que: La medida de plausibilidad de que ocurra A o B sea la suma de las medida de plausibilidad de A más la de B . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 11 / 41 Probabilidad: definición Función de probabilidad P : es cualquier función que a cada evento A le asigna un número P (A) tal que: 1 P (A) � 0. 2 P (W) = 1. 3 (Aditividad) Si A y B son disjuntos entonces P (A[ B) = P (A) + P (B) . Más generalmente, si A1,A2, ... es una sucesión (finita o infinita) de conjuntosdisjuntos entonces P (A1 [ A2 [ A3 [ · · · ) = P (A1) + P (A2) + P (A3) + ... A las propiedades (1), (2) y (3) se las llama los Axiomas de Probabilidad Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 12 / 41 Probabilidad: primeros cálculos Teorema 1.1: Supongamos que en un cierto problema, a) el espacio muestral W = {a1, ..., aK} es finito, b) por argumentos de simetŕıa o similitud, es razonable suponer que todos los elementos del espacio muestral son igualmente plausibles. Entonces P (A) = # de elementos en A # de elementos en W = # de casos favorables a A # de casos posibles Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 13 / 41 Demostración del Teorema 1.1 Sea pk ⌘ P ({ak}) . Entonces, la suposición (b) dice que P ({a1}) = P ({a2}) = ... = P ({aK }). Llamemos p ⌘ P ({ai}) para cualquier i . Luego 1 = P (W) (⇤) = P ({a1} [ {a2} [ ...[ {aK }) = P ({a1}) + P ({a2}) + ...+ P ({aK }) (⇤⇤) = p + p + ...+ p = K ⇥ p (⇤) por Prop. (1) de la def. de Prob., (⇤⇤) por Prop. (3) de la def. de Prob. Despejando p nos da que p = 1/K Si A = {aj1 , aj2 , ..., ajr } entonces P (A) = P ({aj1}) + P ({aj2}) + ...+ P ({ajr }) = p + p + · · ·+ p| {z } r veces = r ⇥ p = r ⇥ 1/K = # de elementos en A # de elementos en W . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 14 / 41 Espacio equiprobable, probabilidad uniforme discreta Cuando se cumplen las condiciones del Teorema 1.1 el espacio muestral se llama Espacio Equiprobable y la probabilidad resultante se llama Probabilidad Uniforme Discreta. A la hora de modelar un problema real, que un espacio muestral sea equiprobable es una suposición que según las circumstancias será o no razonable. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 15 / 41 Cálculo de probabilidades en espacios equiprobables Consideremos el tiro de un dado, con espacio muestral W = {1, 2, 3, 4, 5, 6}. Suponer equiprobabilidad en este caso corresponde al supuesto de que el dado está balanceado (no está cargado). A menos que tengamos razones para sospechar del origen del dado, la equiprobabilidad parece razonable. Supongamos entonces que el dado está balanceado. a. Cuál es la probabilidad de que el dado caiga en un número par? Respuesta: A = {2, 4, 6} , #A = 3,#W = 6. Luego, P (A) = #A/#W = 3/6 = 1/2 b. Cuál es la probabilidad de que el dado caiga en un número impar mayor que 1? Respuesta: A = {3, 5} , #A = 2,#W = 6. Luego, P (A) = #A/#W = 2/6 = 1/3 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 16 / 41 Cálculo de probabilidades en espacios equiprobables Consideremos dos tiros de una moneda, con espacio muestral W = {(c , c), (c , s), (s, c), (s, s)}. A menos que tengamos razones para sospechar del origen de la moneda, la equiprobabilidad parece razonable. Supongamos entonces equiprobabilidad. a. Cuál es la probabilidad de que los resultados salgan distintos? Respuesta: A = {(c, s) , (s, c)} , #A = 2,#W = 4. Luego, P (A) = #A/#W = 2/4 = 1/2 Cuál es la probabilidad de que salga al menos una cara en algun tiro? Respuesta: A = {(c, c) , (c, s) , (s, c)} , #A = 3,#W = 4. Luego, P (A) = #A/#W = 3/4 = 3/4 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 17 / 41 Sorteos de bolilleros Consideremos ahora la extracción de una bolilla de un bolillero con n bolillas numeradas. El espacio muestral es W = {1, . . . , n}. En este caso no parece haber razones para no suponer equiprobabilidad. a. Supongamos que en el bolillero k bolillas son rojas y las restantes son blancas. Cúal es la probabilidad de salga sorteada una bolilla roja? Respuesta: Asumamos, sin perdida de generalidad, que las primeras k bolillas son rojas. Luego, A = {1, 2, ..., k} , #A = k , #W = n. Entonces P (A) = k/n Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 18 / 41 El arte de modelar Consideremos ahora el sorteo de un bolillero con k bolillas rojas y n� k blancas. Tomamos W = {rojo, blanco}. No esta mal definir al espacio muestral como {rojo, negro} . Sin embargo, si lo definimos aśı, no es razonable suponer que el espacio muestral sea equiprobable, excepto cuando n = 2k . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 19 / 41 El arte de modelar Este ejemplo ilustra los siguientes puntos interesantes: Hay distintas formulaciones posibles de un espacio muestral. Sin embargo, algunas son mas utiles que otras. Que un espacio muestral sea equiprobable es una suposición o modelo que según las circumstancias será o no razonable. Plantear para un problema (con resultados finitos) un espacio que razonablemente sea equiprobable a veces es obvio, a veces no lo es. Para evaluar la razonabilidad de la suposicion de equiprobabilidad de un espacio muestral no nos alcanza con conocer los elementos del espacio muesral sino también las circumstancias que dan origen al espacio muestral. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 20 / 41 Conteo El cálculo de probabilidades en espacios equiprobables en realidad no requiere especificar quienes son los elementos del espacio muestral W y del evento A, sino simplemente que seamos capaces de contar cuántos elementos hay en cada conjunto. Esto es importante porque en la gran mayoŕıa de problemas reales tanto W como A son enormes y especificar sus elementos es una tarea tediosa, cuando no prácticamente imposible. Hay muchas técnicas y estrategias que facilitan el conteo de conjuntos. Solo veremos algunos pocos resultados que aprenderemos con ejemplos. Lectura recomendada para aprender más sobre este tema: Caṕıtulo 1 del libro de Blitzstein y Hwang. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 21 / 41 Conteo en experimentos compuestos Ejemplo 1. Una heladeŕıa ofrece tres gustos de helados: vanilla, chocolate y frutilla. Ofrece dos posibles recipientes : vasito y cucurucho, pero en un solo tamaño. De cuántos formas puedo elegir un helado? Respuesta: Hay tres gustos y por cada gusto hay dos posibles recipientes, entonces hay 3⇥ 2 combinaciones posibles. Notar que en este problema NO importa el orden. Por ejemplo, la combinacion Cucurucho seguida por Chocolate es la misma que la combinacion Chocolate seguida por Cucurucho. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 22 / 41 Regla para conteo en experimentos compuestos. Regla 1: consideremos un ”experimento compuesto” E que consiste en dos ”sub-experimentos”, E1 y E2 . Entonces, (# resultados posibles de E ) = (# resultados posibles de E1)⇥ (# resultados posibles de E2) Si E consiste en k sub-experimentos E1,E2, ...,Ek , entonces, # resultados posibles de E = (# resultados posibles de E1)⇥ · · ·⇥ (# resultados posibles de Ek ) El termino ”experimento” en la Regla 1 puede interpretarse libremente, como una situación incierta cualquiera a la cual podemos sub-clasificar de acuerdo a dos o más categorias. Por ejemplo, en el Ejemplo 1, el experimento es ”registrar el gusto y recipiente del helado” y los dos sub-experimentos son E1 :”registrar el sabor”, y E2 :”registrar el recipiente” del helado. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 23 / 41 Ejemplo de experimento con tres sub-experimentos Ejemplo 2. Supongamos ahora que la heladeŕıa ofrece cuatro tamanos distintos: chico, mediano, grande y cuarto de kilo. De cuántas formas puedo elegir un helado ahora? Respuesta: 3⇥ 2⇥ 4 combinaciones distintas. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducciona la Estad́ıstica 24 / 41 Uso anidado de la Regla 1. Ejemplo 3. En el Ejercicio 1, supongamos que dos amigas Laura y Susana comprarán helados. Cuáles son todos los posibles resultados de sus elecciones combinadas? Respuesta. Sea L el experimento ”elección de Laura”, y sea S el experimento ”elección de Susana” y sea C el ”experimento combinado elección de Laura y Susana”. Luego, (# resultados posibles de C ) = (# resultados posibles de L)⇥ (# resultados posibles de S) L es a su vez un experimento combinado ”elección de gusto y recipiente de Laura”, luego (# resultados posibles de L) = 3⇥ 2 = 6 y del mismo modo, (# resultados posibles de S) = 3⇥ 2 = 6. De modo que la respuesta es 36, ya que (# resultados posibles de C ) = 6⇥ 6 = 36. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 25 / 41 Muestreos con y sin reposición. Muchos problemas de conteo se pueden ver como problemas equivalentes a uno de los dos tipos de experimentos siguientes. Muestreo con reposición : En un bolillero hay n bolillas idénticas excepto por estar numeradas 1, 2, . . . , n. El experimento consiste en sortear, de a una por vez, k bolillas del bolillero, reponiendo la bolilla sorteada al bolillero cada vez. El resultado del experimento es la k�tupla ordenada (a1, ..., ak ) , siendo a1 el primer numero sorteado, a2 el segundo, etc. Muestreo sin reposicion : En un bolillero hay n bolillas idénticas excepto por estar numeradas 1, 2, . . . ,n. El experimento consiste en sortear, de a una por vez, k bolillas del bolillero, sin reponer la bolilla sorteada al bolillero cada vez. El resultado del experimento es la k�tupla ordenada (b1, ..., bk ) , siendo b1 el primer número sorteado, b2 el segundo, etc. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 26 / 41 Muestreo con reposición, n = 3, k = 2. 3⇥ 3 = 9 resultados posibles. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 27 / 41 Muestreo sin reposición, n = 3, k = 2. 3⇥ 2 = 6 resultados posibles. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 28 / 41 Muestreos con y sin reposición. Muestreo con reposición : n bolillas de las cuales se sortean k bolillas reponiendo la bolilla sorteada cada vez. # resultados posibles = nk . Muestreo sin reposición : n bolillas de las cuales se sortean k bolillas sin reponer las bolillas sorteadas # resultados posibles = n⇥ (n� 1)⇥ (n� 2)⇥ · · ·⇥ (n� k + 1) = n! (n� k)! . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 29 / 41 Problema del cumpleaños Problema: En un aula de 25 alumnos, cuál es la probabilidad de que al menos dos alumnos cumplan años el mismo d́ıa? (asumiendo que Feb 29 no existe). Resumen de la solución: primero definiremos W. Despues decidiremos que es razonable suponer que W sea equiprobable y por lo tanto que P (A) = #A/#W. Espacio muestral W. Cada dia del año es como una bolilla en un bolillero de 365 bolillas. Los cumpleaños de los 25 alumnos son el resultado de 25 sorteos con reposición del bolillero (por qué con reposicion?). Luego W = {(a1, ..., a25) : ai es un numero entero entre 1 y 365} #W = 36525 Como no hay ninguna razón para suponer que alguna asignación de 25 fechas de cumpleaños sea más probable que otra, vamos a suponer que W es equiprobable . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 30 / 41 Problema del cumpleaños El evento de interés A : es el conjunto de las tuplas (a1, ..., a25) en W que tienen al menos dos de sus elementos iguales. Calcular #A directamente es complicado (por qué?). Más fácil es calcular #Ac y luego calcular #A = #W�#Ac . Ac es el conjunto de tuplas (a1, ..., a25) en W con todos sus elementos distintos. Luego Ac coincide con el conjunto de todos los resultados posibles de sortear 25 veces sin reposición del bolillero. Luego #Ac = 365⇥ 364⇥ · · ·⇥ (365� 25+ 1) #A = 36525 � 365⇥ 364⇥ · · ·⇥ (365� 25+ 1) Por lo tanto, P (A) = 36525 � 365⇥ 364⇥ · · ·⇥ (365� 25+ 1) 36525 = 1� 365⇥ 364⇥ · · ·⇥ (365� 25+ 1) 36525 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 31 / 41 R R es un entorno y lenguaje de programación gratuito para hacer gráficos y cálculos estad́ısticos. Es un lenguage muy popular en la ciencia de datos. R está disponible en el sitio http://www.r-project.org. La interface RStudio- también gratuita - que facilita trabajar con R, del sitio http://www.rstudio.com. En R, el código y la salida para el problema del cumpleaños es k <- 25 1 - prod((365 - k + 1):365) / 365^k El resultado es [1] 0.5686997 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 32 / 41 El código para calcular la probabilidad para aulas con k = 2, 3, 4, ..., 100 alumnos y guardar el resultado en un vector probs es: probs <- rep(0, 99) num alum <- 2:100 for (k in num alum){ probs[k - 1]<- 1 - prod((365 -k + 1):365) / 365^k } Imprimimos los valores de las probabilidades para aulas con 2, 3 y 4 estudiantes probs[1:3] [1] 0.002739726 0.008204166 0.016355912 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 33 / 41 Gráficos en R Ahora graficamos las probabilidades contra el número de alumnos por aula. plot(num alum, probs, xlab = "numero de alumnos", ylab = "probabilidad", main ="Probabilidad de dos o mas coincidencias") 0 20 40 60 80 100 0 .0 0 .2 0 .4 0 .6 0 .8 1 .0 Probabilidad de dos o mas coincidencias numero de alumnos p ro b a b ili d a d Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 34 / 41 Gráficos en R Se pueden hacer gráficos más lindos usando el paquete ggplot2. Para instalarlo, escribimos install.packages("ggplot2") en la consola. Para cargarlo, library("ggplot2"). Un buen tutorial con muchos ejemplos: tutorials.iq.harvard.edu/R/Rgraphics/Rgraphics.html Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 35 / 41 (null)://(null)tutorials.iq.harvard.edu/R/Rgraphics/Rgraphics.html Muestreo en R El comando sample en R nos permite simular muestreos con y sin reposición. Para simular los resultados de sortear sin reposicion de un bolillero con bolillas numeradas del 1 al 10 n <- 10 k <- 5 sample(n, k) Con resultado [1] 4 8 10 3 7 Si repito el comando sample(n, k) obtengo [1] 6 5 3 1 8 Para generar con reposición n <- 10 k <- 5 sample(n, k, replace=TRUE) Con resultado [1] 2 1 5 10 2 Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 36 / 41 Interpretación de la probabilidad Los axiomas de probabilidad nos dan reglas para decidir si una función P es una probabilidad. Sin embargo, los axiomas no nos dicen como interpretar a la funcion P . Cómo interpretamos las siguientes afirmaciones? a. la probabilidad de que el tiro de una moneda caiga en cara es 1/2 b. la probabilidad de que de un bolillero con k bolillas rojas y n� k blancas salga sorteada una roja es k/n c. la probabilidad de que en un aula con 25 alumnos haya al menos dos con cumpleaños el mismo dia es 0.57 d. la probabilidad de que mañana me pegue un rayo es 10�20. e. la probabilidad de que Argentina entre en recesión en el próximo mes es 1/10 A grandes rasgos hay dos escuelas filosóficas: la frecuentista y la Bayesiana. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 37 / 41 Interpretación de la probabilidad: escuela frecuentista. Escuela Frecuentista: la probabilidad de un evento representa la frecuencia a la larga de la ocurrencia del evento si pudiesemos repetir el ”experimento aleatorio” infinitasveces. Esta interpretación tiene sustento teórico en un Teorema que veremos mas adelante llamado ”Ley de los Grandes Números” . Notemos que esta interpretación implica que a pesar de todo, hay regularidades en la incertidumbre... En el caso (a), P (cara) = 1/2 se interpreta como: en la mitad de infinitos tiros de una misma moneda, la moneda caera en ”cara”. En el caso (b), P (roja) = k/n se interpreta como: en k/n de infinitos sorteos del mismo bolillero, la bolilla sorteada sera roja. La regularidad ”a la larga” de la probabilidad es muy útil. Por ejemplo, cuando se tira una moneda para decidir que equipo arranca un partido de futbol, la probabilidad garantiza que esta estrategia ”a la larga” es objetiva. La interpretación es problemática en los casos (c) - (e) porque no hay realmente un experimento ni la posibilidad de repetirlo infinitamente. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 38 / 41 Interpretacion de la probabilidad: escuela Bayesiana. Escuela Bayesiana: La probabilidad representa ”grados de creencia” subjetivos sobre el evento en cuestión. Hay distintas formas de ”calibrar” una probabilidad subjetiva. Una de ellas es por medio de apuestas en juegos sin pérdida. Veamos como asigno el valor a P (A) siguiendo esta lógica. Consideremos dos juegos. Juego 1. Saco una bolilla de un bolillero con k bolillas rojas y n� k bolillas blancas. Si sale roja, recibo un premio de un millón de dolares, si sale blanca no recibo nada. Juego 2. Si el evento A es cierto, recibo un millón de dolares, de lo contrario no recibo nada. Entonces, la probabilidad P (A) que le asigno al evento A es k/n si para el par (k , n) me da lo mismo -soy indiferente a- jugar cualquiera de los dos juegos. Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 39 / 41 Bolilleros con infinito numerables bolillas A veces necesitaremos considerar espacios con infinitas, pero numerables, bolillas. Por ejemplo: en el experimento numero de tiros hasta que emboque al aro el espacio muestral es W = {1, 2, 3, ...} Un espacio infinito numerable no puede ser equiprobable, por qué? Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 40 / 41 Reglas de la probabilidad Los tres axiomas de la probabilidad implican las siguientes propiedades 1. P (∆) = 0 2. P (Ac ) = 1� P (A) 3. Si A ⇢ B entonces P (A) P (B) 4. P (A[ B) = P (A) + P (B)� P (A\ B) 5. P (A[ B) P (A) + P (B) 6. Si A ⇢ B entonces P (B � A) = P (B)� P (A) Demostracion de propiedad (2) (las otras demostraciones quedan como problemas para la practica) W = A[Ac . Ademas, A y Ac son disjuntos. Luego, 1 = P (W) = P (A[Ac ) = P (A) + P (Ac ) . Luego, P (Ac ) = 1� P (A) . Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 41 / 41
Compartir