Logo Studenta

Slides 1 - Introduccion

¡Este material tiene más páginas!

Vista previa del material en texto

Introduccion a la Estad́ıstica
Probabilidad y sus propiedades
Rotnitzky, Ferrari, Cersosimo, Smucler
Universidad Torcuato Di Tella
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 1 / 41
 
Grandes volúmenes de datos
La revolución de ”Big Data”: avances en las tecnoloǵıas de información
permiten que grandes cantidades de datos esten disponibles para ser
analizados e interpretados.
Registros de transacciones :
de cajeros, comercios, transacciones con tarjetas de débito y crédito, de
scans de códigos de barra.
Estad́ısticas públicas:
gobierno abierto, series económicas, estad́ısticas de salud (electronic
health records), de justicia.
Mercado de acciones :
series temporales del valor de acciones o de derivados financieros.
Datos satelitales, internet:
GPS, páginas visitadas en internet, uso de redes sociales, items
comprados en Mercado Libre.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 2 / 41
La Estad́ıstica y los grandes volúmenes de datos
La Estad́ıstica nos enseña como organizar, analizar e interpretar datos para
evaluar:
Descripciones del estado de situación
tasa de desempleo, obesidad, inflación, apoyo a un candidato poĺıtico.
Relaciones de causa-efecto, evaluaciones de impacto
impacto en las ventas de una estrategia de marketing, impacto en la
calidad educativa de una mejora en el salario docente.
Predicciones a futuro
finanzas: riesgo de una estrategia de inversión.
marketing : Market Basket Analysis: si un usuario compró pasajes, le
ofrecemos una valija?
credit scoring : riesgo de no pago de un préstamo bancario.
econoḿıa: inflación, desempleo, crecimiento del PBI.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 3 / 41
Incertidumbre
Un buen análisis de datos nos ayuda a tomar decisiones racionales e
inteligentes frente a incertidumbre sobre el futuro.
Además, el análisis de datos tambien está generalmente sujeto a
incertidumbre(y sesgos):
Cuán confiable es una encuesta sobre apoyo al aborto basada en tan solo 2000
personas?
Cuán confiable es un calculo sobre la efectividad de una estrategia de marketing si
mi calculo fue basado en un estudio piloto en un grupo seleccionado de clientes?
Cuán confiable es una predicción sobre el futuro del valor de la acción de una
empresa en un mercado volatil?
Cuán confiable es una predicción sobre la capacidad de pago de un solicitante de
credito bancario si mi cálculo esta basado en apenas algunas caracteŕısticas del
cliente?
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 4 / 41
Probabilidad
La probabilidad de un evento incierto es un valor numérico que cuantifica
la posibilidad de ocurrencia del evento.
La Teoria de Probabilidad es la rama de la matemática que nos da reglas
para operar con probabilidades y razonar coherentemente frente a la
incertidumbre. Es la herramienta esencial para
Cuantificar la confiabilidad de los resultados de un análisis de datos.
Esto es llamado inferencia estad́ıstica.
La toma de decisiones racionales frente a la incertidumbre.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 5 / 41
En este curso veremos
Teoŕıa de la Probabilidad
Algunos elementos básicos de la Inferencia Estad́ıstica.
Más sobre Estad́ıstica en el próximo curso de la serie Análisis
Estad́ıstico.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 6 / 41
Primeras nociones de Probabilidad
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 7 / 41
Espacio Muestral
Espacio muestral W : es el conjunto de todos los resultados posibles para
una situación incierta dada.
w : denota un elemento genérico de W.
Situacion incierta Espacio Muestral W
1 El clima mañana {lluvioso, nublado, soleado}
2 La temperatura en grados centigrados mañana [�5, 45]
3 La tendencia del dolar mañana {sube, baja, estable}
4 El precio del dolar mañana cualquier numero racional en [0,•)
5 El resultado del partido de River el domingo {gana, pierde, empata}
6 Mi estado de humor al finalizar esta clase {optimista, pesimista, ambivalente}
7 El número en el que caera un tiro de un dado {1, 2, 3, 4, 5, 6}
8 Los resultados de dos tiros de una moneda {(c, c) , (c, s) , (s, c) , (s, s)}
9 El número de tiros al arco hasta que emboque un tiro {1, 2, 3, 4, 5, ...}
10 El número de d́ıas hasta que Racing salga campeón {1, 2, 3, ...}
11 El número de alumnos que aprobará esta materia {0, 1, 2, 3, ..., 50} (con 50 alumnos)
12 La cifra en la posicion decimal 50 del numero p⇤⇤⇤ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
1, 2, 3, 4, 5, 6, 10 y 11 son situaciones inciertas ”no experimentables” o no ”repetibles”
7, 8 y 9 son situaciones inciertas ”experimentables” o ”repetibles”
12 es incierta para ”mi” pero puede no serlo para otras personas
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 8 / 41
Eventos
Evento : cualquier subconjunto del espacio muestral, denotado en
general con letras mayúscula A,B ,C , etc.
Situacion incierta Espacio Muestral W Ejemplo de un evento
Como subconjunto de W En palabras
Clima mañana {lluvia, nube, sol} {nube, sol} no llueve
Temperatura mañana [�5, 45] (25, 45] arriba de 25�
Tendencia del dolar {sube , baja, estable} {estable} estable
Precio del dolar racionales en [0,•) racionales en [0, 20.5] entre 0 y 20.50
Partido de River {gana, pierde, empata} {gana, empata} no pierde
Mi estado de humor {opt., pes., amb.} {opt., pes., amb.} cualquiera
El tiro de un dado {1, 2, 3, 4, 5, 6} {2, 4, 6} sale par
Dos tiros de una moneda {(c, c) , (c, s) , (s, c) , (s, s)} {(c, c) , (s, s)} salen tipos iguales
Tiros hasta que emboque {1, 2, 3, 4, 5, ...} {10, 11, 12, 13, ...} por lo menos 10
Dias a Racing campeón {1, 2, 3, ...} {1, 2, ..., 99} menos de 100
Alumnos que aprobaran {0, 1, 2, 3, ..., 50} {26, 27, ..., 50} más de la mitad
50 cifra decimal de p {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} {1, 3, 5, 7, 9} impar
NOTA: W es el evento ”cierto” de que el resultado incierto esta dentro de los resultados posibles
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 9 / 41
Eventos mutuamente excluyentes
Dos eventos A y B son mutuamente excluyentes (disjuntos) si nunca pueden
ocurrir simultáneamente .
Con conjuntos: A y B son mutuamente excluyentes si A\ B = ∆
Situacion incierta Eventos excluyentes Eventos no excluyentes
Clima mañana A = {nube} ,B = {sol} A = {no llueve},B= {no sol}
El tiro de un dado A ={par},B={impar} A={par},B= {mayor que 5}
Tiros hasta que emboque A = {10 o más},B= {5 o menos} A={10 o más},B= {20 o menos}
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 10 / 41
Probabilidad: intuición
Cuantificaremos a la plausibilidad de un events en una escala del 0 al 1, de
modo tal que:
1 cuantifica la plausibilidad de ocurrencia de un evento ”cierto”.
0 cuantifica la plausibilidad de ocurrencia de un evento ”imposible”.
Qué propiedad ”razonable” debeŕıa satisfacer una medida de plausibilidad?
Si A y B son eventos mutuamente excluyentes , es razonable pedir que
nuestra medida de plausibilidad se comporte de modo que:
La medida de plausibilidad de que ocurra A o B sea la suma de las
medida de plausibilidad de A más la de B .
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 11 / 41
Probabilidad: definición
Función de probabilidad P : es cualquier función que a cada evento A le
asigna un número P (A) tal que:
1 P (A) � 0.
2 P (W) = 1.
3 (Aditividad) Si A y B son disjuntos entonces
P (A[ B) = P (A) + P (B) .
Más generalmente, si A1,A2, ... es una sucesión (finita o infinita) de
conjuntosdisjuntos entonces
P (A1 [ A2 [ A3 [ · · · ) = P (A1) + P (A2) + P (A3) + ...
A las propiedades (1), (2) y (3) se las llama los Axiomas de Probabilidad
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 12 / 41
Probabilidad: primeros cálculos
Teorema 1.1: Supongamos que en un cierto problema,
a) el espacio muestral W = {a1, ..., aK} es finito,
b) por argumentos de simetŕıa o similitud, es razonable suponer que
todos los elementos del espacio muestral son igualmente plausibles.
Entonces
P (A) =
# de elementos en A
# de elementos en W
=
# de casos favorables a A
# de casos posibles
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 13 / 41
Demostración del Teorema 1.1
Sea pk ⌘ P ({ak}) . Entonces, la suposición (b) dice que
P ({a1}) = P ({a2}) = ... = P ({aK }).
Llamemos p ⌘ P ({ai}) para cualquier i . Luego
1 = P (W) (⇤)
= P ({a1} [ {a2} [ ...[ {aK })
= P ({a1}) + P ({a2}) + ...+ P ({aK }) (⇤⇤)
= p + p + ...+ p
= K ⇥ p
(⇤) por Prop. (1) de la def. de Prob., (⇤⇤) por Prop. (3) de la def. de Prob.
Despejando p nos da que
p = 1/K
Si A = {aj1 , aj2 , ..., ajr } entonces
P (A) = P ({aj1}) + P ({aj2}) + ...+ P ({ajr })
= p + p + · · ·+ p| {z }
r veces
= r ⇥ p = r ⇥ 1/K
=
# de elementos en A
# de elementos en W
.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 14 / 41
Espacio equiprobable, probabilidad uniforme discreta
Cuando se cumplen las condiciones del Teorema 1.1 el espacio muestral se
llama Espacio Equiprobable y la probabilidad resultante se llama
Probabilidad Uniforme Discreta.
A la hora de modelar un problema real, que un espacio muestral sea
equiprobable es una suposición que según las circumstancias será o no
razonable.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 15 / 41
Cálculo de probabilidades en espacios equiprobables
Consideremos el tiro de un dado, con espacio muestral W = {1, 2, 3, 4, 5, 6}.
Suponer equiprobabilidad en este caso corresponde al supuesto de que el dado
está balanceado (no está cargado).
A menos que tengamos razones para sospechar del origen del dado, la
equiprobabilidad parece razonable. Supongamos entonces que el dado está
balanceado.
a. Cuál es la probabilidad de que el dado caiga en un número par?
Respuesta: A = {2, 4, 6} , #A = 3,#W = 6. Luego, P (A) = #A/#W = 3/6 = 1/2
b. Cuál es la probabilidad de que el dado caiga en un número impar
mayor que 1?
Respuesta: A = {3, 5} , #A = 2,#W = 6. Luego, P (A) = #A/#W = 2/6 = 1/3
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 16 / 41
Cálculo de probabilidades en espacios equiprobables
Consideremos dos tiros de una moneda, con espacio muestral
W = {(c , c), (c , s), (s, c), (s, s)}.
A menos que tengamos razones para sospechar del origen de la moneda, la
equiprobabilidad parece razonable. Supongamos entonces equiprobabilidad.
a. Cuál es la probabilidad de que los resultados salgan distintos?
Respuesta: A = {(c, s) , (s, c)} , #A = 2,#W = 4. Luego,
P (A) = #A/#W = 2/4 = 1/2
Cuál es la probabilidad de que salga al menos una cara en algun
tiro?
Respuesta: A = {(c, c) , (c, s) , (s, c)} , #A = 3,#W = 4. Luego,
P (A) = #A/#W = 3/4 = 3/4
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 17 / 41
Sorteos de bolilleros
Consideremos ahora la extracción de una bolilla de un bolillero con n bolillas
numeradas. El espacio muestral es W = {1, . . . , n}.
En este caso no parece haber razones para no suponer equiprobabilidad.
a. Supongamos que en el bolillero k bolillas son rojas y las restantes son
blancas. Cúal es la probabilidad de salga sorteada una bolilla roja?
Respuesta: Asumamos, sin perdida de generalidad, que las primeras k
bolillas son rojas.
Luego, A = {1, 2, ..., k} , #A = k , #W = n.
Entonces
P (A) = k/n
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 18 / 41
El arte de modelar
Consideremos ahora el sorteo de un bolillero con k bolillas rojas y n� k blancas.
Tomamos W = {rojo, blanco}.
No esta mal definir al espacio muestral como {rojo, negro} . Sin embargo, si lo
definimos aśı, no es razonable suponer que el espacio muestral sea equiprobable,
excepto cuando n = 2k .
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 19 / 41
El arte de modelar
Este ejemplo ilustra los siguientes puntos interesantes:
Hay distintas formulaciones posibles de un espacio muestral. Sin embargo,
algunas son mas utiles que otras.
Que un espacio muestral sea equiprobable es una suposición o modelo
que según las circumstancias será o no razonable.
Plantear para un problema (con resultados finitos) un espacio que
razonablemente sea equiprobable a veces es obvio, a veces no lo es.
Para evaluar la razonabilidad de la suposicion de equiprobabilidad de un
espacio muestral no nos alcanza con conocer los elementos del espacio
muesral sino también las circumstancias que dan origen al espacio muestral.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 20 / 41
Conteo
El cálculo de probabilidades en espacios equiprobables en realidad no
requiere especificar quienes son los elementos del espacio muestral W y del
evento A, sino simplemente que seamos capaces de contar cuántos
elementos hay en cada conjunto.
Esto es importante porque en la gran mayoŕıa de problemas reales tanto W
como A son enormes y especificar sus elementos es una tarea tediosa,
cuando no prácticamente imposible.
Hay muchas técnicas y estrategias que facilitan el conteo de conjuntos. Solo
veremos algunos pocos resultados que aprenderemos con ejemplos.
Lectura recomendada para aprender más sobre este tema: Caṕıtulo 1 del
libro de Blitzstein y Hwang.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 21 / 41
Conteo en experimentos compuestos
Ejemplo 1. Una heladeŕıa ofrece tres gustos de helados: vanilla, chocolate y
frutilla. Ofrece dos posibles recipientes : vasito y cucurucho, pero en un solo
tamaño. De cuántos formas puedo elegir un helado?
Respuesta: Hay tres gustos y por cada gusto hay dos posibles recipientes, entonces hay
3⇥ 2 combinaciones posibles.
Notar que en este problema NO importa el orden. Por ejemplo, la combinacion Cucurucho
seguida por Chocolate es la misma que la combinacion Chocolate seguida por Cucurucho.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 22 / 41
Regla para conteo en experimentos compuestos.
Regla 1: consideremos un ”experimento compuesto” E que consiste en dos
”sub-experimentos”, E1 y E2 . Entonces,
(# resultados posibles de E ) = (# resultados posibles de E1)⇥ (# resultados posibles de E2)
Si E consiste en k sub-experimentos E1,E2, ...,Ek , entonces,
# resultados posibles de E = (# resultados posibles de E1)⇥ · · ·⇥ (# resultados posibles de Ek )
El termino ”experimento” en la Regla 1 puede interpretarse libremente, como una
situación incierta cualquiera a la cual podemos sub-clasificar de acuerdo a dos o más
categorias. Por ejemplo, en el Ejemplo 1, el experimento es ”registrar el gusto y recipiente
del helado” y los dos sub-experimentos son E1 :”registrar el sabor”, y E2 :”registrar el
recipiente” del helado.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 23 / 41
Ejemplo de experimento con tres sub-experimentos
Ejemplo 2. Supongamos ahora que la heladeŕıa ofrece cuatro tamanos distintos:
chico, mediano, grande y cuarto de kilo. De cuántas formas puedo elegir un
helado ahora?
Respuesta: 3⇥ 2⇥ 4 combinaciones distintas.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introducciona la Estad́ıstica 24 / 41
Uso anidado de la Regla 1.
Ejemplo 3. En el Ejercicio 1, supongamos que dos amigas Laura y Susana
comprarán helados. Cuáles son todos los posibles resultados de sus
elecciones combinadas?
Respuesta. Sea L el experimento ”elección de Laura”, y sea S el
experimento ”elección de Susana” y sea C el ”experimento combinado
elección de Laura y Susana”. Luego,
(# resultados posibles de C ) = (# resultados posibles de L)⇥ (# resultados posibles de S)
L es a su vez un experimento combinado ”elección de gusto y recipiente de Laura”, luego
(# resultados posibles de L) = 3⇥ 2 = 6
y del mismo modo,
(# resultados posibles de S) = 3⇥ 2 = 6.
De modo que la respuesta es 36, ya que
(# resultados posibles de C ) = 6⇥ 6 = 36.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 25 / 41
Muestreos con y sin reposición.
Muchos problemas de conteo se pueden ver como problemas equivalentes a
uno de los dos tipos de experimentos siguientes.
Muestreo con reposición : En un bolillero hay n bolillas idénticas excepto
por estar numeradas 1, 2, . . . , n. El experimento consiste en sortear, de a
una por vez, k bolillas del bolillero, reponiendo la bolilla sorteada al
bolillero cada vez. El resultado del experimento es la k�tupla ordenada
(a1, ..., ak ) , siendo a1 el primer numero sorteado, a2 el segundo, etc.
Muestreo sin reposicion : En un bolillero hay n bolillas idénticas excepto
por estar numeradas 1, 2, . . . ,n. El experimento consiste en sortear, de a
una por vez, k bolillas del bolillero, sin reponer la bolilla sorteada al
bolillero cada vez. El resultado del experimento es la k�tupla ordenada
(b1, ..., bk ) , siendo b1 el primer número sorteado, b2 el segundo, etc.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 26 / 41
Muestreo con reposición, n = 3, k = 2.
3⇥ 3 = 9 resultados posibles.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 27 / 41
Muestreo sin reposición, n = 3, k = 2.
3⇥ 2 = 6 resultados posibles.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 28 / 41
Muestreos con y sin reposición.
Muestreo con reposición : n bolillas de las cuales se sortean k bolillas
reponiendo la bolilla sorteada cada vez.
# resultados posibles = nk .
Muestreo sin reposición : n bolillas de las cuales se sortean k bolillas sin
reponer las bolillas sorteadas
# resultados posibles = n⇥ (n� 1)⇥ (n� 2)⇥ · · ·⇥ (n� k + 1)
=
n!
(n� k)! .
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 29 / 41
Problema del cumpleaños
Problema: En un aula de 25 alumnos, cuál es la probabilidad de que al
menos dos alumnos cumplan años el mismo d́ıa? (asumiendo que Feb 29 no
existe).
Resumen de la solución: primero definiremos W. Despues decidiremos que
es razonable suponer que W sea equiprobable y por lo tanto que
P (A) = #A/#W.
Espacio muestral W. Cada dia del año es como una bolilla en un bolillero
de 365 bolillas. Los cumpleaños de los 25 alumnos son el resultado de 25
sorteos con reposición del bolillero (por qué con reposicion?). Luego
W = {(a1, ..., a25) : ai es un numero entero entre 1 y 365}
#W = 36525
Como no hay ninguna razón para suponer que alguna asignación de 25
fechas de cumpleaños sea más probable que otra, vamos a suponer que W es
equiprobable .
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 30 / 41
Problema del cumpleaños
El evento de interés A : es el conjunto de las tuplas (a1, ..., a25) en W que
tienen al menos dos de sus elementos iguales.
Calcular #A directamente es complicado (por qué?). Más fácil es calcular
#Ac y luego calcular #A = #W�#Ac .
Ac es el conjunto de tuplas (a1, ..., a25) en W con todos sus elementos
distintos. Luego Ac coincide con el conjunto de todos los resultados posibles
de sortear 25 veces sin reposición del bolillero.
Luego
#Ac = 365⇥ 364⇥ · · ·⇥ (365� 25+ 1)
#A = 36525 � 365⇥ 364⇥ · · ·⇥ (365� 25+ 1)
Por lo tanto,
P (A) =
36525 � 365⇥ 364⇥ · · ·⇥ (365� 25+ 1)
36525
= 1� 365⇥ 364⇥ · · ·⇥ (365� 25+ 1)
36525
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 31 / 41
R
R es un entorno y lenguaje de programación gratuito para hacer gráficos y
cálculos estad́ısticos. Es un lenguage muy popular en la ciencia de datos.
R está disponible en el sitio http://www.r-project.org.
La interface RStudio- también gratuita - que facilita trabajar con R, del sitio
http://www.rstudio.com.
En R, el código y la salida para el problema del cumpleaños es
k <- 25
1 - prod((365 - k + 1):365) / 365^k
El resultado es
[1] 0.5686997
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 32 / 41
El código para calcular la probabilidad para aulas con k = 2, 3, 4, ..., 100
alumnos y guardar el resultado en un vector probs es:
probs <- rep(0, 99)
num alum <- 2:100
for (k in num alum){
probs[k - 1]<- 1 - prod((365 -k + 1):365) / 365^k
}
Imprimimos los valores de las probabilidades para aulas con 2, 3 y 4
estudiantes
probs[1:3]
[1] 0.002739726 0.008204166 0.016355912
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 33 / 41
Gráficos en R
Ahora graficamos las probabilidades contra el número de alumnos por
aula.
plot(num alum, probs, xlab = "numero de alumnos", ylab = "probabilidad", main
="Probabilidad de dos o mas coincidencias")
0 20 40 60 80 100
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
Probabilidad de dos o mas coincidencias
numero de alumnos
p
ro
b
a
b
ili
d
a
d
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 34 / 41
Gráficos en R
Se pueden hacer gráficos más lindos usando el paquete ggplot2.
Para instalarlo, escribimos install.packages("ggplot2") en la
consola.
Para cargarlo, library("ggplot2").
Un buen tutorial con muchos ejemplos:
tutorials.iq.harvard.edu/R/Rgraphics/Rgraphics.html
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 35 / 41
(null)://(null)tutorials.iq.harvard.edu/R/Rgraphics/Rgraphics.html
Muestreo en R
El comando sample en R nos permite simular muestreos con y sin
reposición.
Para simular los resultados de sortear sin reposicion de un bolillero
con bolillas numeradas del 1 al 10
n <- 10
k <- 5
sample(n, k)
Con resultado [1] 4 8 10 3 7
Si repito el comando sample(n, k) obtengo [1] 6 5 3 1 8
Para generar con reposición
n <- 10
k <- 5
sample(n, k, replace=TRUE)
Con resultado [1] 2 1 5 10 2
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 36 / 41
Interpretación de la probabilidad
Los axiomas de probabilidad nos dan reglas para decidir si una
función P es una probabilidad. Sin embargo, los axiomas no nos dicen
como interpretar a la funcion P .
Cómo interpretamos las siguientes afirmaciones?
a. la probabilidad de que el tiro de una moneda caiga en cara es 1/2
b. la probabilidad de que de un bolillero con k bolillas rojas y n� k blancas salga
sorteada una roja es k/n
c. la probabilidad de que en un aula con 25 alumnos haya al menos dos con
cumpleaños el mismo dia es 0.57
d. la probabilidad de que mañana me pegue un rayo es 10�20.
e. la probabilidad de que Argentina entre en recesión en el próximo mes es 1/10
A grandes rasgos hay dos escuelas filosóficas: la frecuentista y la
Bayesiana.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 37 / 41
Interpretación de la probabilidad: escuela frecuentista.
Escuela Frecuentista: la probabilidad de un evento representa la
frecuencia a la larga de la ocurrencia del evento si pudiesemos repetir
el ”experimento aleatorio” infinitasveces.
Esta interpretación tiene sustento teórico en un Teorema que veremos mas adelante
llamado ”Ley de los Grandes Números” .
Notemos que esta interpretación implica que a pesar de todo, hay regularidades en
la incertidumbre...
En el caso (a), P (cara) = 1/2 se interpreta como: en la mitad de infinitos tiros de
una misma moneda, la moneda caera en ”cara”.
En el caso (b), P (roja) = k/n se interpreta como: en k/n de infinitos sorteos del
mismo bolillero, la bolilla sorteada sera roja.
La regularidad ”a la larga” de la probabilidad es muy útil. Por ejemplo, cuando se
tira una moneda para decidir que equipo arranca un partido de futbol, la
probabilidad garantiza que esta estrategia ”a la larga” es objetiva.
La interpretación es problemática en los casos (c) - (e) porque no hay realmente un
experimento ni la posibilidad de repetirlo infinitamente.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 38 / 41
Interpretacion de la probabilidad: escuela Bayesiana.
Escuela Bayesiana: La probabilidad representa ”grados de creencia”
subjetivos sobre el evento en cuestión.
Hay distintas formas de ”calibrar” una probabilidad subjetiva.
Una de ellas es por medio de apuestas en juegos sin pérdida. Veamos
como asigno el valor a P (A) siguiendo esta lógica. Consideremos dos
juegos.
Juego 1. Saco una bolilla de un bolillero con k bolillas rojas y n� k
bolillas blancas. Si sale roja, recibo un premio de un millón de dolares,
si sale blanca no recibo nada.
Juego 2. Si el evento A es cierto, recibo un millón de dolares, de lo
contrario no recibo nada.
Entonces, la probabilidad P (A) que le asigno al evento A es k/n si
para el par (k , n) me da lo mismo -soy indiferente a- jugar cualquiera
de los dos juegos.
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 39 / 41
Bolilleros con infinito numerables bolillas
A veces necesitaremos considerar espacios con infinitas, pero
numerables, bolillas.
Por ejemplo: en el experimento numero de tiros hasta que emboque
al aro el espacio muestral es
W = {1, 2, 3, ...}
Un espacio infinito numerable no puede ser equiprobable, por qué?
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 40 / 41
Reglas de la probabilidad
Los tres axiomas de la probabilidad implican las siguientes propiedades
1. P (∆) = 0
2. P (Ac ) = 1� P (A)
3. Si A ⇢ B entonces P (A)  P (B)
4. P (A[ B) = P (A) + P (B)� P (A\ B)
5. P (A[ B)  P (A) + P (B)
6. Si A ⇢ B entonces P (B � A) = P (B)� P (A)
Demostracion de propiedad (2) (las otras demostraciones quedan como
problemas para la practica)
W = A[Ac . Ademas, A y Ac son disjuntos. Luego,
1 = P (W) = P (A[Ac ) = P (A) + P (Ac ) . Luego, P (Ac ) = 1� P (A) .
Rotnitzky, Ferrari, Cersosimo, Smucler (Universidad Torcuato Di Tella )Introduccion a la Estad́ıstica 41 / 41

Continuar navegando