Logo Studenta

Clase 1 - Inferencia Estadística

¡Este material tiene más páginas!

Vista previa del material en texto

Teoŕıa de Probabilidades
“El lenguaje formal de la incertidumbre”
Wasserman (2003)
3 / 19
Teoŕıa de Probabilidades
Wasserman (2003)
4 / 19
Teoŕıa de Probabilidades vs. Inferencia Estad́ıstica
Wasserman (2003)
5 / 19
Inferencia Estad́ıstica - otro enfoque
“La Inferencia Estad́ıstica es el proceso de sacar conclusiones sobre
toda la población en base a la información de una muestra”
Lock, et al. (2020)
6 / 19
7 / 19
Ingredientes fundamentales
1 Distribución (población):
F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional):
θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) =
θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria:
X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn)
= θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn)
= θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n
= θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ejemplo
La tienda de colchones “DormiTown” está considerando lanzar una
nueva versión de su página web. Antes de tomar la decisión le
gustaŕıa saber si este cambio será conveniente de acuerdo a alguna
de las siguientes métricas:
Tiempo de permanencia medio en la página por sesión
Tasa de conversión (proporción de sesiones que terminan en
una transacción)
9 / 19
Tiempo de permanencia
Parámetros de interés:
µ1 = tiempo de permanencia medio con la versión actual
µ2 = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ2 > µ1?
10 / 19
Tiempo de permanencia
Parámetros de interés:
µ1 = tiempo de permanencia medio con la versión actual
µ2 = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ2 > µ1?
10 / 19
Test AB
Objetivos:
1 estimar µ1 y µ2
2 comparar µ̂1 y µ̂2
3 tomar una decisión
11 / 19
Test AB
Objetivos:
1 estimar µ1 y µ2
2 comparar µ̂1 y µ̂2
3 tomar una decisión
11 / 19
Test AB
Objetivos:
1 estimar µ1 y µ2
2 comparar µ̂1 y µ̂2
3 tomar una decisión
11 / 19
Test AB
Objetivos:
1 estimar µ1 y µ2
2 comparar µ̂1 y µ̂2
3 tomar una decisión
11 / 19
Test AB
Objetivos:
1 estimar µ1 y µ2
2 comparar µ̂1 y µ̂2
3 tomar una decisión
11 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado (“TestB”)
12 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado (“TestB”)
12 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado (“TestB”)
12 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado
(“TestB”)
12 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado (“TestB”)
12 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado (“TestB”)
12 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanenciadel i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro:
µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria:
X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn)
= Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19
Ejemplo con n = 5
datos observados:
73.93 31.17 86.18 90.30 43.30
14 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) =
θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n =
θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. EstimaciónEstimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) =
θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Temas de la materia
1 Ley de los grandes números y Teorema central del ĺımite
2 Estimación puntual
3 Intervalos de confianza
4 Test de hipótesis
16 / 19
Temas de la materia
1 Ley de los grandes números y Teorema central del ĺımite
2 Estimación puntual
3 Intervalos de confianza
4 Test de hipótesis
16 / 19
Temas de la materia
1 Ley de los grandes números y Teorema central del ĺımite
2 Estimación puntual
3 Intervalos de confianza
4 Test de hipótesis
16 / 19
Temas de la materia
1 Ley de los grandes números y Teorema central del ĺımite
2 Estimación puntual
3 Intervalos de confianza
4 Test de hipótesis
16 / 19
5 Regresión Lineal
17 / 19
5 Regresión Lineal
17 / 19
5 Regresión Lineal
6 Regresión Loǵıstica
18 / 19
5 Regresión Lineal
6 Regresión Loǵıstica
18 / 19
Bibliograf́ıa recomendada
All of Statistics-A Concise Course in Statistical
Inference. Wasserman, L. (2021).
(pocas ideas intuitivas pero muy conciso y tiene todos los
temas que veremos)
Statistics: Unlocking the power of data. Lock et al.
(2020).
(poca teoŕıa pero muchos ejemplos e ideas intuitivas. Buen
complemento del Wasserman, sobre todo para los temas 2 a
4)
An introduction to statistical learning. James, G., Witten,
D., Hastie, T., & Tibshirani, R. (2021).
https://www.statlearning.com/
(ideal para los temas 5 y 6)
19 / 19
https://www.statlearning.com/

Continuar navegando

Materiales relacionados

39 pag.
Infrencia estadística (1)

SIN SIGLA

User badge image

Roosevelt Daniel Santos Vanegas

5 pag.
Práctica7

SIN SIGLA

User badge image

Marcos Accornero

27 pag.
Resumen- TEORIA

SIN SIGLA

User badge image

Josefina Bordiga

6 pag.
Cap02_MetEstad (1) (1)

SIN SIGLA

User badge image

lizethsalin748