Clase 1 - Inferencia Estadística

Estadística

•
SIN SIGLA

0
tecnologo
15/10/2023
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Estadística

5643 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
Teoŕıa de Probabilidades
“El lenguaje formal de la incertidumbre”
Wasserman (2003)
3 / 19
Teoŕıa de Probabilidades
Wasserman (2003)
4 / 19
Teoŕıa de Probabilidades vs. Inferencia Estad́ıstica
Wasserman (2003)
5 / 19
Inferencia Estad́ıstica - otro enfoque
“La Inferencia Estad́ıstica es el proceso de sacar conclusiones sobre
toda la población en base a la información de una muestra”
Lock, et al. (2020)
6 / 19
7 / 19
Ingredientes fundamentales
1 Distribución (población):
F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional):
θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) =
θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria:
X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn)
= θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn)
= θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n
= θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ingredientes fundamentales
1 Distribución (población): F
2 Parámetro (poblacional): θ(F ) = θ
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
4 Estimador:
g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂
5 Incertidumbre (error de estimación):
Intervalos de Confianza
Test de Hipótesis
8 / 19
Ejemplo
La tienda de colchones “DormiTown” está considerando lanzar una
nueva versión de su página web. Antes de tomar la decisión le
gustaŕıa saber si este cambio será conveniente de acuerdo a alguna
de las siguientes métricas:
Tiempo de permanencia medio en la página por sesión
Tasa de conversión (proporción de sesiones que terminan en
una transacción)
9 / 19
Tiempo de permanencia
Parámetros de interés:
µ1 = tiempo de permanencia medio con la versión actual
µ2 = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ2 > µ1?
10 / 19
Tiempo de permanencia
Parámetros de interés:
µ1 = tiempo de permanencia medio con la versión actual
µ2 = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ2 > µ1?
10 / 19
Test AB
Objetivos:
1 estimar µ1 y µ2
2 comparar µ̂1 y µ̂2
3 tomar una decisión
11 / 19
Test AB
Objetivos:
1 estimar µ1 y µ2
2 comparar µ̂1 y µ̂2
3 tomar una decisión
11 / 19
Test AB
Objetivos:
1 estimar µ1 y µ2
2 comparar µ̂1 y µ̂2
3 tomar una decisión
11 / 19
Test AB
Objetivos:
1 estimar µ1 y µ2
2 comparar µ̂1 y µ̂2
3 tomar una decisión
11 / 19
Test AB
Objetivos:
1 estimar µ1 y µ2
2 comparar µ̂1 y µ̂2
3 tomar una decisión
11 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado (“TestB”)
12 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado (“TestB”)
12 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado (“TestB”)
12 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado
(“TestB”)
12 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado (“TestB”)
12 / 19
Tiempo de permanencia: problema simplificado
Suponemos...
µ0 = tiempo de permanencia medio con la versión actual
= 60 seg −→ conocido
Parámetro de interés:
µ = tiempo de permanencia medio con la versión nueva
Pregunta: ¿µ > µ0?
Experimento: TestAB simplificado (“TestB”)
12 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanenciadel i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro:
µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria:
X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn)
= Xn
13 / 19
Ingredientes
1 Distribución:
X = tiempo de permanencia con la nueva versión de un
visitante elegido al azar de la “población”
X ∼ F → distribución de interés
2 Parámetro: µ = µ(F ) = EF (X)
3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d.
Xi = tiempo de permanencia del i-ésimo individuo de la muestra
4 Estimador:
µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19
Ejemplo con n = 5
datos observados:
73.93 31.17 86.18 90.30 43.30
14 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) =
θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n =
θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Estimador vs. EstimaciónEstimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) =
θ̂obs
15 / 19
Estimador vs. Estimación
Estimador
Procedimiento que haremos
con las variables de la
muestra aleatoria
Se define antes de extraer la
muestra
Es una variable aleatoria
Lo notamos...
θ̂n(X1, . . . , Xn) = θ̂n = θ̂
Estimación
Resultado de aplicar el
procedimiento a los datos de
la muestra observada
Se calcula luego de extraer
la muestra
Es un número
Lo notamos...
θ̂n(x1, . . . , xn) = θ̂obs
15 / 19
Temas de la materia
1 Ley de los grandes números y Teorema central del ĺımite
2 Estimación puntual
3 Intervalos de confianza
4 Test de hipótesis
16 / 19
Temas de la materia
1 Ley de los grandes números y Teorema central del ĺımite
2 Estimación puntual
3 Intervalos de confianza
4 Test de hipótesis
16 / 19
Temas de la materia
1 Ley de los grandes números y Teorema central del ĺımite
2 Estimación puntual
3 Intervalos de confianza
4 Test de hipótesis
16 / 19
Temas de la materia
1 Ley de los grandes números y Teorema central del ĺımite
2 Estimación puntual
3 Intervalos de confianza
4 Test de hipótesis
16 / 19
5 Regresión Lineal
17 / 19
5 Regresión Lineal
17 / 19
5 Regresión Lineal
6 Regresión Loǵıstica
18 / 19
5 Regresión Lineal
6 Regresión Loǵıstica
18 / 19
Bibliograf́ıa recomendada
All of Statistics-A Concise Course in Statistical
Inference. Wasserman, L. (2021).
(pocas ideas intuitivas pero muy conciso y tiene todos los
temas que veremos)
Statistics: Unlocking the power of data. Lock et al.
(2020).
(poca teoŕıa pero muchos ejemplos e ideas intuitivas. Buen
complemento del Wasserman, sobre todo para los temas 2 a
4)
An introduction to statistical learning. James, G., Witten,
D., Hastie, T., & Tibshirani, R. (2021).
https://www.statlearning.com/
(ideal para los temas 5 y 6)
19 / 19
https://www.statlearning.com/