Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Teoŕıa de Probabilidades “El lenguaje formal de la incertidumbre” Wasserman (2003) 3 / 19 Teoŕıa de Probabilidades Wasserman (2003) 4 / 19 Teoŕıa de Probabilidades vs. Inferencia Estad́ıstica Wasserman (2003) 5 / 19 Inferencia Estad́ıstica - otro enfoque “La Inferencia Estad́ıstica es el proceso de sacar conclusiones sobre toda la población en base a la información de una muestra” Lock, et al. (2020) 6 / 19 7 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ingredientes fundamentales 1 Distribución (población): F 2 Parámetro (poblacional): θ(F ) = θ 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. 4 Estimador: g(X1, . . . , Xn) = θ̂n(X1, . . . , Xn) = θ̂n = θ̂ 5 Incertidumbre (error de estimación): Intervalos de Confianza Test de Hipótesis 8 / 19 Ejemplo La tienda de colchones “DormiTown” está considerando lanzar una nueva versión de su página web. Antes de tomar la decisión le gustaŕıa saber si este cambio será conveniente de acuerdo a alguna de las siguientes métricas: Tiempo de permanencia medio en la página por sesión Tasa de conversión (proporción de sesiones que terminan en una transacción) 9 / 19 Tiempo de permanencia Parámetros de interés: µ1 = tiempo de permanencia medio con la versión actual µ2 = tiempo de permanencia medio con la versión nueva Pregunta: ¿µ2 > µ1? 10 / 19 Tiempo de permanencia Parámetros de interés: µ1 = tiempo de permanencia medio con la versión actual µ2 = tiempo de permanencia medio con la versión nueva Pregunta: ¿µ2 > µ1? 10 / 19 Test AB Objetivos: 1 estimar µ1 y µ2 2 comparar µ̂1 y µ̂2 3 tomar una decisión 11 / 19 Test AB Objetivos: 1 estimar µ1 y µ2 2 comparar µ̂1 y µ̂2 3 tomar una decisión 11 / 19 Test AB Objetivos: 1 estimar µ1 y µ2 2 comparar µ̂1 y µ̂2 3 tomar una decisión 11 / 19 Test AB Objetivos: 1 estimar µ1 y µ2 2 comparar µ̂1 y µ̂2 3 tomar una decisión 11 / 19 Test AB Objetivos: 1 estimar µ1 y µ2 2 comparar µ̂1 y µ̂2 3 tomar una decisión 11 / 19 Tiempo de permanencia: problema simplificado Suponemos... µ0 = tiempo de permanencia medio con la versión actual = 60 seg −→ conocido Parámetro de interés: µ = tiempo de permanencia medio con la versión nueva Pregunta: ¿µ > µ0? Experimento: TestAB simplificado (“TestB”) 12 / 19 Tiempo de permanencia: problema simplificado Suponemos... µ0 = tiempo de permanencia medio con la versión actual = 60 seg −→ conocido Parámetro de interés: µ = tiempo de permanencia medio con la versión nueva Pregunta: ¿µ > µ0? Experimento: TestAB simplificado (“TestB”) 12 / 19 Tiempo de permanencia: problema simplificado Suponemos... µ0 = tiempo de permanencia medio con la versión actual = 60 seg −→ conocido Parámetro de interés: µ = tiempo de permanencia medio con la versión nueva Pregunta: ¿µ > µ0? Experimento: TestAB simplificado (“TestB”) 12 / 19 Tiempo de permanencia: problema simplificado Suponemos... µ0 = tiempo de permanencia medio con la versión actual = 60 seg −→ conocido Parámetro de interés: µ = tiempo de permanencia medio con la versión nueva Pregunta: ¿µ > µ0? Experimento: TestAB simplificado (“TestB”) 12 / 19 Tiempo de permanencia: problema simplificado Suponemos... µ0 = tiempo de permanencia medio con la versión actual = 60 seg −→ conocido Parámetro de interés: µ = tiempo de permanencia medio con la versión nueva Pregunta: ¿µ > µ0? Experimento: TestAB simplificado (“TestB”) 12 / 19 Tiempo de permanencia: problema simplificado Suponemos... µ0 = tiempo de permanencia medio con la versión actual = 60 seg −→ conocido Parámetro de interés: µ = tiempo de permanencia medio con la versión nueva Pregunta: ¿µ > µ0? Experimento: TestAB simplificado (“TestB”) 12 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanenciadel i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ingredientes 1 Distribución: X = tiempo de permanencia con la nueva versión de un visitante elegido al azar de la “población” X ∼ F → distribución de interés 2 Parámetro: µ = µ(F ) = EF (X) 3 Muestra aleatoria: X1, . . . , Xn ∼ F i.i.d. Xi = tiempo de permanencia del i-ésimo individuo de la muestra 4 Estimador: µ̂n = µ̂n(X1, . . . , Xn) = Xn 13 / 19 Ejemplo con n = 5 datos observados: 73.93 31.17 86.18 90.30 43.30 14 / 19 Estimador vs. Estimación Estimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Estimador vs. Estimación Estimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Estimador vs. Estimación Estimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Estimador vs. Estimación Estimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Estimador vs. Estimación Estimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Estimador vs. Estimación Estimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Estimador vs. Estimación Estimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Estimador vs. Estimación Estimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Estimador vs. Estimación Estimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Estimador vs. EstimaciónEstimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Estimador vs. Estimación Estimador Procedimiento que haremos con las variables de la muestra aleatoria Se define antes de extraer la muestra Es una variable aleatoria Lo notamos... θ̂n(X1, . . . , Xn) = θ̂n = θ̂ Estimación Resultado de aplicar el procedimiento a los datos de la muestra observada Se calcula luego de extraer la muestra Es un número Lo notamos... θ̂n(x1, . . . , xn) = θ̂obs 15 / 19 Temas de la materia 1 Ley de los grandes números y Teorema central del ĺımite 2 Estimación puntual 3 Intervalos de confianza 4 Test de hipótesis 16 / 19 Temas de la materia 1 Ley de los grandes números y Teorema central del ĺımite 2 Estimación puntual 3 Intervalos de confianza 4 Test de hipótesis 16 / 19 Temas de la materia 1 Ley de los grandes números y Teorema central del ĺımite 2 Estimación puntual 3 Intervalos de confianza 4 Test de hipótesis 16 / 19 Temas de la materia 1 Ley de los grandes números y Teorema central del ĺımite 2 Estimación puntual 3 Intervalos de confianza 4 Test de hipótesis 16 / 19 5 Regresión Lineal 17 / 19 5 Regresión Lineal 17 / 19 5 Regresión Lineal 6 Regresión Loǵıstica 18 / 19 5 Regresión Lineal 6 Regresión Loǵıstica 18 / 19 Bibliograf́ıa recomendada All of Statistics-A Concise Course in Statistical Inference. Wasserman, L. (2021). (pocas ideas intuitivas pero muy conciso y tiene todos los temas que veremos) Statistics: Unlocking the power of data. Lock et al. (2020). (poca teoŕıa pero muchos ejemplos e ideas intuitivas. Buen complemento del Wasserman, sobre todo para los temas 2 a 4) An introduction to statistical learning. James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021). https://www.statlearning.com/ (ideal para los temas 5 y 6) 19 / 19 https://www.statlearning.com/
Compartir