Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Pontificia Universidad Católica de Chile Instituto de Economía Econometría I – EAE 250A Juan Ignacio Urquiza – Segundo Semestre 2019 Modelo de Regresión Lineal Simple Herramienta que se emplea para estudiar la relación entre dos variables. Objeto de estudio: Sean Y, X dos variables que representan a una población. Se busca “explicar a Y en términos de X”, o la “variación en Y ante variaciones en X”. Ej: gasto en vestimenta vs. nivel de ingreso Notación: Modelo de Regresión Lineal Simple MRL Simple: Y: variable dependiente, explicada, predicha… X: variable independiente, explicativa, predictora, de control, regresor… β0, β1: parámetros poblacionales. ε: término de error, perturbación inobservable. Representa factores distintos de X que afectan a Y. Componente aleatorio. Ejemplos Ecuación de Salarios: Y: salario X: años de educación ε: experiencia laboral, capacidad/habilidad innata, años de antigüedad en la empresa… Rendimiento y Fertilizante: Y: rendimiento X: cantidad de fertilizante ε: calidad de la tierra, lluvia, sol… Supuestos Linealidad en los parámetros: Cambios unitarios en X tienen el mismo efecto sobre Y, independientemente del valor inicial de X. No linealidades pueden incorporarse de otra manera. Media Condicional Cero – E(ε|X) = 0: El valor esperado de los factores inobservables no depende del valor X, y dicho promedio es igual a 0. E(ε|X) = E(ε) = 0 ¿De qué manera se relaciona ε con X? Regresión Poblacional Si se cumple con los supuestos anteriores: Linealidad en parámetros E(ε|X)=0 Entonces, Por lo tanto, podemos descomponer a Y en una parte “sistemática” (β0 + β1X) y una parte “no sistemática” (ε). Función de Regresión Poblacional (FRP) Regresión Poblacional Cuando E(ε|X)=0, para cualquier valor de X la distribución de Y se concentra alrededor de E(Y|X) . La FRP es la relación entre el promedio de Y para diferentes valores de X. El verdadero valor de Y puede ser mayor o menor dependiendo de los factores inobservables. Interpretación Recuerde: Por lo tanto, Cuando X aumenta en una unidad, el valor esperado de Y cambia en β1 unidades Pendiente β0 es el valor medio de Y cuando X es igual a cero Intercepto (término constante) Estimación Nuestro objetivo consiste en estimar los parámetros poblacionales a partir de una muestra aleatoria de tamaño n tomada de la población. Sea el modelo poblacional: Entonces, podemos escribir para cada i = 1, 2,… n: donde εi es el término de error para la observación i. Estimación Al análogo muestral del término de error se lo conoce como “residuo”. Definición: llamaremos residuo a la diferencia entre el “valor observado” y el “valor ajustado”: Así, los estimadores de Mínimos Cuadrados Ordinarios (MCO) son los argumentos que minimizan la suma de los residuos al cuadrado: Estimación CPO: Implicancia: Si en la muestra X e Y correlacionan positivamente, entonces 𝛽1 es positivo. Si correlacionan negativamente, 𝛽1 es negativo. Compruébelo! Valores Ajustados y Residuos Regresión Muestral Una vez estimados los parámetros, se obtiene la función de regresión muestral (FRM) : Recordar: La FRP es fija pero desconocida. La FRM se obtiene a partir de una muestra. Es la versión estimada de la FRP. Distintas muestras generan distintas FRM. Regresión Muestral Propiedades Algebraicas: (1) La suma de los residuos es igual a cero. (2) La covarianza muestral entre el regresor y el residuo es igual a cero. Regresión Muestral Propiedades Algebraicas: (3) El punto 𝑋, 𝑌 siempre se encuentra sobre la línea de regresión de MCO. Estas propiedades permiten reescribir a Yi como su valor ajustado más su residuo: Análisis de Varianza Def: suma de cuadrados totales = variación muestral total. Análisis de Varianza Entonces, Suma de Cuadrados Residuales Suma de Cuadrados Estimados Análisis de Varianza Entonces, Suma Residual de Cuadrados Suma Explicada de Cuadrados Análisis de Varianza Entonces, Por propiedades anteriores: Análisis de Varianza Entonces, Por lo tanto, Bondad del Ajuste ¿Cuán bien explica la variable independiente a la variable dependiente? Métrica: grado en que la regresión de MCO se ajusta a los datos. Entonces, Coef. de Determinación Bondad del Ajuste Interpretación: Proporción de la variación muestral de Y que “es explicada” por X. 0 ≤ R2 ≤ 1. Se puede demostrar que: Es igual al cuadrado del coef. de correlación e/ Y e 𝑌.
Compartir