Logo Studenta

Modelo de regresión lineal Resumen

¡Estudia con miles de materiales!

Vista previa del material en texto

ECONOMETRÍA INTERMEDIA 
 
La econometría1 se basa en métodos estadísticos para estimar las relaciones económicas, poner a 
prueba teorías económicas y evaluar y poner en práctica políticas gubernamentales y comerciales. La 
aplicación más común de la econometría es el pronóstico de variables macroeconómicas importantes. 
 
Dos de los componentes fundamentales de la econometría son la teoría y los hechos, ya que la 
econometría se sirve tanto de teorías como de hechos y, mediante el uso de técnicas estadísticas, los 
combina para estimar relaciones económicas. La teoría se desarrolla en forma de un modelo2 
econométrico y los hechos en un conjunto de datos selectos. 
 
El resultado de este proceso, es un modelo econométrico estimado en el que ciertas magnitudes 
(conocidas como parámetros), son estimadas sobre la base de datos relevantes. El modelo estimado 
da una forma de medir y probar las relaciones que sugiere la teoría económica. 
 
El modelo econométrico es un tipo especial de modelo algebraico3, estocástico, esto es, que incluye 
una o más variables aleatorias. Representa un sistema a través de un conjunto de relaciones 
estocásticas entre las variables del sistema. 
 
Un modelo econométrico puede ser lineal o no lineal (el modelo es lineal en sus parámetros). El 
supuesto de linealidad es muy importante, tanto para probar teoremas matemáticos y estadísticos en 
relación con tales modelos, como para calcular los valores que adoptan las variables en los mismos. La 
razón por la cual se supone linealidad (en los parámetros) es la conveniencia y la maleabilidad de este 
supuesto. 
 
Los modelos econométricos pueden ser estáticos o dinámicos. Un modelo estático no involucra 
dependencia explicita del tiempo, de modo que el tiempo no es esencial en el modelo. Sin embrago, 
no basta simplemente con añadir subíndices tiempo a las variables para convertir un modelo estático 
en uno dinámico. Un modelo dinámico es aquel en el cual el tiempo tiene un papel esencial, i.e. si son 
parte del modelo variables desfasadas o diferencias de variables en el tiempo. Así, si cualquier 
ecuación del modelo es una ecuación en diferencias, entonces el modelo es dinámico. El tiempo 
también tiene un papel esencial si las variables y sus tasas de cambio son consideradas 
explícitamente, como en una ecuación diferencial. 
 
PROPOSITOS DE LA ECONOMETRÍA 
 
Análisis estructural.- es el uso de un modelo econométrico estimado, para efectuar la medición 
cuantitativa de relaciones económicas. 
 
Predicción.- es la aplicación de n modelo econométrico estimado, para predecir valores cuantitativos 
de ciertas variables fuera de la muestra de datos realmente observados. 
 
Evaluación de políticas.- es el manejo de un modelo econométrico estimado para elegir entre 
políticas alternas. 
 
 
 
 
 
 
 
 
 
1 El sufijo “metría” significa medición. 
2 Un modelo es cualquier representación de un fenómeno real tal como un proceso o sistema real. 
3 En econometría, el modelo algebraico es el tipo de modelo más importante ya que este representa el sistema del mundo real a través de un 
sistema de ecuaciones. 
ESTRUCTURA DE LOS DATOS. 
 
Un estudio econométrico implica el uso de datos para estimar un modelo a través de técnicas 
econométricas. Para estimar un modelo econométrico se requieren datos a cerca de todas las 
variables incluidas en el modelo. 
 
Datos de corte transversal.- Un conjunto de datos de corte transversal consta de una muestra 
tomada en un momento determinado. Una particularidad importante de este tipo de datos es que, se 
da por sentado que estos se obtuvieron mediante muestreo aleatorio de la población de origen. El 
hecho de que el ordenamiento de los datos no importe es un rasgo característico de los conjuntos de 
datos de corte transversal. 
 
Los datos de sección cruzada miden una variable particular en un periodo de tiempo dado, para 
diferentes entidades. 
 
Datos de series de tiempo.- Un conjunto de datos de series de tiempo consta de observaciones, de 
una o más variables, hechas en el tiempo. Como los hechos del pasado pueden tener influencia en los 
del futuro y los rezagos en el comportamiento son comunes en las ciencias sociales, el tiempo es un 
factor importante en este tipo de datos. A diferencia del ordenamiento de los datos de corte 
transversal, la disposición cronológica de las observaciones en una serie de tiempo proporciona 
información importante. Otra característica de este tipo de datos, es su frecuencia, o sea la 
periodicidad con que son reunidos (los datos pueden ser: diarios, semanales, mensuales, trimestrales, 
anuales, etc.). 
 
Los datos de series de tiempo miden una variable particular durante periodos de tiempo sucesivos o 
en diferentes fechas. 
 
Combinación de cortes transversales.- Algunos conjuntos de datos tienen características tanto de 
corte transversal como de series de tiempo. Consta de observaciones, de una o más variables, hechas 
en el tiempo. 
 
En ocasiones, los datos en sección cruzada y los datos de series de tiempo se fusionan o combinan. El 
resultado puede interpretarse como una sección cruzada en series de tiempo como una serie de 
tiempo en secciones cruzadas. 
 
Datos de panel.- Un conjunto de datos de panel consta de una serie de tiempo para cada miembro 
del corte transversal en el conjunto de datos. La característica fundamental de este tipo de datos, que 
los distinguen de las combinaciones de cortes transversales, es el hecho de que se da seguimiento a 
las mismas unidades transversales durante cierto periodo. 
 
Los datos en panel son un tipo especial de datos combinados de sección cruzada-series de tiempo, en 
el cual se muestra a través del tiempo la misma sección cruzada. 
 
CAUSALIDAD Y LA CLAUSULA “CETERIS PARIBUS” 
 
En casi todas las pruebas de la teoría económica, el objetivo del economista es inferir que una variable 
ejerce un efecto causal en otra. La noción de ceteris paribus –que significa “con lo demás (otros 
factores relevantes) igual”- desempeña un papel importante en el análisis causal. 
 
En la mayor parte de los casos, las hipótesis de las ciencias sociales son de naturaleza ceteris paribus: 
todos los demás factores relevantes deben mantenerse fijos cuando se estudia la relación entre dos 
variables. 
 
 
 
 
 
 
EL MODELO DE REGRESIÓN LINEAL SIMPLE 
 
El modelo de regresión simple puede ser usado para estudiar la relación entre dos variables. Gran 
parte del análisis econométrico empieza con la siguiente premisa: y son dos variables, de las 
cuales a nosotros nos interesa “explicar en términos de ”, o en otras palabras “estudiar como varia 
 a través de cambios de ”. 
 
Resolvemos esto escribiendo una ecuación que relacione con x. Una ecuación simple es: 
 
 
 
Esta ecuación, define el modelo de regresión lineal simple. También se denomina modelo de regresión 
lineal de dos variables o modelo de regresión lineal bivariada porque relaciona las dos variables y . 
 
Las variables y poseen varios nombres que se usan en forma indistinta, i.e.: 
 
 
 
 
La variable , denominada termino de error o perturbación de la relación, representa los factores, 
aparte de , que influyen en . 
 
La ecuación (1.1) también aborda el tema de la relación funcional entre y . Si los otros factores de 
 se mantienen fijos de modo que el cambio en sea cero, , entonces tiene un efecto lineal en 
: 
 
 
Así, el cambio en es multiplicada por el cambio en . Esto significa que es el parámetro de la 
pendiente de la relación entre y si se mantienen fijos en los otros factores. El parámetro de 
intercepción también tiene sus usos, pero pocas veces es crucial para el análisis. 
 
Ejemplo 1 (Cosecha de soya y Fertilizante) 
 
Supongamos que la cosecha de soya está determinada por el modelo: 
 
 
 
de modo que y . El investigador agrícola se interesa en el efecto del 
fertilizante en la cosecha, con los demás factores fijos.Este efecto está dado por . El termino de 
error contiene factores como la calidad del suelo, la lluvia, etc. El coeficiente mide el efecto del 
fertilizante en la cosecha con los otros factores fijos: . 
 
Ejemplo 2 (Ecuación simple de salarios) 
 
El modelo que relaciona el salario de una persona con la educación observada y otros factores no 
observables es: 
 
 
Si se mide en dólares por hora y son los años de escolaridad, entonces mide el 
cambio en el salario por hora con otro año de instrucción, conservando fijos los demás factores, entre 
los que se encuentran la experiencia laboral, la capacidad innata, la ética laboral, etc. 
 
 
ESTIMACIÓN DE MÍNIMOS CUADRADOS ORDINARIOS (MCO) 
 
 
 
 
 
 
 
 
 
Ejemplo 3 (Ecuación simple de salarios) 
 
Sea una población de 526 trabajadores donde: 
 
, el cual esta medido en dólares por hora; así, para una persona cualquiera, si , 
el salario por hora es de 6.75 dólares. 
 
, el cual representa los años de escolaridad; por ejemplo corresponde a la 
educación preparatoria completa. 
 
Con los datos proporcionados (salario.exe), verificar que se obtiene la siguiente línea de regresión de 
MCO (o función de regresión muestral): 
 
 
 
La intercepción -0.90 significa literalmente que una persona sin instrucción recibe un salario 
pronosticado de -90 centavos de dólar por hora, i.e. 
 
 
 
Para una persona con ocho años de escolaridad, el salario pronosticado es de 3.42 dólares por hora. 
 
 
 
La estimación de la pendiente para este ejercicio implica que un año más de educación aumenta el 
salario en 54 centavos de dólar por hora. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ejemplo 4 (Salario del director y Rendimiento del capital) 
 
Sea una población de 209 directores ejecutivos de una empresa donde: 
 
, el cual representa el salario anual medido en miles dólares; así, 
indica un salario anual de 856,300 dólares. 
 
, el cual representa el rendimiento promedio del capital de la 
empresa en los últimos tres años (el roe se define en términos del ingreso neto como porcentaje de 
las acciones comunes) 
 
Para estudiar la relación entre esta medida del rendimiento de la empresa y la compensación del 
director, se postula el siguiente modelo: 
 
 
 
El parámetro de la pendiente mide el cambio en el salario anual, en miles de dólares, cuando el 
rendimiento del capital aumenta un punto porcentual. 
 
Con los datos proporcionados (salaroe.exe), verificar que se obtiene la siguiente línea de regresión de 
MCO (o función de regresión muestral): 
 
 
 
Si el rendimiento del capital es cero, entonces el sala pronosticado es la intercepción 963.191, que es 
igual a 963,191 dólares, ya que sala se mide en dólares, i.e. 
 
 
 
La estimación de la pendiente para este ejercicio implica que un punto porcentual más de roe 
aumenta el sala en 18.5, o 18,500 dólares. 
 
Suponga que , entonces 
 
 
 
En algunos casos, el análisis de regresión no se aplica para determinar la causalidad, sino solo para 
ver si dos variables guardan relación positiva o negativa, en forma muy parecida al análisis de 
correlación estándar. 
 
Siempre hacemos la regresión de la variable dependiente sobre la variable independiente, y siempre 
entendemos que vamos a estimar los parámetros ( . 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
VALORES AJUSTADOS Y RESIDUOS 
 
Dados y , obtenemos el valor ajustado para cada observación. Por definición cada valor de 
está en la línea de regresión de MCO. 
 
 
El residuo de MCO de la observación , es la diferencia entre y (su valor ajustado). Si es 
positiva, la línea subpronostica ; y si es negativa, la línea sobrepronostica . El caso ideal de la 
observación es cuando , pero esto casi nunca pasa. 
 
 
 
 
PROPIEDADES ALGEBRAICAS DE MCO 
 
i) La suma, y por lo tanto, el promedio muestral de los residuos de MCO, es cero. 
 
 
 
ii) La covarianza muestral entre los regresores y los residuos de MCO es cero. 
 
 
 
iii) El punto está siempre sobre la línea de regresión de los MCO. 
 
 
Escribir cada como su valor ajustado más su residuo da otra forma de interpretar una regresión de 
MCO. 
 
 
Def. 
 
La suma total de cuadrados (STC) es una medida de la variación total muestral de ; es decir, 
mide que tan disperse esta en la muestra. Si dividimos la STC entre , obtenemos la varianza 
muestral de . 
 
 
La suma explicada de cuadrados (SEC) mide la variación muestral de . 
 
 
 
La suma residual de cuadrados (SRC) mide la variación mustral de . 
 
 
 
Siempre es posible expresar la variación total en como la suma de la variación explicada y la 
variación no explicada, i.e. 
 
 
 
BONDAD DE AJUSTE 
 
La manera de medir que tan bien explica la variable independiente a la variable dependiente , o en 
otras palabras, la manera de calcular el número que resume el grado en que la línea de regresión de 
MCO coincide con los datos; se hace mediante la R cuadrada4 (R2) de la regresión (también conocido 
como coeficiente de determinación). 
 
 
 
 
La R2 es la proporción de la variación explicada en la variación total y, por lo tanto, se interpreta como 
la fracción de la variación muestral de que es explicada por . El valor de la siempre está entre 
cero y uno, puesto que la SEC no puede ser mayor que la STC. 
 
 
 
Cuando se interpreta la , por lo común se multiplica por 100 para convertirla en porcentaje, i.e. la 
 es el porcentaje de la variación muestral de que es explicada por . 
 
Cuando 
 
 , los puntos asociados a los datos están en la misma línea, los MCO proporcionan un ajuste 
perfecto. 
 
 cercano a cero, indica poco ajuste a la línea de MCO: muy poco de la variación de las es 
capturado por la variación de las . 
 
 
Ejemplo 5 (…continuación Ejemplo 3, Ecuación simple de salarios) 
 
Basándonos en el Ejemplo 3 y dados los datos proporcionados (salario.exe), calcular: valores 
ajustados y residuos; STC, SEC y SRC; . 
 
Verificando los resultados, tenemos: 
 
 
 
 
 
Ejemplo 6 (…continuación Ejemplo 4, Salario del director y Rendimiento del capital) 
 
4 Es posible demostrar que es igual al cuadrado del coeficiente de correlación muestral entre y . De aquí 
procede el término “R cuadrada”. 
 
Basándonos en el Ejemplo 4 y dados los datos proporcionados (salario.exe), calcular: valores 
ajustados y residuos; STC, SEC y SRC; . 
 
Verificando los resultados, tenemos: 
 
 
 
 
 
 
 
 
 
UNIDADES DE MEDIDA Y FORMA FUNCIONAL 
 
 
 
INCORPORACIÓN DE NO LINEALIDADES EN LA REGRESION SIMPLE 
 
Hasta aquí nos hemos concentrado en relaciones lineales entre las variables dependiente e 
independiente. Sin embargo, las relaciones lineales no son la generalidad en todas las aplicaciones 
económicas. Es relativamente fácil incorporar muchas no linealidades en el análisis de regresión 
simple definiendo en la forma apropiada las variables dependiente e independiente. 
 
 
FORMAS FUNCIONALES CON LOGARITMOS 
 Modelo 
Variable 
dependiente 
Variable 
independiente 
Interpretación de 
 nivel-nivel 
 nivel-log 
semielasticidad log-nivel 
elasticidad log-log

Continuar navegando