Vista previa del material en texto
CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO Análisis Estadístico con STATA • Stata se considera un “paquete para análisis estadístico” •Trabaja con datos de sección cruzada, series de tiempo y datos panel • Se puede utilizar es sistemas operativos de Windows, Macintosh, Unix y Linux http://www.stata.com • Stata/MP: The fastest version of Stata (for dual-core and multicore/multiprocessor computers) • Stata/SE: Stata for large datasets • Stata/IC: Stata for moderate-sized datasets • Small Stata: A version of Stata that handles small datasets (for educational purchases only) • Numerics by Stata: Stata for embedded and web applications Ventana de Resultados Editor de comandos Historial de instrucciones Lista de variables Características de las variables Comandos básicos Syntax [prefix :] command [varlist] [=exp] [if] [in] [weight] [using filename] [, options] Cambio de directorio cd c:\practica\stata_1\ Log files guarda los resultados de Stata la extensión es .log se puede cambiar a txt File/Log/Begin.. Se debe iniciar abriendo este archivo Seleccionar Hacer una copia y pegar en Stata Comandos básicos Syntax command [nombre var] [=operación] [if] [in] [, opciones] • Crear un archivo con extensión “do” • Permite editar y ejecutar las instrucciones 2 0 0 4 0 0 6 0 0 8 0 0 1 0 0 0 1 2 0 0 p ib 1960 1980 2000 2020 tiempo Fuente: Con base en información de INEGI (miles de millones de dólares USA de 2010) Evolución del PIB 1965-2014 5 0 0 06 0 0 07 0 0 08 0 0 09 0 0 01 0 0 0 0 p ib p 1960 1980 2000 2020 tiempo Fuente: Con base en información de INEGI (Dólares por persona de 2010) PIB per cápita 1965-2014 .8 1 1 .2 1 .4 1 .6 1 .8 e n g p 1960 1980 2000 2020 tiempo Fuente: Con base en información de SENER (tons eq petróleo por persona) Consumo de Energía 1965-2014 1 .5 2 2 .5 3 3 .5 4 c o 2 p 1960 1980 2000 2020 tiempo Fuente: Con base en información de IEA (tons CO2 eq por persona) Emisiones CO2 1965-2014 1 .2 1 .3 1 .4 1 .5 1 .6 ie n g 1960 1980 2000 2020 tiempo Fuente: Con base en información de IEA (barriles por cada 1000 dólares) Intensidad Energética 1965-2014 Dadas dos variables (Y, X) tomadas sobre el mismo elemento de la población, el diagrama de dispersión es simplemente un gráfico de dos dimensiones, donde en un eje (la abscisa) se sitúa una variable, y en el otro eje (la ordenada) se sitúa la otra variable Si las variables están correlacionadas, el gráfico mostraría algún nivel de correlación (tendencia) entre las dos variables. Si no hay ninguna correlación, el gráfico presentaría una figura sin forma, una nube de puntos dispersos en el gráfico. GRÁFICOS DE DISPERSIÓN: Permite representar la evolución conjunta de ambas variables Representación gráfica de una relación Variable X V ar ia b le Y V ar ia b le Y V ar ia b le Y Variable XVariable X Relación lineal positiva Relación lineal negativaSin relación .5 1 1 .5 2 5000 6000 7000 8000 9000 10000 pibp 95% CI Fitted values Fitted values engp Energía vs PIB 1 2 3 4 5 5000 6000 7000 8000 9000 10000 pibp 95% CI Fitted values Fitted values co2p Emisiones CO2 vs PIB 1 2 3 4 .8 1 1.2 1.4 1.6 1.8 engp 95% CI Fitted values Fitted values co2p Emisiones CO2 vs ENG .86 1.5 1.2 1.1 2.3 1.3 1.5 3.2 1.5 1.5 3.3 1.4 1.8 3.7 1.4 0 1 2 3 4 0 1 2 3 4 1965-1969 1970-1979 1980-1989 1990-1999 2000-2014 mean of engp mean of co2p mean of ieng Graphs by periodo -5 0 5 1 0 1 5 P o rc e n ta je 1960 1980 2000 2020 tiempo dpib deng dco2 Tasas de crecimeinto CO2p = 𝛼 + 𝛽𝑃𝐼𝐵𝑝 Modelo de Regresión Lineal El modelo establece que un cambio en una unidad de del PIB per cápita produce u ocasiona un cambio en las emisiones per cápita de CO2, medido por el parámetro 𝛽 Este modelo podría ser adecuado si la línea recta pasará por todos los puntos del diagrama de dispersión Debido a que los valores observados de la línea recta del modelo se define un erro ii XY 𝑢𝑖 La diferencia entre el valor observado de la variable y la recta estimada se denomina error CO2p = 𝛼 + 𝛽𝑃𝐼𝐵𝑝 CO2p = −0.655 + 0.000479𝑃𝐼𝐵𝑝 TABLA DE ANALISIS DE LA VARIANZA (ANOVA) 𝑅𝑒𝑔𝑆𝑆 = 𝑖=1 𝑁 𝑌𝑖 − ത𝑌 2 Regression Sum of Squares Variabilidad explicada por el modelo 𝑅𝑆𝑆 = 𝑖=1 𝑁 𝑌𝑖 − 𝑌𝑖 2 Residual Sum of Squares Variabilidad NO EXPLICADA 𝑇𝑆𝑆 = 𝑖=1 𝑁 𝑌𝑖 − ത𝑌 2 Total Sum of Squares Variabilidad Total 𝑇𝑆𝑆 = 𝑅𝑒𝑔𝑆𝑆 + 𝑅𝑆𝑆 MS (Mean Square) N i i N i i YY u R 1 2 1 2 2 ˆ 1 𝛼 𝛽 𝑠𝑒(𝛼) 𝑠𝑒(𝛽) 𝑡 = መ𝛽 𝑠𝑒(𝛽) 𝑡 = ො𝛼 𝑠𝑒(𝛼) 𝛽 ± 𝑡 0.975,𝑁−𝑘 𝑠𝑒(𝛽) 𝛼 ± 𝑡 0.975,𝑁−𝑘 𝑠𝑒(𝛼) N i i N i i N i i N i ii YPYPYP YPCOYPCO 11 2 11 22 ̂ La curva ambiental de Kuznets, representada por una U invertida, es una de las hipótesis básicas para explicar la relación entre nivel de ingreso per cápita y el medio ambiente Las causas económicas que originan este comportamiento son múltiples Tres efectos principales: de escala, de composición y tecnológico 𝐶𝑂2𝑡 = 𝛽0 + 𝛽1𝑌𝑃𝑡 + 𝛽2𝑌𝑃𝑡 2 + 𝛽3𝑌𝑃𝑡 3 + 𝑗=1 𝑘 𝛾𝑗𝑋𝑗,𝑡 + 𝑢𝑡 1 .5 2 2 .5 3 3 .5 4 5000 6000 7000 8000 9000 10000 pibp Fitted values co2p CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO