Logo Studenta
¡Este material tiene más páginas!

Vista previa del material en texto

CURSO: ECONOMETRÍA Y 
ANÁLISIS DE POLÍTICAS FISCALES
INSTRUCTOR: HORACIO CATALÁN ALONSO
Análisis Estadístico
con STATA
• Stata se considera un “paquete para análisis 
estadístico”
•Trabaja con datos de sección cruzada, series de 
tiempo y datos panel
• Se puede utilizar es sistemas operativos de 
Windows, Macintosh, Unix y Linux
http://www.stata.com
• Stata/MP: The fastest version of Stata (for dual-core
and multicore/multiprocessor computers)
• Stata/SE: Stata for large datasets
• Stata/IC: Stata for moderate-sized datasets
• Small Stata: A version of Stata that handles small
datasets (for educational purchases only) 
• Numerics by Stata: Stata for embedded and web 
applications
Ventana de 
Resultados
Editor de comandos
Historial 
de 
instrucciones
Lista de 
variables
Características de 
las variables
Comandos básicos
Syntax
[prefix :] command [varlist] [=exp] [if] [in] [weight]
[using filename] [, options]
Cambio de directorio
cd c:\practica\stata_1\
Log files guarda los resultados de
Stata la extensión es .log 
se puede cambiar a txt 
File/Log/Begin..
Se debe iniciar abriendo este archivo
Seleccionar 
Hacer una copia y pegar en Stata
Comandos básicos
Syntax
command [nombre var] [=operación] [if] [in] [, opciones]
• Crear un archivo con extensión “do”
• Permite editar y ejecutar las 
instrucciones
2
0
0
4
0
0
6
0
0
8
0
0
1
0
0
0
1
2
0
0
p
ib
1960 1980 2000 2020
tiempo
Fuente: Con base en información de INEGI
(miles de millones de dólares USA de 2010)
Evolución del PIB 1965-2014
5
0
0
06
0
0
07
0
0
08
0
0
09
0
0
01
0
0
0
0
p
ib
p
1960 1980 2000 2020
tiempo
Fuente: Con base en información de INEGI
(Dólares por persona de 2010)
PIB per cápita 1965-2014
.8
1
1
.2
1
.4
1
.6
1
.8
e
n
g
p
1960 1980 2000 2020
tiempo
Fuente: Con base en información de SENER
(tons eq petróleo por persona)
Consumo de Energía 1965-2014
1
.5
2
2
.5
3
3
.5
4
c
o
2
p
1960 1980 2000 2020
tiempo
Fuente: Con base en información de IEA
(tons CO2 eq por persona)
Emisiones CO2 1965-2014
1
.2
1
.3
1
.4
1
.5
1
.6
ie
n
g
1960 1980 2000 2020
tiempo
Fuente: Con base en información de IEA
(barriles por cada 1000 dólares)
Intensidad Energética 1965-2014
Dadas dos variables (Y, X) tomadas sobre el mismo 
elemento de la población, el diagrama de dispersión es 
simplemente un gráfico de dos dimensiones, donde en un 
eje (la abscisa) se sitúa una variable, y en el otro eje (la 
ordenada) se sitúa la otra variable
Si las variables están correlacionadas, el gráfico mostraría 
algún nivel de correlación (tendencia) entre las dos 
variables. Si no hay ninguna correlación, el gráfico 
presentaría una figura sin forma, una nube de puntos 
dispersos en el gráfico. 
GRÁFICOS DE DISPERSIÓN: Permite 
representar la evolución conjunta de ambas 
variables
Representación gráfica de una relación
Variable X
V
ar
ia
b
le
 Y
V
ar
ia
b
le
 Y
V
ar
ia
b
le
 Y
Variable XVariable X
Relación lineal positiva Relación lineal negativaSin relación
.5
1
1
.5
2
5000 6000 7000 8000 9000 10000
pibp
95% CI Fitted values
Fitted values engp
Energía vs PIB
1
2
3
4
5
5000 6000 7000 8000 9000 10000
pibp
95% CI Fitted values
Fitted values co2p
Emisiones CO2 vs PIB
1
2
3
4
.8 1 1.2 1.4 1.6 1.8
engp
95% CI Fitted values
Fitted values co2p
Emisiones CO2 vs ENG
.86
1.5
1.2 1.1
2.3
1.3
1.5
3.2
1.5
1.5
3.3
1.4
1.8
3.7
1.4
0
1
2
3
4
0
1
2
3
4
1965-1969 1970-1979 1980-1989
1990-1999 2000-2014
mean of engp mean of co2p
mean of ieng
Graphs by periodo
-5
0
5
1
0
1
5
P
o
rc
e
n
ta
je
1960 1980 2000 2020
tiempo
dpib deng
dco2
Tasas de crecimeinto
CO2p = 𝛼 + 𝛽𝑃𝐼𝐵𝑝
Modelo de Regresión Lineal
El modelo establece que un cambio en una unidad de del 
PIB per cápita produce u ocasiona un cambio en las 
emisiones per cápita de CO2, medido por el parámetro 𝛽
Este modelo podría ser adecuado si la línea recta pasará 
por todos los puntos del diagrama de dispersión
Debido a que los valores observados de la línea recta del 
modelo se define un erro
ii XY  
𝑢𝑖
La diferencia entre el valor observado de la variable y la 
recta estimada se denomina error
CO2p = 𝛼 + 𝛽𝑃𝐼𝐵𝑝
CO2p = −0.655 + 0.000479𝑃𝐼𝐵𝑝
TABLA DE ANALISIS DE LA VARIANZA (ANOVA) 
𝑅𝑒𝑔𝑆𝑆 =෍
𝑖=1
𝑁
෠𝑌𝑖 − ത𝑌
2
Regression Sum of Squares
Variabilidad explicada por el modelo
𝑅𝑆𝑆 =෍
𝑖=1
𝑁
𝑌𝑖 − ෠𝑌𝑖
2
Residual Sum of Squares
Variabilidad NO EXPLICADA
𝑇𝑆𝑆 =෍
𝑖=1
𝑁
෠𝑌𝑖 − ത𝑌
2 Total Sum of Squares
Variabilidad Total
𝑇𝑆𝑆 = 𝑅𝑒𝑔𝑆𝑆 + 𝑅𝑆𝑆
MS (Mean Square) 
 





N
i
i
N
i
i
YY
u
R
1
2
1
2
2
ˆ
1
𝛼
𝛽
𝑠𝑒(𝛼)
𝑠𝑒(𝛽) 𝑡 =
መ𝛽
𝑠𝑒(𝛽)
𝑡 =
ො𝛼
𝑠𝑒(𝛼)
𝛽 ± 𝑡 0.975,𝑁−𝑘 𝑠𝑒(𝛽)
𝛼 ± 𝑡 0.975,𝑁−𝑘 𝑠𝑒(𝛼)















N
i
i
N
i
i
N
i
i
N
i
ii
YPYPYP
YPCOYPCO
11
2
11
22
̂
La curva ambiental de Kuznets, representada por una U invertida, 
es una de las hipótesis básicas para explicar la relación entre nivel 
de ingreso per cápita y el medio ambiente
Las causas económicas que originan este comportamiento son 
múltiples
Tres efectos principales: de escala, de composición y tecnológico 
𝐶𝑂2𝑡 = 𝛽0 + 𝛽1𝑌𝑃𝑡 + 𝛽2𝑌𝑃𝑡
2 + 𝛽3𝑌𝑃𝑡
3 +෍
𝑗=1
𝑘
𝛾𝑗𝑋𝑗,𝑡 + 𝑢𝑡
1
.5
2
2
.5
3
3
.5
4
5000 6000 7000 8000 9000 10000
pibp
Fitted values co2p
CURSO: ECONOMETRÍA Y 
ANÁLISIS DE POLÍTICAS FISCALES
INSTRUCTOR: HORACIO CATALÁN ALONSO