Logo Studenta

script taller 2

Esta es una vista previa del archivo. Inicie sesión para ver el archivo original

# Union Horizontal de Microdatos de GEIH 
#1. instalar el paquete dplyr hecho 
#2. especificar la carpeta de trabajo 
setwd("~/Desktop/Universidad Sergio Arboleda /Introduccion econometria/Segundo Corte/CSV")
dir(pattern = "CSV")
library(dplyr)
library(car)
# lectura de bases de datos GEIH 
avh=read.csv("µrea - Vivienda y Hogares.CSV",sep=";")
acg=read.csv("µrea - Caracter°sticas generales (Personas).CSV",sep=";")
aft=read.csv("µrea- Fuerza de trabajo.CSV", sep = ";")
aoc=read.csv("µrea - Ocupados.CSV", sep = ";")
adc=read.csv("µrea - Desocupados.CSV", sep = ";")
ain=read.csv("µrea - Inactivos.CSV",sep = ";")
aoi=read.csv("µrea - Otros ingresos.CSV", sep = ";")
aoa=read.csv("µrea - Otras actividades y ayudas en la semana.CSV", sep = ";")
# cambiar el nombre de la variable directorio 
colnames(avh)[1]
colnames(avh)[1]="DIRECTORIO"
colnames(acg)[1]="DIRECTORIO"
colnames(aft)[1]="DIRECTORIO"
colnames(aoc)[1]="DIRECTORIO"
colnames(adc)[1]="DIRECTORIO"
colnames(ain)[1]="DIRECTORIO"
colnames(aoa)[1]="DIRECTORIO"
colnames(aoi)[1]="DIRECTORIO"
colnames(avh)[1]
# union
dim(avh)
dim(acg)
a20212=merge(avh,acg,by=c("DIRECTORIO","SECUENCIA_P"),all=TRUE)
a20212=merge(a20212,aft,by=c("DIRECTORIO","SECUENCIA_P","ORDEN"),all=TRUE)
a20212$factor=round(as.numeric(gsub(",",".",a20212$fex_c_2011.y)))
a20212=select(a20212,-HOGAR.x,-REGIS.x,-AREA.x,-MES.x,-DPTO.x,-fex_c_2011.x,
 -HOGAR.y,-REGIS.y,-AREA.y,-MES.y,-DPTO.y,-fex_c_2011.y)
a20212=merge(a20212,aoc,by=c("DIRECTORIO","SECUENCIA_P","ORDEN"),all=TRUE)
a20212=select(a20212,-HOGAR.x,-REGIS.x,-AREA.x,-MES.x,-DPTO.x,-fex_c_2011.x,
 -HOGAR.y,-REGIS.y,-AREA.y,-MES.y,-DPTO.y,-fex_c_2011.y)
a20212=merge(a20212,adc,by=c("DIRECTORIO","SECUENCIA_P","ORDEN"),all=TRUE)
a20212=merge(a20212,ain,by=c("DIRECTORIO","SECUENCIA_P","ORDEN"),all=TRUE)
a20212=merge(a20212,aoi,by=c("DIRECTORIO","SECUENCIA_P","ORDEN"),all=TRUE)
a20212=select(a20212,-HOGAR.x,-REGIS.x,-AREA.x,-MES.x,-DPTO.x,-fex_c_2011.x,
 -HOGAR.y,-REGIS.y,-AREA.y,-MES.y,-DPTO.y,-fex_c_2011.y)
a20212=merge(a20212,aoa,by=c("DIRECTORIO","SECUENCIA_P","ORDEN"),all=TRUE)
dim(a20212)
# Grabar en el disco la base de datos union()
write.csv(a20212,"a20212.csv")
Barranquilla = subset(a20212, AREA.x==08)
##Punto 1
mutate(Barranquilla, exptrabajo=P6426/12)
Barranquilla$Genero <- recode(Barranquilla$P6020, "1=1 ; 2=0")
m1=lm(INGLABO~ESC+exptrabajo+exptrabajo^2)
Barranquilla %>% filter(P4030S1A1 == 1)
table (Barranquilla$Genero)
table (Barranquilla$P6020)

Continuar navegando

Materiales relacionados

2 pag.
Taller 2 Introduccion Econometria

SIN SIGLA

User badge image

leonarD Bautista

Taller Segundo Corte

SIN SIGLA

User badge image

leonarD Bautista

3 pag.
Resumen Control 4

21 De Agosto

User badge image

Sofia Saavedra C