Logo Studenta

Aplicacion-de-Modelos-no-Lineales-con-Variable-Dependiente-Limitada-Logit-Probit-en-GRETL

¡Este material tiene más páginas!

Vista previa del material en texto

INV- Modelos no lineales en GRETL/2011-II 
 
 
APLICACIÓN DE MODELOS NO LINEALES CON VARIABLE 
DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL 
Diego Esteban Eslava Avendaño1 
diciembre de 2011 
 
Resumen: 
El modelo de regresión lineal clásico no siempre es una buena aproximación en la 
explicación y análisis de fenómenos económicos debido a que los problemas que se 
buscan modelar pueden presentar características que hacen que las estimaciones bajo 
este modelo no sean adecuadas. Por tal motivo, esta investigación tiene como objetivo 
presentar al lector la aplicación de dos modelos (Logit y Probit) que buscan solucionar dos 
problemas: considerar la variable dependiente limitada o binaria, y, asumir que la 
probabilidad de que un evento pase no esté relacionada linealmente con las variables 
explicativas. Para la aplicación de dichos modelos se van a describir los procesos 
necesarios para su estimación en GRETL (The Gnu Regression, econometrics and Time-
series Library) como un software alternativo a los usualmente utilizados, por lo que se 
hará una descripción básica del software, se aplicarán los modelos Logit y Probit en éste y 
se evaluarán los resultados respecto a uno de los programas más reconocidos: Stata. 
Palabras Clave: Modelo de Probabilidad Lineal, Logit, Probit, GRETL, Stata. 
APPLICATION OF NON-LINEAR MODELS WITH LIMITED 
ENDOGENOUS VARIABLE (LOGIT, PROBIT) USING GRETL 
Abstract: 
The classic linear regression model is not always a useful approximation for explaining 
and analyzing the economic phenomena, that is because some problems researchers try 
to model may have characteristics that make estimations not appropriate under this 
model. Therefore, this research aims to present the application of two models (Logit and 
Probit) useful for solving two specific problems: to assume the endogenous variable 
limited or binary, and, to assume the probability that an event happens is not linearly 
associated with the exogenous variables. The processes needed for the application of 
those models will be described in GRETL (The Gnu Regression, econometrics and Time-
series Library) as alternative software to the ones usually used. A basic description of the 
software and the application of Logit and Probit using GRETL will be provided in this 
document; in addition the results will be evaluated in contrast to one of the most known 
software: Stata. 
Keywords: Linear Probability Model, Logit, Probit, GRETL, Stata. 
 
 
1Estudiante de Economía de la Facultad de Ciencias Económicas de la Universidad Nacional de 
Colombia, y monitor de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias 
Económicas. Correo Electrónico: deeslavaa@unal.edu.co 
INV- Modelos no lineales en GRETL/2011-II 
 
 
2 
 
 
 
 
Director Unidad Informática: 
Henry Martínez Sarmiento 
 
Tutor Investigación: 
Juan Carlos Tarapuez roa. 
 
Coordinadores: 
Jasmin Guerra Cárdenas 
Juan Felipe Reyes Rodríguez 
 
Coordinador Servicios Web: 
John Jairo Vargas 
 
Analista de Infraestructura y 
Comunicaciones: 
Diego Alejandro Jiménez Arévalo 
 
Analista de Sistemas de 
Información: 
Víctor Hugo Ramos Ramos 
 
 
 
 
 
 
Estudiantes Auxiliares: 
 
Camilo Alexandry Peña Talero 
Cristian Andrés Hernández Caro 
Claudia Patricia Ospina Aldana 
Daniel Francisco Rojas Martín 
David Camilo Sánchez Zambrano 
David Mauricio Mahecha Salas 
Diego Esteban Eslava Avendaño 
Edward F. Yanquen Briñez 
Gloria Stella Barrera Ardila 
Iván Albeiro Cabezas Martínez 
Javier Alejandro Ortiz Varela 
Jeimmy Paola Muñoz 
Juan Carlos Tarapuez Roa 
Juan David Vega Baquero 
Juan Fernando López Prieto 
Leonardo Alexander Cárdenas 
Lina Marcela Igua Torres 
María Paula Contreras Navarrete 
Paola Alejandra Alvarado Castillo 
Viviana Contreras Moreno 
Viviana María Oquendo 
 
Este documento es resultado de un 
trabajo conjunto y coordinado de los 
integrantes de la Unidad de Informática y 
Comunicaciones de la Facultad de 
Ciencias Económicas de la Universidad 
Nacional de Colombia. 
 
 
 
 
 
Esta obra está bajo una licencia reconocimiento no comercial 2.5 
Colombia de Creative Commons. Para ver una copia de esta 
licencia, visite http://creativecommons.org/licenses/by/2.5/co/ o 
envíe una carta a Creative Commons, 171second street, suite 30 
San Francisco, California 94105, USA. 
 
http://creativecommons.org/licenses/by/2.5/co/
INV- Modelos no lineales en GRETL/2011-II 
 
 
3 
 
 
APLICACIÓN DE MODELOS NO LINEALES DE VARIABLE 
DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL 
Contenido 
 
1. INTRODUCCIÓN. ..................................................................................................................5 
1.1. PERTINENCIA DE LA APLICACIÓN DE MODELOS NO LINEALES Y 
GRETL EN LA FCE. ..................................................................................................................5 
2. DESCRIPCIÓN BÁSICA DE GRETL. ...............................................................................7 
2.1. INSTALACIÓN. ...............................................................................................................7 
2.1.1. Linux. .......................................................................................................................7 
2.1.2. MS Windows. ..........................................................................................................8 
2.2. EXPLORACIÓN BÁSICA DEL PROGRAMA. ..........................................................8 
2.2.1. Ventana Principal .................................................................................................8 
2.2.2. Importación de archivos .....................................................................................9 
2.2.3. Herramientas de trabajo ...................................................................................11 
2.3. ANÁLISIS ESTADÍSTICO DESCRIPTIVO Y EDICIÓN DE VARIABLES. ......11 
2.3.1. Estadísticos y gráficos descriptivos. .............................................................12 
2.3.2. Transformación y generación de nuevas variables. .................................15 
3. APLICACIÓN DE MODELOS ECONOMÉTRICOS. ....................................................17 
3.1. MÍNIMOS CUADRADOS ORDINARIOS. ...............................................................17 
3.1.1. Contraste de supuestos. ...................................................................................18 
3.1.2. Intervalos de confianza. ....................................................................................18 
4. MODELOS CON VARIABLE DEPENDIENTE BINARIA ............................................19 
4.1. MODELO DE PROBABILIDAD LINEAL (MPL). ...................................................19 
4.1.1. Desventajas del MPL ..........................................................................................21 
4.2. MODELOS NO LINEALES PARA RESPUESTA BINARIA. ................................21 
4.2.1. Interpretación de las estimaciones de los modelos Logit y Probit ........24 
4.2.2. Pruebas de hipótesis múltiples. .....................................................................26 
4.3. CONCLUSIONES.........................................................................................................27 
INV- Modelos no lineales en GRETL/2011-II 
 
 
4 
 
5. APLICACIÓN DE MODELOS LOGIT Y PROBIT EN GRETL. ..................................27 
6. APLICACIÓN DE LOGIT Y PROBIT EN STATA. .........................................................31 
7. CONCLUSIÓN. .....................................................................................................................34 
8. REFERENCIAS. ...................................................................................................................35 
 
INV- Modelos no lineales en GRETL/2011-II 
 
 
1. INTRODUCCIÓN. 
En la prácticacada vez toma mayor importancia el análisis de la efectividad de 
políticas y medidas aplicadas en diversas esferas de la sociedad mediante el uso 
de modelos econométricos. Sin embargo, debido a la complejidad de la realidad 
económica encontrar modelos que se ajusten al problema analizado sugiere un 
gran problema para el investigador, que se agrava al sumársele el problema de 
encontrar software que le permita la exploración de nuevas herramientas y 
modelos, fáciles de utilizar y que no sean restrictivos en su uso. 
Bajo este contexto, la presente investigación tiene como objetivo darle a los 
estudiantes una introducción a la aplicación de dos modelos que buscan mayor 
precisión en el análisis: Logit y Probit; estos modelos responden específicamente 
a dos problemas básicos que presenta el modelo de regresión lineal clásico. Junto 
con esto, se ofrece una guía de aplicación de dichos modelos en un software 
alternativo a los utilizados generalmente en el análisis estadístico: GRETL, 
haciendo énfasis en el fácil acceso y utilización de dicho programa que favorece la 
interacción del usuario. Para contrastar los resultados de la aplicación de los 
modelos en GRETL, se va a realizar el mismo proceso en Stata, uno de los 
software más reconocidos y utilizados en el área. 
1.1. PERTINENCIA DE LA APLICACIÓN DE MODELOS NO 
LINEALES Y GRETL EN LA FCE. 
La enseñanza de los distintos métodos econométricos debe considerar como 
componente de gran importancia los procesos necesarios para la estimación de 
modelos y el contraste de supuestos utilizando la diversidad de paquetes 
econométricos que existen en el mercado. Estos programas regularmente han 
sido desarrollados utilizando códigos y procedimientos propios, por lo que para 
los nuevos usuarios resulta un reto el hecho de tener que, además de aprender la 
teoría estadística detrás de cada modelo, entender el lenguaje del software que se 
está utilizando y los resultados que le son mostrados al ejecutar un 
procedimiento. 
Dentro de la Facultad de Ciencias Económicas se ha evidenciado la falta de 
diversidad en los programas utilizados para la aplicación de la teoría tomada en 
clase, esta problemática se puede deber principalmente a dos factores: el primero, 
es la falta de medios explicativos para que los estudiantes aprendan a utilizar los 
diferentes paquetes (clases auxiliares con monitores que conozcan diversos 
programas, documentos de apoyo, ejemplos, etc.); el segundo, los problemas de 
acceso a los software por fuera del aula, pues debido a que ciertos de ellos, 
generalmente los más utilizados, requieren licencias y permisos, su uso está 
restringido. 
INV- Modelos no lineales en GRETL/2011-II 
 
 
6 
 
Como forma de colaborar a disminuir el problema que se evidencia en la facultad, 
la presente investigación busca, en primera instancia, ofrecerles a los estudiantes 
una guía para el uso básico de GRETL, un software que se ajusta a las 
necesidades de la academia y que cuenta con gran cantidad de funcionalidades. A 
continuación se hace un análisis de los contenidos de las materias básicas de la 
línea de econometría relacionándolos con GRETL: 
Materia2 Funcionalidad en GRETL 
Econometría I 
Contenidos: 
 Modelo de regresión simple y MCO. 
 Modelo de regresión múltiple: 
estimación y supuestos Inferencia. 
 Problemas asociados: 
heteroscedasticidad, 
multicolinealidad, variables 
omitidas, error de medición y 
simultaneidad. 
Estimación de modelos por MCO, contraste 
de supuestos, intervalos de confianza, 
gráficos de variables estimadas y 
observadas, gráfico de residuos, intervalos 
de confianza. 
Econometría II 
Contenidos: 
 Análisis de Componentes 
Principales. 
 Datos panel. 
 Procesos estocásticos: lineales, 
estacionarios y no estacionarios. 
 Modelos ARMA y ARIMA: 
especificación y propiedades, 
identificación, estimación, 
verificación y uso del modelo 
(predicción). 
 Pruebas de raíz unitaria. 
 Modelo ARIMA estacional. 
Análisis de componentes principales (arroja 
los resultados básicos de valores propios 
con su varianza y varianza acumulada y 
los vectores propios asociados a cada 
valor), estimación de datos panel (por 
efectos fijos, efectos aleatorios, MCO 
ponderados), análisis de series de tiempo 
con modelos ARMA y ARIMA. 
TABLA 1. PERTINENCIA DE GRETL EN LA FCE 
Como se observa en la relación descrita, el programa se ajusta a las necesidades 
de las clases del núcleo básico que ofrece la carrera. A través del presente 
documento se mostrarán las características básicas para el uso del programa en 
las que se hace énfasis en la facilidad y versatilidad que este ofrece, lo cual 
fortalece la pertinencia de su uso en la facultad, pues puede servir como medio 
 
2 Contenidos tomados del Sistema de Información Académica de la Universidad Nacional de 
Colombia 
INV- Modelos no lineales en GRETL/2011-II 
 
 
7 
 
para incentivar el trabajo autónomo de los estudiantes que no se van a ver 
limitados por problemas de entendimiento usuario-software, como tampoco por el 
acceso restringido al uso del programa; sin dejar de asegurar la calidad en las 
estimaciones y en los procesos realizados. 
Respecto a la calidad en los procesos que GRETL realiza, el documento busca 
abarcar un tema complementario a los normalmente enseñados en los cursos de 
la facultad (presentados en la Tabla 1) se trata de la aplicación de modelos no 
lineales con variable dependiente binaria, modelos muy utilizados para el análisis 
de la realidad pero que por la dificultad en su interpretación no tienen cabida en 
los cursos iniciales de econometría. De esta manera, se busca hacer una 
aproximación básica a temas complementarios que incentivan el aprendizaje de 
los estudiantes por fuera del aula de clases. Los resultados que se obtengan de la 
estimación de dichos modelos serán confrontados con los resultados obtenidos de 
uno de los programas más utilizados, como lo es Stata, buscando validar la 
pertinencia del uso alternativo de GRETL. 
2. DESCRIPCIÓN BÁSICA DE GRETL. 
GRETL (The Gnu Regression, Econometrics and Time-series Library) es un 
paquete econométrico desarrollado bajo los principios del software libre y la 
“General Public License (GPL)” de GNU. De este modo está dirigido 
principalmente al sistema operativo Linux, aunque cuenta con versiones 
desarrolladas para Windows y Mac. La principal fortaleza pedagógica del 
programa reside en que además de ofrecer una interfaz agradable para el usuario, 
incluye gran cantidad de datos de ejercicios de libros de econometría 
ampliamente usados en la enseñanza de esta herramienta. 
GRETL, además de permitir desarrollar gran cantidad de métodos y pruebas 
estadísticas, permite asociarse con otros programas ya sea en importación de 
datos (lee bases de datos de SPSS, Excel, Stata, Eviews, etc.) o de exportación de 
documentos donde trabaja conjuntamente con LaTeX. Sumado a esto, el 
programa tiene un enlace con R-Project, que se puede usar para un análisis de 
datos más avanzado. 
2.1. INSTALACIÓN. 
2.1.1. Linux. 
En Linux existe la posibilidad de elegir entre dos tipos de instalaciones. Por un 
lado, se puede instalar GRETL desde la compilación y construcción de su código, 
esto es útil para las personas que pretenden hacer desarrollos sobre la 
plataforma o quieren adecuar el programa a sus necesidades; Por el otro, existe 
un paquete “pre-construido” el cual es instalado por los usuarios corrientes, pues 
INV- Modelos no lineales en GRETL/2011-II 
 
 
8 
 
el primer tipo requiere de un conocimiento del código de programación. Algunas 
distribuciones de Linux como Debian y Ubuntu incluyen dentro de sus paquetes 
a GRETL y sus librerías, además se pueden encontrar ciertos paquetes listos para 
ejecutar en la página principal del programa, sección descargas 
(http://gretl.sourceforge.net/gretl_espanol.html).2.1.2. MS Windows. 
En Windows el proceso de instalación se reduce a un archivo ejecutable que se 
encuentra en la dirección http://gretl.sourceforge.net/win32/index_es.html. Al 
ejecutar el archivo y elegir el directorio donde va a ser instalado el programa se 
instala automáticamente. Aparte de encontrar el instalador de GRETL para 
Windows, en esta página están diversos paquetes que se han venido 
desarrollando, tales como TRAMO/SEATS, datos de libros de enseñanza de 
Econometría, etc. Además se encuentran de opciones para actualización y 
construcción del programa. 
Tanto para Windows como para Linux el programa busca actualizaciones 
recurrentemente, sin embargo para el caso de Windows, el usuario puede decidir 
si desea que el programa actualice automáticamente. Para esto el usuario debe 
cerrar GRETL, ejecutar el programa “gretl updater” y cuando este termine volver a 
abrir GRETL. 
2.2. EXPLORACIÓN BÁSICA DEL PROGRAMA. 
2.2.1. Ventana Principal 
 
A. VENTANA PRINCIPAL 
INV- Modelos no lineales en GRETL/2011-II 
 
 
9 
 
La ventana principal de GRETL es supremamente sencilla e intuitiva para el 
usuario, el cual no tiene que tener un conocimiento en programación para poder 
usarlo. GRETL le ofrece opciones que tan sólo tiene que elegir con unos cuantos 
clics y que simplifican el trabajo del investigador. Sin embargo, para usuarios 
avanzados que quieren aumentar la experiencia en GRETL, el código del 
programa es abierto y pueden colaborar en el desarrollo de este. A continuación 
se hará revisión de las principales herramientas que ofrece la ventana principal: 
 Barra de herramientas: Contiene las principales herramientas del 
programa en lo que se refiere a gestión de archivos y análisis estadístico y 
econométrico. Además, contiene una ventana de ayuda que enriquece el 
aprendizaje del investigador. 
 Variables disponibles: Esta ventana, que ocupa el espacio más amplio de 
la ventana principal, muestra al usuario las variables que son cargadas 
dándole a cada variable un orden, un nombre y una descripción básica. 
 Barra de acceso rápido: Ubicada en la parte inferior izquierda de la 
ventana principal, le ofrece al usuario un acceso rápido a ciertas 
herramientas básicas como es calculadora, guía de instrucciones, guía de 
usuario, consola y la vista de íconos de sesión donde se encuentra la 
información principal del conjunto de datos que está siendo trabajado. 
 Características del conjunto de datos: Es un pequeño espacio ubicado 
en la parte inferior central de la ventana principal. Muestra la periodicidad 
de los datos y los años que comprende. 
2.2.2. Importación de archivos 
Para importar datos a GRETL hay que utilizar la herramienta Abrir Datos ubicada 
en el menú archivo de la barra de herramientas, al dar clic en esta opción el 
programa mostrará tres opciones: 
 Archivo de usuario: en la que el usuario busca en su equipo el conjunto 
de datos que desea importar. 
 Archivo de muestra: Aquí el usuario tiene a disposición, por defecto, tres 
librerías de datos las cuales muestran una cantidad de conjuntos de datos 
precargadas y que se pueden aplicar a gran cantidad de modelos según 
sus características (revisar Ilustración B). En la página de GRETL es 
posible más bases de datos procedentes de libros de econometría. Para 
más información revise el siguiente vínculo 
http://gretl.sourceforge.net/gretl_data_es.html 
INV- Modelos no lineales en GRETL/2011-II 
 
 
10 
 
 Importar: GRETL permite importar datos de diversos programas y 
extensiones, como son: Octave, texto/csv, Eviews, Gnumeric, Stata, SPSS, 
entre muchos más. 
 
B. ARCHIVOS DE MUESTRA 
 
Además de esta opción, existe la posibilidad de cargar guiones para ejecutar por 
medio de la consola, esto se hace desde la opción Archivos de guion del menú 
Archivo. Aquí se encontrarán las opciones comunes de cargar un guion ya sea 
por el mismo archivo del usuario o precargadas con el programa o crear una 
nueva de tipo R, GRETL, Octave, entre otros. 
Otra función útil que GRETL contiene es la carga de archivos de funciones, que 
también se encuentra ubicada en el menú Archivo, en ésta opción se puede 
cargar paquetes de funciones que hayan sido desarrolladas por algún usuario o 
por usted mismo, evitando el proceso de tener que desarrollarla por medio de 
programación. 
Por último existe la opción de configurar el directorio predeterminado de GRETL, 
la opción Archivo – Directorio de trabajo, permite configurar el directorio y las 
opciones de uso como se observa en la Ilustración C. 
 
C. SELECCIÓN DE DIRECTORIO 
INV- Modelos no lineales en GRETL/2011-II 
 
 
11 
 
De este modo al trabajar con nuestro directorio predeterminado el programa 
automáticamente buscará allí todos los archivos que se llamen usando los 
comandos open, run o include, por medio de la consola. Además cualquier trabajo 
que sea guardado o editado quedara grabado en este directorio. 
GRETL ofrece la opción de guardar y abrir sesiones de trabajo en el programa, así 
se tendrán a salvo los datos usados, algunos modelos aplicados y algunas 
gráficas que el usuario al cerrar la sesión haya decido guardar. 
Ciertas veces puede ser necesario dar información acerca de la naturaleza de la 
información, esto se lleva a cabo a través de la opción “Estructura del conjunto de 
datos” ubicada en la pestaña Datos de la barra de herramientas, aquí se podrá 
especificar si los datos son de tipo sección cruzada, serie temporal o panel. 
2.2.3. Herramientas de trabajo 
 
La opción Herramientas, ubicada en la barra de herramientas de la ventana 
principal, cuenta con ciertas opciones útiles tanto para mejorar la eficiencia o la 
capacidad de uso del programa, como para el análisis estadístico básico. Por el 
momento se hará referencia a las herramientas de trabajo del programa, en la 
próxima sección se revisarán las herramientas de análisis. 
La principal función que podemos encontrar es la consola de GRETL, desde aquí 
podemos trabajar todas las funciones usando la línea de comandos del programa. 
Las funciones que el programa contiene se encuentran, o escribiendo “help” en la 
consola de comandos o en el menú de ayuda, ubicado en la barra de 
herramientas, donde aparece la opción “guía de instrucciones”. Aquí tendremos a 
nuestra disposición una descripción de todos los comandos disponibles en el 
programa. 
Adicional a esta herramienta está disponible una opción llamada “historial de 
instrucciones” la cual muestra los comandos que han sido utilizados durante la 
sesión de trabajo, junto con una opción de enlace a GNU R, la cual nos va a llevar 
a la interfaz de R-Project, que puede llegar a ser útil en el desarrollo de funciones 
más avanzadas que GRETL puede no contener. 
 
2.3. ANÁLISIS ESTADÍSTICO DESCRIPTIVO Y EDICIÓN DE 
VARIABLES. 
GRETL ofrece al usuario ciertas herramientas útiles para la creación de 
estadísticos descriptivos de las variables que se estén trabajando. Una ventaja del 
software es que no sólo tiene un proceso muy intuitivo para generar los 
estadísticos principales sino que además contiene una serie de calculadoras o 
INV- Modelos no lineales en GRETL/2011-II 
 
 
12 
 
programaciones que nos muestran, por ejemplo, tablas estadísticas, valores-p, 
gráficas de distribuciones, estadísticos de contraste, entre otros. 
2.3.1. Estadísticos y gráficos descriptivos. 
En la barra de herramientas se encuentra la opción Variable que desplegará 
opciones de edición y análisis estadístico, hay que tener en cuenta que cualquier 
opción que se elija va a arrojar el resultado para la variable que se haya 
seleccionado previamente en la ventana principal del programa. En relación con 
las opciones de edición se encontrarán opciones para cambiar datos, atributos de 
la serie (cambiar el nombre y número) y para establecer el código que reconocerá 
valores ausentes. 
Una de las opciones a tener en cuenta es eltipo de estructura de los datos, 
opción que se ejecutará automáticamente al importar una base de datos, o que se 
encuentra ubicada en la opción Datos de la barra de herramientas de la ventana 
principal. Aquí se podrá especificar la naturaleza de los datos y el orden que 
tiene, algo básico para la estimación correcta del modelo. Las opciones se 
muestran en la Ilustración D. 
 
 
D. ESTRUCTURA DE LOS DATOS 
INV- Modelos no lineales en GRETL/2011-II 
 
 
13 
 
En cuanto al análisis descriptivo las opciones que es posible encontrar son 
básicamente: 
 Estadísticos principales: La salida de esta opción nos mostrará: media, 
mediana, máximo, mínimo, desviación estándar o típica, coeficiente de 
variación, de asimetría y el excedente de curtosis. 
 
E. ESTADÍSTICOS PRINCIPALES 
 
Además de esta opción, desde la barra de acceso rápido se puede encontrar 
una herramienta aún más interesante: dando clic en el botón “vista de 
iconos de sesión” se encontrará la opción Resumen la cual 
automáticamente nos mostrará la media, mediana, mínimo y máximo de 
todos los datos que contiene la base que ha sido cargada. 
 
 
 
F. ESTADÍSTICOS DEL CONJUNTO DE DATOS GENERAL 
 
 
INV- Modelos no lineales en GRETL/2011-II 
 
 
14 
 
 Contraste de normalidad: El programa automáticamente hace cuatro 
pruebas de normalidad para la serie escogida: Doornik-Hansen, W de 
Shapiro-Wilk, Lilliefors y Jarque-Bera. Para cada una el programa 
muestra el estadístico y su valor-p asociado. 
 
 
 
G. CONTRASTE DE NORMALIDAD 
 
 Gráfico Q-Q normal: Esta herramienta nos permite comparar los cuantiles 
empíricos de la serie en cuestión contra los cuantiles de una distribución 
normal. Para llevar a cabo este proceso mínimo hay que contar con 20 
datos y el programa por defecto calcula la distribución normal con la media 
y varianza de los datos que se están utilizando. Además hay dos opciones 
más para trabajar con datos estandarizados o enfrentar a los cuantiles 
brutos contra una normal de media 0 y varianza 1. 
 
H. Q-Q NORMAL. 
 
INV- Modelos no lineales en GRETL/2011-II 
 
 
15 
 
 Gráfico de Cajas (Boxplot): Dando clic derecho sobre la variable es posible 
encontrar la opción de gráfico de cajas que nos permite ver la distribución 
de la variable, usando su mínimo, máximo, sus cuartiles, su media y su 
mediana. 
 
 
I. BOXPLOT 
2.3.2. Transformación y generación de nuevas variables. 
Otra función muy útil de GRETL es la variedad de opciones que ofrece para 
convertir en diferentes formas funcionales las variables que se han cargado. Así 
mismo, es muy útil para agregar con tan sólo un clic variables dummy 
estacionales, variables aleatorias, entre otras herramientas que su construcción 
podría llevar mucho más tiempo. Todas estas herramientas las encontramos en el 
botón Añadir de la barra de herramientas de la ventana principal. Las opciones 
disponibles son: logaritmos, cuadrados, retardos, primeras diferencias, 
diferencias de logaritmos y diferencias estacionales de las variables 
seleccionadas. 
Además de esto existe la opción para definir una nueva variable que se quiera 
introducir, una gran ventaja pues dinamiza el trabajo de tener que ir hasta la 
base de datos original para poder incluirla, o para crear una matriz ya sea 
utilizando las series que están cargadas o introduciendo su tamaño y 
posteriormente los datos, o mediante una función que incluya una relación 
matemática entre ciertas variables. 
Apenas se haga clic sobre la opción que se desea, la nueva variable que ha sido 
creada aparecerá en la ventana principal, de esta forma ya puede ser llamada en 
cualquier proceso que se vaya a realizar. 
 
INV- Modelos no lineales en GRETL/2011-II 
 
 
16 
 
2.3.3. Análisis de componentes principales. 
Uno de los procesos estadísticos no inferenciales más útiles que se pueden 
realizar es el Análisis de componentes principales (ACP). Aunque GRETL tiene 
una función desarrollada para este proceso es muy básica respecto a los procesos 
que se pueden desarrollar en otros programas como R y SPSS. 
La aplicación de ACP en GRETL se limita a una opción que se encuentra en el 
botón Ver de la barra de herramientas o al comando acp de la consola. Al dar clic 
sobre la opción de ACP el programa abrirá automáticamente una ventana que 
pedirá seleccionar las variables a analizar y decidir si se trabaja con la matriz de 
covarianzas o con la de correlaciones (paso básico para la determinación de los 
componentes). Si se realiza el proceso por medio del comando en la consola hay 
que especificar las variables a analizar, o en su defecto si se desea analizar toda 
la base simplemente hay que escribir el comando y dar enter. 
 
J. ANÁLISIS DE COMPONENTES PRINCIPALES 
La ventana de salida que se obtiene nos muestra, en primera instancia, la 
varianza de cada componente (vector propio) y la varianza acumulada que sirven 
como criterio de selección las componentes a retener. Debajo de estos datos se 
encontrará la ponderación que cada componente le otorga a cada variable, lo cual 
es útil para hacer el proceso de descripción de los componentes retenidos. 
 
 
INV- Modelos no lineales en GRETL/2011-II 
 
 
17 
 
3. APLICACIÓN DE MODELOS ECONOMÉTRICOS. 
GRETL contiene programación para realizar procesos en aproximadamente 28 
métodos econométricos, dentro de estos encontramos mínimos cuadrados 
ordinarios, estimación de la matriz de covarianzas robusta, datos panel estático y 
dinámico, mínimo cuadrados no lineales, Estimación de máxima verosimilitud y 
modelos de series de tiempo univariados y multivariados, entre muchos otros. 
Este documento se centrará al estudio de modelos que se enfrentan a problemas 
de variables discretas, como ya se verá más adelante al hacer referencia a los 
modelos Logit y Probit. Sin embargo, para explorar un poco más en detalle el 
programa se pretende hacer a continuación una exposición de la estimación de 
un modelo de regresión lineal por mínimos cuadrados ordinarios. 
 
3.1. MÍNIMOS CUADRADOS ORDINARIOS. 
El proceso de estimar un modelo de regresión lineal por mínimos cuadrados 
ordinarios (MCO) en GRETL se puede desarrollar, al igual que la mayoría de los 
procesos, por medio de la interfaz de usuario o por medio de la consola. 
En la barra de herramientas se encontrará la pestaña Modelo en donde 
aparecerán los diferentes conjuntos de modelos que se pueden aplicar a los datos 
con los que se cuenta. Por consiguiente, en este menú aparecerá la opción de 
MCO que al seleccionarla mostrará una ventana en donde se debe seleccionar la 
variable dependiente y las variables independientes del modelo. Si se desea 
proceder usando la consola, se puede realizar con el comando ols seguido de la 
variable independiente y después de las independientes. 
 
 
K. MÍNIMOS CUADRADOS ORDINARIOS 
INV- Modelos no lineales en GRETL/2011-II 
 
 
18 
 
3.1.1. Contraste de supuestos. 
Al haber estimado el modelo, aparecerá una ventana de salida en la cual se 
muestran los principales resultados de la estimación. Así mismo, se encuentra 
una barra de herramientas con todas las opciones disponibles para analizar y 
contrastar el modelo. Específicamente, la opción contrastes muestra una gran 
cantidad de contrastes a los supuestos del modelo, tal como muestra la 
Ilustración L. Al seleccionar cualquiera de los contrastes aparecerá 
automáticamente en otra ventana el proceso realizado por el programa y se creará 
debajo de los resultados principales de la estimación del modelo (obtenidos 
anteriormente) un resumen de la prueba realizada, mostrando la hipótesis nula, 
el estadístico y su valor-p principalmente. 
 
 
L. CONTRASTES DE LOS SUPUESTOS, TEST RESET DE RAMSEY. 
 
La diferencia entre las dos formas de aplicar el modelo (interfaz o consola) está en 
que para hacer los contrastes de los supuestos del modelo la primera opción 
ofrece en el documento desalida el menú explicado anteriormente. Al proceder 
mediante la consola se deben seguir utilizando los comandos correspondientes a 
los contrastes que se desean hacer, por ejemplo, para hacer el test de Ramsey se 
procede con el comando reset. 
3.1.2. Intervalos de confianza. 
Una de las fortalezas con las que GRETL cuenta es la fácil estimación de los 
intervalos de confianza para cada una de las variables del modelos que se haya 
ejecutado, simplemente hay que dirigirse a la sección análisis en la ventana de 
INV- Modelos no lineales en GRETL/2011-II 
 
 
19 
 
salida de resultados del modelo, donde aparece la opción de intervalos de 
confianza, estos automáticamente serán generados. 
 
 
M. INTERVALOS DE CONFIANZA 
4. MODELOS CON VARIABLE DEPENDIENTE BINARIA3 
La aplicación del modelo de regresión múltiple lineal puede ser no adecuada para 
la explicación de problemas en los cuales la respuesta que se espera toma 
únicamente dos valores, por ejemplo, cuando se quiere hacer un análisis de 
políticas las únicas respuestas que se pueden esperar es si estas fueron exitosas 
o no en el medio en el cual fueron aplicadas. Para estos casos es necesario 
utilizar nuevas herramientas que difieren del modelo de regresión múltiple y que 
plantean nuevos mecanismos de medición. A continuación se consideraran 
ciertos modelos que son útiles para solucionar problemas con variable 
dependiente binaria, estos son: Modelo de probabilidad lineal, modelo Logit y 
modelo Probit. 
4.1. MODELO DE PROBABILIDAD LINEAL (MPL). 
El modelo de probabilidad lineal (MPL) es básicamente una variación del modelo 
de regresión lineal múltiple enfocada a la explicación de eventos cualitativos. En 
este documento sólo se considerarán el caso en que el evento a explicar tiene 
resultados binarios, de este modo la variable dependiente del modelo de regresión 
lineal sólo podrá tomar valores de cero o uno. 
Al tener un modelo, 
 
Con y como una variable bivariada, la interpretación común de los no puede 
seguir siendo utilizada, pues los cambios en y ya no son continuos ante cambios 
en las X. De este modo hay que recurrir a una nueva forma de entender el modelo 
con el fin de hallar su utilidad. 
 
3Explicación de modelos basada en Wooldridge (2009) 
INV- Modelos no lineales en GRETL/2011-II 
 
 
20 
 
Al admitir el supuesto de media condicional cero, , el modelo 
puede ser expresado como, 
 
El punto clave de la explicación del modelo de regresión lineal con variable 
dependiente binaria está en que siempre se tiene que el valor esperado de y es 
igual a su probabilidad de éxito, que es la probabilidad de que y sea igual a 1, 
expresado de otra forma: . De este modo el modelo dice que la 
probabilidad de éxito es función lineal de las variables x, lo que se puede expresar 
como, 
 
Así mismo, dado que las probabilidades tienen que sumar uno podemos decir que 
 , que también es función lineal de las variables x. Este 
modelo es llamado Modelo de Probabilidad Lineal (MPL) debido a la linealidad de 
los parámetros del éste. El modelo se estima por Mínimos Cuadrados Ordinarios 
(MCO) como un modelo común de regresión lineal múltiple. 
La interpretación de los se puede entender como “la variación de la 
probabilidad de éxito al variar , permaneciendo los demás factores constantes” 
(Wooldridge, 2009): 
 
Cuando se tiene variables independientes binarias el coeficiente que se obtiene 
“mide la diferencia que se predice para la probabilidad en relación con el grupo 
base” (Wooldridge, 2009) 
 
N. MPL BASE DE DATOS WOOLDRIDGE (2009) 
INV- Modelos no lineales en GRETL/2011-II 
 
 
21 
 
Al ser el modelo estimado por MCO, en GRETL se debe seguir el proceso 
explicado en la sección 3.1 con la variable independiente bivariada que exprese 
una relación cualitativa. 
Con el ánimo de evaluar los resultados de GRETL, se va a utilizar la base de 
datos MROZ del libro de Wooldridge (2009) la cual se puede encontrar dentro de 
la biblioteca de datos lista para instalar en el programa utilizando el enlace 
especificado en la sección 2.2.2 de este documento. 
4.1.1. Desventajas del MPL 
El modelo MPL tiene dos desventajas principalmente que lo hacen débil frente a 
los modelos que posteriormente se explicarán. La primera debilidad reside en 
que es posible que se den, con ciertas combinaciones de las variables 
independientes, resultados en donde la probabilidad es negativa o mayor a uno; 
probabilidades que generan un problema de interpretación y que por lo tanto 
requieren de un cambio en la forma de entender y estimar el modelo. 
La segunda debilidad del modelo es que no se puede considerar que la 
probabilidad esté relacionada linealmente con las variables independientes para 
todos los valores, ciertos efectos sobre la variable dependiente varían en su 
magnitud según aumenta la variable independiente, el MPL no es capaz de 
recoger dichos cambios. Sin embargo, si los valores de las variables 
independientes están cerca del promedio el modelo es útil para predecir. 
4.2. MODELOS NO LINEALES PARA RESPUESTA BINARIA. 
Los modelos Logit y Probit pueden superar las limitaciones que tienen los 
modelos de probabilidad lineal vistos en la sección anterior, pero la principal 
desventaja de estos modelos es el grado de dificultad que adquiere la 
interpretación de estos. 
Para especificar los modelos Logit y Probit se puede partir de la ecuación (3) y 
hacer una variación para considerar una clase de modelos como el siguiente: 
 
Donde G se considera una función con valores ente cero y uno estrictamente, 
para todos los números reales z. Esta primera condición elimina el problema del 
MPL de poder tener valores negativos o mayores a 1. 
Por otro lado, la función G es una función no lineal que cumple con la 
característica anterior de valores estrictamente entre cero y uno. Las funciones 
que se han utilizado más ampliamente en las aplicaciones de modelos de variable 
dependiente limitada son: 
INV- Modelos no lineales en GRETL/2011-II 
 
 
22 
 
 Función logística (modelo Logit): función de distribución acumulada 
para una variable logística estándar. 
 
 
 
 
Se encuentra entre cero y uno para todos los números reales. 
 Función de distribución acumulada normal estándar (Modelo Probit): 
 
 
 
 
Donde es la densidad normal estándar 
 
 
 
 
 
Una forma de derivar los modelos Logit y Probit es a través de un modelo de 
variable latente subyacente. 
 
 
Se parte de considerar a como una variable inobservable determinada por la 
ecuación (9) que introduce la notación de una función indicador, lo que 
significa que esta función asume el valor de uno si se cumple la condición dentro 
de los corchetes y de cero si no se cumple. 
Los errores, se suponen independientes de y que tienen la distribución 
logística estándar o la distribución normal estándar. Esto significa que en 
cualquier caso los errores se distribuyen simétricamente en torno a cero y así 
para todos los números reales z se tiene que . 
Con las consideraciones anteriores es posible calcular la probabilidad de 
respuesta para y en los modelos Logit y Probit como, 
 ( 
 
 
Recordando que en los modelos de respuesta binaria toma importancia explicar 
los efectos de las variables independientes sobre la probabilidad de éxito, es 
importante tener en cuenta que aunque a primera vista parezca que lo 
importante está en mirar los efectosde las sobre la variable latente 
 , en los 
modelos Logit y Probit la dirección del efecto sobre y sobre 
 es la misma. De este modo, dado que la variable 
latente regularmente no tiene una unidad de medida definida, toma mayor 
INV- Modelos no lineales en GRETL/2011-II 
 
 
23 
 
importancia la estimación de los efectos de las sobre la probabilidad de éxito. 
Ahora el problema está en que la no linealidad de las funciones G complica la 
estimación e interpretación de dichos modelos. 
Para solucionar el problema hay que recurrir a la derivación, pues si es una 
variable aproximadamente continua el efecto parcial sobre la probabilidad de 
éxito, , se obtiene de la derivada parcial (Wooldridge, 2009), que 
se define como: 
 
 
 
 
 
 
Con G definida una función de distribución de probabilidad de una variable 
aleatoria continua y g como una función de densidad de probabilidad. Al ser G 
una función estrictamente creciente (como en los casos de Logit y Probit), g(z) 
siempre va a ser mayor a cero y así de (11) se puede decir que el efecto de sobre 
la probabilidad de éxito p(x) va a depender únicamente del signo de , 
reafirmando así su importancia en la explicación de los efectos. 
Cuando hay variables explicativas binarias, el efecto parcial de que sea cero o 
uno, ceteris paribus, es: 
 
Que indica el cambio en la probabilidad de tener o no cierta característica 
representada por la variable binaria, teniendo en cuenta las demás 
características que permanecen constantes. En resumen el que representa la 
variable binaria determinará el cambio en la probabilidad de éxito de acuerdo a 
su signo y la cantidad en que varía se estima mediante (12). 
También es útil utilizar (12) para mirar los cambios en la probabilidad para 
variables discretas, de este modo se puede medir el efecto de que cambie de 
a siguiendo la misma lógica: 
 
 
Para estimar los modelos de variables dependientes limitadas es necesario utilizar 
la Estimación de Máxima Verosimilitud (EMV) debido a la naturaleza no lineal de 
los modelos utilizados. 
Estos modelos se pueden poner bajo la forma: “Sea la función de 
densidad para una extracción aleatoria de la población, condicional en ” 
(Wooldridge, 2009), al suponerse que se tiene una muestra aleatoria de tamaño n, 
la densidad de , para los modelos Logit y Probit, se determina por dos 
INV- Modelos no lineales en GRETL/2011-II 
 
 
24 
 
valores . 
Concretamente, la densidad va a estar dada por: 
 
 
 
 
Para = 0, 1. El estimador de máxima verosimilitud de maximiza la función de 
log-verosimilitud: 
 
 
 
 
 
 
El vector b es el argumento binario en el problema de maximización. En general 
(Estimación de máxima verosimilitud) es consistente y tiene una distribución 
normal aproximada en muestras grandes (Wooldridge, 2009). 
Para los modelos Logit y Probit la función de log-verosimilitud se obtiene al 
aplicar el logaritmo a la ecuación (14), lo cual, para la observación i quedaría 
expresado como una función de los parámetros y los datos ( : 
 
Así el problema de maximización que expresa (15) se puede escribir como: 
 
 
 
 
 
 
Más adelante se revisará como GRETL realiza muestra los resultados del proceso 
de estimación por máxima verosimilitud. 
 
4.2.1. Interpretación de las estimaciones de los modelos Logit y Probit 
 
Con los paquetes econométricos los problemas de estimación de los modelos 
debido a su complejidad deja de ser un problema, ahora toma importancia la 
forma en cómo se interpretan las estimaciones que resultan. Anteriormente, se 
dijo que los coeficientes resultantes de la estimación del modelo reflejan los 
efectos parciales de cada sobre la probabilidad de respuesta, con una 
significancia estadística determinada por la prueba de hipótesis , a un 
nivel de significancia suficiente. 
Inicialmente existe una medida de la bondad de ajuste del modelo conocido como 
“porcentaje predicho correctamente” que consiste en definir un predictor binario 
INV- Modelos no lineales en GRETL/2011-II 
 
 
25 
 
de como uno si la probabilidad que el modelo predice es mayor o igual a 0.5 y 
cero si ésta es menor de 0.5. 
 
 (18) 
Con esta herramienta es posible observar que tan bien predice el a en cada 
observación del modelo. En GRETL la salida que se obtiene al aplicar el modelo 
contiene un análisis del porcentaje predicho correctamente y que observaremos 
posteriormente. Una deficiencia de este método es que en casos particulares 
puede no predecir correctamente el resultado menos probable. 
Entre las variantes a este método está el de cambiar el umbral de acuerdo a la 
fracción de éxitos en la muestra y partir de ahí para considerar si es 1 o 0. De 
este modo si el porcentaje de éxitos en nuestra muestra es 7% en la ecuación (18) 
hablaríamos de . 
Al calcularse un modelo sin utilizar MCO, el que servía como medida para la 
capacidad de ajuste del modelo ya no aplica, pues el procedimiento utilizado para 
calcular no ha sido minimizando la varianza sino por máxima verosimilitud. El 
equivalente para estos modelos ha sido conocido como pseudo . Uno de los 
más utilizados y que GRETL calcula automáticamente al correr el modelo es el 
Pseudo de McFadden que sugiere la siguiente medida: 
 
 
 
 
Con como la función de log-verosimilitud para el modelo estimado y como 
la función de log-verosimilitud con sólo el intercepto. “La log-verosimilitud del 
modelo del intercepto es tratada como la suma total de cuadrados, y la log-
verosimilitud del modelo completo como la suma de los errores al cuadrado” 
(UCLA, What are Pseudo R-squareds?) en comparación con el de MCO. 
El ratio entre y nos muestra la capacidad de mejoramiento sobre el 
modelo del intercepto que ofrece el modelo completo. Sabemos por la ecuación 
(16) que las log-verosimilitudes de los modelos Logit y Probit siempre van a ser 
negativas por lo cual , por lo tanto, si el modelo tiene baja 
probabilidad la log-verosimilitud será mayor en valor absoluto que la de un 
modelo con mayor probabilidad. Así, entre el ratio de log-verosimilitudes sea más 
cercano a cero el será más cercano a uno, que indica que el modelo se ajusta 
bien. Si el modelo completo no tiene poder explicativo el ratio va a ser cercano o 
igual a 1, con lo que el del modelo será igual o cercano a 0. 
INV- Modelos no lineales en GRETL/2011-II 
 
 
26 
 
Para estimar los efectos de las sobre las probabilidades de éxito, se parte de la 
derivada parcial y los efectos en el cambio de la probabilidad estimada de éxito 
para cambios pequeños de , que se puede escribir como: 
 
La dificultad de estimar el efecto está en que el factor de escala 
depende de todas las variables explicativas, así que se tiene que recurrir a 
diferentes medidas de como las medias, los máximos, los cuartiles, entre otras, 
y así ver cómo cambia el factor. 
Para GRETL el factor escalar es medido utilizando las variables explicativas en el 
promedio muestral, de este modo “se obtiene el efecto parcial de para la 
persona “promedio” en la muestra” (Wooldridge, 2009).El procedimiento es realizado tanto para variables explicativas continuas como 
discretas. Críticas y alternativas a este procedimiento en Wooldridge (2009). 
4.2.2. Pruebas de hipótesis múltiples. 
Para probar restricciones de exclusión en los modelos Logit y Probit existen tres 
métodos: El multiplicador de Lagrange, el test de Wald y la Razón de 
verosimilitudes. GRETL en el resultado que muestra al usuario aplica la Razón de 
verosimilitudes. 
La prueba de la razón de verosimilitudes parte de considerar que, dado que la 
EMV maximiza la función de log-verosimilitud, la omisión de variables ocasiona 
generalmente una log-verosimilitud no mayor a la del modelo completo. Así, la 
prueba está basada en la diferencia de las funciones de log-verosimilitud entre un 
modelo restringido y uno no restringido y de este modo se puede concluir si la 
disminución en la log-verosimilitud es lo suficientemente grande para considerar 
a las variables omitidas significativas. 
Este estadístico es dos veces la diferencia de las log-verosimilitudes del modelo no 
restringido ( ) y el restringido ( ). 
 ) 
 (21) 
Con q como el número de restricciones de exclusión. La hipótesis nula del 
contraste considera que los parámetros de las variables excluidas en el modelo 
restringido son iguales a cero. 
 
INV- Modelos no lineales en GRETL/2011-II 
 
 
27 
 
4.3. CONCLUSIONES. 
Como se observó anteriormente, los modelos Logit y Probit han surgido como 
nuevos métodos para superar las deficiencias del modelo de regresión lineal 
aplicado a variables endógenas restringidas (Modelo de Probabilidad Lineal) y así 
generar predicciones más precisas sobre los fenómenos observados y modelados. 
Sin embargo, se reconoce que la dificultad en el proceso de estimación e 
interpretación del modelo es mayor para los modelos Logit y Probit, planteando 
un nuevo reto a los investigadores en cuanto a cómo entender los resultados que 
obtienen. Evaluar las salidas de los programas utilizados para estimar los 
modelos toma cierta importancia en cuanto a las facilidades que le ofrece al 
usuario. 
Este apartado del documento busca únicamente ser una guía teórica de los 
modelos MPL, Logit y Probit; con el fin de evaluar posteriormente los resultados 
que GRETL arroja al usuario y su utilidad en la interpretación de dichos modelos. 
5. APLICACIÓN DE MODELOS LOGIT Y PROBIT EN 
GRETL. 
Utilizando los mismos datos que se tomaron para ilustrar el proceso del MPL 
(sección 4.1) se ejecutará GRETL utilizando en este caso los modelos Logit y 
Probit. 
Dentro de la pestaña modelo, de la barra de herramientas de la interfaz, aparece 
la opción llamada Modelos no lineales, aquí se encontrarán los dos modelos en 
cuestión, tal como lo muestra la figura M. En este caso, solo se están 
considerando los modelos binarios o con variable endógena restringida, así que la 
opción Binario es la única que será trabajada en este documento. 
 
O. MODELOS NO LINEALES 
INV- Modelos no lineales en GRETL/2011-II 
 
 
28 
 
Al seleccionar la opción de aplicar el modelo Binario, tanto para Logit o Probit, 
aparecerá la ventana de selección de variables que ya había sido explicada en el 
apartado 3.1, las diferencias respecto a la explicada anteriormente son 
nombradas en la Ilustración P, a saber, opciones para mirar pendientes o p-
valores, y detalles sobre iteraciones. 
De acuerdo a la teoría explicada anteriormente, las pendientes en la media son 
útiles para mirar los efectos parciales de las en la probabilidad de éxito. Debido 
a que este efecto parcial depende de las , GRETL por defecto calcula ésta 
pendiente en la media, lo cual indica que los resultados obtenidos se interpretan 
respecto al “individuo promedio” de la muestra. Los detalles sobre las iteraciones 
mostrarán los valores de la función de log-verosimilitud de cada iteración 
realizada hasta maximizar la función. 
 
P. ESPECIFICACIÓN DE LOGIT 
Dentro de la salida de GRETL para la estimación de un modelo no lineal con 
variable restringida, aparecen ciertos recursos estadísticos de gran ayuda para la 
interpretación de los resultados por parte del usuario. De acuerdo a la teoría 
enunciada anteriormente los más importantes son: El pseudo de McFadden, El 
contraste de razón de verosimilitudes, el número de casos “correctamente 
predichos” y un cuadro que muestra en detalle el acierto del modelo en su 
predicción mediante la comparación entre los predichos y los observados. 
INV- Modelos no lineales en GRETL/2011-II 
 
 
29 
 
 
Q. SALIDA LOGIT (CON DETALLES DE ITERACIONES) 
Por supuesto, en la parte central de la salida aparecerán los coeficientes 
estimados, la desviación típica, las pendientes o los p-valores según la elección 
tomada al momento de especificar el modelo. 
Una de las opciones que puede ser interesante para contrastar el modelo es el 
Test de Wald, aunque no se revisó teoría sobre este permite probar restricciones 
múltiples sobre el modelo y cumple una función similar a la del estadístico de 
razón de verosimilitudes. 
 
R. OMISIÓN DE VARIABLES, TEST DE WALD 
INV- Modelos no lineales en GRETL/2011-II 
 
 
30 
 
Los pasos para llevar a cabo este test es mediante la opción contrastes que 
aparece en la barra de herramientas de la ventana de salida del programa. 
Mediante la opción omitir variables el programa permitirá estimar otro modelo 
con variables omitidas o restringidas. 
La Ilustración P muestra la ventana para la omisión de variables. Los pasos a 
seguir son: seleccionar las variables a omitir y seleccionar la opción de Contraste 
de Wald. La hipótesis nula de la prueba es que los parámetros de las variables 
omitidas son cero. 
La salida generada por esta prueba mostrará detalles sobre la hipótesis nula y el 
estadístico de contraste utilizado. Si se comparan los resultados del contraste de 
Razón de Verosimilitudes y el de Wald los resultados generalmente tendrán 
conclusiones similares. 
 
S. CONTRASTE DE OMISIÓN DE WALD 
Otro forma por medio de la cual se puede estimar un modelo Logit o Probit es el 
mediante la consola de GRETL se hace mediante el comando Logit o probit, según 
sea el caso. El comando solo pide la especificación de las variables separadas por 
un espacio. Para activar opciones adicionales como ver los p-valores en vez de las 
pendientes (p-values), errores estándar robustos (robust), mostrar la matriz de 
covarianzas (VCV) o mostrar detalles de las iteraciones (verbose); sólo hay que 
dejar un espacio después de las variables escribir dos guiones seguido de la 
opción u opciones que deseamos, tal como se muestra a continuación: 
logit inlf const nwifeinc exper expersq kidslt6 --verbose --vcv 
Para llevar a cabo pruebas de restricción múltiples y en este caso el test de Wald, 
el comando es omit, seguido de las variables a restringir y la opción de Wald: 
omit nwifeinc exper expersq kidslt6 --wald 
Así se llegará al mismo resultado descrito anteriormente. 
INV- Modelos no lineales en GRETL/2011-II 
 
 
31 
 
Debido a que la única diferencia entre la aplicación de un modelo Logit y Probit 
está en la función utilizada, para efectos del proceso necesario en el software para 
su estimación no varía en absoluto. 
6. APLICACIÓN DE LOGIT Y PROBIT EN STATA. 
Como una forma de comparar los resultados obtenidos en GRETL, se pretende a 
continuación hacer una exposición rápida de la estimación de un modelo Logit o 
Probit mediante STATA. Al ser reconocido STATA como uno de los programas de 
estadística más completos en el mercado, éste será un buen referente para 
comparar los resultados obtenidos con GRETL. A continuación se explicarán los 
comandos y paquetes necesarios para la estimación del modelo y todos los pasos 
para su consecución. Se seguirá trabajando con la misma base de datos que ha 
venido utilizándose en el documento. 
Para la estimación de un modeloLogit o Probit es STATA hay que utilizar los 
mismos comandos Logit o Probit, según sea el caso. Cuando no se adhieren 
opciones adicionales para la estimación del modelo la estructura del código 
utilizado en GRETL y STATA es el mismo. 
 
T. LOGIT EN STATA 
Sin embargo, la salida por defecto de Stata, en comparación a la de GRETL, no 
contiene información sobre las pendientes del modelo respecto a cada variable 
exógena, que como se revisó en la teoría es la única herramienta que permite la 
explicación de los efectos de las variables independientes sobre la probabilidad de 
éxito. Para conseguir esta información en Stata se recurre al comando mfx, el 
cual arroja información tal como muestra la Ilustración U. 
INV- Modelos no lineales en GRETL/2011-II 
 
 
32 
 
 
U. MODELO LOGIT CON PENDIENTES EN STATA 
El test de Wald y la razón de verosimilitudes son ejecutados por Stata mediante 
dos comandos: test y lrtest, respectivamente. Para el primero, simplemente se 
necesita haber corrido el modelo deseado, después se ejecuta el comando test 
seguido de las variables que se van a omitir y el software calcula la prueba y 
arroja el p-valor correspondiente. El resultado de este proceso se observa en la 
Ilustración V. 
 
V. TEST DE WALD EN STATA 
Para calcular el estadístico de razón de verosimilitudes el proceso que se debe 
realizar no es tan intuitivo como el test de Wald, en este caso se deben hacer 
unos cuántos pasos antes de ejecutar el comando lrtest que calcula el estadístico, 
pues este comando pide especificar los dos modelos (restringido y no restringido) 
que va a ser comparados. 
Por tal motivo es necesario (mediante el comando estimates store el cual nos 
permite guardar los modelos estimados dándoles un nombre) guardar las 
estimaciones del modelo restringido y no restringido, para el modelo restringido 
tan sólo hay que ejecutar el modelo con la variable independiente. Los comandos 
necesarios para la estimación del test en el ejemplo que ha sido trabajado en todo 
el documento se especifican en la Ilustración W. 
INV- Modelos no lineales en GRETL/2011-II 
 
 
33 
 
 
W. ESTIMACIÓN RAZÓN DE VEROSIMILITUDES EN STATA 
Por último, el comando que permite ver los casos “correctamente predichos” es 
estat classification el cual muestra principalmente el cuadro de predichos y 
observados con los casos en que el modelo predijo correctamente respecto al dato 
observado (al igual que en GRETL se considera predicho correctamente cuando el 
valor observado es uno y el valor de la estimación es mayor a 0,5; o cuando el 
observado es 0 y la estimación menor a 0,5). En la salida de Stata “True D” 
representa un dato observado de 1 y “Classified +” una estimación mayor a 0,5. 
 
X. CASOS CORRECTAMENTE PREDICHOS EN STATA 
En el último campo de la salida del comando estat classification aparece el 
porcentaje de casos correctamente predichos el cual sirve para mirar que tan 
bueno fue el modelo especificado. 
 
 
 
INV- Modelos no lineales en GRETL/2011-II 
 
 
34 
 
7. CONCLUSIÓN. 
Aunque no se han explorado más funcionalidades de GRETL y Stata para la 
estimación de modelos no lineales con variable dependiente limitada, se ha hecho 
una revisión de los principales comandos que le permitirían al estudiante o 
investigador estimar e interpretar en un nivel básico un modelo no lineal de este 
tipo. 
Respecto a los dos software utilizados, es posible observar que las estimaciones y 
pruebas realizadas no varían entre los dos programas, por lo cual arrojan los 
mismos datos y conclusiones. Además, las salidas que se obtiene de los dos 
programas tienen un aspecto similar que permite una fácil comprensión por parte 
del usuario; en este punto es importante decir que GRETL genera la mayoría de 
cálculos con el mismo comando mientras que en Stata se deben buscar diversos 
comandos para analizar el modelo estimado, esto sin duda presenta una 
diferencia entre GRETL y Stata, pues para los nuevos usuarios puede llegar a ser 
más complicada la búsqueda de los comandos necesarios para llegar a buenas 
conclusiones. 
Esto demuestra que GRETL al ser software libre de código abierto, se presenta 
como un programa útil para el análisis econométrico con buenas estimaciones, 
una interfaz agradable e intuitiva en varios idiomas, de fácil instalación y 
disponible para cualquier usuario. Aunque todavía necesite desarrollos que 
fortalezcan su potencia en la ejecución de varios modelos, se presenta como una 
oportunidad para los usuarios que no pueden acceder a otros programas por los 
altos costos de las licencias o por la dificultad de entender cómo funcionan. 
Además, al ofrecer una librería gratuita con gran cantidad de bases de datos de 
los libros más reconocidos en la enseñanza de la econometría, GRETL se 
convierte en una herramienta muy interesante para el aprendizaje. 
Modelos como Logit y Probit son utilizados recurrentemente para la estimación de 
fenómenos en el mundo real, sin embargo debido a lo complejo que es su 
estimación no son tomados en cuenta en los cursos básicos. La pertinencia de 
aplicar modelos que no son vistos en la línea de econometría del programa de 
pregrado de la Facultad utilizando interfaces tan intuitivas como GRETL, está en 
que los estudiantes y las personas interesadas en profundizar en temas 
diferentes, como los modelos no lineales estudiados aquí, no necesitan de un 
tutor o profesor que los guíe sino de una guía teórica y práctica que los 
introduzca en el tema y les ofrezca las bases, incentivando así el auto-
aprendizaje como complemento a la formación que se recibe en las aulas. 
 
 
INV- Modelos no lineales en GRETL/2011-II 
 
 
8. REFERENCIAS. 
 
Cottrell, A., & Lucchetti, R. (Julio de 2011). GRETL user´s guide. Recuperado el 9 
de Septiembre de 2011, de GRETL Web page: 
http://gretl.ecn.wfu.edu/pub/gretl/manual/PDF/gretl-guide-a4.pdf 
UCLA. (s.f.). Stata Data Analysis Examples: Logistic regression. Recuperado el 25 
de Noviembre de 2011, de http://www.ats.ucla.edu/stat/stata/dae/logit.htm 
UCLA. (s.f.). What are Pseudo R-squareds? Recuperado el 16 de Noviembre de 
2011, de 
http://www.ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm 
Wooldridge, J. (2009). Introductory Econometrics: A modern approach. Cengage 
Learning.

Continuar navegando