Logo Studenta

Modelo-de-prediccion-de-la-tendencia-del-tipo-de-cambio-peso-dolar-mediante-triangulacion-de-arbitraje

¡Este material tiene más páginas!

Vista previa del material en texto

i 
 
 
Universidad Nacional Autónoma de México 
Programa de Posgrado en Ciencias de la Administración 
 
 
 
 
Modelo de predicción de la tendencia del tipo de cambio peso-
dólar mediante triangulación de arbitraje 
 
 
 
 
T e s i s 
 
Que para optar por el grado de: 
 
Maestro en Finanzas 
 
 
 
Presenta: 
Carlos Omar Chávez Sánchez 
 
 
 
Tutor: 
Dr. Arturo Morales Castro 
Facultad de Contaduría y Administración 
 
 
 
 
 
México, D. F., diciembre de 2015 
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
 ii 
 
 
Dedicatoria 
 
 
 
 
A mis padres 
que, a pesar del paso de los años, 
siempre han sido un pilar importante, 
y nunca me cansaré de agradecerles… 
 
A mi Valen y mi Caming 
porque, buscando trascender, 
lo he logrado de la mejor forma, 
sin darme cuenta. 
 
 
 
 
 
 
 
 
“Para que me puedas ver detener 
y replegar hará falta algo más 
que taparme los ojos” […] 
 
 
“Porque siempre lo creí pertinente 
 y basta con que sea importante para mí” […] 
 
 
 
 
 
 
 iii 
 
 
Agradecimientos 
 
 
 
Agradezco a m i asesor Dr. Arturo Morales Castro, quién depos itó en mí su confianza y 
amistad, por b rindarme su apoy o y haber me g uiado a t ravés de l a r ealización de es ta 
tesis. De m anera es pecial agradezco sus at enciones, todo su tiempo y g ran 
temperamento, s iempre dispuesto a es cuchar, y s obretodo porque pudo ver m ás al lá y 
creer en l a per sona; sin él es ta m eta no habr ía podi do s er c umplida: “Gracias in finitas 
Doc…” 
 
A mis sinodales Mtra. Rosario Higuera, Mtra. Cristina Ordoñez, Mtro. Francisco Gerardo y 
Dr. José Antonio Morales Castro, por sus aportaciones y tan atinados comentarios. 
 
 
Finalmente, agradezco a la Universidad Nacional Autónoma de México y a la Facultad de 
Contaduría y A dministración por stos años de f ormación q ue m e ha brindado, por 
permitirme v ivir esta g ran experiencia; y haber me c obijado una vez m ás dent ro de s us 
aulas. 
 
 
 iv 
 
 
Resumen 
 
 
 
Un esquema para pronosticar la tendencia de los precios del tipo de cambio peso/dólar es 
propuesto. E l es quema pr etende ut ilizar l a ex istencia de arbitraje del t ipo de c ambio 
peso/dólar a par tir del ex istente en ot ras di visas: eur o/dólar, eu ro/peso, eur o/dólar 
canadiense y yen/dólar. Esta propuesta permite explorar otros medios o instrumentos de 
interés en la búsqueda de variables o estrategias de inversión como alternativa en el corto 
plazo, más allá de pr opuestas basadas en fundamentales macroeconómicos de m ediano 
y largo plazo. 
 
La propuesta consiste en tomar una combinación de datos de los precios de las divisas 
mencionadas para p ronosticar l a di rección que t omará el precio del t ipo de cambio 
peso/dólar. Los pr ecios ex plorados c orresponden al úl timo cuatrimestre de 2012, d e 
septiembre a diciembre, y consideran un periodo de 30 minutos. 
 
Se emplean distintos algoritmos de clasificación pertenecientes a la minería de datos para 
evaluar la propuesta los cuales son contrastados contra Redes Neuronales (RN), que han 
mostrado ser superiores a l os métodos tradicionales. Los resultados empíricos obtenidos 
validan la capacidad del modelo en términos de porcentajes de recuperación que, como 
se m uestra, consiguen i gualar, y en al gunos casos s uperar, a l os ob tenidos c on R N; 
sugieren que este puede ser utilizado como indicador para pronosticar la tendencia de los 
precios sobre el tipo de cambio exhibido en términos de sus rendimientos. 
 
 
Palabra clave: Pronóstico de rendimientos, minería de datos, tipo de cambio, exploración 
de r endimientos, ar bitraje ent re di visas, contagio de m ercados, em parejamiento d e 
valores. 
 
 
 v 
 
 
Abstract 
 
 
 
A m odel t o forecast t he peso/dolar ex change r ate i s pr oposed. The model c onsists i n 
detecting the presence of arbitrage in peso/dolar exchange rate from that in other 
exchange rates: euro/dolar, euro/peso, euro/dolar canadiense y yen/dolar. This proposal 
allows e xploring other means o f i nterest i n the q uest for variables’ and investment 
strategies’ seeking f or short te rm, unless proposals bas ed on m ean and l ong t erm 
macroeconomic fundamentals. 
 
This proposal takes different data combinations of the exchange rate prices aim to foresee 
trend direction of the peso/dolar exchange rate. The explored prices span the last quarter 
of 2012, from September to December, with a time frame of 30 minutes. 
 
Different classification algorithms of data mining for the proposal evaluation are employed 
and are contrasted to Neural Networks (NN) which have shown to be superior to traditional 
methods. T he empirical results v alidate the capacity of t he model in t erms of recovery 
percentages that, as shown, are very similar, and superior in some cases, to those of NN; 
they suggest that this might be used as an indicator to forecast the price tendency over the 
described exchange rate in terms of its returns. 
 
 
Keywords: return forecasting, data mining, peso/dólar exchange rate, returns exploration, 
arbitrage among exchange rates, makets contagion, market pairing. 
 
iv 
 
 
 
Índice 
 
Dedicatoria ......................................................................................................................... ii 
Agradecimientos ................................................................................................................ iii 
Resumen ........................................................................................................................... iv 
Abstract ............................................................................................................................. v 
Índice ................................................................................................................................. iv 
Índice de tablas .................................................................................................................. vi 
Índice de figuras ................................................................................................................ vi 
Metodología de la investigación ......................................................................................... 1 
Introducción ................................................................................................................... 1 
Planteamiento del problema........................................................................................... 2 
Objetivos ........................................................................................................................ 3 
Hipótesis ........................................................................................................................ 3 
Metodología ................................................................................................................... 4 
Justificación ................................................................................................................... 4 
Matriz de congruencia .................................................................................................... 5 
Resumen capitular ......................................................................................................... 6 
Capítulo 1 ..........................................................................................................................7 
Marco teórico ................................................................................................................. 7 
1.1 Teoría del Mercado Eficiente ............................................................................... 7 
1.1.1 Antecedentes ................................................................................................... 8 
1.1.2 Niveles de eficiencia ........................................................................................ 8 
1.2 Tipo de cambio .................................................................................................. 10 
1.2.1 Régimen......................................................................................................... 10 
1.2.2 Antecedentes ................................................................................................. 11 
1.3 Pronóstico del tipo de cambio ............................................................................ 12 
Capítulo 2 ........................................................................................................................ 15 
Herramientas y metodologías de análisis de datos ...................................................... 15 
2.1 Series de tiempo ................................................................................................ 15 
2.1.1 Modelos ARIMA ............................................................................................. 19 
2.1.2 Caracterización de las series de tiempo ......................................................... 20 
2.1.3 Propiedades de las series de tiempo financieras ............................................ 21 
2.2 Modelos de clasificación .................................................................................... 22 
2.2.1 Vecindades .................................................................................................... 22 
2.2.2 Probabilísticos ................................................................................................ 23 
2.2.3 Meta clasificadores ........................................................................................ 25 
2.2.4 Tablas de decisión ......................................................................................... 26 
2.2.5 Árboles de decisión ........................................................................................ 28 
2.3 Evaluación de desempeño ................................................................................. 29 
v 
 
Capítulo 3 ........................................................................................................................ 32 
Modelo propuesto ........................................................................................................ 32 
 Fuente de datos ................................................................................................. 32 3.1
 Selección de variables ....................................................................................... 34 3.2
 Selección de clases ........................................................................................... 35 3.3
 Plataforma de ejecución .................................................................................... 38 3.4
 Evaluación del modelo ....................................................................................... 39 3.5
Capítulo 4 ........................................................................................................................ 40 
Resultados y discusiones ............................................................................................. 40 
4.1 Procedimiento .................................................................................................... 40 
4.2 Ejecución de pruebas ........................................................................................ 41 
Conclusiones ................................................................................................................... 45 
Referencias bibliográficas ................................................................................................ 46 
 
vi 
 
 
 
 
Índice de tablas 
 
 
 
Tabla a. Matriz de congruencia .......................................................................................... 6 
Tabla 2.1 Patrones teóricos de FAC y FACP. .................................................................. 21 
Tabla 3.1.Variables propuestas conformadas con los precios de los tipos de cambio. ..... 35 
Tabla 3.2.Clasificadores evaluados con WEKA. .............................................................. 38 
Tabla 4.1. Resultados de desempeño de la recuperación de los patrones dentro de la 
muestra .................................................................................................................... 42 
Tabla 4.2. Resultados de desempeño de la recuperación de los patrones por validación 
cruzada .................................................................................................................... 43 
 
 
 
Índice de figuras 
 
 
Figura 1.1. Niveles de eficiencia de los mercados. ............................................................ 9 
Figura 2.1.Ejemplo gráfico de una validación cruzada, con k=4. ...................................... 30 
Figura 3.1. Series de datos de los tipos de cambio con precios al cierre con línea de 
tendencia para el periodo del 22/ago/2012 al 28/dic/2012........................................ 33 
Gráfica 3.1.Gráfica de velas de 30 minutos para el tipo de cambio peso-dólar del día 
28/dic/2012. ............................................................................................................. 36 
Gráfica 3.2.Precios al cierre de 30 minutos del tipo de cambio peso-dólar para el día 
28/dic/2012. ............................................................................................................. 36 
Gráfica 3.3. Ejemplo de la partición y clasificación de los rendimientos. .......................... 37 
Gráfica 4.1. Resumen de variables con ocurrencia dentro de las combinaciones 
analizadas ................................................................................................................ 44 
 
 
 
1 
 
 
 
 
Metodología de la investigación 
 
Introducción 
 
La predicción y pronóstico de los fenómenos que se presentan en la vida cotidiana ha sido 
siempre un área de gran i nterés y de oportunidad par a los investigadores, sean estos 
naturales, económicos, sociales, etc. (García, Jalal, Garzón, & López, 2013) (Rodríguez, 
Cortéz, Méndez, & Garza, 2014) (Arroyo, Espínola, & Maté, 2010). Especialmente en el 
sector económico y financiero donde los posibles beneficios de los mercados resultan 
altamente at ractivos par a s us pa rticipantes s ería pr ovechoso poder ant iciparse a l os 
hechos de los movimientos y tendencias de los precios de las acciones (Chávez Sánchez 
& Morales C astro, Modelo de pr edicción de l a tendencia del t ipo de c ambio pes o-dólar 
mediante otras divisas utilizando algoritmos de clasificación de minería de datos, 2015). 
 
Numerosas investigaciones han puesto su atención en la predicción de valores en las 
últimas décadas (Arroyo, Espínola, & Maté, 2010) (Morales Castro, 2009) (MacDonald & 
Taylor, 1994). Distintas alternativas y métodos para brindar predicciones mejores y más 
precisas han s ido pr opuestos (Cheung, C hinn, & P ascual, 2005) . Los es tudios han 
involucrado di ferentes enfoques y par adigmas, q ue v an des de l os c lásicos m odelos 
lineales, autoregresivos, promedios móviles y ARIMA (Rout, Majhi, Majhi, & Panda, 2014), 
otros mediante r epresentaciones de dat os multivariados c on r egresión m últiple; no 
lineales, m ediante técnicas t omadas del á rea de i nteligencia ar tificial c omo al goritmos 
genéticos (Chang, C hen, & H siao, 2014 ), r edes neur onales (Wang, L ai, Nakamori, & 
Wang, 2004 ) (Semaan, H arb, & K assem, 201 4), r ecientemente, m odelos as ociativos 
(Jurado-Sánchez, Yáñez-Márquez, C amacho-Nieto,& López Y áñez, 2 014); i ncluyendo 
esquemas de algoritmos híbridos utilizando el análisis de la serie de t iempo y localizando 
su m odelo para s u posterior ejecución empleando di stinta técnica en l a fase de 
recuperación, por ejemplo, las redes neuronales artificiales, han mostrado resultados 
importantes (Chen, Peng, & Abraham, 2006) (Chang J. F., 2011). 
 
Aunque, de manera general, los datos de análisis han sido considerados a partir de los 
históricos y t ratados c omo s eries de t iempo, al gunas i nvestigaciones m ás r ecientes 
proponen nuevos esquemas como la segmentación de datos, el uso de ventanas móviles 
(Ramírez & Chimal, 2012), e incluso más que enfocarse en el pronóstico de los precios 
adelantados de una s erie, la tendencia a partir las di ferencias entre el precio actual y 
alguno adel antado (Chávez S ánchez & Morales C astro, M odelo de pr edicción de l a 
Metodología de la investigación 
 
 
2 
 
tendencia del t ipo de c ambio peso-dólar mediante ot ras divisas ut ilizando algoritmos de 
clasificación de minería de datos, 2015). 
 
Planteamiento del problema 
 
El modelo que se propone en este t rabajo plantea la ut ilización de una c ombinación de 
variables intermercado para pronosticar el precio, específicamente la tendencia de alguna 
de las diferencias futuras, del tipo de cambio peso-dólar. La propuesta se basa en la idea 
de identificar la posibilidad de ar bitraje1 del t ipo de cambio a pa rtir de ot ras divisas. Este 
concepto s e enc uentra también en l a l iteratura bajo no mbres c omo em parejamiento d e 
valores, c ontagio de m ercados, contagio t óxico o l igado de m ercados (Toribio, 2012 ) 
donde t eóricamente s e hac e not ar que ex isten m ercados r elacionados di recta o 
inversamente y que sugieren que el desinterés (interés) público de un v alor corresponde 
al i nterés ( desinterés) de ot ro v alor. O , en al gunos c asos, s e habl a s implemente d e 
triangulación de arbitraje (Wang, Li, Liang, & Li, 2008). 
 
Asimismo, r esulta i mportante hac er not ar que son poc os l os t rabajos q ue ut ilizan 
algoritmos de m inería de datos para tratar el tipo de c ambio peso-dólar que, si bien, han 
explorado el tema, aunque de manera limitada y superficial, han mostrado que es posible 
el planteamiento presentado con relación a un m odelo que permita predecir la tendencia 
de los precios del tipo de cambio a partir de un grupo de otras divisas (Chávez Sánchez & 
Morales Castro, M odelo de pr edicción de la t endencia del t ipo de c ambio pes o-dólar 
mediante ot ras di visas utilizando algoritmos de c lasificación de m inería de dat os, 2015) 
(Chávez Sánchez & Morales Castro, El tipo de cambio peso-dólar: Propuesta de un 
modelo de de terminación bas ado en el t ipo de c ambio eu ro/dólar y e uro/peso, 201 5) 
(Jurado-Sánchez, Yáñez-Márquez, Camacho-Nieto, & López Yáñez, 201 4). De ahí q ue, 
en es te trabajo se exploren di ferentes variables tomadas de l os p recios de l os t ipos de 
cambio o alguna razón de estos para conformar el modelo que pudiera ayudar a 
pronosticar l a t endencia del t ipo de c ambio peso-dólar, m ismo que pudiera i ntegrarse y 
formar pa rte de una e strategia de i nversión en c aso de i nversionistas, m inoristas o 
institucionales, o c omo indicador q ue apoy e en l as dec isiones t omadas en l as ár eas 
financieras de alguna empresa o institución de crédito, por ejemplo. 
 
En el presente trabajo se propone un modelo para el pronóstico de la tendencia del precio 
de tipo de cambio peso-dólar utilizando componentes intermercado intradiarias, el cual es 
validado ut ilizando al gunas de l as metodologías m ás r epresentativas per tenecientes a 
distintos paradigmas de clasificación de la minería de datos: probabilístico, naïve bayes; 
redes neu ronales, pe rceptrón multicapa ( MPL); vecindades, I B1; metaclasificadores, 
 
1 Se c onoce c omo arbitraje a l a práctica de c omprar y vender bienes eq uivalentes en m ercados 
distintos p ara obtener ventaja de un a d iferencia de pr ecios. En ge neral, s e hace r eferencia a 
cualquier s ituación en l a que es pos ible o btener u na ut ilidad s in c orrer r iesgos o hacer u na 
inversión. 
Metodología de la investigación 
 
 
3 
 
bagging; tablas de decisión, data table, y árboles, bftree (Witten & Eibe, Data mining: 
practical machine learning tools and techniques with Java implementations, 2000). 
 
Por lo anterior la pregunta de investigación obligada es ¿Existirá algún grupo de t ipos de 
cambio cuya triangulación de divisas permita identificar alguna posibilidad de arbitraje con 
el fin de pronóstico del tipo de cambio peso-dólar o por lo menos de su tendencia en el 
corto plazo? 
 
- Si fuera posible descubrir la existencia de relaciones entre mercados que permitan 
anticiparse a los cambios de los tipos de cambio con el fin de prever lo que sería el 
rebote en el tipo de c ambio pes o-dólar ¿C uáles s erían l os t ipos de c ambio 
relevantes? 
 
- Construyendo v ariables a par tir de p recio de c ierre, aper tura, máximo, mínimo, 
históricos, rendimientos, di ferencias ¿Q ué combinación de es tas s ervirían par a 
conseguir el pronóstico en el corto plazo? 
 
- ¿Cuál sería el desempeño del modelo y si este pudiera ut ilizar alguna técnica en 
especial para incrementarlo? 
 
Objetivos 
 
Proponer un modelo de predicción de t endencia de los precios del tipo de cambio peso-
dólar utilizando alguna combinación de datos de los precios de otras divisas y aprovechar 
la posibilidad de arbitraje de estas mediante técnicas de minería de datos. 
 
- Mostrar un m odelo de pr edicción de la tendencia de pr ecios del t ipo de c ambio 
peso-dólar 
 
- Explorar l as di versas c ombinaciones de da tos par a i dentificar cuáles t ienen 
relevancia par a el t ipo de c ambio y q ué c ombinación de es tas presenta m ejor 
desempeño 
 
- Probar el modelo mediante un estudio comparativo entre las diferentes técnicas de 
la minería de datos el desempeño del modelo 
 
Hipótesis 
 
La hipótesis de l a investigación es que con la identificación de l a presencia de ar bitraje 
entre di ferentes t ipos de c ambios relacionados a un c onjunto de divisas s e puede 
pronosticar la tendencia del precio o precio mismo del tipo de cambio peso-dólar. 
 
Metodología de la investigación 
 
 
4 
 
Las hipótesis específicas son: 
- Tipos de cambios de divisas relacionadas cambian de manera anticipada a alguna 
de ellas posibilitando el arbitraje 
 
- Existen patrones con presencia temporal en las series de precios y del mismo tipo 
de cambio y de otros 
 
- Las técnicas de la minería de dat os han m ostrado resultados sobresalientes para 
diversas tareas de reconocimiento en distintas áreas 
 
Metodología 
 
La investigación, dado que involucra series de tiempo de los precios del tipo de cambio 
peso-dólar es de tipo longitudinal, y transversal, ya que también involucra combinaciones 
de datos (precios de aper tura, cierre, máximo y mínimo) de otras divisas para realizar el 
pronóstico: euro-dólar, eur o-peso, eur o-dólar c anadiense y yen-dólar. Se considera el 
periodo correspondiente al último cuatrimestre del 2012, de septiembre a diciembre, con 
una per iodicidad de pr ecios de 30 m inutos, da do q ue adem ás de que fue l o que s e 
disponía y es taba v igente al t iempo de i niciar l os es tudios, no hub o ev entos ex tra 
económicos que insertaran grandes movimientos extraordinarios al comportamiento de los 
mercados. 
 
El alcance de la investigación es descriptivo ya que involucrará un análisis discriminante y 
exploratorio para la identificación de la relevancia de los mercados y las combinaciones 
de sus variables para los fines del estudio comparativo. 
 
Justificación 
 
Teorías existentes y conceptos sobre la conducta de los mercados dentro de las áreas de 
economía y finanzas sesgan la idea de que pudiera existir una manera de predecir o, tan 
sólo, de estimar el valor futurosobre algún producto financiero. Siendo la más conocida la 
de la Hipótesis de mercados eficientes (Fama, 1970), la cual asume que los inversionistas 
son racionales y que los precios reflejan ya toda la información disponible. Que no hay 
oportunidad de obtener ganancias del mercado al analizar los precios pasados para 
predecir los m ovimientos f uturos de estos. De ahí q ue, el análisis técnico, como se l e 
conoce a este tipo de análisis, que se basa en el descubrimiento de formas 
correspondientes a patrones dibujados en las series temporales de los precios históricos, 
no se ha considerado una manera confiable para la estimación de los precios futuros. 
 
Cuando se t rata del corto plazo, l os t ipos de c ambio det erminados por el m ercado son 
muy volátiles, como respuesta a la política monetaria, los eventos políticos y los cambios 
de expectativas. Diversos estudios coinciden en la existencia de relaciones de causalidad 
Metodología de la investigación 
 
 
5 
 
de v ariables c on el t ipo de c ambio pes o-dólar a par tir del v ariables m acroeconómicas 
(Torre Cepeda & Provorova Panteleyeva, 2007) (Morales Castro, 2009). Asimismo, otros 
autores y per sonalidades r econocidas del m edio, i ncluyendo e l F ondo M onetario 
Internacional ( FMI), han r emarcado el hec ho d e c onsiderar pa ra s u e stimación c iertas 
variables macroeconómicas como la tasa de i nterés, el monto de ex portaciones y el de 
importaciones, principalmente. No obstante, los estudios demuestran que las variaciones 
del t ipo de c ambio no r esponden a una úni ca variable ec onómica-financiera 
exclusivamente. 
 
Si bien, los estudios realizados han mostrado ser eficaces, en su mayoría han basado sus 
investigaciones en el l argo pl azo m ediante componentes c on v ariables i ntramercado 
(precios hi stóricos de apertura, de c ierre, v olumen, interés abierto, et c.) o en ot ros 
factores fundamentales macroeconómicos, c omo el í ndice de pr ecios, tasa de i nterés, 
balanza de comercialización, etc. Sin embargo, existe poca discusión para el corto plazo, 
donde los precios muestran mayor sensibilidad y, para los inversionistas de este mercado, 
resulta m ás at ractivo y es m otivo del des arrollo de la pr esente i nvestigación donde s e 
explora la posibilidad de arbitraje del tipo de cambio peso-dólar a partir de otras divisas en 
el corto plazo. 
 
En la presente tesis, se mostrará un estudio empírico sobre una propuesta de modelo de 
predicción para la estimación de la tendencia de precio del tipo de cambio a partir de otras 
divisas ut ilizando algunos de l os clasificadores más representativos del área de m inería 
de datos. El modelo será probado con datos intradiarios para distintos periodos dentro del 
cuatrimestre último de 2012: cuatro meses, dos meses, un mes y una semana. 
 
Los esquemas de clasificación em pleados, además de v alidar l a factibilidad del m odelo 
propuesto, sirven par a mostrar el poder de o tras t écnicas de pr edicción y c lasificación, 
pertenecientes a otras áreas, en el ámbito de l as finanzas para la solución de pr oblemas 
referentes a la identificación y extracción de patrones que involucran el análisis y 
procesamiento de series de tiempo y datos históricos. 
 
Matriz de congruencia 
 
# PROBLEMA OBJETIVO HIPÓTESIS 
1 Si fuera posible descubrir la 
existencia de relaciones 
entre mercados que permitan 
anticiparse a los cambios de 
los tipos de cambio con el fin 
de prever lo que sería el 
rebote en el tipo de cambio 
peso-dólar ¿Cuáles serían 
los tipos de cambio 
Mostrar un modelo de 
predicción de la tendencia de 
precios del tipo de cambio 
peso-dólar 
 
Tipos de cambios de divisas 
relacionadas cambian de 
manera anticipada a alguna 
de ellas posibilitando el 
arbitraje 
 
Metodología de la investigación 
 
 
6 
 
relevantes? 
2 Construyendo variables a 
partir de precio de cierre, 
apertura, máximo, mínimo, 
históricos, rendimientos, 
diferencias ¿Qué 
combinación de estas 
servirían para conseguir el 
pronóstico en el corto plazo? 
Explorar las diversas 
combinaciones de datos para 
identificar cuáles tienen 
relevancia para el tipo de 
cambio y qué combinación de 
estas presenta mejor 
desempeño 
Existen patrones con 
presencia temporal en las 
series de precios y del 
mismo tipo de cambio y de 
otros 
 
3 ¿Cuál sería el desempeño 
del modelo y si este pudiera 
utilizar alguna técnica en 
especial para incrementarlo? 
Probar el modelo mediante un 
estudio comparativo entre las 
diferentes técnicas de la 
minería de datos el 
desempeño del modelo 
Las técnicas de la minería 
de datos han mostrado 
resultados sobresalientes 
para diversas tareas de 
reconocimiento en distintas 
áreas 
 
Tabla a. Matriz de congruencia 
 
Resumen capitular 
 
El trabajo se encuentra organizado de la siguiente manera; en el presente capítulo, 
titulado Metodología d e l a i nvestigación, s e des cribe el obj etivo de l a t esis, l as 
motivaciones que impulsan a su realización y las contribuciones. En el capítulo 2, titulado 
Marco teórico, se describen algunos conceptos relacionados al t ipo de cambio junto con 
algunos de l os trabajos m ás i mportantes r elacionados c on l as di ferentes pr opuestas 
realizadas par a es timar o p redecir l os pr ecios del t ipo de c ambio pes o-dólar, se 
mencionan l as técnicas de c lasificación, utilizadas en l a par te de di squisiciones 
experimentales, así como de los esquemas de evaluación comúnmente usados para 
medir el desempeño. El desarrollo principal del modelo propuesto y su demostración se 
brindan en el capítulo 3 , para posteriormente mostrar los experimentos realizados en el 
capítulo 4, que llevan a las conclusiones expuestas, que se describen en el capítulo 5. 
 
7 
 
 
 
 
Capítulo 1 
 
Marco teórico 
 
Mucho se habla sobre la predicción de series de tiempo financieras y esto puede ser 
corroborado con la cantidad de t rabajos de i nvestigación existentes en l a l iteratura. Y no 
es de extrañarse, como se ha mencionado, que los beneficios producto de una predicción 
de l os pr ecios futuros de cualquier ac tivo f inanciero, r esultan un gran campo y ár ea de 
oportunidad par a t odo i nvestigador c on c onocimientos de t emas c uantitativos par a el 
análisis de dat os. Esto sumado al poder de cómputo dado po r la tecnología hoy en d ía 
permite la automatización de las técnicas de estimación haciendo cada vez más factible 
su aprovechamiento. 
 
Si b ien, el fuerte en el ár ea financiera y ec onómica ha s ido el m odelado de s eries de 
tiempo utilizando lo establecido por (Box & Jenkins, 1978), este desprecia la presencia de 
no linealidad en los datos. Es aquí donde diversas técnicas y metodologías para el 
análisis y c lasificación de información del área de m inería de datos son integradas cada 
vez con mayor énfasis teniendo la oportunidad para dar nuevas soluciones y propuestas. 
 
A continuación se describen algunos de los conceptos a considerar para el desarrollo del 
tema y pos teriormente, en el m ismo c apítulo, s e presentan al gunos de l os t rabajos d e 
investigación existentes en l a l iteratura con e studios r elacionados a la es timación y 
pronóstico de precios del tipo de cambio peso-dólar y los problemas relacionados con su 
determinación. 
 
1.1 Teoría del Mercado Eficiente 
 
La T eoría del Mercado Eficiente (TME) es uno de l os t érminos bás icos de l as f inanzas 
corporativas y una de las teorías más utilizadas para estudiar el comportamiento de los 
precios de l os m ercados f inancieros. T iene su or igen en l a t eoría de l paseo aleatorio y 
parte de que las cotizaciones bursátiles son totalmente impredecibles; de modo que 
cualquier i ntento de es timación futura es tá de stinado al fracaso (Gutierrez Fer nández, 
2016). 
 
La TME postula, de manera general, que los inversores, como personas racionales que 
son, valoran todos sus activos y títulos por su valor intrínseco u objetivo, en el sentido del 
CAPÍTULO 2. Marcoteórico 
 
 
8 
 
precio de equilibrio. Sobre esta base, dicho valor intrínseco se verá modificado por la 
nueva i nformación que l legue al mercado, que, por de finición, será i mpredecible 
(Gutierrez Fernández, 2016). 
 
1.1.1 Antecedentes 
 
Cuestionamientos preliminares sobre el comportamiento de los mercados en cuanto a l a 
evolución de d istintas variables económicas y la capacidad de ant icipar los ciclos alcistas 
y baj istas son i ntroducidos en (Kendall, 1953) . En es te t rabajo se es tudian pat rones de 
comportamiento de las acciones con la premisa inicial de que los precios de estas, para 
una determinada empresa, deben reflejar las perspectivas de beneficios, el impacto de los 
ciclos ec onómicos y t oda aq uella i nformación q ue pudi era s er r elevante par a di cha 
empresa. El autor concluye que los precios parecen seguir un cierto patrón aleatorio, que 
suben y bajan sin tener en cuenta ninguna pauta previa. De ahí que, no sean predecibles. 
Establece t ambién l a di ferencia entre aleatorio e i rracional y q ue el c omportamiento 
aparente de los precios de las acciones significa que el mercado es eficiente, por lo tanto 
que funciona c orrectamente. Y , por el c ontrario, que el m ercado sea i rracional s ignifica 
que el mercado no es eficiente (Brun & Moreno, 2008). 
 
La situación en la que los precios de una acción son consecuencia de toda la información 
existente en el mercado se encuentra en la hipótesis de mercados eficientes (Fama, 
1970). Donde se plantea que los precios de un i nstrumento financiero reflajan ya toda la 
información disponible y relevante, lo que no permitiría obtener rendimientos de manera 
consistente po r enc ima del pr omedio del m ercado. A dicionalmente, reconsidera y 
defiende el entendimiento de l os mercados eficientes en función de di stintos aspectos, 
propuesto previamente en (Roberts, 1967) y que desprende tres niveles de e ficiencia del 
mercado en función del nivel de información disponible y su impacto en las cotizaciones. 
 
1.1.2 Niveles de eficiencia 
Hipótesis débil 
 
Los pr ecios i ncorporan l a i nformación q ue s e der iva de la e volución hi stórica de l as 
cotizaciones y volúmenes de ne gociación. P or lo t anto, anal izando l as paut as s eguidas 
por las cotizaciones en el pasado, no se puede adivinar ninguna regla que permita 
obtener beneficios extraordinarios (Brun & Moreno, 2008). 
 
Esta hipótesis implica que las series históricas de las acciones son públicas y no tienen 
costo. Por lo t anto, t odos los inversores tendrán los m ismos datos. S i los anal istas han 
aprendido a det ectar c omportamientos futuros de l as ac ciones es tudiando l as s eries 
históricas, en tonces cualquier s igno que det ermine un c omportamiento s erá 
inmediatamente detectado, y el precio de la acción aumentará o disminuirá 
CAPÍTULO 2. Marco teórico 
 
 
9 
 
automáticamente puesto que todos los participantes del mercado habrán explotado dichas 
señales ajustando así su valor. 
 
Hipótesis semi-fuerte 
 
Los precios incorporan toda la información pública disponible. Es decir, los precios no 
incluyen sólo la información pasada (la que hace referencia a los volúmenes y precios) 
sino también la información actual pública, como los resultados obtenidos, los dividendos 
a pagar, en resumen, la referente a sus fundamentales económicos (crecimiento en 
resultados, situación financiera, situación competitiva, etc.). Este es el concepto cercano 
al utilizado pro el análisis fundamental (Brun & Moreno, 2008). 
 
Hipótesis fuerte 
 
Los precios incorporan toda la información referente a una empresa, incluso la no pública 
o privilegiada. Esta hipótesis va más allá de las demás y asume que existen inversores 
que utilizan información privada de su empresa para obtener un beneficio propio adicional 
(Brun & Moreno, 2008) (Figura 1.1). 
 
Entonces, un m ercado es eficiente debido a la competencia entre los distintos 
participantes del m arcado que, guiados por el principio de maximización del beneficio, 
buscaran oportunidades de arbitraje en los mercados, lo que conducirá a una situación de 
equilibrio en la que los precios de las acciones en el mercado es la mejor referencia de su 
valor intrínseco. 
 
Figura 1.1. Niveles de eficiencia de los mercados. 
 
 
 
Fuente (Brun & Moreno, 2008, pág. 14). 
 
 
Hipótesis 
fuerte 
Hipótesis 
semi-fuerte 
Hipótesis 
débil 
CAPÍTULO 2. Marco teórico 
 
 
10 
 
1.2 Tipo de cambio 
 
En un m undo donde l os países se v inculan cada v ez m ás a t ravés del comercio y l as 
finanzas, el c omercio ex terior puede t ener una g ran i nfluencia s obre l a pr oducción y el 
empleo nac ional. E l c omercio i nternacional de bi enes y s ervicios per mite a l os paí ses 
elevar s u ni vel de v ida, es pecializándose en ár eas de v entajas c omparativas en l a 
producción; exportar bienes y servicios en los que son relativamente eficientes, e importar 
aquellos en l os que son relativamente ineficientes. El comercio internacional se realiza a 
través de distintas divisas, en este sentido el sistema financiero internacional desempeña 
un papel i mportante, y a q ue facilita el i ntercambio por c ompra y v enta de bi enes en 
dólares, eu ros y ot ras divisas, y el i ntercambio de una m oneda por otra (Kozikowski, 
2013). 
 
El comercio internacional implica usar distintas monedas nacionales. El tipo de cambio es 
el precio de una m oneda en t érminos de ot ra moneda. Se determina en el mercado de 
cambio de di visas, q ue es el m ercado d onde s e c ompran y v enden l as di ferentes 
monedas. E l eq uilibrio de of erta y demanda de divisas determina el t ipo de c ambio de 
una moneda (Kozikowski, 2013). 
 
En el c orto pl azo, l os t ipos de c ambio det erminados por el m ercado s on m uy volátiles, 
como r espuesta a l a pol ítica m onetaria, l os ev entos pol íticos y l os c ambios de 
expectativas. Sin embargo, en el largo plazo, los tipos de cambio son determinados por 
los precios relativos de los bienes en distintos países, lo cual se sintetiza en la teoría de la 
paridad de pode r de compra (PPC) sobre los tipos de cambio. Según esta teoría, el t ipo 
de cambio de un paí s tiende a i gual el costo de compra de esos bienes en el extranjero. 
Las barreras comerciales, los costos de transporte y la presencia de servicios no 
comerciados permiten que los precios difieran en forma importante de un país a otro. 
Además, los flujos financieros pueden superar mucho a los flujos comerciales, en el corto 
plazo. Así que, mientras que la teoría PPC es una guía útil para los tipos de cambio en el 
largo plazo, los tipos de cambio pueden di ferir respecto de su nivel PPC durante muchos 
años (Samuelson & Nordhaus, 2009). 
 
1.2.1 Régimen 
 
El r égimen de t ipo de cambio fijo es uno de l os fundamentos del s istema monetario: el 
otro régimen es el de los tipos de cambio flexibles. Un importante sistema de tipo de 
cambio es el de l os t ipos de c ambio flotantes, cuando el t ipo de c ambio internacional de 
un país se determina por las fuerzas de mercado de oferta y demanda, en ese sistema, el 
gobierno ni anunc ia un t ipo de c ambio ni em prende m edidas pa ra i mponer uno. Otro 
término que s e us a c on frecuencia es tipos d e cambios flotantes, que q uiere dec ir l o 
mismo (Kozikowski, 2013) (Stiglitz & Walsh, 2005). 
 
CAPÍTULO 2. Marco teórico 
 
 
11 
 
Entre l os dos ex tremos del s istema r ígidamente f ijo y el c ompletamente f lexible es tá el 
intermedio de l os tipos de c ambio c ontrolado. En es te c aso, l os tipos de c ambio s on 
determinados bás icamente por l as fuerzas del m ercado, per o l os gobiernos c ompran o 
venden di visas, o c ambian s us o fertas m onetarias par a a fectar s us tipos de c ambio. A 
veces, l os gobiernos v an c ontra el v iento de l os m ercados privados. Otras v eces, l os 
gobiernos al canzan ‘ zonas des eadas’ q ue guían s us ac ciones pol íticas. E ste s istema 
gradualmentepierde importancia a medida que los países g ravitan cada vez más hac ia 
los sistemas de tipo de cambio fijo o flexible (Krugman & Obstfeld). 
 
1.2.2 Antecedentes 
 
Los paí ses s iguen r eglas di stintas en l o que respecta a l os r egímenes c ambiarios y el 
grado de ape rtura. En un entorno de l iberalización y desregularización, el mercado es el 
que de fine l as r eglas del j uego e i mpone l a disciplina. La c aracterística pr incipal de l os 
mercados financieros internacionales en l a actualidad es una al ta volatilidad de t odas las 
variables económicas, en par ticular de l os t ipos de cambio. El pronóstico de l os t ipos de 
cambio futuros es prácticamente imposible, por lo que surge la necesidad de ad ministrar 
el riesgo cambiario (Kozikowski, 2013) (Taylor & Taylor, 2004). 
 
La v olatilidad de l os tipos de c ambio s e debe a l as m odificaciones c onstantes de l as 
variables económicas, el progreso tecnológico y la liberación financiera. Suben o bajan los 
precios relativos de los productos básicos como el petróleo, el cobre, los productos 
agropecuarios; se transforma el poder relativo de di ferentes países y se forman nuevos 
bloques regionales. Las telecomunicaciones modernas reducen los costos de transacción 
y f acilitan l os m ovimientos i nternacionales de c apital. La di sponibilidad i nmediata de 
abundante i nformación cambia l a tendencia de l os m ercados en c uestión de minutos 
(Toribio, 2012) (Samuelson & Nordhaus, 2009). 
 
Una di visa es l a m oneda de ot ro paí s, s iempre y c uando s ea l ibremente c onvertible a 
otras monedas en el mercado cambiario. Después del derrumbe comunista, la mayoría de 
los pa íses t ienen m onedas convertibles. Algunas excepciones: Cuba y corea del norte 
(Kozikowski, 2013). 
 
La convertibilidad de las monedas es muy importante para el comercio internacional para 
la eficiencia económica. Sin ella, el comercio se limita a un simple trueque de mercancías. 
Y si, en este contexto, los precios internos se hallan totalmente divorciados de los precios 
internacionales, el cálculo de rentabilidad de los proyectos resulta imposible. Cuando se 
derrumbó el sistema comunista unas de las tareas prioritarias de los nuevos gobiernos fue 
reestablecer la plena convertibilidad de las monedas internacionales (Camarero, 1994). 
 
La manera más común de cotizar el tipo de cambio es la cantidad de la moneda nacional 
necesaria par a c omprar ot ra: generalmente, dól ares. C omo s e ha di cho, ex iste en la 
literatura gran c antidad de i nvestigaciones s obre m odelos que i ntentan m ostrar l a 
CAPÍTULO 2. Marco teórico 
 
 
12 
 
dependencia del tipo de cambio con ciertas variables económicas-financieras, domésticas 
y e xtranjeras, m uchas de el las bas adas en el I PC o el P IB, m ostrando r esultados m uy 
alentadores (Navarro C hávez, R odríguez C hávez, & Zamora T orres, 2011) (Morales 
Castro, 2009) , y q ue s i bi en, han podi do m ostrar que en c iertos per iodos el m odelo 
planteado es de gran r elevancia no s e ha t rabajado s obre l a noc ión de que ex iste una 
relación importante entre los mercados de distintos países, tal que los tipos de cambio de 
una moneda en términos de ot ra puedan es tablecer el comportamiento de una de es tas, 
siendo q ue en un mundo g lobalizado puede ex istir r elación ent re di stintas ec onomías 
(Kindleberger, Aliber, & Solow, 2005) (Reinhart & Rogoff, 2011) (Toribio, 2012). 
 
1.3 Pronóstico del tipo de cambio 
 
La r evisión de l os es tudios em píricos s obre l a det erminación de l os tipos de c ambio 
presentan conclusiones encontradas, (Torre Cepeda & Provorova Panteleyeva, 2007) 
para México en un per iodo de 1995-2008, concluye que existen relaciones de causalidad 
entre el tipo de cambio peso mexicano-dólar estadounidense, y una serie de variables (el 
diferencial de tasas de interés, el diferencial de ingreso, el diferencial de tasas de inflación 
y el diferencial de of ertas monetarias) del modelo monetario del enfoque del mercado de 
activos, lo cual interpreta como consistente con las implicaciones del enfoque del mercado 
de activos para la determinación de la paridad. 
 
En (Morales C astro, 20 09) se establece que conocer l a forma en que l as v ariables 
económico-financieras y el tipo de cambio están relacionados es de suma importancia en 
la actualidad, especialmente porque las interrelaciones son cruciales en la t ransmisión o 
propagación de las crisis financieras, y el objetivo central de su investigación, consistió en 
estudiar empíricamente la relación entre el tipo de cambio y cinco variables económico-
financieras: precio del petróleo, oferta monetaria, brecha del producto, inflación, y tasa de 
interés. Se construyó y estimó un modelo de vectores autorregresivos capaz de des cribir 
a corto plazo el comportamiento y la interrelación entre las variables y el tipo de c ambio, 
para la economía mexicana en el periodo 1999-2007; asimismo, se realizó un análisis de 
impulso-respuesta y de descomposición estructural de la varianza. Los autores concluyen 
que existe evidencia, al menos empírica, que las variables inciden en el tipo de cambio, y 
están relacionadas di námicamente a t ravés del t iempo. C on el anál isis de i mpulso-
respuesta y des composición es tructural de l a v arianza, s e i dentificó l os i mpactos y 
reacciones del t ipo de c ambio a l as pe rturbaciones de l as v ariables; éstos a nálisis 
sugirieron que la brecha del producto explica en menor cuantía el comportamiento del tipo 
de cambio; y, la inflación, la tasa de interés, el precio del petróleo, y la oferta monetaria, 
lo hacen en mayor cuantía, para el periodo analizado. 
 
Por ot ra par te, y hac iendo r eferencia a l a hi pótesis de l a ef iciencia del m ercado en s u 
forma débil implica que el análisis técnico no pu ede producir rendimientos anormales, es 
decir, no puede generar una estrategia para ganarle sistemáticamente al mercado. E n 
(Quintanilla-García & Z althen, 2011) se p resenta un c aso que c ontradice l a hi pótesis 
CAPÍTULO 2. Marco teórico 
 
 
13 
 
introducida por (Fama, 1970) donde s e m enciona q ue el anál isis t écnico no es tá 
subordinado al anál isis fundamental, es dec ir, que un i nversionista no puede es perar 
poder obt ener ganancias t ratando de ant icipar o pr onosticar el p recio futuro de al gún 
activo f inanciero dado que s i se pud iera también podr ían ser ant icipados por ot ros y el 
precio ent onces r eflejaría e l c omportamiento d e m anera i nmediata ha ciendo q ue no 
pudieran t omar v entaja. Se anal iza l a c onducta de l os pr ecios del 9 d e ener o de 200 8 
argumentando q ue estos se an ticipan a l os fundamentales con r elación a una no ticia 
negativa par a el m ercado es tadounidense q ue, c omo s e m enciona, e n v ez de hac er 
débiles a l os pr ecios estos se v en fortalecidos i ndicando s eñales de c ompra, des de l a 
perspectiva de un inversionista. La divisa considerada es el marco_suizo-dólar, y se 
utilizan cuatro indicadores t écnicos para i dentificar l as s eñales de c ompra supuestas: 
estocástico, índice de fuerza relativa, bandas de Bollinger y media móvil. Sin embargo, el 
estudio no muestra datos cuantitativos ni se basa en algún modelo de análisis estadístico 
para soportar sus conclusiones. 
 
En (Villar Corona, 2013) se analiza el tipo de cambio peso-dólar como una serie temporal 
evaluando la m etodología B ox-Jenkins y obt eniendo un m odelo A RIMA par a s er 
contrastado c ontra r edes neur onales artificiales. Los pr ecios ut ilizados s on di arios y 
corresponden al periodo de en ero del 2000 a diciembre de 2013 . El estudio comparativo 
fue realizado tanto para datos univariados, los precios históricos del tipo de cambio peso-
dólar, c omo m ultivariados, donde s e ex ploró l a ut ilidad de di versas v ariables q ue v an 
desde ot ras di visas, bonos del m ercado mexicano has ta bonos de t esoro del m ercado 
estadounidense y dat os de r eservas i nternacionales.Los r esultados m uestran que l as 
redes neuronales consiguen obtener el mejor ajuste de los datos, sin embargo, resaltan el 
hecho de que l os r esultados dados po r el modelo m ultivariado pr esentan mejores 
características para pronosticar el tipo de cambio siendo superior al del modelo univariado 
para el periodo tratado. 
 
Otras investigaciones han explorado técnicas alternativas de modelos asociativos que han 
mostrado tener resultados sobresalientes en tareas de predicción y clasificación (Chávez-
Sánchez, 2012). En (Jurado-Sánchez, Yáñez-Márquez, Camacho-Nieto, & López Yáñez, 
2014) utilizan el clasificador Gamma como predictor para analizar los tipos de cambio 
peso-dólar, yen-dólar, dólar-libra. E l es tudio r ealizado s e enf oca en ana lizar l a s erie de 
tiempo de c ada tipo de c ambio, por separado, utilizando la metodología Box-Jenkins. Se 
emplean los precios diarios, para el tipo de c ambio peso-dólar y yen-dólar, y mensuales, 
para el tipo de c ambio dólar-libra, correspondientes a l os periodos del 1 de diciembre de 
2010 al 20 de di ciembre de 2013, del 4 de ener o de 2010 al 31 de febrero de 2012 y 
finalmente del 1 de en ero de 1971 al 1 de n oviembre de 2013, r espectivamente. Lo s 
resultados son contrastados con modelos de di ferentes técnicas: un modelo ARIMA, con 
regresión l ineal, redes neuronales, entre otros, y son contundentes al mostrar la 
importancia del clasificador Gamma según los errores obtenidos, donde éste consigue 
estar dentro de las 4 pr imeras posiciones con menor grado con relación al resto de l as 
técnicas evaluadas. 
 
CAPÍTULO 2. Marco teórico 
 
 
14 
 
Resultados preliminares del presente trabajo fueron tratados en (Chávez Sánchez & 
Morales Castro, El tipo de cambio peso-dólar: Propuesta de un m odelo de determinación 
basado en el t ipo de c ambio eur o/dólar y eur o/peso, 2015 ). Muestran un m odelo de 
predicción del tipo de cambio utilizando los precios diarios al cierre de los tipos de cambio 
euro-dólar y euro-peso, para el periodo comprendido del 1 de enero de 2011 al 30 de julio 
de 2011. Las variables analizadas son validadas a través de la valuación de parámetros y 
de apl icación de pruebas es tadísticas que soportan su utilización. Se concluye q ue el 
modelo propuesto tiene las propiedades estadísticas suficientes para poder pronosticar el 
precio del tipo de cambio peso-dólar. Posteriormente los mismos autores presentan una 
variación del modelo en (Chávez Sánchez & Morales Castro, Modelo de pr edicción de l a 
tendencia del t ipo de c ambio peso-dólar mediante ot ras divisas ut ilizando algoritmos de 
clasificación de m inería de dat os, 2015) donde s e am plía el vector de v ariables y s e 
prueba el modelo con técnicas de minería de datos; esta vez para pronosticar la tendencia 
del precio del tipo de cambio peso-dólar. 
 
De manera general, los estudios presentados demuestran que las variaciones del tipo de 
cambio no r esponden a una úni ca v ariable ec onómica-financiera, exclusivamente. S in 
embargo, y sin importar el medio o técnica utilizada se ha podido observar que es posible 
identificar oportunidades de arbitraje. 
 
 
 
 
 
 
 
 
 
 
 
 
15 
 
 
 
 
Capítulo 2 
 
Herramientas y metodologías de análisis de datos 
 
 
En el pr esente capítulo s e hace r eferencia a l as metodologías clásicas para evaluar y 
analizar series de datos temporales y aquellas basadas en el reconocimiento de patrones 
cuya bas e es l a c lasificación. Las metodologías aq uí m encionadas s ervirán de 
introducción par a el c apítulo de di squisiciones donde s erán sometidas a c omparación 
para mostrar la capacidad del modelo propuesto. 
 
2.1 Series de tiempo 
 
Entre las técnicas más ampliamente utilizadas para tratar y analizar series económicas y 
financieras están las series de tiempo. En este apartado se introducen los conceptos más 
relevantes del tema y se toman en su mayoría de (Cruz & Morales Castro, 2007). 
 
Una serie de tiempo es una secuencia cronológica de observaciones de una v ariable en 
particular. En términos formales, una serie de tiempo se define como una secuencia de 
vectores, dependientes del tiempo transcurrido t: 
�̅� (𝑡) 
donde t = 0, 1, 2 , … 
 
Teóricamente, �̅� se puede ver como una función continúa de la variable en el tiempo t. Sin 
embargo, para cuestiones prácticas, el tiempo generalmente se ve en términos discretos, 
conduciendo a una instancia de �̅� en cada punto del intervalo de tiempo, normalmente de 
tamaño fijo. 
 
La motivación para realizar un análisis de serie de tiempo puede ser: 
 
- Descripción. Al tener una serie de tiempo, el primer paso en el análisis es gráficas 
los dat os pa ra obt ener m edidas descriptivas s imples de l as p ropiedades 
principales de los datos. 
 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
16 
 
- Explicación. Cuando las observaciones son tomadas sobre dos o m ás variables, 
es pos ible us ar l a variación en una s erie par a explicar l a variación en las ot ras 
series. 
 
- Predicción. Dada una serie de t iempo se intenta predecir los valores futuros de l a 
serie. Este es el objetivo más frecuente en el análisis de las series de tiempo. 
 
- Control. S i una s erie d e t iempo s e genera po r m ediciones de c alidad de un 
proceso, el objetivo del análisis puede ser el control del proceso. 
 
Una s erie de t iempo s e ex amina c on l a i ntención de des cubrir pat rones hi stóricos que 
puedan ser útiles en la predicción. Para identificar esos patrones es conveniente pensar 
que una serie de tiempo consiste de varias componentes: 
 
- Tendencia. U na s erie d e t iempo tiene t endencia c uando por per iodos l argos l os 
valores c recen o di sminuyen c onsistentemente. También pueden de finirse c omo 
cambios en la media. 
 
- Ciclos. Se refiere a m ovimientos hacia arriba o hac ia abajo alrededor del nivel de 
la t endencia. E stas fluctuaciones, medidas de pico a pi co, pueden tener un a 
duración larga. 
 
- Variaciones es tacionales. Son pa trones históricos que ocurren y se r epiten cada 
determinado t iempo, po r ej emplo, anual mente. Estas v ariaciones s on c ausadas 
típicamente por factores como el clima y las costumbres. 
 
- Fluctuaciones irregulares. Son movimientos irregulares en una serie de tiempo que 
no siguen un patrón regular, ni reconocible. Teles movimientos representan lo que 
queda en una serie de tiempo después de que la tendencia, ciclos y variaciones 
estacionales han sido explicados. 
 
Pueden obtenerse valores futuros de una serie de tiempo observada mediante una g ran 
cantidad de métodos de predicción. Estos métodos pueden clasificarse fundamentalmente 
en tres grupos: 
 
- Subjetivos. Las predicciones se hacen sobre bases subjetivas usando el criterio, la 
intuición, el c onocimiento en el ár ea y ot ra i nformación relevante. E ntre estos 
métodos se encuentran: el ajuste de una curva subjetiva, el método Delphi y las 
comparaciones tecnológicas en tiempo independiente. 
 
- Univariados. Con este tipo de métodos se valores futuros de la serie basándose en 
el análisis de sus valores pasados, se intenta conseguir un patrón en estos datos, 
se asume que este pat rón continuará en el futuro y se ex trapola par a conseguir 
predicciones. Son muchos los métodos que encajan en esta categoría, entre estos 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
17 
 
se enc uentran: E xtrapolación de c urvas de t endencia, s uavización e xponencial, 
método d e H olt-Winters y m étodo de B ox-Jenkins ( ARIMA). E ste úl timo es un 
método ampliamente utilizado. 
 
- Causales o multivariados. Involucran la identificación de ot ras variables que están 
relacionadas c on l a variable a pr edecir. U na v ez q ue es as variables han s ido 
identificadas, s e des arrolla un m odelo es tadístico que des cribe l a relación ent re 
esas v ariables y l a variable a pr onosticar. Entre estos métodos se pueden 
identificar: r egresiónmúltiple, modelos econométricos y m étodos de Box-Jenkins 
(Modelo de función de transferencia). 
 
Proceso estocástico 
 
Un proceso estocástico o aleatorio es una colección de variables aleatorias ordenadas en 
el t iempo. Si Y denota una variable aleatoria y continua, se denota como Y(t), pero si es 
discreta se expresa como Yt. 
 
Proceso estacionario 
 
Un proceso es tocástico es es tacionario s i su media y su varianza son constantes en el 
tiempo y si el valor de la covarianza entre dos periodos depende solamente de la distancia 
o rezago entre estos dos periodos de tiempo y no del tiempo en el cual se ha calculado la 
covarianza. En otras palabras, una serie de tiempo no estacionaria tendrá una media que 
varía con el tiempo o una varianza que cambia con el tiempo o ambas. 
 
Proceso puramente aleatorio 
 
Un proceso puramente aleatorio es un tipo especial de proceso estocástico que tiene una 
media igual a cero, una varianza constante σ2 y no esta serialmente correlacionada. 
 
Caminata aleatoria 
 
Es una s erie de t iempo es tocástica en l a q ue cada c ambio s ucesivo en Yt, expresado 
como ut es extraído en forma independiente de una distribución de probabilidad con media 
0 y varianza σ2. Por lo tanto, Yt está determinada por: 
 
𝑌𝑡 = 𝑌𝑡−1 + 𝑢𝑡 
 
 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
18 
 
Procesos estocásticos integrados 
 
El m odelo de c aminata al eatoria es un c aso es pecífico de una c lase más general de 
procesos estocásticos conocidos como procesos integrados. Se puede demostrar de 
manera s encilla q ue la pr imera di ferencia del m odelo de c aminata al eatoria es 
estacionaria. Si expresamos la caminata aleatoria como: 
 
(𝑌𝑡 − 𝑌𝑡−1) = ∆𝑌𝑡 = 𝑢𝑡 
 
Resulta fácil probar que mientras Yt no es estacionaria, su primera diferencia si lo es, ya 
que por definición ut tiene media constante cero y una varianza de σ2. Por tanto, se llama 
al modelo de caminata aleatoria sin variaciones proceso integrado de orden 1 y se denota 
como I(1). De manera s imilar, s i una s erie de tiempo t iene que di ferenciarse dos veces 
para hacerla estacionaria, se llamará a esa serie de tiempo integrada de orden 2 ó I(2). 
 
En consecuencia, para convertir una serie no estacionaria en estacionaria se toman 
tantas di ferencias c omo s ea nec esario, y s e di ce que el nú mero de diferencias que se 
requiere para alcanzar la estacionariedad es el orden de integración de la serie. 
 
Prueba de raíz unitaria 
 
Es una prueba para determinar la estacionariedad o no es tacionariedad de una serie de 
tiempo. Si se considera la siguiente serie: 
 
𝑌𝑡 = 𝜌𝑌𝑡−1 + 𝑢𝑡 
donde -1 ≤ ρ ≤ 1 
 
Si ρ = 1, como se demostró anteriormente, el proceso no es estacionario. De esta 
manera, s i s e r ealiza la r egresión de Yt sobre Yt-1 y s e det ermina q ue l a ρ es 
estadísticamente igual a 1, se concluiría que Yt no es estacionaria. Ahora, al diferenciar la 
serie se tiene la siguiente ecuación: 
 
𝑌𝑡 − 𝑌𝑡−1 = 𝜌𝑌𝑡−1 − 𝑌𝑡−1 + 𝑢𝑡 
 
o expresándola de otra manera: 
∆𝑌𝑡 = 𝛿𝑌𝑡−1 + 𝑢𝑡 
donde δ = ρ - 1 
 
Si δ = 0, entonces ρ = 1 y se dice que tiene una raíz unitaria, lo cual significa que la serie 
de tiempo bajo estudio no es estacionaria, pero al mismo tiempo ΔYt = ut. En 
consecuencia al tomar las primeras diferencias de la serie se obtiene una estacionaria. 
 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
19 
 
Para s aber s i δ = 0 , l a m ayoría de l os es tudios apl ican pr uebas de r aíces unitarias 
conocidas como DF o DFA (Dickey-Fuller aumentada), las cuales vienen integradas en la 
mayoría de los paquetes econométricos actuales. 
 
2.1.1 Modelos ARIMA 
 
En (Box & Jenkins, 1978) se introduce el modelo para la predicción de series de tiempo. 
Popularmente es conocida como metodología Box-Jenkins aunque técnicamente se 
conoce como metodología ARIMA, en la que se analizan las propiedades probabilísticas o 
estocásticas de l as s eries de t iempo ec onómicas baj o la f ilosofía de “permitir q ue la 
información hable por sí misma”. 
 
Proceso autorregresivo (AR) 
 
En el pr oceso autorregresivo de orden p la observación actual Yt es generada por un 
promedio ponderado de observaciones pasadas que se remontan p per iodos, junto con 
una perturbación aleatoria en el periodo actual. Se denota este proceso como AR(p) y la 
ecuación que lo describe es: 
 
𝑌𝑡 = 𝛼1𝑌𝑡−1 + 𝛼2𝑌𝑡−2 + ⋯+ 𝛼𝑝𝑌𝑡−𝑝 + 𝛿+𝑢1 
 
donde δ es un término constante que se relaciona con la media del proceso estocástico. 
 
Es interesante observar que el modelo anterior solamente considera los valores actuales y 
anteriores de Yt, no hay otros regresores. 
 
Proceso de media móvil (MA) 
 
En el pr oceso de media m óvil de or den q cada obs ervación Yt es generada por un 
promedio ponderado de perturbaciones aleatorias que se remontan q periodos. Se denota 
este proceso como MA(q) y su ecuación respectiva es: 
 
𝑌𝑡 = 𝜇 + 𝛽0𝑢𝑡 + 𝛽1𝑢𝑡−1 + 𝛽2𝑢𝑡−2 + ⋯+ 𝛽𝑞𝑌𝑡−𝑞 
donde μ = E(Yt). 
 
El modelo de media móvil supone que las perturbaciones aleatorias están distribuidas en 
forma i ndependiente a l o l argo del tiempo, es decir, s on generadas por un pr oceso de 
ruido blanco. 
 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
20 
 
Proceso autorregresivo y de media móvil (ARMA) 
 
Muchos pr ocesos al eatorios es tacionarios no pueden m odelarse c omo autorregresivos 
puros o de medias móviles puras, ya que tienen cualidades de ambos tipos de procesos. 
De esta forma, se puede concebir un modelo mixto autorregresivo de media móvil de 
orden (p, q). Se denota este proceso como ARMA (p, q) y se representa por medio de la 
ecuación: 
𝑌𝑡 = 𝛼1𝑌𝑡−1 + ⋯+ 𝛼𝑝𝑌𝑡−𝑝 + 𝛿 + 𝑢𝑡 + 𝛽1𝑢𝑡−1 + ⋯+ 𝛽𝑞𝑢𝑡−𝑞 
 
Además, las series de tiempo económicas generalmente no son estacionarias, es decir, 
son i ntegradas, r azón por l a c ual s i agr egamos el c oncepto de i ntegración ex plicado 
anteriormente, de manera que se tenga que diferenciar una serie de t iempo d veces para 
hacerla estacionaria y luego aplicar a esta el modelo ARMA(p, q) se dice que la serie de 
tiempo original es del tipo ARIMA(p, d, q), es decir, es una serie de tiempo autorregresiva 
integrada de media móvil. 
 
2.1.2 Caracterización de las series de tiempo 
 
Existen dos funciones importantes en el análisis de series de tiempo a partir de las cuales 
es posible extraer los parámetros del proceso ARMA. De acuerdo con Box y Jenkins, 
éstas s on l a función de aut ocorrelación de l a muestra y l a f unción de autocorrelación 
parcial. La apar iencia de cada una de es tas funciones da una indicación de la naturaleza 
del proceso bajo es tudio y , en teoría, la t area de identificar el modelo y de obt ener sus 
parámetros se puede llevar a cabo con base en ellas. 
 
Función de autocorrelación 
 
Dada una m uestra Y0, Y1, … , Yn-1 de n observaciones, l a f unción de aut ocorrelación 
muestral (FAC) de la muestra al rezago k, denotada por ρk, se define como: 
𝜌𝑘� �
𝛾𝑘
𝛾0
 𝑝𝑎𝑟𝑎 𝑘 = 1, … ,𝑛 − 1
1 𝑝𝑎𝑟𝑎 𝑘 = 0 
 
 
donde γ0 es la varianza de la muestra dada por: 
𝛾0 =
1
𝑛
�(𝑌𝑡 − 𝑌�)2
𝑛
𝑡=1
 
 
γk es la covarianza al rezago k definida como: 
𝛾𝑘 =
1
𝑛
�(𝑌𝑡 − 𝑌�)(𝑌𝑡+𝑘 − 𝑌�)
𝑛−𝑘
𝑡=1
 
 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
21 
 
La f unción de aut ocorrelación indica c uánta c orrelación ex iste ent re dat os individuales 
contiguos en l a s erie Yt. C onforme el v alor del retraso au menta, el núm ero d e 
observaciones comprendidas en la autocovarianza disminuye hasta el elemento final. Al 
graficar ρk frente a k, la gráfica obtenida se conoce como correlograma. 
 
Cuando se grafica ρk se debe om itir el valor ρ0 el cual es invariablemente 1. Además, al 
interpretar la gráfica se debe tener cuidado de dar demasiada importancia a correlaciones 
en valores de retrasos que están significativamente altos en relación con eltamaño de la 
muestra. 
 
Función de autocorrelación parcial 
 
La f unción de aut ocorrelación par cial ( FACP) de l a m uestra ρkk en el r etraso k es la 
correlación en tre ob servaciones ( series de tiempo) que es tán separadas k periodos de 
tiempo, manteniendo c onstantes l as c orrelaciones en l os r ezagos i ntermedios (es dec ir 
rezagos menores de k). En otras palabras, la autocorrelación parcial es la correlación 
entre Yt y Yt-k después de eliminar el efecto de l as Y intermedias. En la tabla 2.1 se dan 
algunos l ineamientos generales ac erca de l os pat rones típicos de las f unciones d e 
correlaciones muestral y parcial. 
 
Tabla 2.1 Patrones teóricos de FAC y FACP. 
 
Modelo Patrón típico de FAC Patrón típico de FACP 
AR(p) Disminuye 
exponencialmente o con un 
patrón sinusoidal 
decreciente o ambos 
Picos grandes a lo largo de 
los p rezagos 
MA(q) Picos grandes a lo largo de 
los q rezagos 
Decrece exponencialmente 
ARMA(p, q) Decrece exponencialmente Decrece exponencialmente 
 
Fuente (Gujarati, 2004. 4ta Edición) 
 
2.1.3 Propiedades de las series de tiempo financieras 
 
La predicción de series de tiempo financieras es una tarea altamente complicada debido a 
las siguientes razones: 
 
- Las series de tiempo financieras se comportan casi como un proceso de caminata 
aleatoria, impidiendo desde un punto de vista teórico la predicción. La predicción 
de las series de tiempo más comunes (precios de acciones, niveles de índices) es 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
22 
 
un tema controversial y ha sido cuestionado en función de la hipótesis de 
mercados eficientes. 
 
- Las series de tiempo financieras están sujetas al cambio en el tiempo, por ejemplo, 
las pr opiedades es tadísticas de l as s eries de tiempo s on di ferentes en di stintos 
puntos del tiempo (el proceso de variación en tiempo. 
 
- Las s eries de tiempo financieras s on generalmente m uy r uidosas, ya que existe 
una gran cantidad de aleatoriedad (impredecible) en las variaciones día a día. 
 
- En el largo plazo, una nueva técnica de predicción llega ser parte del proceso a 
ser predicho, por ejemplo, se influencia el proceso en predicción. 
 
2.2 Modelos de clasificación 
 
Los m odelos es tadísticos c uentan c on c iertas hi pótesis de di stribución q ue l os da tos 
financieros difícilmente cumplen. De ahí que algunas técnicas no paramétricas han sido 
desarrolladas par a s obre l levar l as r estricciones de m odelos es tadísticos t radicionales. 
Muchas de es tas técnicas pertenecen al dominio de l a minería de dat os. Investigaciones 
en las últimas décadas han sido dedicadas al estudio y comparación entre estos métodos 
y los clásicos del área financiera. 
 
A continuación se describen las técnicas de c lasificación y predicción correspondientes a 
algunos de los enfoques y técnicas comúnmente utilizadas en el campo del 
reconocimiento de patrones y de representación de información. Las distintas técnicas 
aquí mostradas servirán de referencia dado que son con las que se soportará la 
factibilidad del m odelo pr opuesto. Los ex tractos des criptivos de l as m etodologías 
mencionadas son tomados de (Chávez-Sánchez, 2012). 
 
2.2.1 Vecindades 
 
El vecino más cercano o, de s us siglas en inglés, NN (nearest neighbour), es un método 
originado en estadística. I nicialmente c onsiderado par a l a pr oducción de r eglas, es 
propuesto en (Fix & H odges, 1952 ) donde s e m uestra un anál isis p reliminar de l as 
propiedades de los sistemas de k vecinos más cercanos y se establece la consistencia del 
método pa ra l as v ariaciones de k desde 1 hasta ∞. E n di cho es tudio s e ev alúa 
numéricamente el desempeño de l os k vecinos m ás cercanos para pequeñas muestras 
bajo c riterios estadísticos de di stribución nor mal. P osteriormente es pr opuesto c omo 
clasificador de pa trones en (Aha & Kibler, 199 1) y s ometido a anál isis en t areas de 
clasificación y predicción (Desarathy, 1990). 
 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
23 
 
Los métodos basados en NN ut ilizan una m étrica que mide la distancia ent re un nuev o 
elemento y el c onjunto de el ementos al macenados. E l nuev o el emento es c lasificado 
según el tipo de su vecino más cercano. Un método basado en NN puro almacena todos 
los el ementos en memoria de forma l iteral. É ste c lasifica l os nu evos el ementos 
localizando el elemento más semejante, de entre los almacenados, para posteriormente 
asignar su clase. Una función de distancia es usada para determinar dicha similitud. Para 
atributos numéricos, se utiliza comúnmente la distancia Euclidiana, donde cada elemento 
es tratado como un pun to en un es pacio característico de n di mensiones. Se asume que 
para un punto dado en dicho espacio característico el área alrededor compartirá la misma 
clase. A demás, l a di stancia E uclidiana as ume que todas l as características s on 
igualmente importantes, así que comparten la misma escala en el espacio característico, y 
dicha escala es lineal a lo largo de cada eje (Aha & Kibler, 1991). 
 
Los métodos basados en NN tomaron popularidad después que en (Duda, Hart, & Stork, 
2001) (Aha, 1992) se mostrara que los más simples modelos del método podían producir 
excelentes resultados para una variedad de dominios. En dicha investigación se introduce 
el método IB1 como parte de una familia de algoritmos creados bajo distintos criterios de 
procesado de las muestras con el objetivo de corregir o minimizar algunas desventajas, 
las cuales están inherentes en el método original de NN, tales como: 
 
- Alto costo de almacenamiento 
- Sensibles a la función de similitud 
- Sin criterios para el manejo de atributos faltantes 
- Dificultad para trabajar con atributos nominales 
- Sin generación de resumen de conceptos 
 
Entre las principales características del algoritmo IB1 está la utilización de la función de 
distancia Euclidiana y que cada muestra nueva se clasifica de acuerdo con su vecino más 
cercano bajo esta función y se incorpora al resto de los elementos en el conjunto de datos 
conforme es tas se van i ntroduciendo. La úni ca variación r especto al algoritmo NN puro 
yace en la normalización lineal de los valores de los atributos, previo al procesado de las 
muestras, y en el manejo de los atributos faltantes, los cuales se asume que tienen los 
valores m áximos de di ferencia par a t al c aracterística en t odas las ot ras m uestras. E n 
general, se menciona que el desempeño de este modelo es muy bueno, pero al igual que 
con el al goritmo N N or iginal pr esenta p roblemas c uando s e t rabaja c on m uestras c on 
ruido, con atributos ausentes o con caracterizadores irrelevantes. 
 
2.2.2 Probabilísticos 
 
El algoritmo de Naïve Bayes fue introducido en (Duda, Hart, & Stork, 2001) para su uso en 
el área del reconocimiento de pat rones. Este método es un m odelo probabilístico el cual 
emplea c omo bas e pr incipal el t eorema de B ayes, y es uno de l os más am pliamente 
utilizados (Hand & Yu, 2001). 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
24 
 
 
Este método asume independencia condicional entre las clases, esto es, el efecto de un 
valor de at ributo s obre una c lase dada es i ndependiente de l os v alores de l os ot ros 
atributos. Esta suposición es hecha para reducir el costo computacional, de ahí su nombre 
naïve. El objetivo de este método es el de clasificar una nueva instancia X maximizando la 
probabilidad P(Xi|Ci)P(Ci), donde i es el índice de la clase y π el producto de todas las 
probabilidades. 
( ) ( )∏
=
=
n
k
iki CXPCXP
1
|| 
 
En general, dados un conjunto de tuplas de datos desconocidas, donde cada tupla está 
representada por un vector de n dimensiones, X=(x1, x2, …, xn) con n mediciones hechas 
sobre la tupla de n atributos, respectivamente, A1, A2, …, An; y m clases, C1, C2, …, Cm. 
Utilizando el t eorema d e B ayes, el c lasificador N aïve Bayes calcula l a pr obabilidad a 
posteriori de c ada c lase c ondicionada s obre el elemento desconocido X. D e ahí q ue e l 
elemento desconocido X sea asignado la etiqueta de la clase con la máxima probabilidad 
a pos teriori condicionada sobre X. Por lo t anto, el objetivo es maximizar la probabilidad 
P(Cij|X) = P( Xj|Ci)P(Ci) = P(X). D e c ualquier forma, y dado q ue l a pr obabilidad P(X) es 
constante pa ra t odas l as c lases, s olo l a pr obabilidad P(Xj|Ci)P(Ci) requiere s er 
maximizado. Si las probabilidades de clase previas no son conocidas entonces se asume 
comúnmente que las clases son igualmente probables, P(C1) = P(C2)= …= P(Cm), por lo 
que s e debe ría m aximizar P(Xj|Ci). D e l o c ontrario s e maximiza P(Xj|Ci)P(Ci). L as 
probabilidades pr evias de c lase pueden s er es timadas por P(Ci) = si/s, donde si es el 
número de tuplas de entrenamiento de c lase Ci, y s es el nú mero de t uplas d e 
entrenamiento. 
 
Para reducir cálculos al evaluar P(Xj|Ci), la suposición de la independencia condicional de 
clase, es considerada. Así, se supone que los valores de los atributos son 
condicionalmente independientes unos de o tros, dada la etiqueta de l a clase asociada al 
vector, por ejemplo, que no hay relación de dependencia entre los atributos. 
 
Este método se caracteriza por su alta exactitud y desempeño en comparación con otros 
métodos de c lasificación. En (Domingos & Pazzani, 1997) se muestran los resultados de 
una c omparación ex haustiva del m étodo N aïve B ayes c on al goritmos de ár boles d e 
decisión, bas ados en i nstancias ( IB), y de r eglas s obre c onjuntos de datos es tándar. 
Donde se muestra el gran desempeño de este método incluso sobre conjuntos de datos 
con sustancial dependencia de atributos. 
 
La importancia de este clasificador radica en su base bayesiana y sobre la cual en (Duda, 
Hart, & S tork, 2001, pág. 17) , se a firma l o s iguiente: “Empezamos [con l a T eoría de l a 
Decisión B ayesiana] c onsiderando el c aso i deal en e l c ual l a es tructura es tadística 
inherente a las categorías es perfectamente conocida. Mientras que este tipo de situación 
raramente se presenta en la práctica, [esta teoría] nos permite determinar el c lasificador 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
25 
 
óptimo (Bayesiano) contra el cual podemos comparar a todos los demás clasificadores…” 
(Chávez-Sánchez, 2012). 
 
2.2.3 Meta clasificadores 
 
Desarrollos en l a t eoría de aprendizaje de m áquina ( machine l earning) han g uiado a 
métodos para mejorar el des empeño o extender las capacidades de los esquemas de 
aprendizaje básicos. Este tipo de mejoras de desempeño son conocidos como esquemas 
de meta clasificación o meta aprendizaje, y es que estos esquemas operan a par tir de la 
salida de la ejecución repetida de algún método de clasificación tomado como base 
(Witten & Eibe, 2000). 
 
El método bootstrap aggregating, o, de su acrónimo, bagging, es un método de predicción 
perteneciente a l os m eta c lasificadores y c uyo pr incipal f uncionamiento c onsiste e n 
generar múltiples versiones de un mismo clasificador, comúnmente arboles de decisión, 
tal q ue utiliza estas versiones para obtener un clasificador compuesto, mejorado. Este 
clasificador obtenido promedia los resultados de todas las versiones cuando se trata de 
predecir un valor numérico y somete a votación general para clasificar cuando se trata de 
un el emento. Las v ersiones m últiples s on f ormadas hac iendo réplicas del c onjunto de 
aprendizaje mediante bootstrap y las utiliza como nuevos conjuntos de aprendizaje. 
 
Bagging es uno de los más populares y efectivos métodos de aprendizaje compuesto 
(Breiman, 1992). La t écnica se basa en l a reducción de v arianza, cuyo pr incipal objetivo 
es l a c orrección de l a inestabilidad pr ovocada por l a i ncertidumbre d e es timación de 
parámetros, y del modelo mismo, utilizado en el método, de ahí que sean utilizados sobre 
métodos de clasificación inestables y de alta varianza. Se dice que un clasificador es 
inestable s i un peq ueño c ambio en el c onjunto de apr endizaje i mplica c ambios 
significativos en el clasificador. 
 
Diversas t eorías han s ido pr opuestas sobre l a e fectividad del m étodo b agging p ara 
clasificación bas ada en la des composición del s esgo y de l a v arianza (Opitz & M aclin, 
1999). A simismo, r esultados de pr uebas s obre c onjuntos de dat os r eales y s imulados 
usando ár boles de c lasificación y de r egresión, así como selección de subconjuntos en 
regresión lineal, han mostrado que bagging puede dar ganancias substanciales en 
exactitud, donde el elemento v ital es l a i nestabilidad del m étodo (Guohua, X ingquan, & 
Chengqi, 2007). Además, de indicarse que también reduce la porción de sesgo del error. 
Dado que bagging es una técnica de r educción de varianza y tiende a t rabajar bien para 
métodos con alta varianza como redes neuronales y métodos basados en árboles, de ahí 
que no mejore el desempeño de métodos con baj a v arianza c omo r egresión l ineal y 
análisis de discriminantes lineales. 
 
CAPÍTULO 2. Herramientas y metodologías de análisis de datos 
 
 
26 
 
2.2.4 Tablas de decisión 
 
Las t ablas de dec isión, s on es pecificaciones de c onjuntos mutualmente di sjuntos de 
reglas de dec isión. E n apl icaciones t ípicas, l as t ablas de dec isión s on di señadas 
manualmente, basadas en el conocimiento previo de los vectores de entrada posibles y 
de las decisiones asociadas (Pawlak, 1998). En algunas áreas de aplicación, por ejemplo 
en s istemas de c ontrol c omplejos, es te tipo de c onocimiento no es tá di sponible, o aún 
peor, l a relación ent re ent radas y dec isiones no es funcional. E ste pr oblema fue 
inicialmente t ratado baj o l a i dea de t ablas de decisión en el c ontexto de l a t eoría de 
conjuntos rugosos, en el cual, los datos experimentales, más que el conocimiento 
humano, son usados como una base para la derivación o ent renamiento en una tabla de 
decisión (Marek & Pawlak, 1985). Este esquema es extendido posteriormente para hacer 
uso de información probabilística de las decisiones en la tabla de decisión, conduciendo a 
la introducción de tablas de decisión probabilística (Ziarko, 2001) en el contexto del 
modelo de c onjuntos rugosos de pr ecisión v ariable (Ziarko, 2004 ). U no de l os punt os 
clave de interés c uando s e der ivan t ablas de dec isión de l os dat os, es l a f orma d e 
aprendizaje o de construcción de la tabla. 
 
Una tabla de decisión está constituida por columnas, que son etiquetadas por los 
atributos, los renglones, conformados por los objetos de interés, y las entradas de la tabla, 
representando los valores de l os atributos. Los at ributos de la tabla de dec isión es tán 
divididos en dos g rupos di sjuntos l lamados at ributos de decisión y de c ondición 
respectivamente. D onde c ada r englón de l a t abla i nduce una r egla de decisión, l a c ual 
especifica una solución o decisión (acción, resultados, salidas, etc.) si alguna o algunas 
condiciones son satisfechas. Si una regla determina únicamente una decisión en términos 
de condiciones, se dice entonces que la regla es cierta. De otra forma la decisión es 
incierta. Las r eglas de dec isión es tán fuertemente conectadas por aproximaciones o 
derivaciones. En resumen, las reglas de dec isión ciertas describen baja aproximación de 
decisión en t érminos de condiciones, mientras que reglas de dec isión inciertas refieren a 
las regiones en la frontera de las decisiones (Venkatadri & Lokanatha, 2010). 
 
Con cada regla de decisión se asocian dos probabilidades condicionales llamadas 
coeficientes de certeza y de cobertura. El coeficiente de certeza expresa la probabilidad 
condicional de q ue un o bjeto, que pe rtenece a l a c lase de dec isión es pecificada po r l a 
regla de dec isión, s atisface di chas c ondiciones. E l c oeficiente de cobertura da l a 
probabilidad c ondicional

Continuar navegando