Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
i Universidad Nacional Autónoma de México Programa de Posgrado en Ciencias de la Administración Modelo de predicción de la tendencia del tipo de cambio peso- dólar mediante triangulación de arbitraje T e s i s Que para optar por el grado de: Maestro en Finanzas Presenta: Carlos Omar Chávez Sánchez Tutor: Dr. Arturo Morales Castro Facultad de Contaduría y Administración México, D. F., diciembre de 2015 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. ii Dedicatoria A mis padres que, a pesar del paso de los años, siempre han sido un pilar importante, y nunca me cansaré de agradecerles… A mi Valen y mi Caming porque, buscando trascender, lo he logrado de la mejor forma, sin darme cuenta. “Para que me puedas ver detener y replegar hará falta algo más que taparme los ojos” […] “Porque siempre lo creí pertinente y basta con que sea importante para mí” […] iii Agradecimientos Agradezco a m i asesor Dr. Arturo Morales Castro, quién depos itó en mí su confianza y amistad, por b rindarme su apoy o y haber me g uiado a t ravés de l a r ealización de es ta tesis. De m anera es pecial agradezco sus at enciones, todo su tiempo y g ran temperamento, s iempre dispuesto a es cuchar, y s obretodo porque pudo ver m ás al lá y creer en l a per sona; sin él es ta m eta no habr ía podi do s er c umplida: “Gracias in finitas Doc…” A mis sinodales Mtra. Rosario Higuera, Mtra. Cristina Ordoñez, Mtro. Francisco Gerardo y Dr. José Antonio Morales Castro, por sus aportaciones y tan atinados comentarios. Finalmente, agradezco a la Universidad Nacional Autónoma de México y a la Facultad de Contaduría y A dministración por stos años de f ormación q ue m e ha brindado, por permitirme v ivir esta g ran experiencia; y haber me c obijado una vez m ás dent ro de s us aulas. iv Resumen Un esquema para pronosticar la tendencia de los precios del tipo de cambio peso/dólar es propuesto. E l es quema pr etende ut ilizar l a ex istencia de arbitraje del t ipo de c ambio peso/dólar a par tir del ex istente en ot ras di visas: eur o/dólar, eu ro/peso, eur o/dólar canadiense y yen/dólar. Esta propuesta permite explorar otros medios o instrumentos de interés en la búsqueda de variables o estrategias de inversión como alternativa en el corto plazo, más allá de pr opuestas basadas en fundamentales macroeconómicos de m ediano y largo plazo. La propuesta consiste en tomar una combinación de datos de los precios de las divisas mencionadas para p ronosticar l a di rección que t omará el precio del t ipo de cambio peso/dólar. Los pr ecios ex plorados c orresponden al úl timo cuatrimestre de 2012, d e septiembre a diciembre, y consideran un periodo de 30 minutos. Se emplean distintos algoritmos de clasificación pertenecientes a la minería de datos para evaluar la propuesta los cuales son contrastados contra Redes Neuronales (RN), que han mostrado ser superiores a l os métodos tradicionales. Los resultados empíricos obtenidos validan la capacidad del modelo en términos de porcentajes de recuperación que, como se m uestra, consiguen i gualar, y en al gunos casos s uperar, a l os ob tenidos c on R N; sugieren que este puede ser utilizado como indicador para pronosticar la tendencia de los precios sobre el tipo de cambio exhibido en términos de sus rendimientos. Palabra clave: Pronóstico de rendimientos, minería de datos, tipo de cambio, exploración de r endimientos, ar bitraje ent re di visas, contagio de m ercados, em parejamiento d e valores. v Abstract A m odel t o forecast t he peso/dolar ex change r ate i s pr oposed. The model c onsists i n detecting the presence of arbitrage in peso/dolar exchange rate from that in other exchange rates: euro/dolar, euro/peso, euro/dolar canadiense y yen/dolar. This proposal allows e xploring other means o f i nterest i n the q uest for variables’ and investment strategies’ seeking f or short te rm, unless proposals bas ed on m ean and l ong t erm macroeconomic fundamentals. This proposal takes different data combinations of the exchange rate prices aim to foresee trend direction of the peso/dolar exchange rate. The explored prices span the last quarter of 2012, from September to December, with a time frame of 30 minutes. Different classification algorithms of data mining for the proposal evaluation are employed and are contrasted to Neural Networks (NN) which have shown to be superior to traditional methods. T he empirical results v alidate the capacity of t he model in t erms of recovery percentages that, as shown, are very similar, and superior in some cases, to those of NN; they suggest that this might be used as an indicator to forecast the price tendency over the described exchange rate in terms of its returns. Keywords: return forecasting, data mining, peso/dólar exchange rate, returns exploration, arbitrage among exchange rates, makets contagion, market pairing. iv Índice Dedicatoria ......................................................................................................................... ii Agradecimientos ................................................................................................................ iii Resumen ........................................................................................................................... iv Abstract ............................................................................................................................. v Índice ................................................................................................................................. iv Índice de tablas .................................................................................................................. vi Índice de figuras ................................................................................................................ vi Metodología de la investigación ......................................................................................... 1 Introducción ................................................................................................................... 1 Planteamiento del problema........................................................................................... 2 Objetivos ........................................................................................................................ 3 Hipótesis ........................................................................................................................ 3 Metodología ................................................................................................................... 4 Justificación ................................................................................................................... 4 Matriz de congruencia .................................................................................................... 5 Resumen capitular ......................................................................................................... 6 Capítulo 1 ..........................................................................................................................7 Marco teórico ................................................................................................................. 7 1.1 Teoría del Mercado Eficiente ............................................................................... 7 1.1.1 Antecedentes ................................................................................................... 8 1.1.2 Niveles de eficiencia ........................................................................................ 8 1.2 Tipo de cambio .................................................................................................. 10 1.2.1 Régimen......................................................................................................... 10 1.2.2 Antecedentes ................................................................................................. 11 1.3 Pronóstico del tipo de cambio ............................................................................ 12 Capítulo 2 ........................................................................................................................ 15 Herramientas y metodologías de análisis de datos ...................................................... 15 2.1 Series de tiempo ................................................................................................ 15 2.1.1 Modelos ARIMA ............................................................................................. 19 2.1.2 Caracterización de las series de tiempo ......................................................... 20 2.1.3 Propiedades de las series de tiempo financieras ............................................ 21 2.2 Modelos de clasificación .................................................................................... 22 2.2.1 Vecindades .................................................................................................... 22 2.2.2 Probabilísticos ................................................................................................ 23 2.2.3 Meta clasificadores ........................................................................................ 25 2.2.4 Tablas de decisión ......................................................................................... 26 2.2.5 Árboles de decisión ........................................................................................ 28 2.3 Evaluación de desempeño ................................................................................. 29 v Capítulo 3 ........................................................................................................................ 32 Modelo propuesto ........................................................................................................ 32 Fuente de datos ................................................................................................. 32 3.1 Selección de variables ....................................................................................... 34 3.2 Selección de clases ........................................................................................... 35 3.3 Plataforma de ejecución .................................................................................... 38 3.4 Evaluación del modelo ....................................................................................... 39 3.5 Capítulo 4 ........................................................................................................................ 40 Resultados y discusiones ............................................................................................. 40 4.1 Procedimiento .................................................................................................... 40 4.2 Ejecución de pruebas ........................................................................................ 41 Conclusiones ................................................................................................................... 45 Referencias bibliográficas ................................................................................................ 46 vi Índice de tablas Tabla a. Matriz de congruencia .......................................................................................... 6 Tabla 2.1 Patrones teóricos de FAC y FACP. .................................................................. 21 Tabla 3.1.Variables propuestas conformadas con los precios de los tipos de cambio. ..... 35 Tabla 3.2.Clasificadores evaluados con WEKA. .............................................................. 38 Tabla 4.1. Resultados de desempeño de la recuperación de los patrones dentro de la muestra .................................................................................................................... 42 Tabla 4.2. Resultados de desempeño de la recuperación de los patrones por validación cruzada .................................................................................................................... 43 Índice de figuras Figura 1.1. Niveles de eficiencia de los mercados. ............................................................ 9 Figura 2.1.Ejemplo gráfico de una validación cruzada, con k=4. ...................................... 30 Figura 3.1. Series de datos de los tipos de cambio con precios al cierre con línea de tendencia para el periodo del 22/ago/2012 al 28/dic/2012........................................ 33 Gráfica 3.1.Gráfica de velas de 30 minutos para el tipo de cambio peso-dólar del día 28/dic/2012. ............................................................................................................. 36 Gráfica 3.2.Precios al cierre de 30 minutos del tipo de cambio peso-dólar para el día 28/dic/2012. ............................................................................................................. 36 Gráfica 3.3. Ejemplo de la partición y clasificación de los rendimientos. .......................... 37 Gráfica 4.1. Resumen de variables con ocurrencia dentro de las combinaciones analizadas ................................................................................................................ 44 1 Metodología de la investigación Introducción La predicción y pronóstico de los fenómenos que se presentan en la vida cotidiana ha sido siempre un área de gran i nterés y de oportunidad par a los investigadores, sean estos naturales, económicos, sociales, etc. (García, Jalal, Garzón, & López, 2013) (Rodríguez, Cortéz, Méndez, & Garza, 2014) (Arroyo, Espínola, & Maté, 2010). Especialmente en el sector económico y financiero donde los posibles beneficios de los mercados resultan altamente at ractivos par a s us pa rticipantes s ería pr ovechoso poder ant iciparse a l os hechos de los movimientos y tendencias de los precios de las acciones (Chávez Sánchez & Morales C astro, Modelo de pr edicción de l a tendencia del t ipo de c ambio pes o-dólar mediante otras divisas utilizando algoritmos de clasificación de minería de datos, 2015). Numerosas investigaciones han puesto su atención en la predicción de valores en las últimas décadas (Arroyo, Espínola, & Maté, 2010) (Morales Castro, 2009) (MacDonald & Taylor, 1994). Distintas alternativas y métodos para brindar predicciones mejores y más precisas han s ido pr opuestos (Cheung, C hinn, & P ascual, 2005) . Los es tudios han involucrado di ferentes enfoques y par adigmas, q ue v an des de l os c lásicos m odelos lineales, autoregresivos, promedios móviles y ARIMA (Rout, Majhi, Majhi, & Panda, 2014), otros mediante r epresentaciones de dat os multivariados c on r egresión m últiple; no lineales, m ediante técnicas t omadas del á rea de i nteligencia ar tificial c omo al goritmos genéticos (Chang, C hen, & H siao, 2014 ), r edes neur onales (Wang, L ai, Nakamori, & Wang, 2004 ) (Semaan, H arb, & K assem, 201 4), r ecientemente, m odelos as ociativos (Jurado-Sánchez, Yáñez-Márquez, C amacho-Nieto,& López Y áñez, 2 014); i ncluyendo esquemas de algoritmos híbridos utilizando el análisis de la serie de t iempo y localizando su m odelo para s u posterior ejecución empleando di stinta técnica en l a fase de recuperación, por ejemplo, las redes neuronales artificiales, han mostrado resultados importantes (Chen, Peng, & Abraham, 2006) (Chang J. F., 2011). Aunque, de manera general, los datos de análisis han sido considerados a partir de los históricos y t ratados c omo s eries de t iempo, al gunas i nvestigaciones m ás r ecientes proponen nuevos esquemas como la segmentación de datos, el uso de ventanas móviles (Ramírez & Chimal, 2012), e incluso más que enfocarse en el pronóstico de los precios adelantados de una s erie, la tendencia a partir las di ferencias entre el precio actual y alguno adel antado (Chávez S ánchez & Morales C astro, M odelo de pr edicción de l a Metodología de la investigación 2 tendencia del t ipo de c ambio peso-dólar mediante ot ras divisas ut ilizando algoritmos de clasificación de minería de datos, 2015). Planteamiento del problema El modelo que se propone en este t rabajo plantea la ut ilización de una c ombinación de variables intermercado para pronosticar el precio, específicamente la tendencia de alguna de las diferencias futuras, del tipo de cambio peso-dólar. La propuesta se basa en la idea de identificar la posibilidad de ar bitraje1 del t ipo de cambio a pa rtir de ot ras divisas. Este concepto s e enc uentra también en l a l iteratura bajo no mbres c omo em parejamiento d e valores, c ontagio de m ercados, contagio t óxico o l igado de m ercados (Toribio, 2012 ) donde t eóricamente s e hac e not ar que ex isten m ercados r elacionados di recta o inversamente y que sugieren que el desinterés (interés) público de un v alor corresponde al i nterés ( desinterés) de ot ro v alor. O , en al gunos c asos, s e habl a s implemente d e triangulación de arbitraje (Wang, Li, Liang, & Li, 2008). Asimismo, r esulta i mportante hac er not ar que son poc os l os t rabajos q ue ut ilizan algoritmos de m inería de datos para tratar el tipo de c ambio peso-dólar que, si bien, han explorado el tema, aunque de manera limitada y superficial, han mostrado que es posible el planteamiento presentado con relación a un m odelo que permita predecir la tendencia de los precios del tipo de cambio a partir de un grupo de otras divisas (Chávez Sánchez & Morales Castro, M odelo de pr edicción de la t endencia del t ipo de c ambio pes o-dólar mediante ot ras di visas utilizando algoritmos de c lasificación de m inería de dat os, 2015) (Chávez Sánchez & Morales Castro, El tipo de cambio peso-dólar: Propuesta de un modelo de de terminación bas ado en el t ipo de c ambio eu ro/dólar y e uro/peso, 201 5) (Jurado-Sánchez, Yáñez-Márquez, Camacho-Nieto, & López Yáñez, 201 4). De ahí q ue, en es te trabajo se exploren di ferentes variables tomadas de l os p recios de l os t ipos de cambio o alguna razón de estos para conformar el modelo que pudiera ayudar a pronosticar l a t endencia del t ipo de c ambio peso-dólar, m ismo que pudiera i ntegrarse y formar pa rte de una e strategia de i nversión en c aso de i nversionistas, m inoristas o institucionales, o c omo indicador q ue apoy e en l as dec isiones t omadas en l as ár eas financieras de alguna empresa o institución de crédito, por ejemplo. En el presente trabajo se propone un modelo para el pronóstico de la tendencia del precio de tipo de cambio peso-dólar utilizando componentes intermercado intradiarias, el cual es validado ut ilizando al gunas de l as metodologías m ás r epresentativas per tenecientes a distintos paradigmas de clasificación de la minería de datos: probabilístico, naïve bayes; redes neu ronales, pe rceptrón multicapa ( MPL); vecindades, I B1; metaclasificadores, 1 Se c onoce c omo arbitraje a l a práctica de c omprar y vender bienes eq uivalentes en m ercados distintos p ara obtener ventaja de un a d iferencia de pr ecios. En ge neral, s e hace r eferencia a cualquier s ituación en l a que es pos ible o btener u na ut ilidad s in c orrer r iesgos o hacer u na inversión. Metodología de la investigación 3 bagging; tablas de decisión, data table, y árboles, bftree (Witten & Eibe, Data mining: practical machine learning tools and techniques with Java implementations, 2000). Por lo anterior la pregunta de investigación obligada es ¿Existirá algún grupo de t ipos de cambio cuya triangulación de divisas permita identificar alguna posibilidad de arbitraje con el fin de pronóstico del tipo de cambio peso-dólar o por lo menos de su tendencia en el corto plazo? - Si fuera posible descubrir la existencia de relaciones entre mercados que permitan anticiparse a los cambios de los tipos de cambio con el fin de prever lo que sería el rebote en el tipo de c ambio pes o-dólar ¿C uáles s erían l os t ipos de c ambio relevantes? - Construyendo v ariables a par tir de p recio de c ierre, aper tura, máximo, mínimo, históricos, rendimientos, di ferencias ¿Q ué combinación de es tas s ervirían par a conseguir el pronóstico en el corto plazo? - ¿Cuál sería el desempeño del modelo y si este pudiera ut ilizar alguna técnica en especial para incrementarlo? Objetivos Proponer un modelo de predicción de t endencia de los precios del tipo de cambio peso- dólar utilizando alguna combinación de datos de los precios de otras divisas y aprovechar la posibilidad de arbitraje de estas mediante técnicas de minería de datos. - Mostrar un m odelo de pr edicción de la tendencia de pr ecios del t ipo de c ambio peso-dólar - Explorar l as di versas c ombinaciones de da tos par a i dentificar cuáles t ienen relevancia par a el t ipo de c ambio y q ué c ombinación de es tas presenta m ejor desempeño - Probar el modelo mediante un estudio comparativo entre las diferentes técnicas de la minería de datos el desempeño del modelo Hipótesis La hipótesis de l a investigación es que con la identificación de l a presencia de ar bitraje entre di ferentes t ipos de c ambios relacionados a un c onjunto de divisas s e puede pronosticar la tendencia del precio o precio mismo del tipo de cambio peso-dólar. Metodología de la investigación 4 Las hipótesis específicas son: - Tipos de cambios de divisas relacionadas cambian de manera anticipada a alguna de ellas posibilitando el arbitraje - Existen patrones con presencia temporal en las series de precios y del mismo tipo de cambio y de otros - Las técnicas de la minería de dat os han m ostrado resultados sobresalientes para diversas tareas de reconocimiento en distintas áreas Metodología La investigación, dado que involucra series de tiempo de los precios del tipo de cambio peso-dólar es de tipo longitudinal, y transversal, ya que también involucra combinaciones de datos (precios de aper tura, cierre, máximo y mínimo) de otras divisas para realizar el pronóstico: euro-dólar, eur o-peso, eur o-dólar c anadiense y yen-dólar. Se considera el periodo correspondiente al último cuatrimestre del 2012, de septiembre a diciembre, con una per iodicidad de pr ecios de 30 m inutos, da do q ue adem ás de que fue l o que s e disponía y es taba v igente al t iempo de i niciar l os es tudios, no hub o ev entos ex tra económicos que insertaran grandes movimientos extraordinarios al comportamiento de los mercados. El alcance de la investigación es descriptivo ya que involucrará un análisis discriminante y exploratorio para la identificación de la relevancia de los mercados y las combinaciones de sus variables para los fines del estudio comparativo. Justificación Teorías existentes y conceptos sobre la conducta de los mercados dentro de las áreas de economía y finanzas sesgan la idea de que pudiera existir una manera de predecir o, tan sólo, de estimar el valor futurosobre algún producto financiero. Siendo la más conocida la de la Hipótesis de mercados eficientes (Fama, 1970), la cual asume que los inversionistas son racionales y que los precios reflejan ya toda la información disponible. Que no hay oportunidad de obtener ganancias del mercado al analizar los precios pasados para predecir los m ovimientos f uturos de estos. De ahí q ue, el análisis técnico, como se l e conoce a este tipo de análisis, que se basa en el descubrimiento de formas correspondientes a patrones dibujados en las series temporales de los precios históricos, no se ha considerado una manera confiable para la estimación de los precios futuros. Cuando se t rata del corto plazo, l os t ipos de c ambio det erminados por el m ercado son muy volátiles, como respuesta a la política monetaria, los eventos políticos y los cambios de expectativas. Diversos estudios coinciden en la existencia de relaciones de causalidad Metodología de la investigación 5 de v ariables c on el t ipo de c ambio pes o-dólar a par tir del v ariables m acroeconómicas (Torre Cepeda & Provorova Panteleyeva, 2007) (Morales Castro, 2009). Asimismo, otros autores y per sonalidades r econocidas del m edio, i ncluyendo e l F ondo M onetario Internacional ( FMI), han r emarcado el hec ho d e c onsiderar pa ra s u e stimación c iertas variables macroeconómicas como la tasa de i nterés, el monto de ex portaciones y el de importaciones, principalmente. No obstante, los estudios demuestran que las variaciones del t ipo de c ambio no r esponden a una úni ca variable ec onómica-financiera exclusivamente. Si bien, los estudios realizados han mostrado ser eficaces, en su mayoría han basado sus investigaciones en el l argo pl azo m ediante componentes c on v ariables i ntramercado (precios hi stóricos de apertura, de c ierre, v olumen, interés abierto, et c.) o en ot ros factores fundamentales macroeconómicos, c omo el í ndice de pr ecios, tasa de i nterés, balanza de comercialización, etc. Sin embargo, existe poca discusión para el corto plazo, donde los precios muestran mayor sensibilidad y, para los inversionistas de este mercado, resulta m ás at ractivo y es m otivo del des arrollo de la pr esente i nvestigación donde s e explora la posibilidad de arbitraje del tipo de cambio peso-dólar a partir de otras divisas en el corto plazo. En la presente tesis, se mostrará un estudio empírico sobre una propuesta de modelo de predicción para la estimación de la tendencia de precio del tipo de cambio a partir de otras divisas ut ilizando algunos de l os clasificadores más representativos del área de m inería de datos. El modelo será probado con datos intradiarios para distintos periodos dentro del cuatrimestre último de 2012: cuatro meses, dos meses, un mes y una semana. Los esquemas de clasificación em pleados, además de v alidar l a factibilidad del m odelo propuesto, sirven par a mostrar el poder de o tras t écnicas de pr edicción y c lasificación, pertenecientes a otras áreas, en el ámbito de l as finanzas para la solución de pr oblemas referentes a la identificación y extracción de patrones que involucran el análisis y procesamiento de series de tiempo y datos históricos. Matriz de congruencia # PROBLEMA OBJETIVO HIPÓTESIS 1 Si fuera posible descubrir la existencia de relaciones entre mercados que permitan anticiparse a los cambios de los tipos de cambio con el fin de prever lo que sería el rebote en el tipo de cambio peso-dólar ¿Cuáles serían los tipos de cambio Mostrar un modelo de predicción de la tendencia de precios del tipo de cambio peso-dólar Tipos de cambios de divisas relacionadas cambian de manera anticipada a alguna de ellas posibilitando el arbitraje Metodología de la investigación 6 relevantes? 2 Construyendo variables a partir de precio de cierre, apertura, máximo, mínimo, históricos, rendimientos, diferencias ¿Qué combinación de estas servirían para conseguir el pronóstico en el corto plazo? Explorar las diversas combinaciones de datos para identificar cuáles tienen relevancia para el tipo de cambio y qué combinación de estas presenta mejor desempeño Existen patrones con presencia temporal en las series de precios y del mismo tipo de cambio y de otros 3 ¿Cuál sería el desempeño del modelo y si este pudiera utilizar alguna técnica en especial para incrementarlo? Probar el modelo mediante un estudio comparativo entre las diferentes técnicas de la minería de datos el desempeño del modelo Las técnicas de la minería de datos han mostrado resultados sobresalientes para diversas tareas de reconocimiento en distintas áreas Tabla a. Matriz de congruencia Resumen capitular El trabajo se encuentra organizado de la siguiente manera; en el presente capítulo, titulado Metodología d e l a i nvestigación, s e des cribe el obj etivo de l a t esis, l as motivaciones que impulsan a su realización y las contribuciones. En el capítulo 2, titulado Marco teórico, se describen algunos conceptos relacionados al t ipo de cambio junto con algunos de l os trabajos m ás i mportantes r elacionados c on l as di ferentes pr opuestas realizadas par a es timar o p redecir l os pr ecios del t ipo de c ambio pes o-dólar, se mencionan l as técnicas de c lasificación, utilizadas en l a par te de di squisiciones experimentales, así como de los esquemas de evaluación comúnmente usados para medir el desempeño. El desarrollo principal del modelo propuesto y su demostración se brindan en el capítulo 3 , para posteriormente mostrar los experimentos realizados en el capítulo 4, que llevan a las conclusiones expuestas, que se describen en el capítulo 5. 7 Capítulo 1 Marco teórico Mucho se habla sobre la predicción de series de tiempo financieras y esto puede ser corroborado con la cantidad de t rabajos de i nvestigación existentes en l a l iteratura. Y no es de extrañarse, como se ha mencionado, que los beneficios producto de una predicción de l os pr ecios futuros de cualquier ac tivo f inanciero, r esultan un gran campo y ár ea de oportunidad par a t odo i nvestigador c on c onocimientos de t emas c uantitativos par a el análisis de dat os. Esto sumado al poder de cómputo dado po r la tecnología hoy en d ía permite la automatización de las técnicas de estimación haciendo cada vez más factible su aprovechamiento. Si b ien, el fuerte en el ár ea financiera y ec onómica ha s ido el m odelado de s eries de tiempo utilizando lo establecido por (Box & Jenkins, 1978), este desprecia la presencia de no linealidad en los datos. Es aquí donde diversas técnicas y metodologías para el análisis y c lasificación de información del área de m inería de datos son integradas cada vez con mayor énfasis teniendo la oportunidad para dar nuevas soluciones y propuestas. A continuación se describen algunos de los conceptos a considerar para el desarrollo del tema y pos teriormente, en el m ismo c apítulo, s e presentan al gunos de l os t rabajos d e investigación existentes en l a l iteratura con e studios r elacionados a la es timación y pronóstico de precios del tipo de cambio peso-dólar y los problemas relacionados con su determinación. 1.1 Teoría del Mercado Eficiente La T eoría del Mercado Eficiente (TME) es uno de l os t érminos bás icos de l as f inanzas corporativas y una de las teorías más utilizadas para estudiar el comportamiento de los precios de l os m ercados f inancieros. T iene su or igen en l a t eoría de l paseo aleatorio y parte de que las cotizaciones bursátiles son totalmente impredecibles; de modo que cualquier i ntento de es timación futura es tá de stinado al fracaso (Gutierrez Fer nández, 2016). La TME postula, de manera general, que los inversores, como personas racionales que son, valoran todos sus activos y títulos por su valor intrínseco u objetivo, en el sentido del CAPÍTULO 2. Marcoteórico 8 precio de equilibrio. Sobre esta base, dicho valor intrínseco se verá modificado por la nueva i nformación que l legue al mercado, que, por de finición, será i mpredecible (Gutierrez Fernández, 2016). 1.1.1 Antecedentes Cuestionamientos preliminares sobre el comportamiento de los mercados en cuanto a l a evolución de d istintas variables económicas y la capacidad de ant icipar los ciclos alcistas y baj istas son i ntroducidos en (Kendall, 1953) . En es te t rabajo se es tudian pat rones de comportamiento de las acciones con la premisa inicial de que los precios de estas, para una determinada empresa, deben reflejar las perspectivas de beneficios, el impacto de los ciclos ec onómicos y t oda aq uella i nformación q ue pudi era s er r elevante par a di cha empresa. El autor concluye que los precios parecen seguir un cierto patrón aleatorio, que suben y bajan sin tener en cuenta ninguna pauta previa. De ahí que, no sean predecibles. Establece t ambién l a di ferencia entre aleatorio e i rracional y q ue el c omportamiento aparente de los precios de las acciones significa que el mercado es eficiente, por lo tanto que funciona c orrectamente. Y , por el c ontrario, que el m ercado sea i rracional s ignifica que el mercado no es eficiente (Brun & Moreno, 2008). La situación en la que los precios de una acción son consecuencia de toda la información existente en el mercado se encuentra en la hipótesis de mercados eficientes (Fama, 1970). Donde se plantea que los precios de un i nstrumento financiero reflajan ya toda la información disponible y relevante, lo que no permitiría obtener rendimientos de manera consistente po r enc ima del pr omedio del m ercado. A dicionalmente, reconsidera y defiende el entendimiento de l os mercados eficientes en función de di stintos aspectos, propuesto previamente en (Roberts, 1967) y que desprende tres niveles de e ficiencia del mercado en función del nivel de información disponible y su impacto en las cotizaciones. 1.1.2 Niveles de eficiencia Hipótesis débil Los pr ecios i ncorporan l a i nformación q ue s e der iva de la e volución hi stórica de l as cotizaciones y volúmenes de ne gociación. P or lo t anto, anal izando l as paut as s eguidas por las cotizaciones en el pasado, no se puede adivinar ninguna regla que permita obtener beneficios extraordinarios (Brun & Moreno, 2008). Esta hipótesis implica que las series históricas de las acciones son públicas y no tienen costo. Por lo t anto, t odos los inversores tendrán los m ismos datos. S i los anal istas han aprendido a det ectar c omportamientos futuros de l as ac ciones es tudiando l as s eries históricas, en tonces cualquier s igno que det ermine un c omportamiento s erá inmediatamente detectado, y el precio de la acción aumentará o disminuirá CAPÍTULO 2. Marco teórico 9 automáticamente puesto que todos los participantes del mercado habrán explotado dichas señales ajustando así su valor. Hipótesis semi-fuerte Los precios incorporan toda la información pública disponible. Es decir, los precios no incluyen sólo la información pasada (la que hace referencia a los volúmenes y precios) sino también la información actual pública, como los resultados obtenidos, los dividendos a pagar, en resumen, la referente a sus fundamentales económicos (crecimiento en resultados, situación financiera, situación competitiva, etc.). Este es el concepto cercano al utilizado pro el análisis fundamental (Brun & Moreno, 2008). Hipótesis fuerte Los precios incorporan toda la información referente a una empresa, incluso la no pública o privilegiada. Esta hipótesis va más allá de las demás y asume que existen inversores que utilizan información privada de su empresa para obtener un beneficio propio adicional (Brun & Moreno, 2008) (Figura 1.1). Entonces, un m ercado es eficiente debido a la competencia entre los distintos participantes del m arcado que, guiados por el principio de maximización del beneficio, buscaran oportunidades de arbitraje en los mercados, lo que conducirá a una situación de equilibrio en la que los precios de las acciones en el mercado es la mejor referencia de su valor intrínseco. Figura 1.1. Niveles de eficiencia de los mercados. Fuente (Brun & Moreno, 2008, pág. 14). Hipótesis fuerte Hipótesis semi-fuerte Hipótesis débil CAPÍTULO 2. Marco teórico 10 1.2 Tipo de cambio En un m undo donde l os países se v inculan cada v ez m ás a t ravés del comercio y l as finanzas, el c omercio ex terior puede t ener una g ran i nfluencia s obre l a pr oducción y el empleo nac ional. E l c omercio i nternacional de bi enes y s ervicios per mite a l os paí ses elevar s u ni vel de v ida, es pecializándose en ár eas de v entajas c omparativas en l a producción; exportar bienes y servicios en los que son relativamente eficientes, e importar aquellos en l os que son relativamente ineficientes. El comercio internacional se realiza a través de distintas divisas, en este sentido el sistema financiero internacional desempeña un papel i mportante, y a q ue facilita el i ntercambio por c ompra y v enta de bi enes en dólares, eu ros y ot ras divisas, y el i ntercambio de una m oneda por otra (Kozikowski, 2013). El comercio internacional implica usar distintas monedas nacionales. El tipo de cambio es el precio de una m oneda en t érminos de ot ra moneda. Se determina en el mercado de cambio de di visas, q ue es el m ercado d onde s e c ompran y v enden l as di ferentes monedas. E l eq uilibrio de of erta y demanda de divisas determina el t ipo de c ambio de una moneda (Kozikowski, 2013). En el c orto pl azo, l os t ipos de c ambio det erminados por el m ercado s on m uy volátiles, como r espuesta a l a pol ítica m onetaria, l os ev entos pol íticos y l os c ambios de expectativas. Sin embargo, en el largo plazo, los tipos de cambio son determinados por los precios relativos de los bienes en distintos países, lo cual se sintetiza en la teoría de la paridad de pode r de compra (PPC) sobre los tipos de cambio. Según esta teoría, el t ipo de cambio de un paí s tiende a i gual el costo de compra de esos bienes en el extranjero. Las barreras comerciales, los costos de transporte y la presencia de servicios no comerciados permiten que los precios difieran en forma importante de un país a otro. Además, los flujos financieros pueden superar mucho a los flujos comerciales, en el corto plazo. Así que, mientras que la teoría PPC es una guía útil para los tipos de cambio en el largo plazo, los tipos de cambio pueden di ferir respecto de su nivel PPC durante muchos años (Samuelson & Nordhaus, 2009). 1.2.1 Régimen El r égimen de t ipo de cambio fijo es uno de l os fundamentos del s istema monetario: el otro régimen es el de los tipos de cambio flexibles. Un importante sistema de tipo de cambio es el de l os t ipos de c ambio flotantes, cuando el t ipo de c ambio internacional de un país se determina por las fuerzas de mercado de oferta y demanda, en ese sistema, el gobierno ni anunc ia un t ipo de c ambio ni em prende m edidas pa ra i mponer uno. Otro término que s e us a c on frecuencia es tipos d e cambios flotantes, que q uiere dec ir l o mismo (Kozikowski, 2013) (Stiglitz & Walsh, 2005). CAPÍTULO 2. Marco teórico 11 Entre l os dos ex tremos del s istema r ígidamente f ijo y el c ompletamente f lexible es tá el intermedio de l os tipos de c ambio c ontrolado. En es te c aso, l os tipos de c ambio s on determinados bás icamente por l as fuerzas del m ercado, per o l os gobiernos c ompran o venden di visas, o c ambian s us o fertas m onetarias par a a fectar s us tipos de c ambio. A veces, l os gobiernos v an c ontra el v iento de l os m ercados privados. Otras v eces, l os gobiernos al canzan ‘ zonas des eadas’ q ue guían s us ac ciones pol íticas. E ste s istema gradualmentepierde importancia a medida que los países g ravitan cada vez más hac ia los sistemas de tipo de cambio fijo o flexible (Krugman & Obstfeld). 1.2.2 Antecedentes Los paí ses s iguen r eglas di stintas en l o que respecta a l os r egímenes c ambiarios y el grado de ape rtura. En un entorno de l iberalización y desregularización, el mercado es el que de fine l as r eglas del j uego e i mpone l a disciplina. La c aracterística pr incipal de l os mercados financieros internacionales en l a actualidad es una al ta volatilidad de t odas las variables económicas, en par ticular de l os t ipos de cambio. El pronóstico de l os t ipos de cambio futuros es prácticamente imposible, por lo que surge la necesidad de ad ministrar el riesgo cambiario (Kozikowski, 2013) (Taylor & Taylor, 2004). La v olatilidad de l os tipos de c ambio s e debe a l as m odificaciones c onstantes de l as variables económicas, el progreso tecnológico y la liberación financiera. Suben o bajan los precios relativos de los productos básicos como el petróleo, el cobre, los productos agropecuarios; se transforma el poder relativo de di ferentes países y se forman nuevos bloques regionales. Las telecomunicaciones modernas reducen los costos de transacción y f acilitan l os m ovimientos i nternacionales de c apital. La di sponibilidad i nmediata de abundante i nformación cambia l a tendencia de l os m ercados en c uestión de minutos (Toribio, 2012) (Samuelson & Nordhaus, 2009). Una di visa es l a m oneda de ot ro paí s, s iempre y c uando s ea l ibremente c onvertible a otras monedas en el mercado cambiario. Después del derrumbe comunista, la mayoría de los pa íses t ienen m onedas convertibles. Algunas excepciones: Cuba y corea del norte (Kozikowski, 2013). La convertibilidad de las monedas es muy importante para el comercio internacional para la eficiencia económica. Sin ella, el comercio se limita a un simple trueque de mercancías. Y si, en este contexto, los precios internos se hallan totalmente divorciados de los precios internacionales, el cálculo de rentabilidad de los proyectos resulta imposible. Cuando se derrumbó el sistema comunista unas de las tareas prioritarias de los nuevos gobiernos fue reestablecer la plena convertibilidad de las monedas internacionales (Camarero, 1994). La manera más común de cotizar el tipo de cambio es la cantidad de la moneda nacional necesaria par a c omprar ot ra: generalmente, dól ares. C omo s e ha di cho, ex iste en la literatura gran c antidad de i nvestigaciones s obre m odelos que i ntentan m ostrar l a CAPÍTULO 2. Marco teórico 12 dependencia del tipo de cambio con ciertas variables económicas-financieras, domésticas y e xtranjeras, m uchas de el las bas adas en el I PC o el P IB, m ostrando r esultados m uy alentadores (Navarro C hávez, R odríguez C hávez, & Zamora T orres, 2011) (Morales Castro, 2009) , y q ue s i bi en, han podi do m ostrar que en c iertos per iodos el m odelo planteado es de gran r elevancia no s e ha t rabajado s obre l a noc ión de que ex iste una relación importante entre los mercados de distintos países, tal que los tipos de cambio de una moneda en términos de ot ra puedan es tablecer el comportamiento de una de es tas, siendo q ue en un mundo g lobalizado puede ex istir r elación ent re di stintas ec onomías (Kindleberger, Aliber, & Solow, 2005) (Reinhart & Rogoff, 2011) (Toribio, 2012). 1.3 Pronóstico del tipo de cambio La r evisión de l os es tudios em píricos s obre l a det erminación de l os tipos de c ambio presentan conclusiones encontradas, (Torre Cepeda & Provorova Panteleyeva, 2007) para México en un per iodo de 1995-2008, concluye que existen relaciones de causalidad entre el tipo de cambio peso mexicano-dólar estadounidense, y una serie de variables (el diferencial de tasas de interés, el diferencial de ingreso, el diferencial de tasas de inflación y el diferencial de of ertas monetarias) del modelo monetario del enfoque del mercado de activos, lo cual interpreta como consistente con las implicaciones del enfoque del mercado de activos para la determinación de la paridad. En (Morales C astro, 20 09) se establece que conocer l a forma en que l as v ariables económico-financieras y el tipo de cambio están relacionados es de suma importancia en la actualidad, especialmente porque las interrelaciones son cruciales en la t ransmisión o propagación de las crisis financieras, y el objetivo central de su investigación, consistió en estudiar empíricamente la relación entre el tipo de cambio y cinco variables económico- financieras: precio del petróleo, oferta monetaria, brecha del producto, inflación, y tasa de interés. Se construyó y estimó un modelo de vectores autorregresivos capaz de des cribir a corto plazo el comportamiento y la interrelación entre las variables y el tipo de c ambio, para la economía mexicana en el periodo 1999-2007; asimismo, se realizó un análisis de impulso-respuesta y de descomposición estructural de la varianza. Los autores concluyen que existe evidencia, al menos empírica, que las variables inciden en el tipo de cambio, y están relacionadas di námicamente a t ravés del t iempo. C on el anál isis de i mpulso- respuesta y des composición es tructural de l a v arianza, s e i dentificó l os i mpactos y reacciones del t ipo de c ambio a l as pe rturbaciones de l as v ariables; éstos a nálisis sugirieron que la brecha del producto explica en menor cuantía el comportamiento del tipo de cambio; y, la inflación, la tasa de interés, el precio del petróleo, y la oferta monetaria, lo hacen en mayor cuantía, para el periodo analizado. Por ot ra par te, y hac iendo r eferencia a l a hi pótesis de l a ef iciencia del m ercado en s u forma débil implica que el análisis técnico no pu ede producir rendimientos anormales, es decir, no puede generar una estrategia para ganarle sistemáticamente al mercado. E n (Quintanilla-García & Z althen, 2011) se p resenta un c aso que c ontradice l a hi pótesis CAPÍTULO 2. Marco teórico 13 introducida por (Fama, 1970) donde s e m enciona q ue el anál isis t écnico no es tá subordinado al anál isis fundamental, es dec ir, que un i nversionista no puede es perar poder obt ener ganancias t ratando de ant icipar o pr onosticar el p recio futuro de al gún activo f inanciero dado que s i se pud iera también podr ían ser ant icipados por ot ros y el precio ent onces r eflejaría e l c omportamiento d e m anera i nmediata ha ciendo q ue no pudieran t omar v entaja. Se anal iza l a c onducta de l os pr ecios del 9 d e ener o de 200 8 argumentando q ue estos se an ticipan a l os fundamentales con r elación a una no ticia negativa par a el m ercado es tadounidense q ue, c omo s e m enciona, e n v ez de hac er débiles a l os pr ecios estos se v en fortalecidos i ndicando s eñales de c ompra, des de l a perspectiva de un inversionista. La divisa considerada es el marco_suizo-dólar, y se utilizan cuatro indicadores t écnicos para i dentificar l as s eñales de c ompra supuestas: estocástico, índice de fuerza relativa, bandas de Bollinger y media móvil. Sin embargo, el estudio no muestra datos cuantitativos ni se basa en algún modelo de análisis estadístico para soportar sus conclusiones. En (Villar Corona, 2013) se analiza el tipo de cambio peso-dólar como una serie temporal evaluando la m etodología B ox-Jenkins y obt eniendo un m odelo A RIMA par a s er contrastado c ontra r edes neur onales artificiales. Los pr ecios ut ilizados s on di arios y corresponden al periodo de en ero del 2000 a diciembre de 2013 . El estudio comparativo fue realizado tanto para datos univariados, los precios históricos del tipo de cambio peso- dólar, c omo m ultivariados, donde s e ex ploró l a ut ilidad de di versas v ariables q ue v an desde ot ras di visas, bonos del m ercado mexicano has ta bonos de t esoro del m ercado estadounidense y dat os de r eservas i nternacionales.Los r esultados m uestran que l as redes neuronales consiguen obtener el mejor ajuste de los datos, sin embargo, resaltan el hecho de que l os r esultados dados po r el modelo m ultivariado pr esentan mejores características para pronosticar el tipo de cambio siendo superior al del modelo univariado para el periodo tratado. Otras investigaciones han explorado técnicas alternativas de modelos asociativos que han mostrado tener resultados sobresalientes en tareas de predicción y clasificación (Chávez- Sánchez, 2012). En (Jurado-Sánchez, Yáñez-Márquez, Camacho-Nieto, & López Yáñez, 2014) utilizan el clasificador Gamma como predictor para analizar los tipos de cambio peso-dólar, yen-dólar, dólar-libra. E l es tudio r ealizado s e enf oca en ana lizar l a s erie de tiempo de c ada tipo de c ambio, por separado, utilizando la metodología Box-Jenkins. Se emplean los precios diarios, para el tipo de c ambio peso-dólar y yen-dólar, y mensuales, para el tipo de c ambio dólar-libra, correspondientes a l os periodos del 1 de diciembre de 2010 al 20 de di ciembre de 2013, del 4 de ener o de 2010 al 31 de febrero de 2012 y finalmente del 1 de en ero de 1971 al 1 de n oviembre de 2013, r espectivamente. Lo s resultados son contrastados con modelos de di ferentes técnicas: un modelo ARIMA, con regresión l ineal, redes neuronales, entre otros, y son contundentes al mostrar la importancia del clasificador Gamma según los errores obtenidos, donde éste consigue estar dentro de las 4 pr imeras posiciones con menor grado con relación al resto de l as técnicas evaluadas. CAPÍTULO 2. Marco teórico 14 Resultados preliminares del presente trabajo fueron tratados en (Chávez Sánchez & Morales Castro, El tipo de cambio peso-dólar: Propuesta de un m odelo de determinación basado en el t ipo de c ambio eur o/dólar y eur o/peso, 2015 ). Muestran un m odelo de predicción del tipo de cambio utilizando los precios diarios al cierre de los tipos de cambio euro-dólar y euro-peso, para el periodo comprendido del 1 de enero de 2011 al 30 de julio de 2011. Las variables analizadas son validadas a través de la valuación de parámetros y de apl icación de pruebas es tadísticas que soportan su utilización. Se concluye q ue el modelo propuesto tiene las propiedades estadísticas suficientes para poder pronosticar el precio del tipo de cambio peso-dólar. Posteriormente los mismos autores presentan una variación del modelo en (Chávez Sánchez & Morales Castro, Modelo de pr edicción de l a tendencia del t ipo de c ambio peso-dólar mediante ot ras divisas ut ilizando algoritmos de clasificación de m inería de dat os, 2015) donde s e am plía el vector de v ariables y s e prueba el modelo con técnicas de minería de datos; esta vez para pronosticar la tendencia del precio del tipo de cambio peso-dólar. De manera general, los estudios presentados demuestran que las variaciones del tipo de cambio no r esponden a una úni ca v ariable ec onómica-financiera, exclusivamente. S in embargo, y sin importar el medio o técnica utilizada se ha podido observar que es posible identificar oportunidades de arbitraje. 15 Capítulo 2 Herramientas y metodologías de análisis de datos En el pr esente capítulo s e hace r eferencia a l as metodologías clásicas para evaluar y analizar series de datos temporales y aquellas basadas en el reconocimiento de patrones cuya bas e es l a c lasificación. Las metodologías aq uí m encionadas s ervirán de introducción par a el c apítulo de di squisiciones donde s erán sometidas a c omparación para mostrar la capacidad del modelo propuesto. 2.1 Series de tiempo Entre las técnicas más ampliamente utilizadas para tratar y analizar series económicas y financieras están las series de tiempo. En este apartado se introducen los conceptos más relevantes del tema y se toman en su mayoría de (Cruz & Morales Castro, 2007). Una serie de tiempo es una secuencia cronológica de observaciones de una v ariable en particular. En términos formales, una serie de tiempo se define como una secuencia de vectores, dependientes del tiempo transcurrido t: �̅� (𝑡) donde t = 0, 1, 2 , … Teóricamente, �̅� se puede ver como una función continúa de la variable en el tiempo t. Sin embargo, para cuestiones prácticas, el tiempo generalmente se ve en términos discretos, conduciendo a una instancia de �̅� en cada punto del intervalo de tiempo, normalmente de tamaño fijo. La motivación para realizar un análisis de serie de tiempo puede ser: - Descripción. Al tener una serie de tiempo, el primer paso en el análisis es gráficas los dat os pa ra obt ener m edidas descriptivas s imples de l as p ropiedades principales de los datos. CAPÍTULO 2. Herramientas y metodologías de análisis de datos 16 - Explicación. Cuando las observaciones son tomadas sobre dos o m ás variables, es pos ible us ar l a variación en una s erie par a explicar l a variación en las ot ras series. - Predicción. Dada una serie de t iempo se intenta predecir los valores futuros de l a serie. Este es el objetivo más frecuente en el análisis de las series de tiempo. - Control. S i una s erie d e t iempo s e genera po r m ediciones de c alidad de un proceso, el objetivo del análisis puede ser el control del proceso. Una s erie de t iempo s e ex amina c on l a i ntención de des cubrir pat rones hi stóricos que puedan ser útiles en la predicción. Para identificar esos patrones es conveniente pensar que una serie de tiempo consiste de varias componentes: - Tendencia. U na s erie d e t iempo tiene t endencia c uando por per iodos l argos l os valores c recen o di sminuyen c onsistentemente. También pueden de finirse c omo cambios en la media. - Ciclos. Se refiere a m ovimientos hacia arriba o hac ia abajo alrededor del nivel de la t endencia. E stas fluctuaciones, medidas de pico a pi co, pueden tener un a duración larga. - Variaciones es tacionales. Son pa trones históricos que ocurren y se r epiten cada determinado t iempo, po r ej emplo, anual mente. Estas v ariaciones s on c ausadas típicamente por factores como el clima y las costumbres. - Fluctuaciones irregulares. Son movimientos irregulares en una serie de tiempo que no siguen un patrón regular, ni reconocible. Teles movimientos representan lo que queda en una serie de tiempo después de que la tendencia, ciclos y variaciones estacionales han sido explicados. Pueden obtenerse valores futuros de una serie de tiempo observada mediante una g ran cantidad de métodos de predicción. Estos métodos pueden clasificarse fundamentalmente en tres grupos: - Subjetivos. Las predicciones se hacen sobre bases subjetivas usando el criterio, la intuición, el c onocimiento en el ár ea y ot ra i nformación relevante. E ntre estos métodos se encuentran: el ajuste de una curva subjetiva, el método Delphi y las comparaciones tecnológicas en tiempo independiente. - Univariados. Con este tipo de métodos se valores futuros de la serie basándose en el análisis de sus valores pasados, se intenta conseguir un patrón en estos datos, se asume que este pat rón continuará en el futuro y se ex trapola par a conseguir predicciones. Son muchos los métodos que encajan en esta categoría, entre estos CAPÍTULO 2. Herramientas y metodologías de análisis de datos 17 se enc uentran: E xtrapolación de c urvas de t endencia, s uavización e xponencial, método d e H olt-Winters y m étodo de B ox-Jenkins ( ARIMA). E ste úl timo es un método ampliamente utilizado. - Causales o multivariados. Involucran la identificación de ot ras variables que están relacionadas c on l a variable a pr edecir. U na v ez q ue es as variables han s ido identificadas, s e des arrolla un m odelo es tadístico que des cribe l a relación ent re esas v ariables y l a variable a pr onosticar. Entre estos métodos se pueden identificar: r egresiónmúltiple, modelos econométricos y m étodos de Box-Jenkins (Modelo de función de transferencia). Proceso estocástico Un proceso estocástico o aleatorio es una colección de variables aleatorias ordenadas en el t iempo. Si Y denota una variable aleatoria y continua, se denota como Y(t), pero si es discreta se expresa como Yt. Proceso estacionario Un proceso es tocástico es es tacionario s i su media y su varianza son constantes en el tiempo y si el valor de la covarianza entre dos periodos depende solamente de la distancia o rezago entre estos dos periodos de tiempo y no del tiempo en el cual se ha calculado la covarianza. En otras palabras, una serie de tiempo no estacionaria tendrá una media que varía con el tiempo o una varianza que cambia con el tiempo o ambas. Proceso puramente aleatorio Un proceso puramente aleatorio es un tipo especial de proceso estocástico que tiene una media igual a cero, una varianza constante σ2 y no esta serialmente correlacionada. Caminata aleatoria Es una s erie de t iempo es tocástica en l a q ue cada c ambio s ucesivo en Yt, expresado como ut es extraído en forma independiente de una distribución de probabilidad con media 0 y varianza σ2. Por lo tanto, Yt está determinada por: 𝑌𝑡 = 𝑌𝑡−1 + 𝑢𝑡 CAPÍTULO 2. Herramientas y metodologías de análisis de datos 18 Procesos estocásticos integrados El m odelo de c aminata al eatoria es un c aso es pecífico de una c lase más general de procesos estocásticos conocidos como procesos integrados. Se puede demostrar de manera s encilla q ue la pr imera di ferencia del m odelo de c aminata al eatoria es estacionaria. Si expresamos la caminata aleatoria como: (𝑌𝑡 − 𝑌𝑡−1) = ∆𝑌𝑡 = 𝑢𝑡 Resulta fácil probar que mientras Yt no es estacionaria, su primera diferencia si lo es, ya que por definición ut tiene media constante cero y una varianza de σ2. Por tanto, se llama al modelo de caminata aleatoria sin variaciones proceso integrado de orden 1 y se denota como I(1). De manera s imilar, s i una s erie de tiempo t iene que di ferenciarse dos veces para hacerla estacionaria, se llamará a esa serie de tiempo integrada de orden 2 ó I(2). En consecuencia, para convertir una serie no estacionaria en estacionaria se toman tantas di ferencias c omo s ea nec esario, y s e di ce que el nú mero de diferencias que se requiere para alcanzar la estacionariedad es el orden de integración de la serie. Prueba de raíz unitaria Es una prueba para determinar la estacionariedad o no es tacionariedad de una serie de tiempo. Si se considera la siguiente serie: 𝑌𝑡 = 𝜌𝑌𝑡−1 + 𝑢𝑡 donde -1 ≤ ρ ≤ 1 Si ρ = 1, como se demostró anteriormente, el proceso no es estacionario. De esta manera, s i s e r ealiza la r egresión de Yt sobre Yt-1 y s e det ermina q ue l a ρ es estadísticamente igual a 1, se concluiría que Yt no es estacionaria. Ahora, al diferenciar la serie se tiene la siguiente ecuación: 𝑌𝑡 − 𝑌𝑡−1 = 𝜌𝑌𝑡−1 − 𝑌𝑡−1 + 𝑢𝑡 o expresándola de otra manera: ∆𝑌𝑡 = 𝛿𝑌𝑡−1 + 𝑢𝑡 donde δ = ρ - 1 Si δ = 0, entonces ρ = 1 y se dice que tiene una raíz unitaria, lo cual significa que la serie de tiempo bajo estudio no es estacionaria, pero al mismo tiempo ΔYt = ut. En consecuencia al tomar las primeras diferencias de la serie se obtiene una estacionaria. CAPÍTULO 2. Herramientas y metodologías de análisis de datos 19 Para s aber s i δ = 0 , l a m ayoría de l os es tudios apl ican pr uebas de r aíces unitarias conocidas como DF o DFA (Dickey-Fuller aumentada), las cuales vienen integradas en la mayoría de los paquetes econométricos actuales. 2.1.1 Modelos ARIMA En (Box & Jenkins, 1978) se introduce el modelo para la predicción de series de tiempo. Popularmente es conocida como metodología Box-Jenkins aunque técnicamente se conoce como metodología ARIMA, en la que se analizan las propiedades probabilísticas o estocásticas de l as s eries de t iempo ec onómicas baj o la f ilosofía de “permitir q ue la información hable por sí misma”. Proceso autorregresivo (AR) En el pr oceso autorregresivo de orden p la observación actual Yt es generada por un promedio ponderado de observaciones pasadas que se remontan p per iodos, junto con una perturbación aleatoria en el periodo actual. Se denota este proceso como AR(p) y la ecuación que lo describe es: 𝑌𝑡 = 𝛼1𝑌𝑡−1 + 𝛼2𝑌𝑡−2 + ⋯+ 𝛼𝑝𝑌𝑡−𝑝 + 𝛿+𝑢1 donde δ es un término constante que se relaciona con la media del proceso estocástico. Es interesante observar que el modelo anterior solamente considera los valores actuales y anteriores de Yt, no hay otros regresores. Proceso de media móvil (MA) En el pr oceso de media m óvil de or den q cada obs ervación Yt es generada por un promedio ponderado de perturbaciones aleatorias que se remontan q periodos. Se denota este proceso como MA(q) y su ecuación respectiva es: 𝑌𝑡 = 𝜇 + 𝛽0𝑢𝑡 + 𝛽1𝑢𝑡−1 + 𝛽2𝑢𝑡−2 + ⋯+ 𝛽𝑞𝑌𝑡−𝑞 donde μ = E(Yt). El modelo de media móvil supone que las perturbaciones aleatorias están distribuidas en forma i ndependiente a l o l argo del tiempo, es decir, s on generadas por un pr oceso de ruido blanco. CAPÍTULO 2. Herramientas y metodologías de análisis de datos 20 Proceso autorregresivo y de media móvil (ARMA) Muchos pr ocesos al eatorios es tacionarios no pueden m odelarse c omo autorregresivos puros o de medias móviles puras, ya que tienen cualidades de ambos tipos de procesos. De esta forma, se puede concebir un modelo mixto autorregresivo de media móvil de orden (p, q). Se denota este proceso como ARMA (p, q) y se representa por medio de la ecuación: 𝑌𝑡 = 𝛼1𝑌𝑡−1 + ⋯+ 𝛼𝑝𝑌𝑡−𝑝 + 𝛿 + 𝑢𝑡 + 𝛽1𝑢𝑡−1 + ⋯+ 𝛽𝑞𝑢𝑡−𝑞 Además, las series de tiempo económicas generalmente no son estacionarias, es decir, son i ntegradas, r azón por l a c ual s i agr egamos el c oncepto de i ntegración ex plicado anteriormente, de manera que se tenga que diferenciar una serie de t iempo d veces para hacerla estacionaria y luego aplicar a esta el modelo ARMA(p, q) se dice que la serie de tiempo original es del tipo ARIMA(p, d, q), es decir, es una serie de tiempo autorregresiva integrada de media móvil. 2.1.2 Caracterización de las series de tiempo Existen dos funciones importantes en el análisis de series de tiempo a partir de las cuales es posible extraer los parámetros del proceso ARMA. De acuerdo con Box y Jenkins, éstas s on l a función de aut ocorrelación de l a muestra y l a f unción de autocorrelación parcial. La apar iencia de cada una de es tas funciones da una indicación de la naturaleza del proceso bajo es tudio y , en teoría, la t area de identificar el modelo y de obt ener sus parámetros se puede llevar a cabo con base en ellas. Función de autocorrelación Dada una m uestra Y0, Y1, … , Yn-1 de n observaciones, l a f unción de aut ocorrelación muestral (FAC) de la muestra al rezago k, denotada por ρk, se define como: 𝜌𝑘� � 𝛾𝑘 𝛾0 𝑝𝑎𝑟𝑎 𝑘 = 1, … ,𝑛 − 1 1 𝑝𝑎𝑟𝑎 𝑘 = 0 donde γ0 es la varianza de la muestra dada por: 𝛾0 = 1 𝑛 �(𝑌𝑡 − 𝑌�)2 𝑛 𝑡=1 γk es la covarianza al rezago k definida como: 𝛾𝑘 = 1 𝑛 �(𝑌𝑡 − 𝑌�)(𝑌𝑡+𝑘 − 𝑌�) 𝑛−𝑘 𝑡=1 CAPÍTULO 2. Herramientas y metodologías de análisis de datos 21 La f unción de aut ocorrelación indica c uánta c orrelación ex iste ent re dat os individuales contiguos en l a s erie Yt. C onforme el v alor del retraso au menta, el núm ero d e observaciones comprendidas en la autocovarianza disminuye hasta el elemento final. Al graficar ρk frente a k, la gráfica obtenida se conoce como correlograma. Cuando se grafica ρk se debe om itir el valor ρ0 el cual es invariablemente 1. Además, al interpretar la gráfica se debe tener cuidado de dar demasiada importancia a correlaciones en valores de retrasos que están significativamente altos en relación con eltamaño de la muestra. Función de autocorrelación parcial La f unción de aut ocorrelación par cial ( FACP) de l a m uestra ρkk en el r etraso k es la correlación en tre ob servaciones ( series de tiempo) que es tán separadas k periodos de tiempo, manteniendo c onstantes l as c orrelaciones en l os r ezagos i ntermedios (es dec ir rezagos menores de k). En otras palabras, la autocorrelación parcial es la correlación entre Yt y Yt-k después de eliminar el efecto de l as Y intermedias. En la tabla 2.1 se dan algunos l ineamientos generales ac erca de l os pat rones típicos de las f unciones d e correlaciones muestral y parcial. Tabla 2.1 Patrones teóricos de FAC y FACP. Modelo Patrón típico de FAC Patrón típico de FACP AR(p) Disminuye exponencialmente o con un patrón sinusoidal decreciente o ambos Picos grandes a lo largo de los p rezagos MA(q) Picos grandes a lo largo de los q rezagos Decrece exponencialmente ARMA(p, q) Decrece exponencialmente Decrece exponencialmente Fuente (Gujarati, 2004. 4ta Edición) 2.1.3 Propiedades de las series de tiempo financieras La predicción de series de tiempo financieras es una tarea altamente complicada debido a las siguientes razones: - Las series de tiempo financieras se comportan casi como un proceso de caminata aleatoria, impidiendo desde un punto de vista teórico la predicción. La predicción de las series de tiempo más comunes (precios de acciones, niveles de índices) es CAPÍTULO 2. Herramientas y metodologías de análisis de datos 22 un tema controversial y ha sido cuestionado en función de la hipótesis de mercados eficientes. - Las series de tiempo financieras están sujetas al cambio en el tiempo, por ejemplo, las pr opiedades es tadísticas de l as s eries de tiempo s on di ferentes en di stintos puntos del tiempo (el proceso de variación en tiempo. - Las s eries de tiempo financieras s on generalmente m uy r uidosas, ya que existe una gran cantidad de aleatoriedad (impredecible) en las variaciones día a día. - En el largo plazo, una nueva técnica de predicción llega ser parte del proceso a ser predicho, por ejemplo, se influencia el proceso en predicción. 2.2 Modelos de clasificación Los m odelos es tadísticos c uentan c on c iertas hi pótesis de di stribución q ue l os da tos financieros difícilmente cumplen. De ahí que algunas técnicas no paramétricas han sido desarrolladas par a s obre l levar l as r estricciones de m odelos es tadísticos t radicionales. Muchas de es tas técnicas pertenecen al dominio de l a minería de dat os. Investigaciones en las últimas décadas han sido dedicadas al estudio y comparación entre estos métodos y los clásicos del área financiera. A continuación se describen las técnicas de c lasificación y predicción correspondientes a algunos de los enfoques y técnicas comúnmente utilizadas en el campo del reconocimiento de patrones y de representación de información. Las distintas técnicas aquí mostradas servirán de referencia dado que son con las que se soportará la factibilidad del m odelo pr opuesto. Los ex tractos des criptivos de l as m etodologías mencionadas son tomados de (Chávez-Sánchez, 2012). 2.2.1 Vecindades El vecino más cercano o, de s us siglas en inglés, NN (nearest neighbour), es un método originado en estadística. I nicialmente c onsiderado par a l a pr oducción de r eglas, es propuesto en (Fix & H odges, 1952 ) donde s e m uestra un anál isis p reliminar de l as propiedades de los sistemas de k vecinos más cercanos y se establece la consistencia del método pa ra l as v ariaciones de k desde 1 hasta ∞. E n di cho es tudio s e ev alúa numéricamente el desempeño de l os k vecinos m ás cercanos para pequeñas muestras bajo c riterios estadísticos de di stribución nor mal. P osteriormente es pr opuesto c omo clasificador de pa trones en (Aha & Kibler, 199 1) y s ometido a anál isis en t areas de clasificación y predicción (Desarathy, 1990). CAPÍTULO 2. Herramientas y metodologías de análisis de datos 23 Los métodos basados en NN ut ilizan una m étrica que mide la distancia ent re un nuev o elemento y el c onjunto de el ementos al macenados. E l nuev o el emento es c lasificado según el tipo de su vecino más cercano. Un método basado en NN puro almacena todos los el ementos en memoria de forma l iteral. É ste c lasifica l os nu evos el ementos localizando el elemento más semejante, de entre los almacenados, para posteriormente asignar su clase. Una función de distancia es usada para determinar dicha similitud. Para atributos numéricos, se utiliza comúnmente la distancia Euclidiana, donde cada elemento es tratado como un pun to en un es pacio característico de n di mensiones. Se asume que para un punto dado en dicho espacio característico el área alrededor compartirá la misma clase. A demás, l a di stancia E uclidiana as ume que todas l as características s on igualmente importantes, así que comparten la misma escala en el espacio característico, y dicha escala es lineal a lo largo de cada eje (Aha & Kibler, 1991). Los métodos basados en NN tomaron popularidad después que en (Duda, Hart, & Stork, 2001) (Aha, 1992) se mostrara que los más simples modelos del método podían producir excelentes resultados para una variedad de dominios. En dicha investigación se introduce el método IB1 como parte de una familia de algoritmos creados bajo distintos criterios de procesado de las muestras con el objetivo de corregir o minimizar algunas desventajas, las cuales están inherentes en el método original de NN, tales como: - Alto costo de almacenamiento - Sensibles a la función de similitud - Sin criterios para el manejo de atributos faltantes - Dificultad para trabajar con atributos nominales - Sin generación de resumen de conceptos Entre las principales características del algoritmo IB1 está la utilización de la función de distancia Euclidiana y que cada muestra nueva se clasifica de acuerdo con su vecino más cercano bajo esta función y se incorpora al resto de los elementos en el conjunto de datos conforme es tas se van i ntroduciendo. La úni ca variación r especto al algoritmo NN puro yace en la normalización lineal de los valores de los atributos, previo al procesado de las muestras, y en el manejo de los atributos faltantes, los cuales se asume que tienen los valores m áximos de di ferencia par a t al c aracterística en t odas las ot ras m uestras. E n general, se menciona que el desempeño de este modelo es muy bueno, pero al igual que con el al goritmo N N or iginal pr esenta p roblemas c uando s e t rabaja c on m uestras c on ruido, con atributos ausentes o con caracterizadores irrelevantes. 2.2.2 Probabilísticos El algoritmo de Naïve Bayes fue introducido en (Duda, Hart, & Stork, 2001) para su uso en el área del reconocimiento de pat rones. Este método es un m odelo probabilístico el cual emplea c omo bas e pr incipal el t eorema de B ayes, y es uno de l os más am pliamente utilizados (Hand & Yu, 2001). CAPÍTULO 2. Herramientas y metodologías de análisis de datos 24 Este método asume independencia condicional entre las clases, esto es, el efecto de un valor de at ributo s obre una c lase dada es i ndependiente de l os v alores de l os ot ros atributos. Esta suposición es hecha para reducir el costo computacional, de ahí su nombre naïve. El objetivo de este método es el de clasificar una nueva instancia X maximizando la probabilidad P(Xi|Ci)P(Ci), donde i es el índice de la clase y π el producto de todas las probabilidades. ( ) ( )∏ = = n k iki CXPCXP 1 || En general, dados un conjunto de tuplas de datos desconocidas, donde cada tupla está representada por un vector de n dimensiones, X=(x1, x2, …, xn) con n mediciones hechas sobre la tupla de n atributos, respectivamente, A1, A2, …, An; y m clases, C1, C2, …, Cm. Utilizando el t eorema d e B ayes, el c lasificador N aïve Bayes calcula l a pr obabilidad a posteriori de c ada c lase c ondicionada s obre el elemento desconocido X. D e ahí q ue e l elemento desconocido X sea asignado la etiqueta de la clase con la máxima probabilidad a pos teriori condicionada sobre X. Por lo t anto, el objetivo es maximizar la probabilidad P(Cij|X) = P( Xj|Ci)P(Ci) = P(X). D e c ualquier forma, y dado q ue l a pr obabilidad P(X) es constante pa ra t odas l as c lases, s olo l a pr obabilidad P(Xj|Ci)P(Ci) requiere s er maximizado. Si las probabilidades de clase previas no son conocidas entonces se asume comúnmente que las clases son igualmente probables, P(C1) = P(C2)= …= P(Cm), por lo que s e debe ría m aximizar P(Xj|Ci). D e l o c ontrario s e maximiza P(Xj|Ci)P(Ci). L as probabilidades pr evias de c lase pueden s er es timadas por P(Ci) = si/s, donde si es el número de tuplas de entrenamiento de c lase Ci, y s es el nú mero de t uplas d e entrenamiento. Para reducir cálculos al evaluar P(Xj|Ci), la suposición de la independencia condicional de clase, es considerada. Así, se supone que los valores de los atributos son condicionalmente independientes unos de o tros, dada la etiqueta de l a clase asociada al vector, por ejemplo, que no hay relación de dependencia entre los atributos. Este método se caracteriza por su alta exactitud y desempeño en comparación con otros métodos de c lasificación. En (Domingos & Pazzani, 1997) se muestran los resultados de una c omparación ex haustiva del m étodo N aïve B ayes c on al goritmos de ár boles d e decisión, bas ados en i nstancias ( IB), y de r eglas s obre c onjuntos de datos es tándar. Donde se muestra el gran desempeño de este método incluso sobre conjuntos de datos con sustancial dependencia de atributos. La importancia de este clasificador radica en su base bayesiana y sobre la cual en (Duda, Hart, & S tork, 2001, pág. 17) , se a firma l o s iguiente: “Empezamos [con l a T eoría de l a Decisión B ayesiana] c onsiderando el c aso i deal en e l c ual l a es tructura es tadística inherente a las categorías es perfectamente conocida. Mientras que este tipo de situación raramente se presenta en la práctica, [esta teoría] nos permite determinar el c lasificador CAPÍTULO 2. Herramientas y metodologías de análisis de datos 25 óptimo (Bayesiano) contra el cual podemos comparar a todos los demás clasificadores…” (Chávez-Sánchez, 2012). 2.2.3 Meta clasificadores Desarrollos en l a t eoría de aprendizaje de m áquina ( machine l earning) han g uiado a métodos para mejorar el des empeño o extender las capacidades de los esquemas de aprendizaje básicos. Este tipo de mejoras de desempeño son conocidos como esquemas de meta clasificación o meta aprendizaje, y es que estos esquemas operan a par tir de la salida de la ejecución repetida de algún método de clasificación tomado como base (Witten & Eibe, 2000). El método bootstrap aggregating, o, de su acrónimo, bagging, es un método de predicción perteneciente a l os m eta c lasificadores y c uyo pr incipal f uncionamiento c onsiste e n generar múltiples versiones de un mismo clasificador, comúnmente arboles de decisión, tal q ue utiliza estas versiones para obtener un clasificador compuesto, mejorado. Este clasificador obtenido promedia los resultados de todas las versiones cuando se trata de predecir un valor numérico y somete a votación general para clasificar cuando se trata de un el emento. Las v ersiones m últiples s on f ormadas hac iendo réplicas del c onjunto de aprendizaje mediante bootstrap y las utiliza como nuevos conjuntos de aprendizaje. Bagging es uno de los más populares y efectivos métodos de aprendizaje compuesto (Breiman, 1992). La t écnica se basa en l a reducción de v arianza, cuyo pr incipal objetivo es l a c orrección de l a inestabilidad pr ovocada por l a i ncertidumbre d e es timación de parámetros, y del modelo mismo, utilizado en el método, de ahí que sean utilizados sobre métodos de clasificación inestables y de alta varianza. Se dice que un clasificador es inestable s i un peq ueño c ambio en el c onjunto de apr endizaje i mplica c ambios significativos en el clasificador. Diversas t eorías han s ido pr opuestas sobre l a e fectividad del m étodo b agging p ara clasificación bas ada en la des composición del s esgo y de l a v arianza (Opitz & M aclin, 1999). A simismo, r esultados de pr uebas s obre c onjuntos de dat os r eales y s imulados usando ár boles de c lasificación y de r egresión, así como selección de subconjuntos en regresión lineal, han mostrado que bagging puede dar ganancias substanciales en exactitud, donde el elemento v ital es l a i nestabilidad del m étodo (Guohua, X ingquan, & Chengqi, 2007). Además, de indicarse que también reduce la porción de sesgo del error. Dado que bagging es una técnica de r educción de varianza y tiende a t rabajar bien para métodos con alta varianza como redes neuronales y métodos basados en árboles, de ahí que no mejore el desempeño de métodos con baj a v arianza c omo r egresión l ineal y análisis de discriminantes lineales. CAPÍTULO 2. Herramientas y metodologías de análisis de datos 26 2.2.4 Tablas de decisión Las t ablas de dec isión, s on es pecificaciones de c onjuntos mutualmente di sjuntos de reglas de dec isión. E n apl icaciones t ípicas, l as t ablas de dec isión s on di señadas manualmente, basadas en el conocimiento previo de los vectores de entrada posibles y de las decisiones asociadas (Pawlak, 1998). En algunas áreas de aplicación, por ejemplo en s istemas de c ontrol c omplejos, es te tipo de c onocimiento no es tá di sponible, o aún peor, l a relación ent re ent radas y dec isiones no es funcional. E ste pr oblema fue inicialmente t ratado baj o l a i dea de t ablas de decisión en el c ontexto de l a t eoría de conjuntos rugosos, en el cual, los datos experimentales, más que el conocimiento humano, son usados como una base para la derivación o ent renamiento en una tabla de decisión (Marek & Pawlak, 1985). Este esquema es extendido posteriormente para hacer uso de información probabilística de las decisiones en la tabla de decisión, conduciendo a la introducción de tablas de decisión probabilística (Ziarko, 2001) en el contexto del modelo de c onjuntos rugosos de pr ecisión v ariable (Ziarko, 2004 ). U no de l os punt os clave de interés c uando s e der ivan t ablas de dec isión de l os dat os, es l a f orma d e aprendizaje o de construcción de la tabla. Una tabla de decisión está constituida por columnas, que son etiquetadas por los atributos, los renglones, conformados por los objetos de interés, y las entradas de la tabla, representando los valores de l os atributos. Los at ributos de la tabla de dec isión es tán divididos en dos g rupos di sjuntos l lamados at ributos de decisión y de c ondición respectivamente. D onde c ada r englón de l a t abla i nduce una r egla de decisión, l a c ual especifica una solución o decisión (acción, resultados, salidas, etc.) si alguna o algunas condiciones son satisfechas. Si una regla determina únicamente una decisión en términos de condiciones, se dice entonces que la regla es cierta. De otra forma la decisión es incierta. Las r eglas de dec isión es tán fuertemente conectadas por aproximaciones o derivaciones. En resumen, las reglas de dec isión ciertas describen baja aproximación de decisión en t érminos de condiciones, mientras que reglas de dec isión inciertas refieren a las regiones en la frontera de las decisiones (Venkatadri & Lokanatha, 2010). Con cada regla de decisión se asocian dos probabilidades condicionales llamadas coeficientes de certeza y de cobertura. El coeficiente de certeza expresa la probabilidad condicional de q ue un o bjeto, que pe rtenece a l a c lase de dec isión es pecificada po r l a regla de dec isión, s atisface di chas c ondiciones. E l c oeficiente de cobertura da l a probabilidad c ondicional
Compartir