Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY SISTEMA DE RECOMENDACIÓN TURÍSTICA BASADO EN RBR Y CBR TESIS QUE PARA OPTAR EL GRADO DE MAESTRO EN CIENCIAS COMPUTACIONALES PRESENTA JOSÉ ARTURO TEJEDA GÓMEZ Asesor: Co-Asesor: Dra. MA. DE LOS ÁNGELES JUNCO REY Dr. JORGE ADOLFO RAMÍREZ URESTI Comité de tesis: Dr. STEVEN WILMOTT Dr. ISAAC JUAN RUDOMIN GOLDBERG Jurado: Dr. ISAAC JUAN RUDOMIN GOLDBERG, Dr. JORGE ADOLFO RAMÍREZ URESTI, Dr. STEVEN WILMOTT, Dr. MA. DE LOS ÁNGELES JUNCO REY Presidente Secretario Vocal Vocal Atizapán de Zaragoza, Edo. Méx., Agosto de 2006. DEDICATORIA A Dios, a mis padres y a mi padrino (q.e.p.d) AGRADECIMIENTOS A Dios por permitirme alcanzar un logro más en mi vida profesional. A mis padres, sería difícil imaginar mi vida sin su apoyo, comprensión y su inmenso amor. Ha sido difícil no convivir con ustedes durante estos tres años pero éste también es un logro para ustedes. A mi padrino (q.e.p.d.), este logro también es tuyo, fuiste y serás mi gran ejemplo a seguir. A mi directora de tesis, Dra. Angeles Junco, por su generosidad al brindarme la oportunidad de recurrir a su capacidad y experiencia científica en un marco de confianza, afecto y amistad, fundamentales para la concreción de este trabajo de tesis. Además por haberme dado la oportunidad de trabajar de la misma manera con usted para el proyecto @lisTechNet. A mi co-director de tesis, Dr. Jorge Uresti, por su apoyo y valiosa colaboración para la realización de este trabajo. Al Dr. Isaac Rudomin, por haber revisado con paciencia este trabajo. Al Dr. Steven Wilmott, por haber aceptado ser miembro del jurado y revisar con paciencia este trabajo. Su confianza depositada en mi trabajo realizado para el proyecto @lisTechNet ha sido fundamental. Al Dr. Neil Hernández, por su comprensión y apoyo a lo largo de todo el postgrado. Al Dr. Ricardo Swain, por su apoyo, estímulo y confianza; los cuales han sido invaluables. Al M.Sc. Steven Bogaerts de la Universidad de Indiana, EEUU, por permitirme utilizar la herramienta IUCBRF para implementar el razonamiento basado en casos. Al proyecto @lisTechNet y a sus miembros por los conocimientos aportados, ya que en el marco de este proyecto surgió éste trabajo de tesis. A todos mis profesores del programa de la maestría en ciencias de la computación que de alguna manera contribuyeron en mi formación profesional. A mi mejor amigo, Zeus Andrade, por soportarme durante estos tres años en los que su amistad incondicional ha sido un pilar para que la cotidianidad de la vida sea más llevadera. Al ITESM, Campus Estado de México y al CONACYT por haberme apoyado en el estudio de éste postgrado. RESUMEN El turismo representa una fuente de ingresos para todos los países del mundo. Hoy en día, los turistas prefieren utilizar la Internet para reservar una fórmula de vacaciones combinadas. Por lo tanto, los sistemas de recomendación turística son fundamentales para que los turistas cuenten con los recursos o servicios turísticos que mejor concuerden con sus preferencias. Los sistemas de recomendación proveen sugerencias específicas con base en las preferencias del usuario y representan un medio eficaz de filtrado cuando existe demasiada información significativa. En el ámbito del turismo, un sistema de recomendación es una herramienta que debe presentar al usuario un subconjunto de la información total acerca de servicios turísticos que representa y satisface en un cierto grado las preferencias del usuario. No obstante, proveer de mecanismos que incrementen la precisión del sistema es indispensable para mejorar el grado de satisfacción del usuario. En esta tesis, se ha planteado el problema de integrar los mecanismos de razonamiento basado en reglas (RBR) y razonamiento basado en casos (CBR), en el desarrollo de un sistema de recomendación turística que sea capaz de proveer recomendaciones de recursos e itinerarios turísticos de manera personalizada. Además se propone una metodología para el desarrollo de un sistema de recomendación turística que combina ambos tipos de razonamiento. Con base en dicha metodología se ha desarrollado un prototipo llamado SyRec, que tiene el objetivo de evaluar un sistema provisto de ambos mecanismos de razonamiento y con base en la metodología propuesta. El RBR es utilizado para la recomendación de ítems turísticos en donde se lleva acabo procesos tales como: filtración, clasificación e inferencia de ítems turísticos para la planeación y modificación de un itinerario. El CBR es utilizado para la recomendación de itinerarios tiene el objetivo de recomendar al usuario los cinco principales itinerarios que satisfagan las preferencias del usuario en mayor grado con opción de modificarlos. La principal contribución de este trabajo de tesis es un sistema de recomendación turística desarrollado con la metodología propuesta que integra el RBR y el CBR para solucionar el proceso de planeación de un itinerario turístico con base en las recomendaciones de ítems e itinerarios turísticos. Este trabajo, ha sido desarrollado dentro del ámbito del proyecto @lisTechnet, el cual tiene como uno de sus objetivos demostrar que el empleo de tecnologías como la de los sistemas multiagente y el razonamiento basado en reglas, pueden ayudar a solucionar de manera distribuida la planeación de un itinerario turístico para varios países. El sistema SyRec es presentado como una aportación para el proyecto @lisTechnet, como un sistema demostrativo que ayuda a la explotación de los recursos culturales y de turismo. 9 CONTENIDO ÍNDICE DE FIGURAS ..........................................................................................................13 INDICE DE TABLAS ............................................................................................................15 1. INTRODUCCIÓN..............................................................................................................17 1.1 GENERALIDADES .............................................................................................................17 1.2 PROYECTO @LIS-TECHNET .............................................................................................19 1.2.1 Programa @lis ........................................................................................................19 1.2.2 Proyecto @lis TechNET ..........................................................................................21 1.3 DESCRIPCIÓN DEL PROBLEMA..........................................................................................23 1.4 OBJETIVOS.......................................................................................................................24 1.5 JUSTIFICACIÓN.................................................................................................................25 1.6 HIPÓTESIS........................................................................................................................25 1.7 ALCANCES Y LIMITACIONES.............................................................................................26 1.8 METODOLOGÍA ................................................................................................................26 1.9 ORGANIZACIÓN DEL DOCUMENTO....................................................................................27 2. SISTEMAS DE RECOMENDACIÓN TURÍSTICA......................................................29 2.1 EL COMERCIO ELECTRÓNICO Y EL TURISMO: PROBLEMÁTICA Y RETOS............................29 2.2 LA TOMA DE DECISIÓN EN LA PLANEACIÓN DE VIAJES TURÍSTICOS ..................................32 2.3 SISTEMAS DE RECOMENDACIÓN.......................................................................................33 2.3.1 La recuperaciónde información preferencial......................................................34 2.3.2 Tipos de sistemas de recomendación ...................................................................34 2.3.4 Objetivos de un sistema de recomendación..........................................................35 2.3.5 Evaluación de sistemas de recomendación ..........................................................36 2.4 SISTEMAS DE RECOMENDACIÓN TURÍSTICA......................................................................39 2.5 RESUMEN.........................................................................................................................41 3. RAZONAMIENTO BASADO EN REGLAS ..................................................................43 3.1 SISTEMAS DE PRODUCCIÓN..............................................................................................44 3.2 ELEMENTOS DE UN SISTEMA DE PRODUCCIÓN..................................................................46 3.2.1 Producción de reglas...............................................................................................46 3.2.2 La memoria de trabajo ............................................................................................47 3.2.3 La unidad de control ...............................................................................................47 3.3 PROPIEDADES DE UN SISTEMA DE PRODUCCIÓN...............................................................49 3.4 TIPOS DE SISTEMAS DE PRODUCCIÓN................................................................................51 3.4.1 Sistemas conmutativos.............................................................................................51 3.4.2 Sistemas particionados............................................................................................51 3.5 RESUMEN.........................................................................................................................52 10 4. RAZONAMIENTO BASADO EN CASOS......................................................................53 4.1 INTRODUCCIÓN................................................................................................................53 4.2 EL CICLO DEL RAZONAMIENTO BASADO EN CASOS...........................................................55 4.3 MÉTODOS DEL RAZONAMIENTO BASADO EN CASOS.........................................................58 4.3.1 Representación de casos..........................................................................................58 4.3.2 Recuperación...........................................................................................................59 4.3.3 Reutilización ............................................................................................................62 4.3.4 Revisión ...................................................................................................................63 4.3.5 Almacenamiento ......................................................................................................63 4.4 COMPARATIVA DEL RAZONAMIENTO BASADOS EN CASOS VS. OTRAS TÉCNICAS..............64 4.4.1 CBR y la recuperación de información ...................................................................64 4.4.2 CBR vs. Técnicas estadísticas .................................................................................64 4.4.3 CBR vs. Sistemas de producción .............................................................................65 4.4.4 CBR vs. Máquinas de aprendizaje...........................................................................66 4.4.5 CBR vs. Redes neuronales.......................................................................................66 4.5 APLICACIONES DEL RAZONAMIENTO BASADO EN CASOS..................................................67 4.6 RESUMEN.........................................................................................................................69 5. TRABAJO RELACIONADO............................................................................................71 5.1 SISTEMAS DE RECOMENDACIÓN TURÍSTICA BASADOS EN CBR ........................................72 5.1.1 Metodología Trip@dvice.........................................................................................73 5.1.2 ITR: Un sistema de recomendación inteligente de viajes .......................................81 5.2 SISTEMA DE RECOMENDACIÓN Y PLANEACIÓN DEL PROYECTO @LISTECHNET................86 5.2.1 Descripción del sistema demostrativo @lisTechNet ...............................................87 5.2.2 Arquitectura del sistema..........................................................................................92 5.2.3 Razonamiento dentro del sistema demostrativo de @lisTechnet ............................94 5.3 OTROS SISTEMAS...........................................................................................................102 5.3.1 Sistemas de recomendación turística basados en MAS.........................................102 5.3.2 Sistemas de recomendación turística comerciales ................................................106 5.3.3 Sistemas que combinan el RBR y CBR ..................................................................107 5.4 COMPARATIVA DE SISTEMAS.........................................................................................108 5.5 RESUMEN.......................................................................................................................111 6. SISTEMA DE RECOMENDACIÓN TURÍSTICA PROPUESTO: SY REC.............113 6.1 INTRODUCCIÓN..............................................................................................................113 6.2 METODOLOGÍA ..............................................................................................................114 6.2.1 Modelación de plan-itinerario ..............................................................................115 6.2.2 Modelación de reglas para la recomendación de ítems turísticos........................116 6.2.3 Modelación de casos para la recomendación de itinerarios turísticos ................118 6.2.4 Recomendación de ítems turísticos .......................................................................120 6.2.5 Recomendación de itinerarios turísticos ...............................................................122 6.3 EL SISTEMA SYREC........................................................................................................123 6.3.1 Arquitectura del sistema........................................................................................125 6.3.2 Interfaz de usuario.................................................................................................127 6.3.3 El RBR y la recomendación de ítems turísticos.....................................................137 11 6.3.4 El CBR y la recomendación de un itinerario turístico ..........................................145 6.3.5 Software de desarrollo ..........................................................................................149 6.4 EXPERIMENTACIÓN........................................................................................................149 6.4.1 RECOMENDACIÓN DE ÍTEMS TURÍSTICOS.....................................................................149 6.4.2 RECOMENDACIÓN DE ITINERARIOS TURÍSTICOS..........................................................155 6.5 COMPARATIVA ENTRE NUTKING, @LISTECHNET Y SYREC...........................................160 7. RESULTADOS, CONCLUSIONES Y TRABAJO FUTURO .....................................163 7.1 RESULTADOS.................................................................................................................163 7.2 CONCLUSIONES..............................................................................................................1657.3 TRABAJO FUTURO..........................................................................................................166 REFERENCIAS ...................................................................................................................167 12 13 ÍNDICE DE FIGURAS FIGURA 1. DIAGRAMA DE BLOQUES DE LAS FASES DEL DESARROLLO DEL PROYECTO DE TESIS.26 FIGURA 2. DIAGRAMA DE CONSUMO DE LOS PRODUCTOS TURÍSTICOS ANTES DE INTERNET.......30 FIGURA 3. DIAGRAMA DE CONSUMO DE LOS PRODUCTOS TURÍSTICOS DESPUÉS DE INTERNET. ..31 FIGURA 4. ARQUITECTURA DE UN SISTEMA DE PRODUCCIÓN. ....................................................49 FIGURA 5. CICLO DEL RAZONAMIENTO BASADO EN CASOS. .......................................................55 FIGURA 6. ESQUEMA DE DESCOMPOSICIÓN TAREA MÉTODO DEL CBR ......................................57 FIGURA 7. ESPACIOS DE PROBLEMA Y SOLUCIÓN. ......................................................................59 FIGURA 8. GRÁFICA REPRESENTATIVA DE LAS DISTANCIAS DEL VECINO MÁS CERCANO............60 FIGURA 9. EJEMPLO DE UN CASO BAJO LA METODOLOGÍA TRIP@DVICE ....................................75 FIGURA 10. RECOMENDACIÓN DE UN SOLO ÍTEM EN LA METODOLOGÍA TRIP@DVICE ...............76 FIGURA 11. BÚSQUEDA DE INSPIRACIÓN DE LA METODOLOGÍA TRIP@DVICE ............................78 FIGURA 12. INTRODUCCIÓN DE LAS PREFERENCIAS DEL USUARIO EN LA INTERFAZ DE USUARIO DE NUTKING. ......................................................................................................................82 FIGURA 13. CASO EJEMPLO EN EL SISTEMA NUTKING ................................................................82 FIGURA 14. OPCIONES PARA SELECCIONAR ÍTEMS EN NUTKING. ...............................................83 FIGURA 15. SELECCIÓN DE LUGARES TURÍSTICOS EN LA REGIÓN DE TRENTINO, ITALIA EN NUTKING............................................................................................................................83 FIGURA 16. RECOMENDACIONES DE ITINERARIOS TURÍSTICOS EN NUTKING ..............................84 FIGURA 17. MANIPULACIÓN DE UN ITINERARIO RECOMENDADO EN NUTKING ...........................85 FIGURA 18. ARQUITECTURA DEL SISTEMA NUTKING..................................................................85 FIGURA 19. INTERFAZ DE USUARIO DEL DEMOSTRADOR @LISTECHNET (A) ..............................90 FIGURA 20. INTERFAZ DE USUARIO DEL DEMOSTRADOR @LISTECHNET (B) ..............................91 FIGURA 21. PLANEACIÓN DE UN ITINERARIO EN @LISTECHNET................................................92 FIGURA 22. ARQUITECTURA DEL SISTEMA DEMOSTRATIVO @LISTECHNET ..............................93 FIGURA 23. NÚCLEO DE RAZONAMIENTO DEL SISTEMA DEMOSTRATIVO @LISTECHNET...........95 FIGURA 24. NIVELES DE DESCOMPOSICIÓN DEL SISTEMA DEMOSTRATIVO @LISTECHNET ........97 FIGURA 25. AGENTES INMERSOS EN LA DESCOMPOSICIÓN DE UN ITINERARIO............................98 FIGURA 26. OBJETIVOS DE LAS REGLAS INMERSAS EN LOS AGENTES.........................................99 FIGURA 27. TIPOS DE REGLAS INMERSAS EN EL AGENTE LPA..................................................100 FIGURA 28. ITINERARIO TURÍSTICO CONFORMADO EN EL SISTEMA DEMOSTRATIVO @LISTECHNET. ...............................................................................................................101 FIGURA 29. ARQUITECTURA DEL MAS1..................................................................................103 FIGURA 30. ARQUITECTURA DEL PTM ....................................................................................104 FIGURA 31. ARQUITECTURA DEL SISTEMA TRAVELPLAN ........................................................105 FIGURA 32. UN EJEMPLO DE PLAN-ITINERARIO ........................................................................116 FIGURA 33. MAPEO DE LAS PREFERENCIAS..............................................................................118 FIGURA 34. EJEMPLO DE MODELACIÓN DE UN CASO................................................................119 FIGURA 35. RECOMENDACIÓN DE ÍTEMS TURÍSTICOS (A). .......................................................121 FIGURA 36. RECOMENDACIÓN DE ÍTEMS TURÍSTICOS (B). .......................................................122 14 FIGURA 37. RECOMENDACIÓN DE ITINERARIOS TURÍSTICOS. ...................................................123 FIGURA 38. ARQUITECTURA LÓGICA DE SYREC ......................................................................126 FIGURA 39. ARQUITECTURA DE COMPONENTES.......................................................................127 FIGURA 40. ESTRUCTURA JERÁRQUICA DE PREFERENCIAS DEL USUARIO.................................128 FIGURA 41. PREFERENCIAS DE VIAJE EN LA INTERFAZ DE USUARIO.........................................129 FIGURA 42. ESPECIFICACIÓN DEL TIPO DE ALOJAMIENTO. .......................................................129 FIGURA 43. PREFERENCIAS DE ALOJAMIENTO..........................................................................130 FIGURA 44. PREFERENCIAS DE TRANSPORTE Y RESTAURANTES...............................................131 FIGURA 45. PREFERENCIAS DE LUGARES DE INTERÉS...............................................................132 FIGURA 46. PREFERENCIAS DE ACTIVIDADES...........................................................................133 FIGURA 47. ESTRUCTURA DE HORARIOS PARA UN ITINERARIO TURÍSTICO EN SYREC. .............135 FIGURA 48. RECOMENDACIÓN DE ÍTEMS TURÍSTICOS EN SYREC..............................................138 FIGURA 49. INFERENCIA DE SYREC PARA TRANSPORTES..........................................................151 FIGURA 50. RECOMENDACIONES DE ALOJAMIENTO. ................................................................152 FIGURA 51. FILTRADO E INFERENCIA DE ALOJAMIENTOS.........................................................153 FIGURA 52. FILTRADO Y ORDENAMIENTO DE RESTAURANTES. ................................................153 FIGURA 53. FILTRADO Y ORDENAMIENTO DE LUGARES. ..........................................................154 FIGURA 54. FILTRADO Y ORDENAMIENTO DE TIPOS DE ACTIVIDADES. .....................................154 FIGURA 55. ITINERARIO EN PROCESO DE PLANEACIÓN. ............................................................155 FIGURA 56. PREFERENCIAS DE VIAJE.......................................................................................157 FIGURA 57. PREFERENCIAS DE ALOJAMIENTO..........................................................................157 FIGURA 58. RECOMENDACIÓN DE ITINERARIOS. ......................................................................158 FIGURA 59. CASOS PROPUESTOS PARA LA RECOMENDACIÓN DE ITINERARIOS .........................159 FIGURA 60. ITINERARIO SUGERIDO EN MODO EDICIÓN. ............................................................160 15 ÍNDICE DE TABLAS TABLA 1. ALGORITMOS DE FILTRADO PARA TIPOS DE INFORMACIÓN.........................................39 TABLA 2. COMPARATIVA ENTRE EL RBR Y EL CBR..................................................................65 TABLA 3. COMPARATIVA DE TÉCNICAS DE RAZONAMIENTO......................................................67 TABLA 4. PONDERACIÓN DE PESOS EN LA METODOLOGÍA TRIP@DVICE ....................................80 TABLA 5. COMPARATIVA DE STR COMERCIALES. ...................................................................106 TABLA 6. COMPARATIVA ENTRE LOS DIFERENTES SISTEMAS DESCRITOS EN ESTE CAPÍTULO. ..110 TABLA 7. EJEMPLOS DE REGLAS DE EVALUACIÓN DE FACTORES EXTERNO..............................117 TABLA 8. EJEMPLO DE REGLAS DE FILTRADO...........................................................................117 TABLA 9.EJEMPLOS DE INSTANCIAS INFERIDAS. .....................................................................118 TABLA 10. EJEMPLO DE LA MODELACIÓN DE LAS CARACTERÍSTICAS DISCRIMINANTES DE UN PLAN-ITINERARIO. ...........................................................................................................134 TABLA 11. EJEMPLO DE MODELACIÓN DE UN CASO EN SYREC ................................................136 TABLA 12. MAPEO...................................................................................................................137 TABLA 13. ENCAPSULAMIENTO DEL GRADO DE PREFERENCIA POR TIPO DE ACTIVIDAD ...........137 TABLA 14. REGLAS DE INFERENCIA PARA TRANSPORTES EN SYREC........................................139 TABLA 15. REGLAS DE FILTRADO PARA LAS INSTANCIAS DE TRANSPORTE EN SYREC. ............140 TABLA 16. REGLAS DE ALOJAMIENTO EN SYREC ....................................................................141 TABLA 17. REGLAS DE RESTAURANTES EN SYREC..................................................................142 TABLA 18. REGLAS DE INFERENCIA DE RESTAURANTES EN SYREC..........................................142 TABLA 19. REGLAS DE LUGARES EN SYREC ............................................................................143 TABLA 20. REGLAS DE ACTIVIDADES EN SYREC......................................................................144 TABLA 21. ESPECIFICACIÓN DE PESOS EN SYREC....................................................................148 TABLA 22. CASO DE PRUEBA PARA LA RECOMENDACIÓN DE ÍTEMS.........................................150 TABLA 23. CASO DE PRUEBA PARA LA RECOMENDACIÓN DE ITINERARIOS...............................156 TABLA 24. COMPARATIVA ENTRE NUTKING, @LISTECHNET Y SYREC...................................161 16 17 1. INTRODUCCIÓN 1.1 Generalidades El acceso a la información a través de medios electrónicos es una realidad que demanda avances tecnológicos que faciliten dicha tarea. El Internet es el medio electrónico más utilizado en la actualidad en la búsqueda de información. Sin embargo, éste medio ha sido además una herramienta capaz de transformar la forma de realizar negocios en la sociedad actual. El comercio electrónico es ahora un término empleado normalmente para denominar las transacciones comerciales hechas a través de Internet. El principal factor que ha impulsado la proliferación del comercio electrónico es la comodidad y el bajo costo que representa este medio para la adquisición de productos o servicios. La industria del turismo es uno de los sectores que han visto en los medios electrónicos – principalmente el Internet – la forma de verter la información de sus ofertas de manera global. El primer sistema de información electrónica en este rubro fue el sistema de reservación para las aerolíneas en la década de los 60s [23]. Hoy en día, los sistemas de información turística representan una de las aplicaciones más importante en el comercio electrónico. Los sistemas de información turística además de permitir la reserva de los productos y servicios turísticos han proliferado de tal manera que en la actualidad existe una gran cantidad en el mercado electrónico que utiliza como medio al Internet [19, 20, 41, 53]. En la actualidad, existen sistemas de recomendación turística en la Internet que proveen recursos o paquetes de viaje hacia ciertos destinos turísticos, como por ejemplo: expedia.com, travelocity.com, priceline.com, y eurovacations.com. Todos estos sitios orientan al usuario a buscar recursos de viaje (transportes, alojamientos y paquetes) en los 18 catálogos de ofertas ya sea con base en sus preferencias o bien, de manera libre. Para aquellos usuarios que únicamente necesitan recursos aislados, estos sitios pueden ser de gran utilidad. Sin embargo, para realizar la planeación de un itinerario de viaje (conjunto ordenado de recursos turísticos) existen factores que pueden incrementar el tiempo para obtener un itinerario al gusto del usuario, estos factores pueden ser: buscar recurso por recurso, verificar los horarios disponibles, adaptar cada recurso al presupuesto, etc. El modelado de un sistema de recomendación debe capturar las preferencias del usuario y ser capaz de realizar procesos de inferencia para buscar y proveer las mejores opciones que se adapten a dichas preferencias. Actualmente, existen sistemas de recomendación turística no-comerciales [16, 47] provistos por el mecanismo de razonamiento basado en casos: CBR (Case-Based Reasoning) y por el mecanismo de razonamiento basado en reglas: RBR (Rule-Based Reasoning) que recomiendan tanto ítems como itinerarios turísticos [4]. En los sistemas que implementan el CBR, se enfocan principalmente en la recomendación de ítems e itinerarios turísticos basados en la experiencia del sistema y en la retroalimentación de los usuarios. Básicamente, se utiliza un proceso de búsqueda y reutilización de lo previamente aprendido por el sistema. Por otra parte los sistemas que implementan el RBR, evalúan las preferencias del usuario para recomendar tanto los ítems como los itinerarios turísticos. Los sistemas multiagentes (MAS – MultiAgent Systems) por su parte han servido como paradigma de sistemas de recomendación turística por la propiedad que tienen estos sistemas de trabajar en ambientes distribuidos. Su principal característica es la definición de roles y tareas de sus entidades distribuyendo así una tarea compleja [57]. Cada entidad del sistema (agente) tiene la capacidad de percibir su ambiente y actuar de manera autónoma. Los sistemas de recomendación turística que se basan en este paradigma para su desarrollo asumen que las fuentes de información se encuentran dispersas geográficamente y que nuevas fuentes de información pueden ser introducidas al sistema a través de agentes encargados de registrar sus servicios para poder ser accedidos. Un sistema de recomendación turística basado en un MAS también puede implementar mecanismos de razonamiento como el CBR o RBR para mejorar el proceso de recomendación. Tal es el caso del sistema demostrativo del proyecto @lisTechNet [2, 4], el cual es un MAS provisto del RBR para la planeación de un itinerario turístico. En el dominio del problema de la planeación de un itinerario de viaje, no solamente se identifica la necesidad de dotar al sistema de un mecanismo de razonamiento sino que además el proceso de búsqueda en un cierto ámbito de recursos de viaje evite ser lento. La libertad con la que el usuario pueda seleccionar o rechazar recursos, así como una interfaz que le permita realizar cambios de manera transparente es determinante para obtener una calificación satisfactoria por parte del usuario. En este trabajo de tesis, se presenta un sistema híbrido de recomendación turística llamado SyRec que combina el razonamiento basado en casos (CBR) y el razonamiento 19 basado en reglas (RBR). Se propone una metodología como guía para el desarrollo de un sistema de recomendación híbrido, así como una arquitectura siendo ambas las principales aportaciones de este trabajo. Además se presenta el análisis del comportamiento del sistema, así como una comparativa con otros sistemas similares. Es necesario señalar que este trabajo de tesis se encuentra inmerso dentro del proyecto @lisTechNet [3], y se origina como una derivación del enfoque propuesto para el desarrollo de un sistema de recomendación turística concretado en la aplicación demostrativa del mismo proyecto. 1.2 Proyecto @lis-TechNet Este trabajo de tesis es una contribución por parte de la cátedra de Ambientes Virtuales del Instituto Tecnológico y de Estudios Superiores de Monterrey (ITESM),Campus Estado de México; para el proyecto @lisTechnet. Los objetivos y tareas de este proyecto serán descritos en los siguientes párrafos, así como la participación del ITESM en éste proyecto. 1.2.1 Programa @lis El programa de cooperación @lis (Alliance for the Information Society) - Alianza para la Sociedad de la Información – nace del dialogo político establecido en junio de1999, en Río de Janeiro, entre los jefes de estado y de gobierno de la Unión Europea y de América Latina. Mediante @lis, la Comisión Europea aspira extender las ventajas de la Sociedad de la Información al conjunto de ciudadanos de América Latina, reduciendo así la brecha digital que divide a los que disponen de acceso a las nuevas tecnologías de la información, de aquellos excluidos de ellas. @lis fue creado por decisión de la Comisión Europea el 6 de diciembre de 2001[1]. Los objetivos del programa @lis son los siguientes [1]: • Estimular la cooperación entre los socios europeos y los socios latinoamericanos; • Responder a las necesidades de las colectividades locales y los ciudadanos con vistas a un desarrollo sostenible; • Fomentar el diálogo entre todos los protagonistas y usuarios de la sociedad de la información; • Acrecentar la capacidad de interconexión entre comunidades de investigadores de las dos regiones; 20 • Poner en práctica aplicaciones derivadas de los proyectos de demostración. @lis consta de cinco líneas de acción que corresponden a otros tantos proyectos a realizar entre 2002 y 2005. Cada uno de estos proyectos contribuirá a acercar a los agentes y usuarios de las dos regiones y a favorecer la integración de los países latinoamericanos en la sociedad de la información global. • Un primer capítulo titulado “Diálogo político y reglamentación” tiene por objeto reforzar la integración regional y subregional en América Latina y consolidar las relaciones entre las dos regiones fomentando el diálogo en cuanto a políticas, reglamentación y la e-gobierno (buena gestión por medios electrónicos). • Un segundo capítulo se propone favorecer una mejor integración de los países latinoamericanos en la sociedad de la información global fomentando normas globales y abiertas y alentando las colaboraciones en materia tecnológica. • Un tercer capítulo intensificará la interconexión del colectivo europeo y latinoamericano de investigadores gracias a la instalación de una red informática de alta velocidad. • Además se han constituido dos asociaciones birregionales entre redes de intermediarios y usuarios. La primera procurará estimular la transferencia de conocimientos técnicos entre regiones gracias, en particular, a la creación de comunidades virtuales, a la organización de conferencias anuales o también al desarrollo de hermanamientos a través de Internet. La segunda será una plataforma de apoyo y de intercambio entre organismos reguladores de las telecomunicaciones de América Latina. • En paralelo a estas acciones, permitirán realizar aproximadamente veinte proyectos de demostración distribuidos en cuatro ámbitos temáticos que son la gobernanza local, la educación y la diversidad cultural, la salud pública y la inserción social. El programa @lis tiene por objeto contribuir a la elaboración y aplicación de un enfoque regional de e-Estrategias (estrategias electrónicas) a cargo de los socios latinoamericanos y reforzar sus capacidades políticas y de reglamentación. La acción que acompañará a la transformación hacia la sociedad de la información se realizará en dos frentes: a nivel regional y a nivel nacional o subregional. Cada una de las partes incluirá foros de debate político, talleres, redes, intercambios de información, programas de formación y estudios específicos que abordarán las cuestiones más convenientes. Estas actividades se desarrollarán a lo largo de 36 meses [1]. @lis se propone llevar a cabo unos veinte proyectos de demostración en América Latina que ilustren al ciudadano sobre las ventajas que pueden derivarse de la sociedad de la información en distintos ámbitos temáticos. 21 Los cuatro ámbitos son los siguientes [1]: • la gobierno local; • la educación y la diversidad cultural; • la salud pública; • la inserción social (o e-inclusión). 1.2.2 Proyecto @lis TechNET Dentro de los proyectos aprobados por el programa @lis dentro del ámbito de la educación diversidad cultural, se encuentra el proyecto: @lis TechNET (Advanced Technology Demonstration Network for Education and Cultural Applications in Europe and Latin America). Siendo el solicitante del proyecto la Universidad Politécnica de Catalunya, España. El proyecto @lis TechNet está diseñado para crear un entorno innovador de experimentación y enseñanza en Europa y América Latina. Las funcionalidades del entorno permitirán la conexión continua de todos los socios del consorcio en una red conformada de componentes de software autónomos y capaces de interactuar de forma dinámica entre ellos para proveer servicios a los usuarios [3]. Los socios que componen al proyecto @lis TechNET son los siguientes: Europa • Universidad Politécnica de Catalunya (España). • University of Bath (Gran Bretaña). • Università degli Studi di Parma (Italia). Latinoamérica • Instituto Superior Politécnico José Antonio Echeverría (Cuba). • Universidad de Costa Rica (Costa Rica). • Universidad Tecnológica Metropolitana (Chile). • Instituto Politécnico Nacional (México). • Instituto Tecnológico y de Estudios Superiores de Monterrey, Campus Estado de México (México). Este proyecto tiene como base de desarrollo la plataforma experimental Agentcities para utilizar las más modernas tecnologías de agentes autónomos, Web Internet. Entre los resultados más importantes se espera obtener los siguientes [3]: • Disponer de una infraestructura tecnológica de agentes autónomos, Web Internet – basada en Agentcities—que conecte Chile, Costa Rica, Cuba, México, España, Italia e Inglaterra así como otras partes del mundo que permita que cualquier tipo de software incluido por cualquier socio sea capaz de comunicarse y ser usado por otras piezas incluidas por otros socios. 22 • Disponer de un entorno virtual de enseñanza extendiendo la infraestructura que permita a estudiantes, profesionales de la educación e investigadores a adquirir experiencia al trabajar con tecnologías de punta en las áreas de los agentes autónomos, Web Internet para crear aplicaciones complejas, dinámicas y disponibles en línea. • Disponer de un demostrador capaz de crear servicios personalizados de carácter cultural o turístico que sean accesibles en línea desde un PC y/o dispositivos inalámbricos (teléfonos móviles, PDAs con servicio de roaming u otros dispositivos) a través de la composición dinámica de los servicios instalados por los distintos socios en los diferentes países de los socios del consorcio. Ahora bien, dentro de los resultados esperados, se pueden concentrar en tres ámbitos: despliegue, creación y demostración, cada uno de los cuales han especificados algunas tareas como lo son [3]: • Despliegue o Una plataforma de prueba funcionando 24/7 y que integre tecnologías de agentes, web services y redes semánticas, ligando a todos los participantes del proyecto y que permita conexiones de otros participantes. o Permitir a cada participante la creación y despliegue de servicios basados en agentes que puedan comunicarse con la red y con servicios desarrollados por terceros. • Creación o Un ambiente de educación que incluya tutoriales, ejemplos de código, modelos de ejercicios y soporte en línea para estudiantes de modo que puedan experimentar el desarrollo y despliegue de aplicaciones basadas en agentes,web services y redes semánticas. o Organizar un conjunto de clases distribuidas que permitan a los estudiantes de diferentes universidades desarrollar sistemas que puedan comunicarse con aquellos desarrollados por cualquier otro estudiante. • Demostración o Una aplicación innovadora de turismo/herencia cultural usando la plataforma de prueba que es capaz de integrar dinámicamente datos de turismo/culturales de diferentes países de modo que se facilite al usuario la planeación de viajes y actividades. o Hacer que la aplicación sea accesible utilizando tecnologías de red inalámbricas y alámbricas. La plataforma experimental, o bien de prueba, sugerida por @lis es Agentcities, la cual es una ciudad virtual que esta conformada por usuarios, agentes y servicios. Sus objetivos principales son [3, 9]: 23 • Crear y proveer un ambiente a gran escala, abierto y heterogéneo de entidades autónomas (agentes) y permitir a estas entidades interactuar unas con otras. Por lo que el ambiente debe ser público y abierto a cualquier agente. • Actuar como una plataforma experimental y de pruebas de interoperatividad para agentes. • Permitir la composición dinámica, inteligente y autónoma de servicios, para satisfacer las distintas necesidades comerciales, así como las de los posibles usuarios. 1.3 Descripción del problema La industria del turismo ha utilizado al comercio electrónico fundamentalmente para ofertar sus productos y servicios, dado que la información que describe a estos recursos turísticos es el fundamento de su oferta y demanda y el medio propicio para esto ha sido Internet. Debido a que en la actualidad, el principal problema al que se enfrentan los consumidores es la gran dimensión que tiene el volumen de la información turística, lo que ha derivado en la necesidad de filtrar todo ese volumen de información con base en parámetros como las preferencias del consumidor. Hoy en día, las necesidades de los consumidores han evolucionado por lo que ya no es suficiente proveerles recursos turísticos de acorde a sus necesidades sino que han buscado también que se les provea de paquetes o itinerarios turísticos de manera personalizada ocasionando un problema complejo de planeación turística aunado a un problema de satisfacción de las necesidades de los consumidores. Los sistemas de recomendación turística han solucionado estos problemas utilizando mecanismos de razonamiento, como el razonamiento basado en reglas y el razonamiento basado en casos, dentro del área de la inteligencia artificial para filtrar y recomendar soluciones que concuerden con las necesidades o deseos del usuario. El mecanismo de razonamiento basado en casos (CBR) explota la experiencia en solucionar problemas utilizando precedentes. El mecanismo de razonamiento basado en reglas (RBR) explota la representación del conocimiento a través de reglas que evalúan hechos, para llegar a una solución o conclusión. El uso de un único mecanismo de razonamiento lo hace iterativo tanto para la recomendación de ítems como de itinerarios turísticos. En el caso del CBR la definición de métricas y en el caso del RBR la producción de reglas, se vuelven procesos complejos. 24 El problema abordado en este trabajo de tesis es la integración de los mecanismos RBR y CBR, en el desarrollo de un sistema de recomendación turística que sea capaz de proveer recomendaciones de recursos e itinerarios turísticos de manera personalizada. 1.4 Objetivos Los objetivos generales en este trabajo de tesis son los siguientes: 1. Establecer un enfoque general en sistemas híbridos de recomendación integrando explotando las fortalezas del RBR y del CBR, ya que hasta la fecha no se ha establecido. 2. Proveer una metodología para el desarrollo de un sistema híbrido de recomendación turística que integre RBR y CBR. 3. Proveer un sistema híbrido de recomendación turística que integre el RBR y el CBR que sea capaz de proveer recomendaciones de recursos e itinerarios turísticos de manera personalizada. Los objetivos particulares de este trabajo de tesis son: 1. Identificar las necesidades actuales en el ámbito de los sistemas de recomendación turística. 2. Analizar y comparar los trabajos relacionados. 3. Analizar las técnicas y métodos del RBR y CBR para identificar sus fortalezas. 4. Establecer el dominio de aplicación del RBR y CBR en el proceso de recomendación turística. 5. Proponer una metodología simplificada para el desarrollo de un sistema híbrido de recomendación turística que integre los mecanismos de razonamiento RBR y CBR. 6. La metodología debe abordar los principales modelos del RBR y CBR los cuales son la producción de reglas y los casos de manera respectiva. 7. Desarrollar un prototipo basado en la metodología propuesta que demuestre las fortalezas e integración del RBR y CBR en los procesos de recomendación. 25 1.5 Justificación En este trabajo de tesis, se tienen los siguientes puntos que constituyen la justificación de este trabajo: • El sector turismo es quizás el principal sector de servicios en el que cualquier país que ofrece oportunidades concretas y cuantificadas a cualquier país del mundo sin importar el grado de desarrollo y representa en mucho de los casos la primer fuente de ingresos económicos. Por lo que es importante proveer una metodología para dar a conocer una forma de desarrollo de sistemas de recomendación turística como un medio para dar a conocer los recursos turísticos de un país. • Satisfacer la necesidad de los turistas de encontrar un sistema de recomendación que les permita realizar la planeación personalizada de un itinerario turístico organizado en el tiempo sin tener que adaptarse a los itinerarios previamente establecidos. 1.6 Hipótesis • Un sistema híbrido de recomendación turística – híbrido en el sentido de combinar tanto el RBR como el CBR – simplifica las tareas de filtración, ordenamiento, inferencia y recomendar recursos o ítems turísticos sin que el costo del proceso sea mayor que su beneficio. • El RBR simplifica la recomendación de ítems turísticos a través de la filtración, ordenamiento e inferencia de ítems turísticos en lugar del CBR, a través de la producción de reglas. Ya que en el CBR se tiene que recurrir a su ciclo de razonamiento para establecer todas estas tareas, además del establecimiento de métricas de similaridad. • El CBR simplifica el proceso de recomendación de itinerario turístico. Un itinerario turístico es una estructura compleja en donde se encuentran las preferencias del usuario y un conjunto de recursos turísticos ordenados. Entonces con base en la propiedad del CBR de manejar características complejas de un problema, en esta caso un itinerario turístico, se puede explotar sus métodos para encontrar y recomendar itinerarios similares que son justificados por precedentes para un usuario en particular. 26 1.7 Alcances y limitaciones • La metodología propuesta para el desarrollo de sistemas híbridos de recomendación turística basados en CBR y RBR • El sistema desarrollado SyRec es un prototipo demostrativo de la metodología propuesta y por lo tanto no debe ser considerado como un producto final. • Las métricas aplicadas al sistema SyRec tienen el objetivo de analizar la funcionalidad y coherencia de las recomendaciones generadas bajo casos específicos de prueba. El uso de métricas robustas representa un costo en recursos y tiempo para la realización de este trabajo y son consideradas como trabajo futuro. 1.8 Metodología La metodología considerada para el desarrollo de este trabajo de tesis comprende lassiguientes fases: Figura 1. Diagrama de bloques de las fases del desarrollo del proyecto de tesis • Fase 1. Inicio del proyecto de Tesis. Se identifica el problema existente en el desarrollo de sistemas de recomendación dentro del proyecto @lisTechNet. 27 Posteriormente se recupera la información para analizar los sistemas de recomendación actuales e identificar las necesidades actuales de los consumidores de productos y servicios turísticos. • Fase 2. Definición y desarrollo de la propuesta. En esta fase se analizan e identifican las características de los sistemas de recomendación. Se establece que prototipos experimentales han utilizado el razonamiento basado en casos para resolver el problema de la recomendación de itinerarios turísticos. A razón del proyecto @lisTechNet el cual ha generado un sistema de planeación y recomendación turística basado en RBR se origina el problema de integrar las principales características de ambos tipos de razonamiento. Finalmente, se identifica la metodología Trip@dvice para el desarrollo de sistemas de recomendación turística basados en CBR. Posteriormente, se establecen los criterios para proveer una metodología híbrida. La fase de requerimientos del sistema se establece para producir un prototipo demostrativo llamado SyRec, para la recomendación de ítems e itinerarios turísticos. La etapa de diseño se basa en la metodología propuesta que posteriormente da origen a la implementación del sistema. • Fase 3: Finalización del proyecto. En esta última fase se realizan pruebas al sistema Syrec para verificar la coherencia de la recomendación de ítems e itinerarios turísticos implementados con base en la metodología. 1.9 Organización del documento Este documento esta organizado en ocho capítulos y un anexo. En este capítulo se ha dado una introducción al trabajo realizado, se establece el problema abordado, así como los objetivos, alcances y limitaciones, así como la metodología del propio trabajo. En el capítulo 2, se establece el origen de los sistemas de recomendación turística. La primera sección de este capítulo se enmarca la problemática y retos del turismo y comercio electrónico. En la segunda sección, se define a los sistemas de recomendación, se describen la taxonomía y características de éstos sistemas y se presentan las principales métricas de evaluación de un sistema de recomendación. Finalmente, se describen a los sistemas de recomendación turística. En el capítulo 3, se describe al razonamiento basado en reglas. La primera sección se define a un sistema de producción, ya que éste tipo de sistema constituye el fundamento del razonamiento basado en reglas. En la segunda sección se describe la producción de reglas, memoria de trabajo y la unidad de control respectivamente; todos estos elementos constituyen un sistema de producción. En la tercera sección se describen las principales 28 propiedades de un sistema de producción. En la cuarta sección, se define la taxonomía de los sistemas de producción. En el capítulo 4, se describe al razonamiento basado en casos. En la primera sección se presentan las motivaciones y antecedentes de este tipo de razonamiento. En la segunda sección se describe y define el ciclo del CBR. En la tercera sección se describen los métodos o técnicas utilizadas en el ciclo del CBR. En la cuarta sección, se presenta una comparativa de los mecanismos de razonamiento contra otras técnicas o mecanismos de razonamiento para analizar sus propiedades y dominios de aplicación. En la quinta sección se describen las principales aplicaciones del CBR. En el capítulo 5, se presentan los trabajos relacionados con los sistemas de recomendación turística. En la primera sección, se describe la principal metodología de desarrollo para los sistemas de recomendación turística basados en CBR y el análisis del prototipo desarrollado con base en dicha metodología. En la segunda sección se describe y analiza el sistema de recomendación turística del proyecto @lisTechNet. En la tercera sección, se describen y analizan brevemente otros sistemas de recomendación turísticos basados en sistemas multiagente, sistemas comerciales y sistemas fuera del ámbito del turismo que han combinado tanto al RBR como al CBR. En la cuarta sección se presenta un análisis comparativo de los sistemas contemplados en éste capítulo. En el capítulo 6, se describe la metodología propuesta para el desarrollo de un sistema de recomendación híbrido que integra el RBR y el CBR para establecer las tareas de recomendación de ítems e itinerarios turísticos. En la primera sección, se identifican los principales problemas de los sistemas de recomendación turística en la actualidad .En la segunda sección, se describe la metodología, abordando la modelación de las reglas y casos para la recomendación de ítems e itinerarios turísticos. En la tercera sección, se describe al sistema SyRec describiendo su arquitectura desde el punto de vista lógico y de componentes. En la cuarta sección, se describen los principales casos de prueba realizados a SyRec en donde se verifica la coherencia de las recomendaciones sugeridas. En el capítulo 7, se presenta de manera general los resultados, conclusiones y el trabajo futuro soportado por este trabajo de tesis. 29 2. Sistemas de recomendación turística La industria del turismo fue una de las primeras en utilizar el comercio electrónico, a través de Internet, para difundir sus productos y servicios; con la aparición de los sistemas de reservación en línea [35]. Aunque en un principio los sistemas de reservación fueron acogidos por las empresas de aerolíneas, actualmente son concebidos como sistemas de información turística y no solamente son una herramienta de reserva y contratación de un único servicio sino que ahora se incluyen: alojamientos, medios de transportes, restaurantes, paquetes turísticos, etc. Los sistemas de información turística ahora han tratado de evolucionar hacia un sistema de recomendación turística incluyendo inherentemente la reservación de los productos y servicios turísticos y dotando de resultados personalizados. La razón principal de esta evolución es la gran cantidad de proveedores turísticos que han diseminado la información de sus ofertas a través del mercado electrónico. Por lo que es necesario un sistema que englobe y filtre de alguna manera dicha información de acuerdo a criterios establecidos por el usuario, resultando así los sistemas de recomendación turística. 2.1 El comercio electrónico y el turismo: problemática y retos Dentro del comercio electrónico se pueden encontrar diferentes tipos de relaciones de negocio, como lo son [34]: 30 a) Business-to-Business (B2B): definen transacciones entre empresas. b) Business-to-Consumers (B2C): definen transacciones entre empresas y consumidores finales. c) Consumers-to-Consumers (C2C): definen transacciones entre consumidores finales. La industria del turismo se encuentra clasificada como B2C y es el principal motor de éste tipo de comercio electrónico tanto en Estados Unidos como en Europa [34]. Los productos y servicios turísticos tienen una característica particularmente importante que los coloca en un primer plano del comercio electrónico: la información es el fundamento de su oferta y consumo. Ésta característica se debe a la propiedad de intangibilidad que tienen en si mismos los productos y servicios turísticos. Por lo tanto, el principal problema de esta propiedad es que tiene un producto o servicio basado en la confianza. Entonces hasta que se consume el producto, el consumidor debe tener plena confianza en la calidadde la información con la que se describió el producto o servicio, asumiendo así que cumplirá con sus expectativas. De tal modo que cualquier proveedor turístico que no utilice las tecnologías de comunicación de la información como es el caso del comercio electrónico esta destinado a desaparecer. Debido al hecho de que la difusión de la información de los productos turísticos es la parte fundamental en este sector, el medio eficaz para realizar esta diseminación ha sido hasta el momento Internet siendo éste la base del comercio electrónico [29]. La apertura del mercado de productos y servicios turísticos se le debe a Internet, que permite llegar a millones de clientes potenciales. Antes de la aparición del Internet, se tenía una estructura descentralizada en el consumo de los productos turísticos como se muestra en la figura 2. Figura 2. Diagrama de consumo de los productos turísticos antes de Internet. Tan pronto como el Internet aparece, como se puede apreciar en la figura 3, los intermediarios tienden a convertirse en infomediarios, los cuales no desaparecen pero ven minimizadas las consultas y transacciones que antes tenían totalmente a su cargo. Es necesario señalar que el comercio electrónico en el sector turismo ha disminuido significativamente el costo de los productos turísticos [34, 35]. 31 Figura 3. Diagrama de consumo de los productos turísticos después de Internet. Más que cualquier otro medio, hoy en día Internet permite encontrar cualquier tipo de información sobre cualquier actividad o destino turístico. Sin embargo, al existir una gran cantidad de información es necesario clasificarla y presentarla al consumidor de tal manera que le sea cómodo identificar la información de su interés. Los sistemas de información turística surgen, aunados a la necesidad de difundir la información de los productos y servicios turísticos de manera electrónica, con la finalidad de presentar ordenada y detalladamente la información, además de establecer un contacto directo con el consumidor. Las principales características que definen a los sistemas de información turística son: la calidad de la información presentada y la calidad de acceso. La calidad de contenido provee de comprensión, precisión, consistencia y temática a la información presentada. La calidad de acceso esta orientada a desarrollar aplicaciones electrónicas que puedan ser accedidas a través de cualquier medio electrónico, en cualquier momento y desde cualquier sitio. Aunque, esto puede ser acotado a medios electrónicos con soporte de Internet. De esta manera, los servicios ofrecidos pueden ser independientes de dispositivos, localización del usuario y personalizados. Los sistemas de información turística se han venido desarrollando como aplicaciones web en donde se incluye información y material visual acerca de los productos turísticos ofertados. Este tipo de sistemas en línea se les ha denominado con el nombre de “portales” y representan puntos centrales de acceso que contienen la información de productos y servicios turísticos de una cierta región geográfica que incluso puede ser un país [23]. El turista en la actualidad también demanda los beneficios que el Internet ha traído consigo. La interactividad, característica soportada en Internet, permite al turista un rol más activo en la selección de productos turísticos. Básicamente, los usuarios eligen su destino 32 turístico, así como los servicios que necesitan comparando las ofertas disponibles. Puesto que cada turista tiene un estilo de vida particular e intereses específicos es necesario proveer productos que se adapten a sus preferencias. A fin de satisfacer a los turistas en sus necesidades y deseos, los cuales pueden tener una compleja estructura multi-nivel con un cierto grado de flexibilidad, las ofertas proporcionadas deben ser multi-opcional y de alta calidad [13]. La proliferación de los sistemas de información turística ha permitido introducir al usuario a un escenario interactivo y con un rol activo en la selección y comparación de productos turísticos. Además de permitir incluso la planeación detallada de un itinerario turístico. Sin embargo, el proceso de búsqueda de información y planeación turística es dinámico y complejo. No obstante, se han convertido en medios de soporte para la toma de decisiones [13, 34]. 2.2 La toma de decisión en la planeación de viajes turísticos Un gran número de investigadores se han dado a la tarea de desarrollar teorías o bien a definir conceptos acerca de la influencia de la toma de decisiones en el ámbito turístico [29]. Sin embargo, estas teorías han estado limitadas en la discusión de los componentes de la toma de decisión. Una topología que define las influencias en el proceso de toma de decisión además de englobar características determinantes, se divide en tres categorías [29]: a) Inter-personal: se basa en la influencia social que involucran la interacción de personas o grupos sociales las cuales pueden modificar las características psicológicas y comportamientos de un individuo. b) Intra-personal: se basa en la influencia de los aspectos individuales característicos, v. gr. Estilo de vida, intereses y gustos personales, etc. c) Cicunstancial: se basa en la influencia externa no-social v.gr. objetos, agentes, factores ambientales, etc. Ahora bien, la planeación de un viaje turístico es un proceso multifacético que consiste en la elección de un destino (o conjunto de destinos) y de productos y servicios turísticos asociados [44]. El manejo conceptual en el proceso de toma de decisión en la planeación de un viaje turístico trae consigo retos de diseño para la utilización y efectividad del sistema turístico. Puede ser el caso de que para un turista el concepto destino pueda ser un país y para otro 33 sea una ciudad. Entonces se dice que los términos “destino” y “planeación” son conceptos difusos que carecen de una definición universal. Dado que la planeación de un viaje turístico puede variar en cuanto a su estructura y contenido pueden utilizarse diferentes estrategias para su construcción. Mientras que existen usuarios que prefieren obtener paquetes turísticos, hay otros más que desean seleccionar componente a componente turístico e incluso hay quienes desean un paquete turístico y modificar algunos componentes. El proceso de toma de decisión no solamente se enfoca en ayudar al usuario a seleccionar productos turísticos sino que también esta inmerso en el sistema de información turística. Dado que el sistema debe tener la capacidad de poder inferir o predecir los resultados que mejor se adapten a las preferencias del usuario tomando en cuenta los diferentes tipos de influencias mencionadas anteriormente. En general, un sistema de información turística que tenga la capacidad de clasificar, ordenar e inferir información puede denominarse como un sistema de recomendación turística. 2.3 Sistemas de recomendación Los sistemas de recomendación han proliferado en el interés del público durante la última década y se han convertido en una gran oportunidad de negocio en el comercio electrónico [13, 44]. Algunas empresas en éste rubro, han implantado diferentes tipos de sistemas de recomendación como lo son: BookPool.com (libros), Amazon.com (multiples artículos) y vacations-explorer (turismo). En el ámbito del turismo, las recomendaciones se han convertido en un medio para la selección y planeación de recursos turísticos (alojamientos, transportes, etc.) de manera significativa. Un sistema de recomendación tiene por objetivo ayudar al usuario en la toma de decisiones cuando no existe la suficiente experiencia personal en un cierto tópico o ámbito de interés;además de optimizar la compensación de la relación costo-beneficio. Algunos factores que un sistema de recomendación toma en cuenta para la simplificación de la toma de decisiones pueden ser: simplificar el proceso de búsqueda y comparación de productos, reportar reseñas de otros usuarios o incluso explotar un historial de experiencias pasadas de otros usuarios para sugerir productos. Un sistema de recomendación es un intento de modelar matemáticamente y reproducir técnicamente el proceso de recomendación en el mundo real [13]. En estos sistemas se aplican técnicas de recomendación que están basadas en el supuesto que las preferencias y necesidades del usuario puedan ser mapeadas a selecciones determinadas de productos, empleando algoritmos apropiados y explotando el conocimiento embebido en el 34 sistema. Por lo tanto es necesario identificar las preferencias del usuario así como la valoración que el usuario determine para cada una. 2.3.1 La recuperación de información preferencial Para generar recomendaciones personalizadas es necesario entonces recuperar las preferencias del usuario, dichas preferencias dependerán del ámbito del problema. Para cada una de las preferencias se debe reflejar el grado de interés o necesidad del usuario, a lo que se le llama rating (valoración o tasación) de la preferencia. Existen dos tipos principales de rating [58]: a. Explicitas. El usuario especifica su preferencia hacia un ítem en particular indicando el grado de interés o necesidad en una escala determinada, por ejemplo: escala de 5 puntos, escala semántica, etc. Las escalas son mapeadas a valores numéricos que indican el grado de preferencia. b. Implícitas. Los usuarios frecuentemente tienden a dirigir la carga de sus preferencias al sistema y confiarle la generación de un resultado. Sin embargo, recuperar información acerca de las propias preferencias del usuario puede ayudar a obtener mayor información en el contexto de las necesidades del usuario y generar un resultado optimizado. Mientras más fácil sea de recuperar la información implícita de las preferencias del usuario, el rating implícito reflejará implicaciones discriminantes. Debido a la dificultad que muchas veces representa adquirir ratings explícitos, se pueden adoptar ambos enfoques de manera suplementaria. 2.3.2 Tipos de sistemas de recomendación Hasta ahora se tienen cuatro diferentes enfoques acerca de los sistemas de recomendación. Cada uno de estos enfoques no solo difiere en las técnicas o métodos empleados sino que en la interpretación real del algoritmo esencial de recomendación. De acuerdo al objetivo de la aplicación del sistema de recomendación se puede optar por alguno de los siguientes enfoques [13, 44, 58]: Basados en Contenido También llamado filtrado cognitivo. En este tipo de sistemas el usuario expresa sus preferencias hacia un conjunto definido de productos. Por lo que el sistema recupera de un catalogo de ítems, aquellos que comparten características comunes con los productos que 35 han sido calificados como preferenciales por el usuario. Los resultados son mostrados de acuerdo al grado de concordancia hacia las preferencias del usuario [44]. Filtrado Colaborativo El sistema almacena las valoraciones de los usuarios hacia productos sugeridos o aceptados, con el objetivo de inferir alguna posible similaridad entre los usuarios. Este enfoque es efectivo en la sugerencia de ítems. Ahora bien, la calidad de la recomendación tiende a mejorar a medida que se vayan acumulando nuevas valoraciones [13, 44]. Por lo tanto, los métodos colaborativos requieren una gran cantidad de valoraciones para producir recomendaciones satisfactorias y no pueden realizar adaptaciones con base en nuevos requerimientos ya que solo se basan en los comportamientos de experiencias pasadas. Filtrado Basado en Conocimiento Los sistemas dependen de la representación del conocimiento que usualmente son conjuntos de declaraciones, ontologías u otras formas de sistemas basados en reglas [13]. Este tipo de sistemas es apropiado cuando se requiere un alto rendimiento y flexibilidad en aplicaciones que se enfoquen tanto en las semánticas de contenido y social. Además de contemplar a la inferencia y razonamiento como parte del sistema, el enfoque basado en conocimiento permite beneficiarse de las diferentes representaciones del conocimiento. Híbridos Este tipo de sistemas pueden emerger de cualquier combinación de los enfoques anteriores que generalmente tratan de minimizar las deficiencias de cada enfoque. De hecho, existen diferentes métodos de hibridación como se menciona en [13, 44, 58]. 2.3.4 Objetivos de un sistema de recomendación Es importante entender los objetivos y tareas para las cuales se ha construido un sistema de recomendación para poder evaluarlo posteriormente. A pesar de enunciar estas tareas, no todas son necesariamente significativas dentro del contexto en el cual se sitúa un sistema de recomendación. Entre las tareas más importantes se encuentran [28]: a) Encontrar ítems de interés. Esta tarea es el núcleo de cualquier sistema de recomendación. Se trata de encontrar los ítems específicos que van de acuerdo a las preferencias del usuario. 36 b) Encontrar todos los ítems de interés. La mayoría de los sistemas de recomendación solo encuentra algunos ítems de interés. Pero pueden existir casos en los que se desea invertir una mayor cantidad de tiempo para encontrar el mejor ítem; entonces es importante ampliar la cobertura de recomendación de los ítems de interés. c) Solo búsqueda. Los sistemas de recomendación se evalúan generalmente por que tan bien ayudan se acercan a lo que el usuario desea. Pero en ocasiones el usuario centra la importancia en: la interfaz, la facilidad de uso y en el nivel y naturaleza de la información provista que en los algoritmos de recomendación. d) Proveer credibilidad. Un usuario no confiará automáticamente en un sistema de recomendación. Muchas veces el usuario lo utiliza para darse cuenta si el sistema encuentra las opciones que el desea. e) Expresar calificaciones. Algunos usuarios no les interesa tanto las reservaciones sino que les parece más importante contribuir con calificar los productos recomendados y esto puede contribuir a ayudar a otros usuarios a formularse una opinión acerca del producto. Para poder llevar a cabo la evaluación de los sistemas de recomendación se debe haber definido cuales son las tareas que el sistema soporta. Una vez que se identifican las tareas, se debe seleccionar el conjunto de datos para el cual se aplicarán los métodos de evaluación. 2.3.5 Evaluación de sistemas de recomendación La evaluación de los sistemas de recomendación es fundamental para cuantificar el grado de utilidad de las recomendaciones hechas por un sistema comparadas con el de otro sistema sobre un conjunto definido de usuarios [58]. Las evaluaciones online vs offline Las evaluaciones online (en línea) son consideradas más representativas ya que están orientadas a determinar la reacción del usuario respecto a los sistemas de recomendación. La cantidad de personas que pueden necesitarse para la evaluación es significativa, además que el tiempo de las evaluaciones pueden superar el tiempo de la realización del proyecto [58]. Se pueden encontrar un conjunto de dimensiones de evaluación que describen las evaluaciones en línea como a continuación se enuncian [28]: a) Explicita (preguntar) e implícita (observar). La diferencia entre ambas radica en que en la primera se pregunta directamente al usuario acerca de su reacción con 37 respecto al sistema v.gr. una encuesta;la segunda se observa y registra el comportamiento del usuario. b) Estudios de laboratorio y de campo. Los estudios de laboratorio se enfocan a investigar problemas específicos (hipótesis bien definidas) bajo condiciones controladas. Los estudios de campo revelan la situación de los usuarios en escenarios reales mostrando los patrones de uso así como problemas o cuestiones que el estudio de laboratorio puede no mostrar. c) Resultados y procesos. Para cualquier tarea se deben tener métricas apropiadas que definan cuando un resultado es exitoso. Por lo que la precisión puede ser una métrica fundamental. Los factores de un proceso: el tiempo y el esfuerzo para realizar una tarea deben ser medidos para asegurar que el costo de un resultado exitoso no sobrepase el beneficio. La evaluación offline (fuera de línea) es aplicable a un conjunto de datos que contiene ratings y tiene dos principales debilidades [28]: a) El escaso rating de los datos, lo que representa un limite en la cardinalidad del conjunto de datos que pueda ser evaluado. b) Limitantes de resultado, esto significa que los resultados están limitados a proveer una evaluación objetiva. Por lo tanto una evaluación offline no puede ser determinante para calificar sistemas de recomendación. Conjuntos de datos naturales vs. Sintetizados Los conjuntos de datos naturales representan tal cual la realidad. Sin embargo, pueden ser difíciles de obtener principalmente por el tiempo que implica. El uso de conjuntos de datos sintetizados facilita la manipulación de la dispersión de los datos y puede ser requerido para un cierto numero de casos pero únicamente debe ser considera como un primer paso en la recuperación de conjuntos de datos. Establecer conclusiones acerca de los conjuntos de datos sintetizados es riesgoso, debido a que los datos pueden comportarse de mejor forma con ciertos algoritmos. Propiedades de los conjuntos de datos Con la finalidad de establecer que propiedades debe tener un conjunto de datos para que el modelo de tareas pueda ser evaluado, se establecen tres categorías [28]: • Características de Dominio. Manifiestan la naturaleza del contenido que esta siendo recomendado. 38 • Características inherentes. Reflejan la naturaleza del sistema de recomendación al cual pertenecen • Características ejemplo. Reflejan la distribución de los datos. Métricas de precisión Las métricas de precisión evalúan el grado con el que el sistema puede predecir el rating para un ítem específico además de evaluar la efectividad con la que el sistema ayuda al usuario a seleccionar ítems de mayor interés del conjunto de todos los productos [58]. Las métricas de precisión están clasificadas de la siguiente manera [28, 58]: a) Métricas de precisión predictiva. Es la medida en la que se cuantifica que tan cercanos se encuentran los ratings pronosticados de los que el usuario ha establecido. La métrica más utilizada en este tipo es el error absoluto medio (MAE – mean absolute error) aunque no es apropiada para tareas como: encontrar los ítems de interés. Otras métricas del mismo tipo son: media del error al cuadrado, media de la raíz del error al cuadrado y media normalizada del error absoluto. Las primeras dos elevan al cuadrado el error antes de sumarlo y la última normaliza el error respecto al rango de valores del rating. b) Métricas de precisión en clasificación y soporte de decisión. Esta métrica esta orientada a cuantificar la relevancia del conjunto de recomendaciones, en otras palabras esta orientada a medir la frecuencia con la que un sistema de recomendación realiza correcta o incorrectamente la decisión si un ítem puede ser de interés. Las métricas más utilizadas en este tipo son: Precisión y Retiro [28, 58]. o La precisión se define como la proporción de los ítems destacados respecto del número de ítems seleccionados, en otras palabras representa la probabilidad que un ítem seleccionado sea relevante. o Retiro se define como la proporción de los ítems destacados con respecto al número total de ítems destacados disponibles. c) Métricas de precisión en ordenamiento. Mide la habilidad de un algoritmo para producir el ordenamiento de los ítems que concuerdan con respecto de cómo el usuario podría realizarlo por él mismo. Esta métrica es propicia cuando el dominio del problema presenta valores de preferencias no binarios. Algo más que precisión Los sistemas de recomendación no solo deben proveer de precisión sino también de utilidad, a fin de incorporar respuestas ante posibles valores de ratings que exceden el umbral de lo idóneo. Entre las métricas de utilidad se encuentran [28, 58]: 39 a) Métrica de cobertura. Se basa en el porcentaje de elementos del dominio del problema para los cuales las predicciones pueden realizarse. b) Métricas de novedad y serendipia. Son aquellas métricas que miden la forma en la que las recomendaciones son abiertas hacia los intereses del usuario en el tiempo. 2.4 Sistemas de recomendación turística Aún cuando los sistemas de recomendación turística son difíciles de construir, han proliferado en el área de la investigación como en el comercio electrónico. La dificultad radica en considerar el amplio grado de heterogeneidad de la información disponible en el ámbito del turismo además de las propias dificultadas que implica el proceso de toma de decisión orientado a la planeación de un itinerario turístico. En el ámbito del turismo, los atributos de las entidades turísticas son esenciales para el desarrollo de un sistema de recomendación turística (preferencias del usuario, destino, alojamientos, restaurantes, actividades, etc) [13]: a) Información espacio-temporal b) Costo y aspectos económicos de los ítems c) Archivos multimedia (texto, imágenes, audio y video) d) Clasificación de la información e) Modelos ontológicos de las propiedades especificas del objeto (bases de datos, ontologías, etc). Con base en estas consideraciones acerca de los tipos de datos e información, se pueden describir enfoques iniciales acerca de las técnicas que son apropiadas para un cierto tipo de información, como se describe en la siguiente tabla [13]: Tipo de Información Técnica de filtrado Espacio-temporal Selección en la base de datos, filtrado y razonamiento basado en conocimiento Económica Selección en la base de datos, filtrado y razonamiento basado en conocimiento Clasificación Multimedia Filtrado basado en contenido y modelos ontológicos Modelos ontológicos Diseño y selección en la base de datos, Construcción y razonamiento ontológico Usuarios Filtrado colaborativo Tabla 1. Algoritmos de filtrado para tipos de información. 40 Existen diferentes enfoques establecidos en [13] para abordar el problema de la recomendación en los sistemas de recomendación turística, tomando como base se deben los aspectos de los objetos del mundo real – anteriormente mencionados – que son importantes para un sistema de recomendación turística, se enuncian a continuación: • Diseño y selección en la base de datos. La selección de ítems en una petición (query) puede ser un primer paso para el filtrado de los datos y reducción de ítems. Aunque, no representa un método flexible y óptimo si se agregan más condiciones en la petición, en algunos casos implica un constante acceso a la base de datos. • Modelos ontológicos. Para proyectos de gran magnitud, las ontologías proveen un medio eficiente de representación y almacenamiento de objetos y proveen una base para el razonamiento. No obstante, el desarrollo de un modelo ontológico requiere de un gran esfuerzo en comparación con el diseño de una base de datos. • Filtrado y razonamiento basado en conocimiento.
Compartir