Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/257138901 ANÁLISIS DE ESPECIFICACIÓN DE UN LENGUAJE VISUAL PARA PROCESAMIENTO DIGITAL DE IMAGENES Article · October 2004 CITATIONS 0 READS 352 2 authors, including: Pedro Marquez Instituto Tecnológico de Chihuahua 27 PUBLICATIONS 31 CITATIONS SEE PROFILE All content following this page was uploaded by Pedro Marquez on 05 June 2014. The user has requested enhancement of the downloaded file. https://www.researchgate.net/publication/257138901_ANALISIS_DE_ESPECIFICACION_DE_UN_LENGUAJE_VISUAL_PARA_PROCESAMIENTO_DIGITAL_DE_IMAGENES?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_2&_esc=publicationCoverPdf https://www.researchgate.net/publication/257138901_ANALISIS_DE_ESPECIFICACION_DE_UN_LENGUAJE_VISUAL_PARA_PROCESAMIENTO_DIGITAL_DE_IMAGENES?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_3&_esc=publicationCoverPdf https://www.researchgate.net/?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_1&_esc=publicationCoverPdf https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_4&_esc=publicationCoverPdf https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_5&_esc=publicationCoverPdf https://www.researchgate.net/institution/Instituto-Tecnologico-de-Chihuahua?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_6&_esc=publicationCoverPdf https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_7&_esc=publicationCoverPdf https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_10&_esc=publicationCoverPdf Instituto Tecnológico de Chihuahua ELECTRO 2004 29 ANÁLISIS DE ESPECIFICACIÓN DE UN LENGUAJE VISUAL PARA PROCESAMIENTO DIGITAL DE IMAGENES Márquez Gutiérrez, Pedro Rafael Tecnológico de Chihuahua Posgrado e Investigación en Electrónica Av. Tecnológico 2909, Chihuahua, Chih., 31310 México 413-7474 ext. 112 y 114 pmarquez@itchihuahua.edu.mx 1. RESUMEN Una de las cuestiones más fundamentales en la investigación sobre lenguajes visuales es su especificación. Un lenguaje visual es esencialmente un conjunto de diagramas que representan “oraciones” válidas en ese lenguaje, y donde un diagrama se puede entender como una colección de “símbolos” en un espacio bidimensional o tridimensional. Estas relaciones espaciales entre los símbolos determinan la validez de las oraciones y su semántica. Ejemplos de lenguajes visuales de uso común son las expresiones matemáticas, los planos arquitectónicos y las notaciones musicales. En este artículo se revisan los formalismos más importantes que han sido sugeridos en las últimas décadas para la especificación de lenguajes visuales y sus posibles aplicaciones, con la intención final de elegir uno de estos formalismos para la especificación del lenguaje visual para procesamiento digital de imágenes LeVi-PDI perteneciente al proyecto SIVPII [31]. Un infortunio de los lenguajes visuales está en que sus aspectos teóricos no están completamente entendidos aún, en contraste con los lenguajes secuenciales basados en texto, donde existe un amplio acuerdo en la comunidad científica acerca de sus formalismos y técnicas de especificación, apoyados en todo momento en el desarrollo mismo de la teoría lingüística moderna. Actualmente existen tres enfoques principales en el área de especificación de lenguajes visuales: (a) el enfoque gramatical, (b) el enfoque lógico, y (c) el enfoque algebraico. En la sección 2 se analiza el enfoque gramatical, el cual ha sido fuertemente influenciado por el trabajo en lingüística teórica y la teoría formal de lenguajes en computación. En la sección 3 se analiza el enfoque lógico desarrollado en el campo de la Inteligencia Artificial. En la sección 4 se analiza el enfoque algebraico surgido del trabajo en especificación formal de lenguajes y ambientes de programación. La revisión de estos enfoques está orientada hacia la teoría de los lenguajes visuales desde las perspectivas de su especificación y de las ciencias cognitivas. Cabe aclarar que esté trabajo es una continuación del presentado en [32]. Finalmente, se dan algunas conclusiones y líneas de trabajo futuras. 2. FORMALISMOS DE ESPECIFICACION GRAMATICAL Los primeros formalismos de especificación de lenguajes visuales fueron los gramaticales. Estos eran simples modificaciones de las gramáticas basadas en frases empleadas para la especificación de lenguajes de cadenas. Posteriormente llegaron los enfoques basados en grafos y árboles. Muchos de estos enfoques fueron introducidos para el procesamiento de imágenes y uno de sus principales proponentes fue K. S. Fu [1]. Desafortunadamente, estos enfoques son muy restrictivos. Los enfoques más genéricos se pueden dividir en dos grandes grupos (1) gramáticas basadas en multi-conjuntos con atributos, y (2) gramáticas de grafos con aristas etiquetadas. 2.1. Lenguajes de Cadenas El trabajo aquí realizado está basado mayormente en la teoría de los lenguajes de Noam Chomsky [2]. De acuerdo a Chomsky, la sintaxis de los lenguajes secuenciales se especifica mediante una gramática compuesta de reglas de producción que denotan frases u oraciones. La especificación de los lenguajes de cadenas distingue la sintaxis de la semántica. Se dice que una oración es sintácticamente correcta si es derivable a partir de la aplicación exclusiva de las reglas de producción. Estas reglas emplean dos tipos básicos de símbolos: terminales y no- terminales. Existe un símbolo no-terminal especial, llamado el símbolo de inicio, a partir del cual se generan todas las posibles oraciones contenidas en Instituto Tecnológico de Chihuahua ELECTRO 2004 30 el lenguaje definido por un conjunto particular de reglas de producción. Se dice que una cadena que sólo contiene símbolos terminales es una oración. El conjunto de todas las posibles oraciones constituye al lenguaje. Dada una gramática y una oración, el problema más simple que podemos plantear es el problema de membresía, es decir, verificar si la oración pertenece al lenguaje definido por la gramática o no. Al procedimiento que resuelve este problema se le conoce en Inglés por parser (analizador sintáctico). Chomsky dividió estas gramáticas en 4 tipos, de acuerdo a la forma de las producciones. Las gramáticas Tipo 0, o gramáticas irrestrictas, permiten cualquier número de símbolos terminales o no terminales en ambos lados de una producción. Las gramáticas Tipo 1, o sensitivas al contexto, poseen producciones de la forma Aα γ αβγ→ , donde A es un símbolo no terminal, β es una cadena no vacía de símbolos y α y γ son cadenas posiblemente vacías. El significado de esta es regla es “A se puede reemplazar por β cuando aparezca en el contexto de α y γ ”. Las gramáticas Tipo 2, o libres de contexto, no permiten el empleo de contextos. Sus reglas tienen la forma A β→ . Las gramáticas Tipo 3, o gramáticas regulares, poseen producciones de la forma A aB→ o A a→ , donde a es un símbolo terminal,mientras que A y B son no- terminales. Cabe mencionar que la importancia de las gramáticas Tipo 2, o libres de contexto, se debe a que son las mayormente empleadas en la creación de lenguajes de programación. En general, el análisis sintáctico permite determinar si una oración está sintácticamente bien formada. El siguiente problema consiste en encontrar su significado. La semántica de una oración se encuentra buscando el significado de cada símbolo terminal en un diccionario y componiendo estos significados siguiendo la estructura del árbol sintáctico definido por la derivación determinística de la oración. Una forma de realizar lo anterior fue sugerida por Knuth [3] empleando atributos, los cuales son valores asociados con cada símbolo y las producciones indican como se puede obtener un símbolo a partir de otros. En el caso de los lenguajes visuales, estos atributos se pueden clasificar adicionalmente en activos y pasivos, los cuales limitan la aplicabilidad de las producciones (el lenguaje definido) y definen la semántica del diagrama, respectivamente. 2.2. Gramáticas de Cadenas Generalizadas La idea básica consiste en modificar las gramáticas de cadenas añadiendo generalizaciones apropiadas de la concatenación bidimensionales. En ellas, los símbolos terminales se interpretan como objetos bidimensionales (líneas o arcos), los cuales tienen una cabeza y una cola que permiten concatenarlos. Sin embargo, su generalidad es muy limitada debido a lo restrictivo de la composición. Otra estrategia es la gramática de formas con atributos de You y Fu [4] empleada para el reconocimiento de formas 2D compuestas de una secuencia de curvas. El empleo de árboles permite la generalización de la concatenación unidimensional hacia multidimensional. Las gramáticas de árboles y sus reconocedores, los autómatas de árboles también han sido empleados en el procesamiento de imágenes por K. S. Fu y otros, donde un árbol describe una imagen. Su generalidad en la generación de imágenes es muy limitada. Otro enfoque es el propuesto por el lenguaje PDL (Picture Description Language) de Shaw [5], el cual proporciona mayor variedad de operaciones de concatenación y primitivas tales como líneas o texto, así como puntos de cabeza y cola para la concatenación de primitivas. PDL ha sido empleado, por ejemplo, para el análisis sintáctico de diagramas de física abstracta de partículas. Masini y Mohr [6] extendieron PDL agregando operadores topológicos y geométricos tales como “contiene” y “encima”. En la gramática 2D-CFG [7], los símbolos representan bloques rectangulares y las producciones permiten componer regiones horizontales o verticales. En cierta forma, las gramáticas posicionales [8] son una generalización de las 2D-CFG ya que la operación de concatenación representa una relación espacial arbitraria, la cual da información acerca de la posición relativa del siguiente símbolo con respecto al actual. Estas son adecuadas, por ejemplo, para describir la distribución 2D de páginas de texto y para lenguajes icónicos. Sin embargo, es difícil diseñar una gramática posicional para expresiones matemáticas, aunque existen extensiones de estas que son capaces de especificar, por ejemplo, diagramas de flujo. Las gramáticas de arreglos asumen que los símbolos están arreglados en una rejilla o arreglo. Las producciones rescriben subarreglos en subarreglos, como lo explica Kirsh [9]. Estas gramáticas han sido empleadas para describir análisis de imágenes Instituto Tecnológico de Chihuahua ELECTRO 2004 31 a bajo nivel en el que los elementos del arreglo son píxeles. Sin embargo, no han sido adecuados para la especificación de lenguajes visuales de alto nivel. 2.3. Gramáticas de Grafos El procesamiento de imágenes fue una de las principales motivaciones para el desarrollo de las gramáticas de grafos, así como el reconocimiento de diagramas, su representación y procesamiento. En las gramáticas de red [10], las oraciones son grafos dirigidos con símbolos en los nodos. Una producción reemplaza una subred dentro de otra y tiene la forma Eβα → donde α y β son redes y E es una incrustación (una función lógica) que especifica como es que β será conectada (incrustada en) la red ω cuando α es reemplazada por β . Desafortunadamente, estas gramáticas no han demostrado mucha utilidad en la especificación de diagramas arbitrarios ni en lenguajes visuales que no sean del tipo grafo. Las gramáticas plex emplean primitivas de imágenes con múltiples puntos de conexión. Sus producciones tienen la forma ααα ∆Γ→∆ AA , donde A es una entidad de enlace múltiple (NAPE), α es una cadena de NAPEs, A∆ es una cadena que detalla los puntos de amarre de A, αΓ especifica la forma en que están interconectados los puntos de enlace de los elementos en α , α∆ indica como los punto de enlace de los elementos en α corresponden a los puntos de amarre en A∆ . Estas gramáticas han sido generalizadas para objetos 3D y se ha demostrado ser equivalentes a los sistemas de reemplazo de hiper-aristas. Sin embargo, estas gramáticas tampoco son adecuadas para lenguajes visuales que no sean grafos. También se ha demostrado que las gramáticas de grafos con aristas etiquetadas se pueden usar para especificar una amplia variedad de lenguajes visuales, aunque es muy costoso, por lo que se investigan subclases de éstas. A estas gramáticas se les conoce como edNLC (edge-labelled directed node-label controlled), cuyas producciones tienen la forma EA α→ , donde A es un nodo etiquetado, α es un grafo edNLC, y E es una incrustación que indica como los nodos en α serán conectados a los vecinos del nodo siendo reescrito en el grafo anfitrión [11]. Variaciones sobre estas gramáticas son las gramáticas árbol-grafo [12] que generan grafos jerárquicos y han sido empleadas para reconocer diagramas de circuitos; las attributed programmed graph grammar empleadas en la representación de diagramas de flujo y circuitos eléctricos y variaciones empleadas como base de editores de lenguajes visuales dirigidos por sintaxis [13]; las gramáticas de relación [14] que emplea reglas de evaluación para rescribir las restricciones (relaciones) que se mantienen entre los símbolos; y las gramáticas 2D-CFG generalizadas, que son una subclase de las gramáticas de relación y generalizan las 2D-CFG. 2.4. Gramáticas Multiconjunto con Atributos En estos enfoques, las producciones rescriben conjuntos o multiconjuntos de símbolos que tienen atributos geométricos y a veces semánticos. La reescritura es controlada por restricciones sobre los atributos de los símbolos en el lado derecho de la producción. Entre éstas encontramos las gramáticas de coordenadas [15] empleadas para especificar notación matemática; gramáticas de procesamiento de imágenes [16] empleada en la comprensión de oraciones compuestas de iconos; las gramáticas de distribución de imágenes [17]; y las gramáticas relacionales [18] para aplicaciones multimedia las cuales heredan ideas de lingüística computacional y emplea restricciones basadas en unificación para expresar restricciones espaciales, entre otras. 2.5. Otros Enfoques Las gramáticas de formas [19] fueron desarrolladas para diseño arquitectural 2D y 3D, y pinturas. Las gramáticas visuales [20] son gramáticas especificadas visualmente, similares a las gramáticas libres de contexto, pero permite un arreglo espacial de los símbolos del lado derecho. 3. FORMALISMOS LÓGICOS Uno de los objetivos principales de este enfoque es mejorar la expresividad y utilidad de las especificaciones, lo cual es en cierto sentido contrario a la búsqueda de una tratabilidad formal completa. Aparte del procesamiento sintáctico de los lenguajes está el procesamiento semántico, del cual parecen existir más tareas. Este último requiere del empleo de conocimiento y, por ende, es necesario un mecanismo de integración.El procesamiento de lenguaje natural ha marcado una pauta a seguir en este sentido. Existe, Instituto Tecnológico de Chihuahua ELECTRO 2004 32 afortunadamente, una similitud entre el enfoque gramatical y el lógico, encontrado en la teoría de la programación lógica. 3.1. Cláusulas Definidas En el marco de la programación lógica un programa es una colección de reglas que definen un predicado de primer orden y tienen la forma ),..,(,..,),..,(),..,( 11 1 111 1 mn mmm n n SSpSSpTTp ∧∧← donde iT y j iS son términos, y se llama una cláusula definida. El lado derecho puede ser vacío, indicando que es incondicionalmente cierto y se llama un hecho. La semántica de un programa lógico se puede describir mediante la teoría de modelos o la teoría de pruebas, y se ha demostrado que son equivalentes. Colmerauer introdujo las gramáticas metamorfosis [21] para la programación lógica, la cual se redefinió después ha gramáticas de cláusulas definidas (DCG) las cuales se convirtieron en el estándar. Las ideas de las gramáticas DCSG (S por Set) se originaron del análisis de circuitos electrónicos [22]. La diferencia entre una y otra es que las DCG usan listas, mientras que las DCSG usan conjuntos o multiconjuntos para representar oraciones, lo cual permite que el orden de las palabras sea parcialmente libre. 3.2. Programación Lógica con Restricciones (CLP) Integra la programación lógica y restricciones en algún dominio matemático, como los reales. Además de esto, CLP reemplaza el procedimiento de unificación de la LP por un mecanismo de resolución de restricciones. Las restricciones son esencialmente igualdades o desigualdades en el dominio. De hecho, la programación lógica clásica se puede entender como CLP sobre el dominio de términos no interpretados. Se pueden definir relaciones espaciales aritméticamente empleando las coordenadas de los objetos, y definiendo conjuntos explícitamente, o extendiendo CLP hacia el dominio de los conjuntos. Así las gramáticas restringidas multiconjunto (CMG) se pueden ver como una forma de CLP parecido a que las DCG son una forma de programas lógicos. La ventaja es que CMG posee una semántica lógica y operacional limpia y permite integrar completamente razonamiento acerca de geometría. Otro enfoque consiste en reformular la topología en un formalismo lógico y luego extenderlo hacia un lenguaje de alto nivel. Clark propone un cálculo de individuos basado en conexiones en el que el concepto primitivo es una región (en vez de un punto). Este enfoque proporciona mucho de lo que se necesita para manejar lenguajes visuales típicos, aunque no proporciona herramientas para la construcción de parsers, ni para relaciones geométricas basadas en medidas, por ejemplo “cerca de”, “arriba del punto medio”, etc. Este cálculo ha sido empleado en la construcción del cálculo de conexión de regiones y aplicado en la definición de lenguajes visuales. Pictorial Janus [24] es un ejemplo, aunque no muestra como se puede interpretar una imagen usando RCC y se espera que el costo computacional sea muy alto. 3.3. Lógica Descriptiva En general, las teorías de la lógica descriptiva se inspiran en las redes de herencia estructuradas, las cuales especifican redes de conceptos definidos mediante fórmulas de primer orden. Existen diferentes tipos de lógicas descriptivas. Si se elige una que sea decidible se puede emplear una máquina de inferencias para interpretar imágenes a partir de conceptos gráficos básicos. En general, un razonador de lógica descriptiva consiste de un razonador terminológico que analiza relaciones de subsumción entre conceptos, y un razonador asercional que reconoce y mantiene la membresía de concepto de los individuos. El principal problema sigue siendo la integración de un dominio espacial concreto. Para permitir el razonamiento sobre datos espaciales, los objetos espaciales deben ser dados de alta como conceptos primitivos mediante algún mecanismo externo. Una alternativa es extender el formalismo subyacente hacia el dominio algebraico de modo que se puedan emplear conceptos geométricos como conceptos definidos. Lo anterior se puede realizar bajo el esquema CLP con la ayuda de dominios concretos, por ejemplo, CLASSIC [28]. La característica más distintiva de la lógica descriptiva es que permite realizar tres tipos diferentes de razonamiento acerca de imágenes: se puede emplear para realizar “parsing” de imágenes; puede construir ejemplos de imágenes; y puede hipotetizar información faltante para imágenes incompletas, lo cual es una poderosa herramienta para el análisis de errores y corrección de diagramas. 3.4. Lógica Visual La idea es combinar las capacidades de razonamiento de los sistemas lógicos con la Instituto Tecnológico de Chihuahua ELECTRO 2004 33 expresividad de la comunicación gráfica, integrando un nuevo tipo de término en la programación lógica: el término imagen. Estos pueden considerarse como imágenes parcialmente especificadas consistentes de constantes visuales (objetos imagen) y variables visuales. Los objetos y las variables en un término imagen se encuentran en relaciones espaciales implícitas que se pueden inferir del despliegue del término. El modelo formal subyacente para los términos imagen son los grafos con nodos objeto y aristas de relación con tipo de acuerdo a la definición de un vocabulario de imágenes que detalla los tipos de objetos y los tipos de relaciones. Adicionalmente, se puede usar un fondo para denotar un contexto análogo a la cola de una lista en programación lógica estándar. Para esto, se usa una segunda clase de unificación que se aplica a los términos imagen. Esto se puede emplear para representar animación de diagramas, por ejemplo. La programación lógica con imágenes maneja imágenes como estructuras tipo grafo, por ello, es similar a las gramáticas de relación y el problema esperado de integrar un dominio geométrico se resuelve haciendo la transición hacia la programación lógica con restricciones, como por ejemplo CLP(RI) [25]. El mecanismo de unificación utiliza unificación de grafos implementado mediante particionamiento de conjuntos. Shin [26] define un sistema de razonamiento formal de diagramas bien formados como una extensión de los diagramas de Venn y la semántica se obtiene mapeando los diagramas a teoría de conjuntos y se demuestra que la regla de consecuencia sintáctica es sólida y completa con respecto a la consecuencia semántica, por lo que las reglas de inferencia gráfica es tan poderosa como su contraparte textual. Hammer [27] extiende el formalismo de Shin permitiendo el uso intercambiable de razonamiento visual y textual haciendo uso de grafos higraph. 4. FORMALISMOS ALGEBRAICOS La idea principal consiste en mapear el dominio a ser definido en un tipo abstracto de datos con tipos y definir funciones con tipos y predicados sobre estas estructuras que especifican las operaciones en el dominio de aplicación. Se emplea normalmente una jerarquía de tipos. Los objetos atómicos se tratan como estructuras de datos de ciertos tipos base, y se emplean funciones de composición para combinar objetos base en objetos compuestos de tipos más complejos. Un problema fundamental bajo este escenario es como definir el procedimiento de parsing. En general, el análisis sintáctico consiste en encontrar una secuencia de aplicaciones de funciones a un conjunto de objetos base (objetos terminales) que los transforma en un solo objeto de tipo oración. 4.1. Enfoques Algebraicos La base formal del método propuesto por Wang [29] es una álgebra order-sorted extendida por un lenguaje lógico order-sorted. La integración del razonamiento se logra definiendo estructuras algebraicas para el dominio de imágenes y el dominio de la aplicación, e introduciendo mapeos entre los objetos y las funciones en ambos dominios. Chang [30] en su teoría deiconos generalizados emplea operaciones de composición de iconos gráficos y está ligado a operaciones de composición semántica para especificar la interpretación de oraciones icónicas. Ya que una imagen se considera como una oración acerca del dominio de aplicación, toda transformación de imágenes es seguida de una transformación de una sentencia acerca del dominio de aplicación. Una imagen concreta es una situación (propiedades de la imagen) y es considerada como un modelo de la teoría gráfica. Si esta teoría describe completamente las imágenes admisibles, entonces se tendrá una forma de verificar si una imagen es válida o no. Solo se requiere probar si la situación es consistente con la teoría. El sistema Graphical Assisted Reasoning el cual puede derivar una interpretación de una imagen dada y responde a preguntas simples acerca del dominio mediante inferencia visual. Una diferencia sustancial respecto de los enfoques anteriores, es que solo se manejan imágenes planas, es decir, no jerárquicas y no existe conexión real entre los objetos geométricos ya que son tratados como tipos abstractos. Sin embargo, es factible extender el formalismo para incluirlos y ya existe trabajo al respecto. Una de las cosas que aun no quedan muy claras es si se pueden implementar métodos comparables al parsing directamente. Para reconocer automáticamente que clase de concepto representa una imagen y cuales son sus constituyentes se requeriría un mecanismo de razonamiento similar al de la lógica descriptiva. 5. CONCLUSIONES Los lenguajes visuales son un concepto abierto y puede comprender el espectro completo de la comunicación humana. Aún no se ha encontrado Instituto Tecnológico de Chihuahua ELECTRO 2004 34 un enfoque unificado para esta teoría. La investigación en lenguajes visuales puede y ha sido realizada desde diferentes perspectivas: teoría de la computación, inteligencia artificial, psicología cognitiva, lingüística, arquitectura, diseño y arte. Algo que aun se pregunta es porque el impacto de las representaciones formales para lenguajes visuales en aplicaciones reales ha sido tan limitado. Por ejemplo, en el área de reconocimiento de bajo nivel y detección de características, los enfoques estructurados se han perdido contra los enfoques estadísticos. En el caso del reconocimiento de alto nivel se han desarrollado muchos prototipos pero pocos se han producido y tienen, en general, un dominio de aplicación muy limitado. Además, se han hecho pocos prototipos de ambientes de lenguajes visuales que puedan ser empleados en el desarrollo de aplicaciones. En general, existe cierto divorcio entre los problemas reales y la tecnología propuesta, la literatura sufre de una alta fragmentación y la investigación básica no pone atención a problemas reales de ingeniería. Por otro lado, las aplicaciones reales implementan métodos solamente para un problema y desprecia la existencia de métodos que pudieran apoyar marcos teóricos más generales. REFERENCIAS [1] K.S. Fu, Syntactic Pattern Recognition and Applications, Prentice-Hall, 1982. [2] N. Chomsky, Aspects of the Theory of Syntax, MIT Press, Cambridge, 1965. [3] D.E. Knuth, The genesis of attribute grammars, en Attribute Grammars and their Applications, P. Deransart y M. Jourdan, Eds., vol. 461 de LNCS, pp. 1-12, Springer-Verlag, 1990. [4] K.C. You y K.S. Fu, A syntactic approach to shape recognition using attributed grammars, IEEE Transactions on Systems, Man and Cybernetics, vol. 9, No. 6, pp. 334-345, 1979. [5] A.C. Shaw, A formal picture description scheme as a abasis for picture processing systems, Information and Control, vol.14, pp. 9-52, 1969. [6] G. Masini y R. Mohr, MIRABELLE: A system for structural analysis od drawings, Pattern Recognition, vol. 16, No. 4, pp. 363-372, 1983. [7] M. Tomita, Efficient parsing for Natural Language, Kluwer Academic, Boston, 1985. [8] G. Costagliola y S.K. Chang, A generalizad parser for 2D languages, IEEE Symposium on Visual Languages, pp. 98-104, IEEE Computer Society Press, 1991. [9] J. Kirsh y R. Kirsh, The structure of paintings: formal grammar and design, Environment and Planning B: Planning and Design, vol. 13, pp. 163-176, 1986. [10] J.L. Pfaltz y A. Rosenfeld, Weg grammars, Proc. First Intl. Joint Conference on Artificial Intelligence, pp. 609-619, 1969. [11] F.J. Branderburg, On polynomial time graph grammars, Fifth Conf. on Theoretical Aspects of Computer Science, vol. 294 LCNS, pp. 227-236, Springer-Verlag, 1988. [12] A. Sanfeliu y K.S. Fu, Tree graph grammars for pattern recognition, Graph Grammars and Their Applications to Computer Science, vol. 153 LCNS, pp. 349-368, Springer-Verlag, 1983. [13] H. Göttler, Graph grammars, a new paradigm for implementing visual languages, EUROGRAPHICS 89, PP. 505-516, Elsevier Science publishers (North-Holland), 1986. [14] C. Crimi, A. Guercio, G. Nota, G. pacini, G. Tortora y M. Tucci, Relation Grammars for modeling multidimensional structures, IEEE Symposium on Visual Languages, pp. 168-173, IEEE Computer Society Press, 1990. [15] M. Anderson, Diagramatic reasoning and cases, Thirteen National Conference on Artificial Intelligence, pp. 1004-1009, Portland, 1996. [16] S.K. Chang, Picture processing grammar and its applications, Information Sciences, vol. 3, pp. 121-148, 1971. [17] E.J. Golin, A Method for the specification and Parsing of Visual languages, PhD Thesis, Dept. of Computer Science, Brown Univ. 1991. [18] K. Wittenburg, L. Weitzman y J. Talley, Unification-based grammars and tabular parsing for graphical languages, Journal of Visual Languages and Computing, vol. 2, pp. 347-370, 1991. Instituto Tecnológico de Chihuahua ELECTRO 2004 35 [19] J. Gips, Shape Grammar and Their Uses, Birkhauser Verlag, 1975. [20] F. Lakin, Visual Grammars for visual languages, Visual Languages, S-K Chang, T. Ichikawa, P. A. Ligomenides, Eds., pp. 35-85, 1986. [21] A. Colmerauer, Metamorphosis Grammars, Natural Language Communication with Computers, L. Bolc, Ed., Springer-Verlag, 1978. [22] T. Tanaka, Definite set clause grammars: A formalism for problem solving, Journal of Logic Programming, vol. 10, pp. 1-17, 1991. [23] B.L. Clarke, A calculus of individuals bases on connection, Notre Damme Journal of Formal Logic, vol. 23, No. 3, pp. 204-218, 1981. [24] J.M. Gooday y A.G. Cohn, Visual language syntax and semantics: A spatial logic approach, Intl. Workshop on Theory of Visual Languages, K. Marriott y B. Meyer, Eds., 1996. [25] B. Meyer, Formalization of visual mathematical notations, AAAI Fall Symposium on Reasoning with Diagrammatic Representations, AAAI Press, pp. 58-68, 1997. [26] S.-J. Shin, The Logical Status of Diagrams, Cambridge Univ. Press, 1995. [27] E. Hammer, Representing relations diagrammatically, Working Papers on Diagrams and Logic, G. Allwein y J. Barwaise, Eds., Indiana Univ., 1993. [28] R.J. Brachman y J.G. Schmolze, An overview of KL-ONE knowledge representation systems, Cognitive Science, pp. 171-216, 1985. [29] D. Wang y J.R. Lee, Pictorial Concepts and a concept supporting graphical system, Journal of Visual languages and Computing, vol. 4, pp. 177- 199, 1993. [30] M. Chacón, SIVPII: Sistema Inteligente de Visión para Inspección Industrial, Tecnológico de Chihuahua, Posgrado e Investigación, Chihuahua, Chih., México, 2001. [31] I. Hernández y P. Márquez, Arquitectura de LeVi-PDI, Electro 2003, Tecnológico de Chihuahua, Chihuahua, Chih., México, 2003. [32] A.V. Aho, R. SEIT y J.D. Ullman, Compilers, Principles, Techniques, and Tools, Addisson- Wesley Series in Computer Science, Addison- Wesley, Reading, 1987. [33] K. Marriot y B. Meyer, Visual Language Theory, Eds., Springer-Verlag, 1998. [34] J.E. Hopcroft y J.D. Ullman, Introduction to Automata Theory, Languages and Computing, Addison-Wesley, Reading,1979. [35] J. Jaffar y M.J. Maher, Constraint Logic Programming: A Survey, The Journal of Logic Programming, v.20, pp. 503-582. 1994. [36] J. van Leeuwen, Ed., Handbook of Theoretical Computer Science, vol.2, Elsevier, Amsterdam, New York, 1990. [37] K. Marriot y P. Stuckey, Programming with Constraints: An Introduction, MIT Press, Cambridge, MA, 1998. View publication stats https://www.researchgate.net/publication/257138901
Compartir