Logo Studenta

ANÁLISIS DE ESPECIFICACIÓN DE UN LENGUAJE VISUAL PARA PROCESAMIENTO DIGITAL DE IAMGNES

¡Estudia con miles de materiales!

Vista previa del material en texto

See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/257138901
ANÁLISIS DE ESPECIFICACIÓN DE UN LENGUAJE VISUAL PARA
PROCESAMIENTO DIGITAL DE IMAGENES
Article · October 2004
CITATIONS
0
READS
352
2 authors, including:
Pedro Marquez
Instituto Tecnológico de Chihuahua
27 PUBLICATIONS   31 CITATIONS   
SEE PROFILE
All content following this page was uploaded by Pedro Marquez on 05 June 2014.
The user has requested enhancement of the downloaded file.
https://www.researchgate.net/publication/257138901_ANALISIS_DE_ESPECIFICACION_DE_UN_LENGUAJE_VISUAL_PARA_PROCESAMIENTO_DIGITAL_DE_IMAGENES?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_2&_esc=publicationCoverPdf
https://www.researchgate.net/publication/257138901_ANALISIS_DE_ESPECIFICACION_DE_UN_LENGUAJE_VISUAL_PARA_PROCESAMIENTO_DIGITAL_DE_IMAGENES?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_3&_esc=publicationCoverPdf
https://www.researchgate.net/?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_1&_esc=publicationCoverPdf
https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_4&_esc=publicationCoverPdf
https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_5&_esc=publicationCoverPdf
https://www.researchgate.net/institution/Instituto-Tecnologico-de-Chihuahua?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_6&_esc=publicationCoverPdf
https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_7&_esc=publicationCoverPdf
https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_10&_esc=publicationCoverPdf
Instituto Tecnológico de Chihuahua ELECTRO 2004 
 
 
 29
ANÁLISIS DE ESPECIFICACIÓN DE UN LENGUAJE VISUAL PARA 
PROCESAMIENTO DIGITAL DE IMAGENES 
 
Márquez Gutiérrez, Pedro Rafael 
Tecnológico de Chihuahua 
Posgrado e Investigación en Electrónica 
Av. Tecnológico 2909, Chihuahua, Chih., 31310 México 
413-7474 ext. 112 y 114 
pmarquez@itchihuahua.edu.mx 
 
 
1. RESUMEN 
Una de las cuestiones más fundamentales 
en la investigación sobre lenguajes visuales es su 
especificación. Un lenguaje visual es 
esencialmente un conjunto de diagramas que 
representan “oraciones” válidas en ese lenguaje, y 
donde un diagrama se puede entender como una 
colección de “símbolos” en un espacio 
bidimensional o tridimensional. Estas relaciones 
espaciales entre los símbolos determinan la validez 
de las oraciones y su semántica. Ejemplos de 
lenguajes visuales de uso común son las 
expresiones matemáticas, los planos 
arquitectónicos y las notaciones musicales. 
En este artículo se revisan los 
formalismos más importantes que han sido 
sugeridos en las últimas décadas para la 
especificación de lenguajes visuales y sus posibles 
aplicaciones, con la intención final de elegir uno de 
estos formalismos para la especificación del 
lenguaje visual para procesamiento digital de 
imágenes LeVi-PDI perteneciente al proyecto 
SIVPII [31]. 
Un infortunio de los lenguajes visuales 
está en que sus aspectos teóricos no están 
completamente entendidos aún, en contraste con 
los lenguajes secuenciales basados en texto, donde 
existe un amplio acuerdo en la comunidad 
científica acerca de sus formalismos y técnicas de 
especificación, apoyados en todo momento en el 
desarrollo mismo de la teoría lingüística moderna. 
Actualmente existen tres enfoques 
principales en el área de especificación de 
lenguajes visuales: (a) el enfoque gramatical, (b) el 
enfoque lógico, y (c) el enfoque algebraico. En la 
sección 2 se analiza el enfoque gramatical, el cual 
ha sido fuertemente influenciado por el trabajo en 
lingüística teórica y la teoría formal de lenguajes 
en computación. En la sección 3 se analiza el 
enfoque lógico desarrollado en el campo de la 
Inteligencia Artificial. En la sección 4 se analiza el 
enfoque algebraico surgido del trabajo en 
especificación formal de lenguajes y ambientes de 
programación. La revisión de estos enfoques está 
orientada hacia la teoría de los lenguajes visuales 
desde las perspectivas de su especificación y de las 
ciencias cognitivas. Cabe aclarar que esté trabajo 
es una continuación del presentado en [32]. 
Finalmente, se dan algunas conclusiones y líneas 
de trabajo futuras. 
 
2. FORMALISMOS DE ESPECIFICACION 
GRAMATICAL 
Los primeros formalismos de 
especificación de lenguajes visuales fueron los 
gramaticales. Estos eran simples modificaciones de 
las gramáticas basadas en frases empleadas para la 
especificación de lenguajes de cadenas. 
Posteriormente llegaron los enfoques basados en 
grafos y árboles. Muchos de estos enfoques fueron 
introducidos para el procesamiento de imágenes y 
uno de sus principales proponentes fue K. S. Fu 
[1]. Desafortunadamente, estos enfoques son muy 
restrictivos. Los enfoques más genéricos se pueden 
dividir en dos grandes grupos (1) gramáticas 
basadas en multi-conjuntos con atributos, y (2) 
gramáticas de grafos con aristas etiquetadas. 
 
2.1. Lenguajes de Cadenas 
El trabajo aquí realizado está basado 
mayormente en la teoría de los lenguajes de Noam 
Chomsky [2]. De acuerdo a Chomsky, la sintaxis 
de los lenguajes secuenciales se especifica 
mediante una gramática compuesta de reglas de 
producción que denotan frases u oraciones. La 
especificación de los lenguajes de cadenas 
distingue la sintaxis de la semántica. Se dice que 
una oración es sintácticamente correcta si es 
derivable a partir de la aplicación exclusiva de las 
reglas de producción. Estas reglas emplean dos 
tipos básicos de símbolos: terminales y no-
terminales. Existe un símbolo no-terminal especial, 
llamado el símbolo de inicio, a partir del cual se 
generan todas las posibles oraciones contenidas en 
Instituto Tecnológico de Chihuahua ELECTRO 2004 
 
 
 30
el lenguaje definido por un conjunto particular de 
reglas de producción. Se dice que una cadena que 
sólo contiene símbolos terminales es una oración. 
El conjunto de todas las posibles oraciones 
constituye al lenguaje. Dada una gramática y una 
oración, el problema más simple que podemos 
plantear es el problema de membresía, es decir, 
verificar si la oración pertenece al lenguaje 
definido por la gramática o no. Al procedimiento 
que resuelve este problema se le conoce en Inglés 
por parser (analizador sintáctico). 
Chomsky dividió estas gramáticas en 4 
tipos, de acuerdo a la forma de las producciones. 
Las gramáticas Tipo 0, o gramáticas irrestrictas, 
permiten cualquier número de símbolos terminales 
o no terminales en ambos lados de una producción. 
Las gramáticas Tipo 1, o sensitivas al contexto, 
poseen producciones de la forma Aα γ αβγ→ , 
donde A es un símbolo no terminal, β es una 
cadena no vacía de símbolos y α y γ son 
cadenas posiblemente vacías. El significado de esta 
es regla es “A se puede reemplazar por β cuando 
aparezca en el contexto de α y γ ”. Las 
gramáticas Tipo 2, o libres de contexto, no 
permiten el empleo de contextos. Sus reglas tienen 
la forma A β→ . Las gramáticas Tipo 3, o 
gramáticas regulares, poseen producciones de la 
forma A aB→ o A a→ , donde a es un 
símbolo terminal,mientras que A y B son no-
terminales. Cabe mencionar que la importancia de 
las gramáticas Tipo 2, o libres de contexto, se debe 
a que son las mayormente empleadas en la creación 
de lenguajes de programación. 
En general, el análisis sintáctico permite 
determinar si una oración está sintácticamente bien 
formada. El siguiente problema consiste en 
encontrar su significado. La semántica de una 
oración se encuentra buscando el significado de 
cada símbolo terminal en un diccionario y 
componiendo estos significados siguiendo la 
estructura del árbol sintáctico definido por la 
derivación determinística de la oración. Una forma 
de realizar lo anterior fue sugerida por Knuth [3] 
empleando atributos, los cuales son valores 
asociados con cada símbolo y las producciones 
indican como se puede obtener un símbolo a partir 
de otros. En el caso de los lenguajes visuales, estos 
atributos se pueden clasificar adicionalmente en 
activos y pasivos, los cuales limitan la 
aplicabilidad de las producciones (el lenguaje 
definido) y definen la semántica del diagrama, 
respectivamente. 
 
2.2. Gramáticas de Cadenas 
Generalizadas 
La idea básica consiste en modificar las 
gramáticas de cadenas añadiendo generalizaciones 
apropiadas de la concatenación bidimensionales. 
En ellas, los símbolos terminales se interpretan 
como objetos bidimensionales (líneas o arcos), los 
cuales tienen una cabeza y una cola que permiten 
concatenarlos. Sin embargo, su generalidad es muy 
limitada debido a lo restrictivo de la composición. 
Otra estrategia es la gramática de formas con 
atributos de You y Fu [4] empleada para el 
reconocimiento de formas 2D compuestas de una 
secuencia de curvas. 
 El empleo de árboles permite la 
generalización de la concatenación unidimensional 
hacia multidimensional. Las gramáticas de árboles 
y sus reconocedores, los autómatas de árboles 
también han sido empleados en el procesamiento 
de imágenes por K. S. Fu y otros, donde un árbol 
describe una imagen. Su generalidad en la 
generación de imágenes es muy limitada. Otro 
enfoque es el propuesto por el lenguaje PDL 
(Picture Description Language) de Shaw [5], el 
cual proporciona mayor variedad de operaciones de 
concatenación y primitivas tales como líneas o 
texto, así como puntos de cabeza y cola para la 
concatenación de primitivas. PDL ha sido 
empleado, por ejemplo, para el análisis sintáctico 
de diagramas de física abstracta de partículas. 
Masini y Mohr [6] extendieron PDL agregando 
operadores topológicos y geométricos tales como 
“contiene” y “encima”. En la gramática 2D-CFG 
[7], los símbolos representan bloques rectangulares 
y las producciones permiten componer regiones 
horizontales o verticales. En cierta forma, las 
gramáticas posicionales [8] son una generalización 
de las 2D-CFG ya que la operación de 
concatenación representa una relación espacial 
arbitraria, la cual da información acerca de la 
posición relativa del siguiente símbolo con 
respecto al actual. Estas son adecuadas, por 
ejemplo, para describir la distribución 2D de 
páginas de texto y para lenguajes icónicos. Sin 
embargo, es difícil diseñar una gramática 
posicional para expresiones matemáticas, aunque 
existen extensiones de estas que son capaces de 
especificar, por ejemplo, diagramas de flujo. Las 
gramáticas de arreglos asumen que los símbolos 
están arreglados en una rejilla o arreglo. Las 
producciones rescriben subarreglos en subarreglos, 
como lo explica Kirsh [9]. Estas gramáticas han 
sido empleadas para describir análisis de imágenes 
Instituto Tecnológico de Chihuahua ELECTRO 2004 
 
 
 31
a bajo nivel en el que los elementos del arreglo son 
píxeles. Sin embargo, no han sido adecuados para 
la especificación de lenguajes visuales de alto 
nivel. 
 
2.3. Gramáticas de Grafos 
El procesamiento de imágenes fue una de las 
principales motivaciones para el desarrollo de las 
gramáticas de grafos, así como el reconocimiento 
de diagramas, su representación y procesamiento. 
En las gramáticas de red [10], las 
oraciones son grafos dirigidos con símbolos en los 
nodos. Una producción reemplaza una subred 
dentro de otra y tiene la forma Eβα → donde 
α y β son redes y E es una incrustación (una 
función lógica) que especifica como es que β será 
conectada (incrustada en) la red ω cuando α es 
reemplazada por β . Desafortunadamente, estas 
gramáticas no han demostrado mucha utilidad en la 
especificación de diagramas arbitrarios ni en 
lenguajes visuales que no sean del tipo grafo. 
Las gramáticas plex emplean primitivas 
de imágenes con múltiples puntos de conexión. Sus 
producciones tienen la forma ααα ∆Γ→∆ AA , 
donde A es una entidad de enlace múltiple (NAPE), 
α es una cadena de NAPEs, A∆ es una cadena 
que detalla los puntos de amarre de A, αΓ 
especifica la forma en que están interconectados 
los puntos de enlace de los elementos en α , α∆ 
indica como los punto de enlace de los elementos 
en α corresponden a los puntos de amarre en A∆ . 
Estas gramáticas han sido generalizadas para 
objetos 3D y se ha demostrado ser equivalentes a 
los sistemas de reemplazo de hiper-aristas. Sin 
embargo, estas gramáticas tampoco son adecuadas 
para lenguajes visuales que no sean grafos. 
También se ha demostrado que las gramáticas de 
grafos con aristas etiquetadas se pueden usar para 
especificar una amplia variedad de lenguajes 
visuales, aunque es muy costoso, por lo que se 
investigan subclases de éstas. A estas gramáticas se 
les conoce como edNLC (edge-labelled directed 
node-label controlled), cuyas producciones tienen 
la forma EA α→ , donde A es un nodo 
etiquetado, α es un grafo edNLC, y E es una 
incrustación que indica como los nodos en α 
serán conectados a los vecinos del nodo siendo 
reescrito en el grafo anfitrión [11]. 
Variaciones sobre estas gramáticas son las 
gramáticas árbol-grafo [12] que generan grafos 
jerárquicos y han sido empleadas para reconocer 
diagramas de circuitos; las attributed programmed 
graph grammar empleadas en la representación de 
diagramas de flujo y circuitos eléctricos y 
variaciones empleadas como base de editores de 
lenguajes visuales dirigidos por sintaxis [13]; las 
gramáticas de relación [14] que emplea reglas de 
evaluación para rescribir las restricciones 
(relaciones) que se mantienen entre los símbolos; y 
las gramáticas 2D-CFG generalizadas, que son una 
subclase de las gramáticas de relación y 
generalizan las 2D-CFG. 
 
2.4. Gramáticas Multiconjunto con 
Atributos 
En estos enfoques, las producciones rescriben 
conjuntos o multiconjuntos de símbolos que tienen 
atributos geométricos y a veces semánticos. La 
reescritura es controlada por restricciones sobre los 
atributos de los símbolos en el lado derecho de la 
producción. Entre éstas encontramos las 
gramáticas de coordenadas [15] empleadas para 
especificar notación matemática; gramáticas de 
procesamiento de imágenes [16] empleada en la 
comprensión de oraciones compuestas de iconos; 
las gramáticas de distribución de imágenes [17]; y 
las gramáticas relacionales [18] para aplicaciones 
multimedia las cuales heredan ideas de lingüística 
computacional y emplea restricciones basadas en 
unificación para expresar restricciones espaciales, 
entre otras. 
 
2.5. Otros Enfoques 
Las gramáticas de formas [19] fueron 
desarrolladas para diseño arquitectural 2D y 3D, y 
pinturas. Las gramáticas visuales [20] son 
gramáticas especificadas visualmente, similares a 
las gramáticas libres de contexto, pero permite un 
arreglo espacial de los símbolos del lado derecho. 
 
3. FORMALISMOS LÓGICOS 
Uno de los objetivos principales de este enfoque es 
mejorar la expresividad y utilidad de las 
especificaciones, lo cual es en cierto sentido 
contrario a la búsqueda de una tratabilidad formal 
completa. Aparte del procesamiento sintáctico de 
los lenguajes está el procesamiento semántico, del 
cual parecen existir más tareas. Este último 
requiere del empleo de conocimiento y, por ende, 
es necesario un mecanismo de integración.El 
procesamiento de lenguaje natural ha marcado una 
pauta a seguir en este sentido. Existe, 
Instituto Tecnológico de Chihuahua ELECTRO 2004 
 
 
 32
afortunadamente, una similitud entre el enfoque 
gramatical y el lógico, encontrado en la teoría de la 
programación lógica. 
 
3.1. Cláusulas Definidas 
En el marco de la programación lógica un 
programa es una colección de reglas que definen 
un predicado de primer orden y tienen la forma 
),..,(,..,),..,(),..,( 11
1
111
1 mn
mmm
n
n SSpSSpTTp ∧∧←
donde iT y 
j
iS son términos, y se llama una 
cláusula definida. El lado derecho puede ser vacío, 
indicando que es incondicionalmente cierto y se 
llama un hecho. La semántica de un programa 
lógico se puede describir mediante la teoría de 
modelos o la teoría de pruebas, y se ha demostrado 
que son equivalentes. 
Colmerauer introdujo las gramáticas 
metamorfosis [21] para la programación lógica, la 
cual se redefinió después ha gramáticas de 
cláusulas definidas (DCG) las cuales se 
convirtieron en el estándar. Las ideas de las 
gramáticas DCSG (S por Set) se originaron del 
análisis de circuitos electrónicos [22]. La 
diferencia entre una y otra es que las DCG usan 
listas, mientras que las DCSG usan conjuntos o 
multiconjuntos para representar oraciones, lo cual 
permite que el orden de las palabras sea 
parcialmente libre. 
 
3.2. Programación Lógica con 
Restricciones (CLP) 
Integra la programación lógica y restricciones en 
algún dominio matemático, como los reales. 
Además de esto, CLP reemplaza el procedimiento 
de unificación de la LP por un mecanismo de 
resolución de restricciones. Las restricciones son 
esencialmente igualdades o desigualdades en el 
dominio. De hecho, la programación lógica clásica 
se puede entender como CLP sobre el dominio de 
términos no interpretados. Se pueden definir 
relaciones espaciales aritméticamente empleando 
las coordenadas de los objetos, y definiendo 
conjuntos explícitamente, o extendiendo CLP hacia 
el dominio de los conjuntos. Así las gramáticas 
restringidas multiconjunto (CMG) se pueden ver 
como una forma de CLP parecido a que las DCG 
son una forma de programas lógicos. La ventaja es 
que CMG posee una semántica lógica y 
operacional limpia y permite integrar 
completamente razonamiento acerca de geometría. 
Otro enfoque consiste en reformular la topología 
en un formalismo lógico y luego extenderlo hacia 
un lenguaje de alto nivel. 
Clark propone un cálculo de individuos 
basado en conexiones en el que el concepto 
primitivo es una región (en vez de un punto). Este 
enfoque proporciona mucho de lo que se necesita 
para manejar lenguajes visuales típicos, aunque no 
proporciona herramientas para la construcción de 
parsers, ni para relaciones geométricas basadas en 
medidas, por ejemplo “cerca de”, “arriba del punto 
medio”, etc. Este cálculo ha sido empleado en la 
construcción del cálculo de conexión de regiones y 
aplicado en la definición de lenguajes visuales. 
Pictorial Janus [24] es un ejemplo, aunque no 
muestra como se puede interpretar una imagen 
usando RCC y se espera que el costo 
computacional sea muy alto. 
 
3.3. Lógica Descriptiva 
En general, las teorías de la lógica descriptiva se 
inspiran en las redes de herencia estructuradas, las 
cuales especifican redes de conceptos definidos 
mediante fórmulas de primer orden. Existen 
diferentes tipos de lógicas descriptivas. Si se elige 
una que sea decidible se puede emplear una 
máquina de inferencias para interpretar imágenes a 
partir de conceptos gráficos básicos. En general, un 
razonador de lógica descriptiva consiste de un 
razonador terminológico que analiza relaciones de 
subsumción entre conceptos, y un razonador 
asercional que reconoce y mantiene la membresía 
de concepto de los individuos. El principal 
problema sigue siendo la integración de un 
dominio espacial concreto. Para permitir el 
razonamiento sobre datos espaciales, los objetos 
espaciales deben ser dados de alta como conceptos 
primitivos mediante algún mecanismo externo. 
Una alternativa es extender el formalismo 
subyacente hacia el dominio algebraico de modo 
que se puedan emplear conceptos geométricos 
como conceptos definidos. Lo anterior se puede 
realizar bajo el esquema CLP con la ayuda de 
dominios concretos, por ejemplo, CLASSIC [28]. 
La característica más distintiva de la 
lógica descriptiva es que permite realizar tres tipos 
diferentes de razonamiento acerca de imágenes: se 
puede emplear para realizar “parsing” de 
imágenes; puede construir ejemplos de imágenes; 
y puede hipotetizar información faltante para 
imágenes incompletas, lo cual es una poderosa 
herramienta para el análisis de errores y corrección 
de diagramas. 
 
3.4. Lógica Visual 
La idea es combinar las capacidades de 
razonamiento de los sistemas lógicos con la 
Instituto Tecnológico de Chihuahua ELECTRO 2004 
 
 
 33
expresividad de la comunicación gráfica, 
integrando un nuevo tipo de término en la 
programación lógica: el término imagen. Estos 
pueden considerarse como imágenes parcialmente 
especificadas consistentes de constantes visuales 
(objetos imagen) y variables visuales. Los objetos 
y las variables en un término imagen se encuentran 
en relaciones espaciales implícitas que se pueden 
inferir del despliegue del término. El modelo 
formal subyacente para los términos imagen son 
los grafos con nodos objeto y aristas de relación 
con tipo de acuerdo a la definición de un 
vocabulario de imágenes que detalla los tipos de 
objetos y los tipos de relaciones. Adicionalmente, 
se puede usar un fondo para denotar un contexto 
análogo a la cola de una lista en programación 
lógica estándar. Para esto, se usa una segunda clase 
de unificación que se aplica a los términos imagen. 
Esto se puede emplear para representar animación 
de diagramas, por ejemplo. 
La programación lógica con imágenes 
maneja imágenes como estructuras tipo grafo, por 
ello, es similar a las gramáticas de relación y el 
problema esperado de integrar un dominio 
geométrico se resuelve haciendo la transición hacia 
la programación lógica con restricciones, como por 
ejemplo CLP(RI) [25]. El mecanismo de 
unificación utiliza unificación de grafos 
implementado mediante particionamiento de 
conjuntos. Shin [26] define un sistema de 
razonamiento formal de diagramas bien formados 
como una extensión de los diagramas de Venn y la 
semántica se obtiene mapeando los diagramas a 
teoría de conjuntos y se demuestra que la regla de 
consecuencia sintáctica es sólida y completa con 
respecto a la consecuencia semántica, por lo que 
las reglas de inferencia gráfica es tan poderosa 
como su contraparte textual. Hammer [27] extiende 
el formalismo de Shin permitiendo el uso 
intercambiable de razonamiento visual y textual 
haciendo uso de grafos higraph. 
 
4. FORMALISMOS ALGEBRAICOS 
La idea principal consiste en mapear el dominio a 
ser definido en un tipo abstracto de datos con tipos 
y definir funciones con tipos y predicados sobre 
estas estructuras que especifican las operaciones en 
el dominio de aplicación. Se emplea normalmente 
una jerarquía de tipos. Los objetos atómicos se 
tratan como estructuras de datos de ciertos tipos 
base, y se emplean funciones de composición para 
combinar objetos base en objetos compuestos de 
tipos más complejos. Un problema fundamental 
bajo este escenario es como definir el 
procedimiento de parsing. En general, el análisis 
sintáctico consiste en encontrar una secuencia de 
aplicaciones de funciones a un conjunto de objetos 
base (objetos terminales) que los transforma en un 
solo objeto de tipo oración. 
 
4.1. Enfoques Algebraicos 
La base formal del método propuesto por Wang 
[29] es una álgebra order-sorted extendida por un 
lenguaje lógico order-sorted. La integración del 
razonamiento se logra definiendo estructuras 
algebraicas para el dominio de imágenes y el 
dominio de la aplicación, e introduciendo mapeos 
entre los objetos y las funciones en ambos 
dominios. 
Chang [30] en su teoría deiconos 
generalizados emplea operaciones de composición 
de iconos gráficos y está ligado a operaciones de 
composición semántica para especificar la 
interpretación de oraciones icónicas. Ya que una 
imagen se considera como una oración acerca del 
dominio de aplicación, toda transformación de 
imágenes es seguida de una transformación de una 
sentencia acerca del dominio de aplicación. 
Una imagen concreta es una situación 
(propiedades de la imagen) y es considerada como 
un modelo de la teoría gráfica. Si esta teoría 
describe completamente las imágenes admisibles, 
entonces se tendrá una forma de verificar si una 
imagen es válida o no. Solo se requiere probar si la 
situación es consistente con la teoría. 
El sistema Graphical Assisted Reasoning 
el cual puede derivar una interpretación de una 
imagen dada y responde a preguntas simples acerca 
del dominio mediante inferencia visual. 
Una diferencia sustancial respecto de los 
enfoques anteriores, es que solo se manejan 
imágenes planas, es decir, no jerárquicas y no 
existe conexión real entre los objetos geométricos 
ya que son tratados como tipos abstractos. Sin 
embargo, es factible extender el formalismo para 
incluirlos y ya existe trabajo al respecto. Una de las 
cosas que aun no quedan muy claras es si se 
pueden implementar métodos comparables al 
parsing directamente. Para reconocer 
automáticamente que clase de concepto representa 
una imagen y cuales son sus constituyentes se 
requeriría un mecanismo de razonamiento similar 
al de la lógica descriptiva. 
 
5. CONCLUSIONES 
Los lenguajes visuales son un concepto abierto y 
puede comprender el espectro completo de la 
comunicación humana. Aún no se ha encontrado 
Instituto Tecnológico de Chihuahua ELECTRO 2004 
 
 
 34
un enfoque unificado para esta teoría. La 
investigación en lenguajes visuales puede y ha sido 
realizada desde diferentes perspectivas: teoría de la 
computación, inteligencia artificial, psicología 
cognitiva, lingüística, arquitectura, diseño y arte. 
Algo que aun se pregunta es porque el impacto de 
las representaciones formales para lenguajes 
visuales en aplicaciones reales ha sido tan limitado. 
Por ejemplo, en el área de reconocimiento de bajo 
nivel y detección de características, los enfoques 
estructurados se han perdido contra los enfoques 
estadísticos. En el caso del reconocimiento de alto 
nivel se han desarrollado muchos prototipos pero 
pocos se han producido y tienen, en general, un 
dominio de aplicación muy limitado. Además, se 
han hecho pocos prototipos de ambientes de 
lenguajes visuales que puedan ser empleados en el 
desarrollo de aplicaciones. En general, existe cierto 
divorcio entre los problemas reales y la tecnología 
propuesta, la literatura sufre de una alta 
fragmentación y la investigación básica no pone 
atención a problemas reales de ingeniería. Por otro 
lado, las aplicaciones reales implementan métodos 
solamente para un problema y desprecia la 
existencia de métodos que pudieran apoyar marcos 
teóricos más generales. 
 
REFERENCIAS 
 
[1] K.S. Fu, Syntactic Pattern Recognition and 
Applications, Prentice-Hall, 1982. 
 
[2] N. Chomsky, Aspects of the Theory of Syntax, 
MIT Press, Cambridge, 1965. 
 
[3] D.E. Knuth, The genesis of attribute 
grammars, en Attribute Grammars and their 
Applications, P. Deransart y M. Jourdan, Eds., vol. 
461 de LNCS, pp. 1-12, Springer-Verlag, 1990. 
 
[4] K.C. You y K.S. Fu, A syntactic approach to 
shape recognition using attributed grammars, IEEE 
Transactions on Systems, Man and Cybernetics, 
vol. 9, No. 6, pp. 334-345, 1979. 
 
[5] A.C. Shaw, A formal picture description 
scheme as a abasis for picture processing systems, 
Information and Control, vol.14, pp. 9-52, 1969. 
 
[6] G. Masini y R. Mohr, MIRABELLE: A 
system for structural analysis od drawings, Pattern 
Recognition, vol. 16, No. 4, pp. 363-372, 1983. 
 
[7] M. Tomita, Efficient parsing for Natural 
Language, Kluwer Academic, Boston, 1985. 
 
[8] G. Costagliola y S.K. Chang, A generalizad 
parser for 2D languages, IEEE Symposium on 
Visual Languages, pp. 98-104, IEEE Computer 
Society Press, 1991. 
 
[9] J. Kirsh y R. Kirsh, The structure of 
paintings: formal grammar and design, 
Environment and Planning B: Planning and 
Design, vol. 13, pp. 163-176, 1986. 
 
[10] J.L. Pfaltz y A. Rosenfeld, Weg grammars, 
Proc. First Intl. Joint Conference on Artificial 
Intelligence, pp. 609-619, 1969. 
[11] F.J. Branderburg, On polynomial time graph 
grammars, Fifth Conf. on Theoretical Aspects of 
Computer Science, vol. 294 LCNS, pp. 227-236, 
Springer-Verlag, 1988. 
 
[12] A. Sanfeliu y K.S. Fu, Tree graph grammars 
for pattern recognition, Graph Grammars and 
Their Applications to Computer Science, vol. 153 
LCNS, pp. 349-368, Springer-Verlag, 1983. 
 
[13] H. Göttler, Graph grammars, a new paradigm 
for implementing visual languages, 
EUROGRAPHICS 89, PP. 505-516, Elsevier 
Science publishers (North-Holland), 1986. 
 
[14] C. Crimi, A. Guercio, G. Nota, G. pacini, G. 
Tortora y M. Tucci, Relation Grammars for 
modeling multidimensional structures, IEEE 
Symposium on Visual Languages, pp. 168-173, 
IEEE Computer Society Press, 1990. 
 
[15] M. Anderson, Diagramatic reasoning and 
cases, Thirteen National Conference on Artificial 
Intelligence, pp. 1004-1009, Portland, 1996. 
 
[16] S.K. Chang, Picture processing grammar and 
its applications, Information Sciences, vol. 3, pp. 
121-148, 1971. 
 
[17] E.J. Golin, A Method for the specification and 
Parsing of Visual languages, PhD Thesis, Dept. of 
Computer Science, Brown Univ. 1991. 
 
[18] K. Wittenburg, L. Weitzman y J. Talley, 
Unification-based grammars and tabular parsing 
for graphical languages, Journal of Visual 
Languages and Computing, vol. 2, pp. 347-370, 
1991. 
Instituto Tecnológico de Chihuahua ELECTRO 2004 
 
 
 35
 
[19] J. Gips, Shape Grammar and Their Uses, 
Birkhauser Verlag, 1975. 
 
[20] F. Lakin, Visual Grammars for visual 
languages, Visual Languages, S-K Chang, T. 
Ichikawa, P. A. Ligomenides, Eds., pp. 35-85, 
1986. 
 
[21] A. Colmerauer, Metamorphosis Grammars, 
Natural Language Communication with 
Computers, L. Bolc, Ed., Springer-Verlag, 1978. 
 
[22] T. Tanaka, Definite set clause grammars: A 
formalism for problem solving, Journal of Logic 
Programming, vol. 10, pp. 1-17, 1991. 
[23] B.L. Clarke, A calculus of individuals bases 
on connection, Notre Damme Journal of Formal 
Logic, vol. 23, No. 3, pp. 204-218, 1981. 
 
[24] J.M. Gooday y A.G. Cohn, Visual language 
syntax and semantics: A spatial logic approach, 
Intl. Workshop on Theory of Visual Languages, K. 
Marriott y B. Meyer, Eds., 1996. 
 
[25] B. Meyer, Formalization of visual 
mathematical notations, AAAI Fall Symposium on 
Reasoning with Diagrammatic Representations, 
AAAI Press, pp. 58-68, 1997. 
 
[26] S.-J. Shin, The Logical Status of Diagrams, 
Cambridge Univ. Press, 1995. 
 
[27] E. Hammer, Representing relations 
diagrammatically, Working Papers on Diagrams 
and Logic, G. Allwein y J. Barwaise, Eds., Indiana 
Univ., 1993. 
 
[28] R.J. Brachman y J.G. Schmolze, An overview 
of KL-ONE knowledge representation systems, 
Cognitive Science, pp. 171-216, 1985. 
 
[29] D. Wang y J.R. Lee, Pictorial Concepts and a 
concept supporting graphical system, Journal of 
Visual languages and Computing, vol. 4, pp. 177-
199, 1993. 
 
[30] M. Chacón, SIVPII: Sistema Inteligente de 
Visión para Inspección Industrial, Tecnológico de 
Chihuahua, Posgrado e Investigación, Chihuahua, 
Chih., México, 2001. 
 
[31] I. Hernández y P. Márquez, Arquitectura de 
LeVi-PDI, Electro 2003, Tecnológico de 
Chihuahua, Chihuahua, Chih., México, 2003. 
 
[32] A.V. Aho, R. SEIT y J.D. Ullman, Compilers, 
Principles, Techniques, and Tools, Addisson-
Wesley Series in Computer Science, Addison-
Wesley, Reading, 1987. 
 
[33] K. Marriot y B. Meyer, Visual Language 
Theory, Eds., Springer-Verlag, 1998. 
 
[34] J.E. Hopcroft y J.D. Ullman, Introduction to 
Automata Theory, Languages and Computing, 
Addison-Wesley, Reading,1979. 
 
[35] J. Jaffar y M.J. Maher, Constraint Logic 
Programming: A Survey, The Journal of Logic 
Programming, v.20, pp. 503-582. 1994. 
 
[36] J. van Leeuwen, Ed., Handbook of 
Theoretical Computer Science, vol.2, Elsevier, 
Amsterdam, New York, 1990. 
 
[37] K. Marriot y P. Stuckey, Programming with 
Constraints: An Introduction, MIT Press, 
Cambridge, MA, 1998. 
View publication stats
https://www.researchgate.net/publication/257138901

Continuar navegando