ANÁLISIS DE ESPECIFICACIÓN DE UN LENGUAJE VISUAL PARA PROCESAMIENTO DIGITAL DE IAMGNES

•

SIN SIGLA

Sara lucia

22/1/2024

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Lenguaje Visual

2072 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/257138901
ANÁLISIS DE ESPECIFICACIÓN DE UN LENGUAJE VISUAL PARA
PROCESAMIENTO DIGITAL DE IMAGENES
Article · October 2004
CITATIONS
0
READS
352
2 authors, including:
Pedro Marquez
Instituto Tecnológico de Chihuahua
27 PUBLICATIONS 31 CITATIONS
SEE PROFILE
All content following this page was uploaded by Pedro Marquez on 05 June 2014.
The user has requested enhancement of the downloaded file.
https://www.researchgate.net/publication/257138901_ANALISIS_DE_ESPECIFICACION_DE_UN_LENGUAJE_VISUAL_PARA_PROCESAMIENTO_DIGITAL_DE_IMAGENES?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_2&_esc=publicationCoverPdf
https://www.researchgate.net/publication/257138901_ANALISIS_DE_ESPECIFICACION_DE_UN_LENGUAJE_VISUAL_PARA_PROCESAMIENTO_DIGITAL_DE_IMAGENES?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_3&_esc=publicationCoverPdf
https://www.researchgate.net/?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_1&_esc=publicationCoverPdf
https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_4&_esc=publicationCoverPdf
https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_5&_esc=publicationCoverPdf
https://www.researchgate.net/institution/Instituto-Tecnologico-de-Chihuahua?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_6&_esc=publicationCoverPdf
https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_7&_esc=publicationCoverPdf
https://www.researchgate.net/profile/Pedro-Marquez-3?enrichId=rgreq-daf0f0ed2d013453cf2092b672e0b111-XXX&enrichSource=Y292ZXJQYWdlOzI1NzEzODkwMTtBUzoxMDQ4MDA0MjMyNTE5NzVAMTQwMTk5Nzc3Njg2NA%3D%3D&el=1_x_10&_esc=publicationCoverPdf
Instituto Tecnológico de Chihuahua ELECTRO 2004

29
ANÁLISIS DE ESPECIFICACIÓN DE UN LENGUAJE VISUAL PARA
PROCESAMIENTO DIGITAL DE IMAGENES

Márquez Gutiérrez, Pedro Rafael
Tecnológico de Chihuahua
Posgrado e Investigación en Electrónica
Av. Tecnológico 2909, Chihuahua, Chih., 31310 México
413-7474 ext. 112 y 114
pmarquez@itchihuahua.edu.mx

1. RESUMEN
Una de las cuestiones más fundamentales
en la investigación sobre lenguajes visuales es su
especificación. Un lenguaje visual es
esencialmente un conjunto de diagramas que
representan “oraciones” válidas en ese lenguaje, y
donde un diagrama se puede entender como una
colección de “símbolos” en un espacio
bidimensional o tridimensional. Estas relaciones
espaciales entre los símbolos determinan la validez
de las oraciones y su semántica. Ejemplos de
lenguajes visuales de uso común son las
expresiones matemáticas, los planos
arquitectónicos y las notaciones musicales.
En este artículo se revisan los
formalismos más importantes que han sido
sugeridos en las últimas décadas para la
especificación de lenguajes visuales y sus posibles
aplicaciones, con la intención final de elegir uno de
estos formalismos para la especificación del
lenguaje visual para procesamiento digital de
imágenes LeVi-PDI perteneciente al proyecto
SIVPII [31].
Un infortunio de los lenguajes visuales
está en que sus aspectos teóricos no están
completamente entendidos aún, en contraste con
los lenguajes secuenciales basados en texto, donde
existe un amplio acuerdo en la comunidad
científica acerca de sus formalismos y técnicas de
especificación, apoyados en todo momento en el
desarrollo mismo de la teoría lingüística moderna.
Actualmente existen tres enfoques
principales en el área de especificación de
lenguajes visuales: (a) el enfoque gramatical, (b) el
enfoque lógico, y (c) el enfoque algebraico. En la
sección 2 se analiza el enfoque gramatical, el cual
ha sido fuertemente influenciado por el trabajo en
lingüística teórica y la teoría formal de lenguajes
en computación. En la sección 3 se analiza el
enfoque lógico desarrollado en el campo de la
Inteligencia Artificial. En la sección 4 se analiza el
enfoque algebraico surgido del trabajo en
especificación formal de lenguajes y ambientes de
programación. La revisión de estos enfoques está
orientada hacia la teoría de los lenguajes visuales
desde las perspectivas de su especificación y de las
ciencias cognitivas. Cabe aclarar que esté trabajo
es una continuación del presentado en [32].
Finalmente, se dan algunas conclusiones y líneas
de trabajo futuras.

2. FORMALISMOS DE ESPECIFICACION
GRAMATICAL
Los primeros formalismos de
especificación de lenguajes visuales fueron los
gramaticales. Estos eran simples modificaciones de
las gramáticas basadas en frases empleadas para la
especificación de lenguajes de cadenas.
Posteriormente llegaron los enfoques basados en
grafos y árboles. Muchos de estos enfoques fueron
introducidos para el procesamiento de imágenes y
uno de sus principales proponentes fue K. S. Fu
[1]. Desafortunadamente, estos enfoques son muy
restrictivos. Los enfoques más genéricos se pueden
dividir en dos grandes grupos (1) gramáticas
basadas en multi-conjuntos con atributos, y (2)
gramáticas de grafos con aristas etiquetadas.

2.1. Lenguajes de Cadenas
El trabajo aquí realizado está basado
mayormente en la teoría de los lenguajes de Noam
Chomsky [2]. De acuerdo a Chomsky, la sintaxis
de los lenguajes secuenciales se especifica
mediante una gramática compuesta de reglas de
producción que denotan frases u oraciones. La
especificación de los lenguajes de cadenas
distingue la sintaxis de la semántica. Se dice que
una oración es sintácticamente correcta si es
derivable a partir de la aplicación exclusiva de las
reglas de producción. Estas reglas emplean dos
tipos básicos de símbolos: terminales y no-
terminales. Existe un símbolo no-terminal especial,
llamado el símbolo de inicio, a partir del cual se
generan todas las posibles oraciones contenidas en
Instituto Tecnológico de Chihuahua ELECTRO 2004

30
el lenguaje definido por un conjunto particular de
reglas de producción. Se dice que una cadena que
sólo contiene símbolos terminales es una oración.
El conjunto de todas las posibles oraciones
constituye al lenguaje. Dada una gramática y una
oración, el problema más simple que podemos
plantear es el problema de membresía, es decir,
verificar si la oración pertenece al lenguaje
definido por la gramática o no. Al procedimiento
que resuelve este problema se le conoce en Inglés
por parser (analizador sintáctico).
Chomsky dividió estas gramáticas en 4
tipos, de acuerdo a la forma de las producciones.
Las gramáticas Tipo 0, o gramáticas irrestrictas,
permiten cualquier número de símbolos terminales
o no terminales en ambos lados de una producción.
Las gramáticas Tipo 1, o sensitivas al contexto,
poseen producciones de la forma Aα γ αβγ→ ,
donde A es un símbolo no terminal, β es una
cadena no vacía de símbolos y α y γ son
cadenas posiblemente vacías. El significado de esta
es regla es “A se puede reemplazar por β cuando
aparezca en el contexto de α y γ ”. Las
gramáticas Tipo 2, o libres de contexto, no
permiten el empleo de contextos. Sus reglas tienen
la forma A β→ . Las gramáticas Tipo 3, o
gramáticas regulares, poseen producciones de la
forma A aB→ o A a→ , donde a es un
símbolo terminal,mientras que A y B son no-
terminales. Cabe mencionar que la importancia de
las gramáticas Tipo 2, o libres de contexto, se debe
a que son las mayormente empleadas en la creación
de lenguajes de programación.
En general, el análisis sintáctico permite
determinar si una oración está sintácticamente bien
formada. El siguiente problema consiste en
encontrar su significado. La semántica de una
oración se encuentra buscando el significado de
cada símbolo terminal en un diccionario y
componiendo estos significados siguiendo la
estructura del árbol sintáctico definido por la
derivación determinística de la oración. Una forma
de realizar lo anterior fue sugerida por Knuth [3]
empleando atributos, los cuales son valores
asociados con cada símbolo y las producciones
indican como se puede obtener un símbolo a partir
de otros. En el caso de los lenguajes visuales, estos
atributos se pueden clasificar adicionalmente en
activos y pasivos, los cuales limitan la
aplicabilidad de las producciones (el lenguaje
definido) y definen la semántica del diagrama,
respectivamente.

2.2. Gramáticas de Cadenas
Generalizadas
La idea básica consiste en modificar las
gramáticas de cadenas añadiendo generalizaciones
apropiadas de la concatenación bidimensionales.
En ellas, los símbolos terminales se interpretan
como objetos bidimensionales (líneas o arcos), los
cuales tienen una cabeza y una cola que permiten
concatenarlos. Sin embargo, su generalidad es muy
limitada debido a lo restrictivo de la composición.
Otra estrategia es la gramática de formas con
atributos de You y Fu [4] empleada para el
reconocimiento de formas 2D compuestas de una
secuencia de curvas.
El empleo de árboles permite la
generalización de la concatenación unidimensional
hacia multidimensional. Las gramáticas de árboles
y sus reconocedores, los autómatas de árboles
también han sido empleados en el procesamiento
de imágenes por K. S. Fu y otros, donde un árbol
describe una imagen. Su generalidad en la
generación de imágenes es muy limitada. Otro
enfoque es el propuesto por el lenguaje PDL
(Picture Description Language) de Shaw [5], el
cual proporciona mayor variedad de operaciones de
concatenación y primitivas tales como líneas o
texto, así como puntos de cabeza y cola para la
concatenación de primitivas. PDL ha sido
empleado, por ejemplo, para el análisis sintáctico
de diagramas de física abstracta de partículas.
Masini y Mohr [6] extendieron PDL agregando
operadores topológicos y geométricos tales como
“contiene” y “encima”. En la gramática 2D-CFG
[7], los símbolos representan bloques rectangulares
y las producciones permiten componer regiones
horizontales o verticales. En cierta forma, las
gramáticas posicionales [8] son una generalización
de las 2D-CFG ya que la operación de
concatenación representa una relación espacial
arbitraria, la cual da información acerca de la
posición relativa del siguiente símbolo con
respecto al actual. Estas son adecuadas, por
ejemplo, para describir la distribución 2D de
páginas de texto y para lenguajes icónicos. Sin
embargo, es difícil diseñar una gramática
posicional para expresiones matemáticas, aunque
existen extensiones de estas que son capaces de
especificar, por ejemplo, diagramas de flujo. Las
gramáticas de arreglos asumen que los símbolos
están arreglados en una rejilla o arreglo. Las
producciones rescriben subarreglos en subarreglos,
como lo explica Kirsh [9]. Estas gramáticas han
sido empleadas para describir análisis de imágenes
Instituto Tecnológico de Chihuahua ELECTRO 2004

31
a bajo nivel en el que los elementos del arreglo son
píxeles. Sin embargo, no han sido adecuados para
la especificación de lenguajes visuales de alto
nivel.

2.3. Gramáticas de Grafos
El procesamiento de imágenes fue una de las
principales motivaciones para el desarrollo de las
gramáticas de grafos, así como el reconocimiento
de diagramas, su representación y procesamiento.
En las gramáticas de red [10], las
oraciones son grafos dirigidos con símbolos en los
nodos. Una producción reemplaza una subred
dentro de otra y tiene la forma Eβα → donde
α y β son redes y E es una incrustación (una
función lógica) que especifica como es que β será
conectada (incrustada en) la red ω cuando α es
reemplazada por β . Desafortunadamente, estas
gramáticas no han demostrado mucha utilidad en la
especificación de diagramas arbitrarios ni en
lenguajes visuales que no sean del tipo grafo.
Las gramáticas plex emplean primitivas
de imágenes con múltiples puntos de conexión. Sus
producciones tienen la forma ααα ∆Γ→∆ AA ,
donde A es una entidad de enlace múltiple (NAPE),
α es una cadena de NAPEs, A∆ es una cadena
que detalla los puntos de amarre de A, αΓ
especifica la forma en que están interconectados
los puntos de enlace de los elementos en α , α∆
indica como los punto de enlace de los elementos
en α corresponden a los puntos de amarre en A∆ .
Estas gramáticas han sido generalizadas para
objetos 3D y se ha demostrado ser equivalentes a
los sistemas de reemplazo de hiper-aristas. Sin
embargo, estas gramáticas tampoco son adecuadas
para lenguajes visuales que no sean grafos.
También se ha demostrado que las gramáticas de
grafos con aristas etiquetadas se pueden usar para
especificar una amplia variedad de lenguajes
visuales, aunque es muy costoso, por lo que se
investigan subclases de éstas. A estas gramáticas se
les conoce como edNLC (edge-labelled directed
node-label controlled), cuyas producciones tienen
la forma EA α→ , donde A es un nodo
etiquetado, α es un grafo edNLC, y E es una
incrustación que indica como los nodos en α
serán conectados a los vecinos del nodo siendo
reescrito en el grafo anfitrión [11].
Variaciones sobre estas gramáticas son las
gramáticas árbol-grafo [12] que generan grafos
jerárquicos y han sido empleadas para reconocer
diagramas de circuitos; las attributed programmed
graph grammar empleadas en la representación de
diagramas de flujo y circuitos eléctricos y
variaciones empleadas como base de editores de
lenguajes visuales dirigidos por sintaxis [13]; las
gramáticas de relación [14] que emplea reglas de
evaluación para rescribir las restricciones
(relaciones) que se mantienen entre los símbolos; y
las gramáticas 2D-CFG generalizadas, que son una
subclase de las gramáticas de relación y
generalizan las 2D-CFG.

2.4. Gramáticas Multiconjunto con
Atributos
En estos enfoques, las producciones rescriben
conjuntos o multiconjuntos de símbolos que tienen
atributos geométricos y a veces semánticos. La
reescritura es controlada por restricciones sobre los
atributos de los símbolos en el lado derecho de la
producción. Entre éstas encontramos las
gramáticas de coordenadas [15] empleadas para
especificar notación matemática; gramáticas de
procesamiento de imágenes [16] empleada en la
comprensión de oraciones compuestas de iconos;
las gramáticas de distribución de imágenes [17]; y
las gramáticas relacionales [18] para aplicaciones
multimedia las cuales heredan ideas de lingüística
computacional y emplea restricciones basadas en
unificación para expresar restricciones espaciales,
entre otras.

2.5. Otros Enfoques
Las gramáticas de formas [19] fueron
desarrolladas para diseño arquitectural 2D y 3D, y
pinturas. Las gramáticas visuales [20] son
gramáticas especificadas visualmente, similares a
las gramáticas libres de contexto, pero permite un
arreglo espacial de los símbolos del lado derecho.

3. FORMALISMOS LÓGICOS
Uno de los objetivos principales de este enfoque es
mejorar la expresividad y utilidad de las
especificaciones, lo cual es en cierto sentido
contrario a la búsqueda de una tratabilidad formal
completa. Aparte del procesamiento sintáctico de
los lenguajes está el procesamiento semántico, del
cual parecen existir más tareas. Este último
requiere del empleo de conocimiento y, por ende,
es necesario un mecanismo de integración.El
procesamiento de lenguaje natural ha marcado una
pauta a seguir en este sentido. Existe,
Instituto Tecnológico de Chihuahua ELECTRO 2004

32
afortunadamente, una similitud entre el enfoque
gramatical y el lógico, encontrado en la teoría de la
programación lógica.

3.1. Cláusulas Definidas
En el marco de la programación lógica un
programa es una colección de reglas que definen
un predicado de primer orden y tienen la forma
),..,(,..,),..,(),..,( 11
1
111
1 mn
mmm
n
n SSpSSpTTp ∧∧←
donde iT y
j
iS son términos, y se llama una
cláusula definida. El lado derecho puede ser vacío,
indicando que es incondicionalmente cierto y se
llama un hecho. La semántica de un programa
lógico se puede describir mediante la teoría de
modelos o la teoría de pruebas, y se ha demostrado
que son equivalentes.
Colmerauer introdujo las gramáticas
metamorfosis [21] para la programación lógica, la
cual se redefinió después ha gramáticas de
cláusulas definidas (DCG) las cuales se
convirtieron en el estándar. Las ideas de las
gramáticas DCSG (S por Set) se originaron del
análisis de circuitos electrónicos [22]. La
diferencia entre una y otra es que las DCG usan
listas, mientras que las DCSG usan conjuntos o
multiconjuntos para representar oraciones, lo cual
permite que el orden de las palabras sea
parcialmente libre.

3.2. Programación Lógica con
Restricciones (CLP)
Integra la programación lógica y restricciones en
algún dominio matemático, como los reales.
Además de esto, CLP reemplaza el procedimiento
de unificación de la LP por un mecanismo de
resolución de restricciones. Las restricciones son
esencialmente igualdades o desigualdades en el
dominio. De hecho, la programación lógica clásica
se puede entender como CLP sobre el dominio de
términos no interpretados. Se pueden definir
relaciones espaciales aritméticamente empleando
las coordenadas de los objetos, y definiendo
conjuntos explícitamente, o extendiendo CLP hacia
el dominio de los conjuntos. Así las gramáticas
restringidas multiconjunto (CMG) se pueden ver
como una forma de CLP parecido a que las DCG
son una forma de programas lógicos. La ventaja es
que CMG posee una semántica lógica y
operacional limpia y permite integrar
completamente razonamiento acerca de geometría.
Otro enfoque consiste en reformular la topología
en un formalismo lógico y luego extenderlo hacia
un lenguaje de alto nivel.
Clark propone un cálculo de individuos
basado en conexiones en el que el concepto
primitivo es una región (en vez de un punto). Este
enfoque proporciona mucho de lo que se necesita
para manejar lenguajes visuales típicos, aunque no
proporciona herramientas para la construcción de
parsers, ni para relaciones geométricas basadas en
medidas, por ejemplo “cerca de”, “arriba del punto
medio”, etc. Este cálculo ha sido empleado en la
construcción del cálculo de conexión de regiones y
aplicado en la definición de lenguajes visuales.
Pictorial Janus [24] es un ejemplo, aunque no
muestra como se puede interpretar una imagen
usando RCC y se espera que el costo
computacional sea muy alto.

3.3. Lógica Descriptiva
En general, las teorías de la lógica descriptiva se
inspiran en las redes de herencia estructuradas, las
cuales especifican redes de conceptos definidos
mediante fórmulas de primer orden. Existen
diferentes tipos de lógicas descriptivas. Si se elige
una que sea decidible se puede emplear una
máquina de inferencias para interpretar imágenes a
partir de conceptos gráficos básicos. En general, un
razonador de lógica descriptiva consiste de un
razonador terminológico que analiza relaciones de
subsumción entre conceptos, y un razonador
asercional que reconoce y mantiene la membresía
de concepto de los individuos. El principal
problema sigue siendo la integración de un
dominio espacial concreto. Para permitir el
razonamiento sobre datos espaciales, los objetos
espaciales deben ser dados de alta como conceptos
primitivos mediante algún mecanismo externo.
Una alternativa es extender el formalismo
subyacente hacia el dominio algebraico de modo
que se puedan emplear conceptos geométricos
como conceptos definidos. Lo anterior se puede
realizar bajo el esquema CLP con la ayuda de
dominios concretos, por ejemplo, CLASSIC [28].
La característica más distintiva de la
lógica descriptiva es que permite realizar tres tipos
diferentes de razonamiento acerca de imágenes: se
puede emplear para realizar “parsing” de
imágenes; puede construir ejemplos de imágenes;
y puede hipotetizar información faltante para
imágenes incompletas, lo cual es una poderosa
herramienta para el análisis de errores y corrección
de diagramas.

3.4. Lógica Visual
La idea es combinar las capacidades de
razonamiento de los sistemas lógicos con la
Instituto Tecnológico de Chihuahua ELECTRO 2004

33
expresividad de la comunicación gráfica,
integrando un nuevo tipo de término en la
programación lógica: el término imagen. Estos
pueden considerarse como imágenes parcialmente
especificadas consistentes de constantes visuales
(objetos imagen) y variables visuales. Los objetos
y las variables en un término imagen se encuentran
en relaciones espaciales implícitas que se pueden
inferir del despliegue del término. El modelo
formal subyacente para los términos imagen son
los grafos con nodos objeto y aristas de relación
con tipo de acuerdo a la definición de un
vocabulario de imágenes que detalla los tipos de
objetos y los tipos de relaciones. Adicionalmente,
se puede usar un fondo para denotar un contexto
análogo a la cola de una lista en programación
lógica estándar. Para esto, se usa una segunda clase
de unificación que se aplica a los términos imagen.
Esto se puede emplear para representar animación
de diagramas, por ejemplo.
La programación lógica con imágenes
maneja imágenes como estructuras tipo grafo, por
ello, es similar a las gramáticas de relación y el
problema esperado de integrar un dominio
geométrico se resuelve haciendo la transición hacia
la programación lógica con restricciones, como por
ejemplo CLP(RI) [25]. El mecanismo de
unificación utiliza unificación de grafos
implementado mediante particionamiento de
conjuntos. Shin [26] define un sistema de
razonamiento formal de diagramas bien formados
como una extensión de los diagramas de Venn y la
semántica se obtiene mapeando los diagramas a
teoría de conjuntos y se demuestra que la regla de
consecuencia sintáctica es sólida y completa con
respecto a la consecuencia semántica, por lo que
las reglas de inferencia gráfica es tan poderosa
como su contraparte textual. Hammer [27] extiende
el formalismo de Shin permitiendo el uso
intercambiable de razonamiento visual y textual
haciendo uso de grafos higraph.

4. FORMALISMOS ALGEBRAICOS
La idea principal consiste en mapear el dominio a
ser definido en un tipo abstracto de datos con tipos
y definir funciones con tipos y predicados sobre
estas estructuras que especifican las operaciones en
el dominio de aplicación. Se emplea normalmente
una jerarquía de tipos. Los objetos atómicos se
tratan como estructuras de datos de ciertos tipos
base, y se emplean funciones de composición para
combinar objetos base en objetos compuestos de
tipos más complejos. Un problema fundamental
bajo este escenario es como definir el
procedimiento de parsing. En general, el análisis
sintáctico consiste en encontrar una secuencia de
aplicaciones de funciones a un conjunto de objetos
base (objetos terminales) que los transforma en un
solo objeto de tipo oración.

4.1. Enfoques Algebraicos
La base formal del método propuesto por Wang
[29] es una álgebra order-sorted extendida por un
lenguaje lógico order-sorted. La integración del
razonamiento se logra definiendo estructuras
algebraicas para el dominio de imágenes y el
dominio de la aplicación, e introduciendo mapeos
entre los objetos y las funciones en ambos
dominios.
Chang [30] en su teoría deiconos
generalizados emplea operaciones de composición
de iconos gráficos y está ligado a operaciones de
composición semántica para especificar la
interpretación de oraciones icónicas. Ya que una
imagen se considera como una oración acerca del
dominio de aplicación, toda transformación de
imágenes es seguida de una transformación de una
sentencia acerca del dominio de aplicación.
Una imagen concreta es una situación
(propiedades de la imagen) y es considerada como
un modelo de la teoría gráfica. Si esta teoría
describe completamente las imágenes admisibles,
entonces se tendrá una forma de verificar si una
imagen es válida o no. Solo se requiere probar si la
situación es consistente con la teoría.
El sistema Graphical Assisted Reasoning
el cual puede derivar una interpretación de una
imagen dada y responde a preguntas simples acerca
del dominio mediante inferencia visual.
Una diferencia sustancial respecto de los
enfoques anteriores, es que solo se manejan
imágenes planas, es decir, no jerárquicas y no
existe conexión real entre los objetos geométricos
ya que son tratados como tipos abstractos. Sin
embargo, es factible extender el formalismo para
incluirlos y ya existe trabajo al respecto. Una de las
cosas que aun no quedan muy claras es si se
pueden implementar métodos comparables al
parsing directamente. Para reconocer
automáticamente que clase de concepto representa
una imagen y cuales son sus constituyentes se
requeriría un mecanismo de razonamiento similar
al de la lógica descriptiva.

5. CONCLUSIONES
Los lenguajes visuales son un concepto abierto y
puede comprender el espectro completo de la
comunicación humana. Aún no se ha encontrado
Instituto Tecnológico de Chihuahua ELECTRO 2004

34
un enfoque unificado para esta teoría. La
investigación en lenguajes visuales puede y ha sido
realizada desde diferentes perspectivas: teoría de la
computación, inteligencia artificial, psicología
cognitiva, lingüística, arquitectura, diseño y arte.
Algo que aun se pregunta es porque el impacto de
las representaciones formales para lenguajes
visuales en aplicaciones reales ha sido tan limitado.
Por ejemplo, en el área de reconocimiento de bajo
nivel y detección de características, los enfoques
estructurados se han perdido contra los enfoques
estadísticos. En el caso del reconocimiento de alto
nivel se han desarrollado muchos prototipos pero
pocos se han producido y tienen, en general, un
dominio de aplicación muy limitado. Además, se
han hecho pocos prototipos de ambientes de
lenguajes visuales que puedan ser empleados en el
desarrollo de aplicaciones. En general, existe cierto
divorcio entre los problemas reales y la tecnología
propuesta, la literatura sufre de una alta
fragmentación y la investigación básica no pone
atención a problemas reales de ingeniería. Por otro
lado, las aplicaciones reales implementan métodos
solamente para un problema y desprecia la
existencia de métodos que pudieran apoyar marcos
teóricos más generales.

REFERENCIAS

[1] K.S. Fu, Syntactic Pattern Recognition and
Applications, Prentice-Hall, 1982.

[2] N. Chomsky, Aspects of the Theory of Syntax,
MIT Press, Cambridge, 1965.

[3] D.E. Knuth, The genesis of attribute
grammars, en Attribute Grammars and their
Applications, P. Deransart y M. Jourdan, Eds., vol.
461 de LNCS, pp. 1-12, Springer-Verlag, 1990.

[4] K.C. You y K.S. Fu, A syntactic approach to
shape recognition using attributed grammars, IEEE
Transactions on Systems, Man and Cybernetics,
vol. 9, No. 6, pp. 334-345, 1979.

[5] A.C. Shaw, A formal picture description
scheme as a abasis for picture processing systems,
Information and Control, vol.14, pp. 9-52, 1969.

[6] G. Masini y R. Mohr, MIRABELLE: A
system for structural analysis od drawings, Pattern
Recognition, vol. 16, No. 4, pp. 363-372, 1983.

[7] M. Tomita, Efficient parsing for Natural
Language, Kluwer Academic, Boston, 1985.

[8] G. Costagliola y S.K. Chang, A generalizad
parser for 2D languages, IEEE Symposium on
Visual Languages, pp. 98-104, IEEE Computer
Society Press, 1991.

[9] J. Kirsh y R. Kirsh, The structure of
paintings: formal grammar and design,
Environment and Planning B: Planning and
Design, vol. 13, pp. 163-176, 1986.

[10] J.L. Pfaltz y A. Rosenfeld, Weg grammars,
Proc. First Intl. Joint Conference on Artificial
Intelligence, pp. 609-619, 1969.
[11] F.J. Branderburg, On polynomial time graph
grammars, Fifth Conf. on Theoretical Aspects of
Computer Science, vol. 294 LCNS, pp. 227-236,
Springer-Verlag, 1988.

[12] A. Sanfeliu y K.S. Fu, Tree graph grammars
for pattern recognition, Graph Grammars and
Their Applications to Computer Science, vol. 153
LCNS, pp. 349-368, Springer-Verlag, 1983.

[13] H. Göttler, Graph grammars, a new paradigm
for implementing visual languages,
EUROGRAPHICS 89, PP. 505-516, Elsevier
Science publishers (North-Holland), 1986.

[14] C. Crimi, A. Guercio, G. Nota, G. pacini, G.
Tortora y M. Tucci, Relation Grammars for
modeling multidimensional structures, IEEE
Symposium on Visual Languages, pp. 168-173,
IEEE Computer Society Press, 1990.

[15] M. Anderson, Diagramatic reasoning and
cases, Thirteen National Conference on Artificial
Intelligence, pp. 1004-1009, Portland, 1996.

[16] S.K. Chang, Picture processing grammar and
its applications, Information Sciences, vol. 3, pp.
121-148, 1971.

[17] E.J. Golin, A Method for the specification and
Parsing of Visual languages, PhD Thesis, Dept. of
Computer Science, Brown Univ. 1991.

[18] K. Wittenburg, L. Weitzman y J. Talley,
Unification-based grammars and tabular parsing
for graphical languages, Journal of Visual
Languages and Computing, vol. 2, pp. 347-370,
1991.
Instituto Tecnológico de Chihuahua ELECTRO 2004

[19] J. Gips, Shape Grammar and Their Uses,
Birkhauser Verlag, 1975.

[20] F. Lakin, Visual Grammars for visual
languages, Visual Languages, S-K Chang, T.
Ichikawa, P. A. Ligomenides, Eds., pp. 35-85,
1986.

[21] A. Colmerauer, Metamorphosis Grammars,
Natural Language Communication with
Computers, L. Bolc, Ed., Springer-Verlag, 1978.

[22] T. Tanaka, Definite set clause grammars: A
formalism for problem solving, Journal of Logic
Programming, vol. 10, pp. 1-17, 1991.
[23] B.L. Clarke, A calculus of individuals bases
on connection, Notre Damme Journal of Formal
Logic, vol. 23, No. 3, pp. 204-218, 1981.

[24] J.M. Gooday y A.G. Cohn, Visual language
syntax and semantics: A spatial logic approach,
Intl. Workshop on Theory of Visual Languages, K.
Marriott y B. Meyer, Eds., 1996.

[25] B. Meyer, Formalization of visual
mathematical notations, AAAI Fall Symposium on
Reasoning with Diagrammatic Representations,
AAAI Press, pp. 58-68, 1997.

[26] S.-J. Shin, The Logical Status of Diagrams,
Cambridge Univ. Press, 1995.

[27] E. Hammer, Representing relations
diagrammatically, Working Papers on Diagrams
and Logic, G. Allwein y J. Barwaise, Eds., Indiana
Univ., 1993.

[28] R.J. Brachman y J.G. Schmolze, An overview
of KL-ONE knowledge representation systems,
Cognitive Science, pp. 171-216, 1985.

[29] D. Wang y J.R. Lee, Pictorial Concepts and a
concept supporting graphical system, Journal of
Visual languages and Computing, vol. 4, pp. 177-
199, 1993.

[30] M. Chacón, SIVPII: Sistema Inteligente de
Visión para Inspección Industrial, Tecnológico de
Chihuahua, Posgrado e Investigación, Chihuahua,
Chih., México, 2001.

[31] I. Hernández y P. Márquez, Arquitectura de
LeVi-PDI, Electro 2003, Tecnológico de
Chihuahua, Chihuahua, Chih., México, 2003.

[32] A.V. Aho, R. SEIT y J.D. Ullman, Compilers,
Principles, Techniques, and Tools, Addisson-
Wesley Series in Computer Science, Addison-
Wesley, Reading, 1987.

[33] K. Marriot y B. Meyer, Visual Language
Theory, Eds., Springer-Verlag, 1998.

[34] J.E. Hopcroft y J.D. Ullman, Introduction to
Automata Theory, Languages and Computing,
Addison-Wesley, Reading,1979.

[35] J. Jaffar y M.J. Maher, Constraint Logic
Programming: A Survey, The Journal of Logic
Programming, v.20, pp. 503-582. 1994.

[36] J. van Leeuwen, Ed., Handbook of
Theoretical Computer Science, vol.2, Elsevier,
Amsterdam, New York, 1990.

[37] K. Marriot y P. Stuckey, Programming with
Constraints: An Introduction, MIT Press,
Cambridge, MA, 1998.
View publication stats
https://www.researchgate.net/publication/257138901