Logo Studenta

Modelado de Base de Datos Botânicos

¡Estudia con miles de materiales!

Vista previa del material en texto

IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 1
MODELADO DE UNA BASE DE DATOS BOTÁNICOS
Isabel Besembel, Domingo Hernández, Juan Gaviria♦ y Javier Estrada♦ .
Grupo de Ingeniería de Datos y Conocimiento (GIDyC)
Departamento de Computación
Escuela de Ingeniería de Sistemas
Centro Jardín Botánico♦
Universidad de Los Andes. Mérida-Venezuela
Palabras claves: Modelado de bases de datos, Bases de datos orientadas por objetos,
Biotecnología y Análisis y diseño.
RESUMEN:
En este artículo se propone un nuevo modelo orientado por objetos para bases de datos botánicos. Este
modelo soporta los dos paradigmas de trabajo en la Botánica, los taxones y los especímenes, relacionados a
través de su información textual y gráfica e incluyendo los conceptos de multi-proyecto, multi-institución y
multi-investigador.
El modelo está compuesto por tres grandes vistas de los museos denominados: Herbarium, jardín
botánico y otras colecciones (anatomía, polen, fósiles, etc.). Todos ellos relacionados con las vistas de
documentación textual y gráfica. Un aspecto importante y resaltante de este modelo es el soporte completo de
la seguridad y privacidad de los datos, ya que los datos obtenidos en las investigaciones botánicas deben ser
protegidos completamente antes de su publicación.
Este modelo fue desarrollado como el modelo base para el sistema de información hipermedia
denominado Orinoco, el cual formará parte del Sistema de Información sobre fitodiversidad de Venezuela.
1. INTRODUCCIÓN:
Hoy en día, los esfuerzos hechos para modelar información taxonómica y fitogenética están circunscritos a
modelos de bases de datos relacionales dedicados a manejar los datos de un investigador, un proyecto y/o una
institución. Estos esfuerzos han mostrado ser menos efectivos y muy vulnerables para hacer frente a los
cambios tecnológicos actuales. Los investigadores de la Botánica están inmersos en un maremagnun de
información, referencias, datos nomenclaturales, etc. cuyo procesamiento es complejo y costoso en tiempo y
esfuerzo. Actualmente muchos de los investigadores botánicos piensan que este sistema debe cambiar, pero la
estabilidad nomenclatural basada en el principio de prioridad y en los tipos nomenclaturales debe ser
mantenida por muchas generaciones antes de que pueda ser cambiada. Esto se debe a la falta de nuevas
propuestas que satisfagan las necesidades de dar nombres a la diversidad biológica. El modelo presentado en
este trabajo ha sido comparado con dos de los modelos de información de nombres botánicos más
reconocidos, como son: el modelo de la American Society of Collections (ASC) [1] y el modelo de la
International Organization of Plan Information (IOPI) [2], los cuales están basados en taxones. Se propone
aquí un nuevo modelo de base de datos botánicos orientado por objetos que soporta taxones y especímenes,
ambos relacionados a la información textual y gráfica que cada dato tenga e incluyendo además, los conceptos
de multi-investigador, multi-proyecto y multi-institución. Esto permite tener varios investigadores e
instituciones asociadas a varios proyectos botánicos. Según nuestras referencias estudiadas, este modelo es el
primero que soporta los dos esquemas antes mencionados para la determinación de plantas, obteniendo un
esquema de base de datos semántico, completo, extensible, robusto y flexible.
El resto de este artículo está organizado como sigue: la sección 2 enumera los principales
requerimientos propuestos por los investigadores del Centro Jardín Botánico (CJB) de la Universidad de Los
Andes, para obtener un modelo de base de datos completo. Dicho modelo se describe en la sección 3 que está
dividida en cinco subsecciones, las cuales se corresponden con cada una de las vistas asociadas a cada
actividad de investigación en la Botánica, incluyendo el herbario, los otros museos, el jardín botánico, la
IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 2
documentación textual y la gráfica. Finalmente, la sección 4 presenta un resumen de nuestras principales
conclusiones y trabajo futuro.
2. REQUERIMIENTOS DE LA BASE DE DATOS:
Todo investigador en Botánica necesita de los datos e informaciones relevantes referidas a colecciones de
otros u otras investigaciones en el área. Al mismo tiempo necesita también de la información textual y/o
gráfica presente en libros, publicaciones periódicas, fotografías, diseños, videos, etc. El grupo de desarrollo de
este trabajo, compuesto por botánicos y computistas, ha trabajado integradamente para derivar los principales
requerimientos de una base de datos botánicos que soporte en el futuro inmediato un sistema de información
hipermedia para el CJB. Estos requerimientos son los siguientes:
1. El diseño de la base de datos debe estar basado en taxones y especímenes. Esto es el soporte de
almacenamiento y procesamiento de nombres taxonómicos de cualquier categoría, siguiendo las reglas
internacionales del International Code Botanical Nomenclature y sus usos particulares (muchos autores
dan diferentes circunscripciones taxonómicas para un nombre). La posibilidad de utilizar varios
esquemas taxonómicos simultáneamente (Cronquist, Takhtajan, Thorne, Engler, etc.). Adicionalmente
debe soportar el manejo de las actividades administrativas y curatoriales para las diferentes colecciones,
entre las que se encuentran: el herbario, la palinoteca, la xiloteca, el jardín botánico, etc.
2. Bibliografía taxonómica y de especímenes. Posibilidad de manejar y relacionar información bibliográfica
asociada con los taxones y los especímenes.
3. Investigaciones taxonómicas y de especímenes. Posibilidad de relacionar los trabajos de investigación en
especímenes con los dedicados a los taxones.
4. Imágenes de taxones y de especímenes. Manejo del almacenamiento y recuperación de las imágenes
asociadas a los especímenes y a los taxones.
5. Datos espacio temporales. Soporte y manejo de datos georeferenciados o geoespaciales y/o temporales,
incluyendo la genealogía de plantas cultivadas en el jardín.
6. Flexibilidad en el ingreso de datos. Posibilidad de incluir información incompleta en la entrada de datos.
7. Robustez. Soporte de un modelo suficientemente completo que sea robusto para soportar los cambios a
través del tiempo.
8. Extensibilidad. Posibilidad de extender el modelo de base de datos para incluir otros servicios de
procesamiento de la información.
9. Seguridad y privacidad. Comenzando con la permanencia de los datos almacenados hasta la protección
de dichos datos frente a accesos no autorizados en un sistema multi-usuarios. Este es uno de los
requerimientos más importantes, dada la condición estratégica de nuestra fitodiversidad en relación a la
materia económica. Para soportar este punto, se incluyen los conceptos de multi-proyecto y multi-
institución que permite el trabajo compartido y colaborativo entre los investigadores botánicos y sus
instituciones.
Estos nueve requerimientos podrán ser soportados en el sistema a través del modelo semántico presentado a
continuación, el cual está basado en el enfoque orientado por objetos.
3. MODELO SEMÁNTICO DE LA BASE DE DATOS:
Un modelo semántico de base de datos puede ser desarrollado utilizando cualquiera de los múltiples modelos
en el área, propuestos en las referencias [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]. Se escogió, en este caso, el
modelo denominado Unified Modelling Language (UML) presentado por G. Booch et al. en [13]. Este
modelo extiende el modelo OMT (Object-Oriented Modelling Technique) presentado por J. Rumbaugh et al.
en [15] con los conceptos del núcleo del modelo de objetos del grupo OMG (Object Management Group)
publicado en [16].
El modelo de la base de datos botánicos se presenta dividido en cinco vistas, solamente con el
propósito de realizar una mejor explicación. La primera vista está dedicada a las actividades realizadas en el
herbario, que maneja principalmente las exsiccatae. Ellasoporta el primer requerimiento referido a la
recolección y registro de ejemplares en el herbario y a la interrelación con los taxones. Además también
soporta las actividades de determinación, préstamo e intercambio de ejemplares entre diferentes instituciones.
La segunda vista está diseñada para las actividades de los demás museos, como son: Anatomía de los
órganos de las plantas (raíz, tallo, hojas, fruto, flor), la colección de polen con sus muestras asociadas para la
realización de estudios microscópicos y la colección de plantas fósiles. Esta vista contiene todos los datos
IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 3
necesarios para mantener los procesos de fijación, acetólisis, fragmentación de maderas y fósiles y la
observación de las muestras de las plantas a través del microscopio.
El jardín botánico es la tercera vista, ella contiene la colección de plantas vivas, la de semillas y la de
frutos. Los datos manejados en ella representan los tratamientos horticulturales, los de propagación de plantas
o su tipo de reproducción y todos aquellos datos sobre su proveniencia natural, que refleja la genealogía de la
planta dentro del jardín.
La cuarta vista es la documentación textual que contiene diversas categorías: libros, publicaciones
periódicas, tesis, capítulos de libros, reportes, etc. Todos ellos relacionados con dos tipos de descriptores:
generales y específicos. Los descriptores generales son palabras claves dentro de cada documento y los
específicos son las referencias a cualquier objeto citado que pertenezca a las otras vistas del sistema. Esta
vista soporta los requerimientos dos, tres y cuatro.
Finalmente, la quinta vista corresponde a la documentación gráfica, que soporta las imágenes
referenciadas en los requerimientos cuatro y cinco. Las imágenes están divididas en: dibujos, fotos, imágenes
de satélite, imágenes en tres dimensiones (3D), imágenes digitalizadas, videos, mapas y software. Un objeto
gráfico también está asociado a cualquier otro objeto del sistema.
A continuación se incluyen los principales diagramas de datos que representan la complejidad y
extensión de la base de datos botánicos.
3.1. Vista del Herbario
Un herbario es una colección de especímenes de plantas que están secos, prensados y montados o preservados
en medios líquidos, rotulados y almacenados sistemáticamente dentro del mismo. En esta vista las principales
actividades son: la recolección de ejemplares, la preservación del material, la asignación de un número de
colección, la distribución de ejemplares duplicados, la asignación de etiquetas a cada uno, el registro de cada
ejemplar en el herbario, su identificación y el intercambio u oferta de materiales con otros herbarios. La figura
1 ilustra el modelo UML de la vista del herbario que está basado en taxones y en especímenes, lo cual permite
múltiples esquemas de clasificaciones botánicas. La base de datos basada en especímenes está representada en
el modelo por la clase CollectionNumber que contiene el conjunto de ejemplares tomados de un espécimen o
de una población y sometidos a las actividades curatoriales que se practican en el herbario.
En la jerarquía taxonómica, cada elemento de una categoría está definido como un taxón. La
taxonomía sobre el rango de las especies se nombran utilizando una sola palabra y los niveles del rango se
indican con un sufijo y/o precedidas del nombre del rango. El resto de la jerarquía se nombra utilizando una
combinación de dos palabras, el nombre del género seguido de un epíteto específico en el caso de nombres de
especies más el nombre del rango infraespecífico y el del nombre infraespecífico en los casos de rangos
menores a la especie (i.e. subespecies, variedades y formas). Todos ellos pueden ser representados por sólo
dos palabras que son: el nombre del rango y el epíteto del taxón relacionado con el rango de la categoría
superior, generalizando los dos tipos de nombres de taxón hacia arriba y hacia abajo en el rango de las
especies. La descripción mencionada se observa en el área gris de la figura. Este modelo permite generar
automáticamente todos los nombres botánicos de acuerdo a la nomenclatura internacional denominada
International Code of Botanical Nomenclature [17]. Para asociar los homónimos, se conecta cada nombre de
taxón con sus autores (asociación Authority) y su publicación (Documentation) a través de la asociación
Protologue. La asociación NomenclaturalStatus refleja los cambios en el estado nomenclatural (nomen
novum, nomen conservandus, nomen nudum, etc.) y los diversos sentidos de un nombre de acuerdo a otros
botánicos que son diferentes a aquel del autor del nombre. Esta asociación enlaza los nombres, no los taxones.
La asociación TaxScheme soporta diferentes esquemas de clasificación como: Takhtajan, Cronquist, Engler,
etc. El concepto de esquemas de clasificación se generaliza para incluir cambios en el rango de los taxones,
movimientos de un taxón dentro de otro del mismo rango (translación) y cambios de la circunscripción del
taxón utilizando la asociación TaxCircunscription. Estas cuatro últimas asociaciones permiten la
representación de los sinónimos homotípicos y heterotípicos y de los taxones enmendavit. Se extiende
también el concepto de taxón potencial [18] para cubrir todas las interrelaciones entre los nombres (citados o
presentes sobre una etiqueta de ejemplar) y los taxones, como una estandarización del nombre del taxón, la
cual está soportada por la asociación Standarization. Teóricamente un nombre de taxón debe ir asociado con
un tipo que puede ser otro taxón de la categoría inmediata inferior, o un espécimen o una foto. Los dos
primeros pertenecen a las especies y sus categorías bajas y el primero está incluido en las categorías más
IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 4
arriba del rango de las especies (asociación Typification). Esta parte del modelo es la que cubre la base de
datos basada en taxones.
La figura 2 muestra una vista detallada del manejo de los proyectos, los cuales reflejan la posibilidad
de que un grupo de Botánicos (clase ProjectGroup) con diferentes roles (asociación PersonRole) tengan
acceso a diversos conjuntos de objetos (clases CollectionNumber y Documentation). Los proyectos están
relacionados con las instituciones a través de dos vías diferentes: los investigadores que trabajan en un
proyecto y que pertenecen a una o más instituciones y la gente que colabora en el mismo, sin el status de
investigador. Esto muestra como el modelo soporta el requerimiento de multi-proyecto y multi-institución. En
esta versión no se considera un manejo real de los proyectos, pero ello puede ser incluido en un futuro
inmediato.
Número de colección Institución Documentación
 * * *
Subproyecto
*
 * Proyecto *
 Rol
Grupo de proyecto 1..* Persona
Figura 2. Modelo UML para la vista de los proyectos.
3.2. Otros museos
El núcleo del modelo es la vista del herbario pues el resto de las colecciones necesitan un espécimen testigo
almacenado en el herbario para validar el taxón al cual pertenece, de lo contrario la investigación no tiene
validez. La colección de anatomía contiene las muestras de los vegetales conservados apropiadamente por los
diferentes tipos de investigación. Hay cuatro tipos de fuentes para obtener este material, por recolección
simultánea de la Naturaleza de la muestra para el herbario y de la muestra de anatomía; por la extracción de
una parte del espécimen del herbario para anatomía, recolectado de la Naturaleza; por recolección de ambas
muestras de una planta cultivada en el jardín y por la extracción de una parte del espécimen de una planta
cultivada en el jardín. Esta vista soporta las cuatro fuentes para mantener la identificación del nombre del
taxón al cual pertenece una planta, con todos los cambios ya descritos. Las diferencias debidas al proceso de
preservación en el segundo ycuarto, y aquellas del primero y tercero debidas al ambiente, también se
soportan en el modelo.
3.3 Jardín botánico
El jardín es la colección de especies vegetales de la Naturaleza dedicadas a las actividades de conservación,
investigación, docencia y recreación. Los especímenes en el jardín así como las muestras anatómicas, deben
tener su ejemplar testigo en el herbario. Ellos pueden ser recolectados de la Naturaleza al mismo tiempo o
tomados más tarde del jardín. Ya que el origen de las especies es la Naturaleza, una de las características más
importantes de la adquisición de información acerca de los tratamientos horticulturales es los ciclos de vida y
fenológicos asociados a los ejemplares. Los procedimientos del sistema soportados por los datos de la base de
datos consolidan toda la información de los ejemplares relacionados por el mismo nombre y soportan el
conocimiento basado en taxones, indicando cómo cultivar y propagar las especies naturales.
El modelo también soporta la localización geoespacial de los especímenes del jardín, su estado
fenológico y su movilidad, que será utilizada para diseñar itinerarios de visitas guiadas y exposiciones
temáticas del jardín.
3.4. Documentación textual y gráfica
Esta es la segunda vista en importancia pues el conocimiento botánico debe ser publicado para que sea
aceptado por la comunidad investigadora en el área. En la vista del herbario todos los cambios taxonómicos y
nomenclaturales deben estar acompañados por las citas bibliográficas a través de su asociación con la clase
Documentation, la cual tiene dos subclases denominadas Textual y Graphic. Esto provee de fuentes para
nuevas identificaciones de los ejemplares almacenados y de otra información no disponible en el herbario
IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 5
como los tipos no designados para los diferentes taxones. El modelo está basado en las necesidades de
recuperación de información de los Botánicos y no en la de los bibliotecólogos.
3.5. Seguridad
El espíritu del sistema de base de datos diseñado es dual, primero él debe ser una herramienta útil para los
Botánicos en la realización de sus investigaciones donde se comparte información en un ambiente seguro y
segundo, él coloca información relevante y contrastada sobre la fitodiversidad Venezolana en Internet
(WWW). Ambas aspectos necesitan control de seguridad referida a la autorización de los usuarios y a la
seguridad e integridad de los datos. El control de autorización incluye el control de acceso, los modos de
acceso, los privilegios, los roles de usuarios y multiniveles de seguridad, los cuales deben ser soportados por
el sistema. Este es el aspecto más importante debido a que la información sobre la fitodiversidad del planeta
es hoy en día, un aspecto estratégico luego de la Cumbre de Río de Janeiro. Adicionalmente, la investigación
botánica en el seno de un grupo de investigación debe perentoriamente ser protegida antes de que los
resultados de dicha investigación sean publicados. Este aspecto se maneja en la clase Project (figura 2).
4. CONCLUSIONES:
El diseño de la base de datos presentado es completo y permite acumular información sobre los recursos
fitogenéticos como una base de la investigación botánica para tomar decisiones ambientales y para manejar
las colecciones de toda institución botánica, que pueden ser multi-institución, multi-proyecto y multi-
investigador. Este modelo toma en cuenta también la privacidad de los datos entre los investigadores,
proyectos e instituciones. La principal característica del modelo es el tratamiento de los taxones y de los
especímenes relacionados con la información textual y gráfica, dándole las facilidades necesarias para
construir sobre él un sistema hipermedia de información, el cual ya está en desarrollo.
5. REFERENCIAS BIBLIOGRÁFICAS:
[1] The American Society of Collections. http://mobot.mobot.org/Pick/Search/pick.html.
[2] The International Organization of Plan Information. http://chaos.mur.csu.edu.au/iopi/iopidpd1.html.
[3] P. Chen. The entity-relationship model -Toward a unified view of data. ACM TODBS 1(1).1976. 9-36.
[4] J. Smith and D. Smith. Database abstraction: Aggregation and generalization. ACM TODBS 2(2). 1977.
105-133.
[5] D. Tsichritzis and F. Lochovsky. Data models. (Prentice-Hall, Inc., 1982)
[6] T. Teorey and J. Fry. Design of database structures. (Prentice-Hall, Inc., 1982)
[7] R. Elmasri, A. Hevner, and J. Weeldreyer. The category concept: An extension to the entity-relationship
model. Data and Knowledge engineering 1(1). 1985. 75-116.
[8] T. Teorey, D. Yang and J. Fry. A logical design methodology for relational databases using the Extended
Entity-Relationship model. ACM Computing Surveys. 18(2). 1986. 197-222.
[9] R. Hull and R. King. Semantic database modelling: surveys, applications, ans research issues. ACM
Computing surveys. 19(3). 1987. 201-260.
[10] P. Ng. Further analysis of the entity-relationship approach to database design. IEEE Transactions on
software engineering. 7(1). 1981. 85-99.
[11] R. Cattell, ed. The object database standard: ODMG-93. (Morgan Kaufmann, 1993)
[12] M. Blaha, W. Premerlani and J. Rumbaugh. Relational database design using an object-oriented
methodology. Communications of the ACM. 31(4). 414-427.
[13] G. Booch, I. Jacobson, and J. Rumbaugh. Unified modeling language. Rational Software Corporation.
1997. Http://www.rational.com/uml/
[14] P.-A. Muller. Modélisation objet avec UML. (Paris, Eyrolles, 1997)
[15] J. Rumbaugh, M. Blaha, W. Premerlani, F. Eddy, and W. Lorensen. Object-oriented modeling technique.
(New Jersey; Prentice-Hall, Inc., 1991)
[16] W. Kim. Modern database systems: The object model, interoperability, and beyond. (New York; ACM
Press, Addison Wesley, 1995)
[17] W. Greuter et al. (Ed.) International Code of Botanical Nomenclature (Tokyo Code). Regnun Vegetabile
131 (Königstein, Koeltz Scientific Books, 1994). Also in http://www.bgbm.fu-
berlin.de/iapt/nomenclature/code/tokyo-e/
[18] W. Berendsohn. The concepts of “potential taxa” in databases. Taxon. 44. 1995. 207-212.
IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 6

Continuar navegando