Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 1 MODELADO DE UNA BASE DE DATOS BOTÁNICOS Isabel Besembel, Domingo Hernández, Juan Gaviria♦ y Javier Estrada♦ . Grupo de Ingeniería de Datos y Conocimiento (GIDyC) Departamento de Computación Escuela de Ingeniería de Sistemas Centro Jardín Botánico♦ Universidad de Los Andes. Mérida-Venezuela Palabras claves: Modelado de bases de datos, Bases de datos orientadas por objetos, Biotecnología y Análisis y diseño. RESUMEN: En este artículo se propone un nuevo modelo orientado por objetos para bases de datos botánicos. Este modelo soporta los dos paradigmas de trabajo en la Botánica, los taxones y los especímenes, relacionados a través de su información textual y gráfica e incluyendo los conceptos de multi-proyecto, multi-institución y multi-investigador. El modelo está compuesto por tres grandes vistas de los museos denominados: Herbarium, jardín botánico y otras colecciones (anatomía, polen, fósiles, etc.). Todos ellos relacionados con las vistas de documentación textual y gráfica. Un aspecto importante y resaltante de este modelo es el soporte completo de la seguridad y privacidad de los datos, ya que los datos obtenidos en las investigaciones botánicas deben ser protegidos completamente antes de su publicación. Este modelo fue desarrollado como el modelo base para el sistema de información hipermedia denominado Orinoco, el cual formará parte del Sistema de Información sobre fitodiversidad de Venezuela. 1. INTRODUCCIÓN: Hoy en día, los esfuerzos hechos para modelar información taxonómica y fitogenética están circunscritos a modelos de bases de datos relacionales dedicados a manejar los datos de un investigador, un proyecto y/o una institución. Estos esfuerzos han mostrado ser menos efectivos y muy vulnerables para hacer frente a los cambios tecnológicos actuales. Los investigadores de la Botánica están inmersos en un maremagnun de información, referencias, datos nomenclaturales, etc. cuyo procesamiento es complejo y costoso en tiempo y esfuerzo. Actualmente muchos de los investigadores botánicos piensan que este sistema debe cambiar, pero la estabilidad nomenclatural basada en el principio de prioridad y en los tipos nomenclaturales debe ser mantenida por muchas generaciones antes de que pueda ser cambiada. Esto se debe a la falta de nuevas propuestas que satisfagan las necesidades de dar nombres a la diversidad biológica. El modelo presentado en este trabajo ha sido comparado con dos de los modelos de información de nombres botánicos más reconocidos, como son: el modelo de la American Society of Collections (ASC) [1] y el modelo de la International Organization of Plan Information (IOPI) [2], los cuales están basados en taxones. Se propone aquí un nuevo modelo de base de datos botánicos orientado por objetos que soporta taxones y especímenes, ambos relacionados a la información textual y gráfica que cada dato tenga e incluyendo además, los conceptos de multi-investigador, multi-proyecto y multi-institución. Esto permite tener varios investigadores e instituciones asociadas a varios proyectos botánicos. Según nuestras referencias estudiadas, este modelo es el primero que soporta los dos esquemas antes mencionados para la determinación de plantas, obteniendo un esquema de base de datos semántico, completo, extensible, robusto y flexible. El resto de este artículo está organizado como sigue: la sección 2 enumera los principales requerimientos propuestos por los investigadores del Centro Jardín Botánico (CJB) de la Universidad de Los Andes, para obtener un modelo de base de datos completo. Dicho modelo se describe en la sección 3 que está dividida en cinco subsecciones, las cuales se corresponden con cada una de las vistas asociadas a cada actividad de investigación en la Botánica, incluyendo el herbario, los otros museos, el jardín botánico, la IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 2 documentación textual y la gráfica. Finalmente, la sección 4 presenta un resumen de nuestras principales conclusiones y trabajo futuro. 2. REQUERIMIENTOS DE LA BASE DE DATOS: Todo investigador en Botánica necesita de los datos e informaciones relevantes referidas a colecciones de otros u otras investigaciones en el área. Al mismo tiempo necesita también de la información textual y/o gráfica presente en libros, publicaciones periódicas, fotografías, diseños, videos, etc. El grupo de desarrollo de este trabajo, compuesto por botánicos y computistas, ha trabajado integradamente para derivar los principales requerimientos de una base de datos botánicos que soporte en el futuro inmediato un sistema de información hipermedia para el CJB. Estos requerimientos son los siguientes: 1. El diseño de la base de datos debe estar basado en taxones y especímenes. Esto es el soporte de almacenamiento y procesamiento de nombres taxonómicos de cualquier categoría, siguiendo las reglas internacionales del International Code Botanical Nomenclature y sus usos particulares (muchos autores dan diferentes circunscripciones taxonómicas para un nombre). La posibilidad de utilizar varios esquemas taxonómicos simultáneamente (Cronquist, Takhtajan, Thorne, Engler, etc.). Adicionalmente debe soportar el manejo de las actividades administrativas y curatoriales para las diferentes colecciones, entre las que se encuentran: el herbario, la palinoteca, la xiloteca, el jardín botánico, etc. 2. Bibliografía taxonómica y de especímenes. Posibilidad de manejar y relacionar información bibliográfica asociada con los taxones y los especímenes. 3. Investigaciones taxonómicas y de especímenes. Posibilidad de relacionar los trabajos de investigación en especímenes con los dedicados a los taxones. 4. Imágenes de taxones y de especímenes. Manejo del almacenamiento y recuperación de las imágenes asociadas a los especímenes y a los taxones. 5. Datos espacio temporales. Soporte y manejo de datos georeferenciados o geoespaciales y/o temporales, incluyendo la genealogía de plantas cultivadas en el jardín. 6. Flexibilidad en el ingreso de datos. Posibilidad de incluir información incompleta en la entrada de datos. 7. Robustez. Soporte de un modelo suficientemente completo que sea robusto para soportar los cambios a través del tiempo. 8. Extensibilidad. Posibilidad de extender el modelo de base de datos para incluir otros servicios de procesamiento de la información. 9. Seguridad y privacidad. Comenzando con la permanencia de los datos almacenados hasta la protección de dichos datos frente a accesos no autorizados en un sistema multi-usuarios. Este es uno de los requerimientos más importantes, dada la condición estratégica de nuestra fitodiversidad en relación a la materia económica. Para soportar este punto, se incluyen los conceptos de multi-proyecto y multi- institución que permite el trabajo compartido y colaborativo entre los investigadores botánicos y sus instituciones. Estos nueve requerimientos podrán ser soportados en el sistema a través del modelo semántico presentado a continuación, el cual está basado en el enfoque orientado por objetos. 3. MODELO SEMÁNTICO DE LA BASE DE DATOS: Un modelo semántico de base de datos puede ser desarrollado utilizando cualquiera de los múltiples modelos en el área, propuestos en las referencias [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]. Se escogió, en este caso, el modelo denominado Unified Modelling Language (UML) presentado por G. Booch et al. en [13]. Este modelo extiende el modelo OMT (Object-Oriented Modelling Technique) presentado por J. Rumbaugh et al. en [15] con los conceptos del núcleo del modelo de objetos del grupo OMG (Object Management Group) publicado en [16]. El modelo de la base de datos botánicos se presenta dividido en cinco vistas, solamente con el propósito de realizar una mejor explicación. La primera vista está dedicada a las actividades realizadas en el herbario, que maneja principalmente las exsiccatae. Ellasoporta el primer requerimiento referido a la recolección y registro de ejemplares en el herbario y a la interrelación con los taxones. Además también soporta las actividades de determinación, préstamo e intercambio de ejemplares entre diferentes instituciones. La segunda vista está diseñada para las actividades de los demás museos, como son: Anatomía de los órganos de las plantas (raíz, tallo, hojas, fruto, flor), la colección de polen con sus muestras asociadas para la realización de estudios microscópicos y la colección de plantas fósiles. Esta vista contiene todos los datos IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 3 necesarios para mantener los procesos de fijación, acetólisis, fragmentación de maderas y fósiles y la observación de las muestras de las plantas a través del microscopio. El jardín botánico es la tercera vista, ella contiene la colección de plantas vivas, la de semillas y la de frutos. Los datos manejados en ella representan los tratamientos horticulturales, los de propagación de plantas o su tipo de reproducción y todos aquellos datos sobre su proveniencia natural, que refleja la genealogía de la planta dentro del jardín. La cuarta vista es la documentación textual que contiene diversas categorías: libros, publicaciones periódicas, tesis, capítulos de libros, reportes, etc. Todos ellos relacionados con dos tipos de descriptores: generales y específicos. Los descriptores generales son palabras claves dentro de cada documento y los específicos son las referencias a cualquier objeto citado que pertenezca a las otras vistas del sistema. Esta vista soporta los requerimientos dos, tres y cuatro. Finalmente, la quinta vista corresponde a la documentación gráfica, que soporta las imágenes referenciadas en los requerimientos cuatro y cinco. Las imágenes están divididas en: dibujos, fotos, imágenes de satélite, imágenes en tres dimensiones (3D), imágenes digitalizadas, videos, mapas y software. Un objeto gráfico también está asociado a cualquier otro objeto del sistema. A continuación se incluyen los principales diagramas de datos que representan la complejidad y extensión de la base de datos botánicos. 3.1. Vista del Herbario Un herbario es una colección de especímenes de plantas que están secos, prensados y montados o preservados en medios líquidos, rotulados y almacenados sistemáticamente dentro del mismo. En esta vista las principales actividades son: la recolección de ejemplares, la preservación del material, la asignación de un número de colección, la distribución de ejemplares duplicados, la asignación de etiquetas a cada uno, el registro de cada ejemplar en el herbario, su identificación y el intercambio u oferta de materiales con otros herbarios. La figura 1 ilustra el modelo UML de la vista del herbario que está basado en taxones y en especímenes, lo cual permite múltiples esquemas de clasificaciones botánicas. La base de datos basada en especímenes está representada en el modelo por la clase CollectionNumber que contiene el conjunto de ejemplares tomados de un espécimen o de una población y sometidos a las actividades curatoriales que se practican en el herbario. En la jerarquía taxonómica, cada elemento de una categoría está definido como un taxón. La taxonomía sobre el rango de las especies se nombran utilizando una sola palabra y los niveles del rango se indican con un sufijo y/o precedidas del nombre del rango. El resto de la jerarquía se nombra utilizando una combinación de dos palabras, el nombre del género seguido de un epíteto específico en el caso de nombres de especies más el nombre del rango infraespecífico y el del nombre infraespecífico en los casos de rangos menores a la especie (i.e. subespecies, variedades y formas). Todos ellos pueden ser representados por sólo dos palabras que son: el nombre del rango y el epíteto del taxón relacionado con el rango de la categoría superior, generalizando los dos tipos de nombres de taxón hacia arriba y hacia abajo en el rango de las especies. La descripción mencionada se observa en el área gris de la figura. Este modelo permite generar automáticamente todos los nombres botánicos de acuerdo a la nomenclatura internacional denominada International Code of Botanical Nomenclature [17]. Para asociar los homónimos, se conecta cada nombre de taxón con sus autores (asociación Authority) y su publicación (Documentation) a través de la asociación Protologue. La asociación NomenclaturalStatus refleja los cambios en el estado nomenclatural (nomen novum, nomen conservandus, nomen nudum, etc.) y los diversos sentidos de un nombre de acuerdo a otros botánicos que son diferentes a aquel del autor del nombre. Esta asociación enlaza los nombres, no los taxones. La asociación TaxScheme soporta diferentes esquemas de clasificación como: Takhtajan, Cronquist, Engler, etc. El concepto de esquemas de clasificación se generaliza para incluir cambios en el rango de los taxones, movimientos de un taxón dentro de otro del mismo rango (translación) y cambios de la circunscripción del taxón utilizando la asociación TaxCircunscription. Estas cuatro últimas asociaciones permiten la representación de los sinónimos homotípicos y heterotípicos y de los taxones enmendavit. Se extiende también el concepto de taxón potencial [18] para cubrir todas las interrelaciones entre los nombres (citados o presentes sobre una etiqueta de ejemplar) y los taxones, como una estandarización del nombre del taxón, la cual está soportada por la asociación Standarization. Teóricamente un nombre de taxón debe ir asociado con un tipo que puede ser otro taxón de la categoría inmediata inferior, o un espécimen o una foto. Los dos primeros pertenecen a las especies y sus categorías bajas y el primero está incluido en las categorías más IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 4 arriba del rango de las especies (asociación Typification). Esta parte del modelo es la que cubre la base de datos basada en taxones. La figura 2 muestra una vista detallada del manejo de los proyectos, los cuales reflejan la posibilidad de que un grupo de Botánicos (clase ProjectGroup) con diferentes roles (asociación PersonRole) tengan acceso a diversos conjuntos de objetos (clases CollectionNumber y Documentation). Los proyectos están relacionados con las instituciones a través de dos vías diferentes: los investigadores que trabajan en un proyecto y que pertenecen a una o más instituciones y la gente que colabora en el mismo, sin el status de investigador. Esto muestra como el modelo soporta el requerimiento de multi-proyecto y multi-institución. En esta versión no se considera un manejo real de los proyectos, pero ello puede ser incluido en un futuro inmediato. Número de colección Institución Documentación * * * Subproyecto * * Proyecto * Rol Grupo de proyecto 1..* Persona Figura 2. Modelo UML para la vista de los proyectos. 3.2. Otros museos El núcleo del modelo es la vista del herbario pues el resto de las colecciones necesitan un espécimen testigo almacenado en el herbario para validar el taxón al cual pertenece, de lo contrario la investigación no tiene validez. La colección de anatomía contiene las muestras de los vegetales conservados apropiadamente por los diferentes tipos de investigación. Hay cuatro tipos de fuentes para obtener este material, por recolección simultánea de la Naturaleza de la muestra para el herbario y de la muestra de anatomía; por la extracción de una parte del espécimen del herbario para anatomía, recolectado de la Naturaleza; por recolección de ambas muestras de una planta cultivada en el jardín y por la extracción de una parte del espécimen de una planta cultivada en el jardín. Esta vista soporta las cuatro fuentes para mantener la identificación del nombre del taxón al cual pertenece una planta, con todos los cambios ya descritos. Las diferencias debidas al proceso de preservación en el segundo ycuarto, y aquellas del primero y tercero debidas al ambiente, también se soportan en el modelo. 3.3 Jardín botánico El jardín es la colección de especies vegetales de la Naturaleza dedicadas a las actividades de conservación, investigación, docencia y recreación. Los especímenes en el jardín así como las muestras anatómicas, deben tener su ejemplar testigo en el herbario. Ellos pueden ser recolectados de la Naturaleza al mismo tiempo o tomados más tarde del jardín. Ya que el origen de las especies es la Naturaleza, una de las características más importantes de la adquisición de información acerca de los tratamientos horticulturales es los ciclos de vida y fenológicos asociados a los ejemplares. Los procedimientos del sistema soportados por los datos de la base de datos consolidan toda la información de los ejemplares relacionados por el mismo nombre y soportan el conocimiento basado en taxones, indicando cómo cultivar y propagar las especies naturales. El modelo también soporta la localización geoespacial de los especímenes del jardín, su estado fenológico y su movilidad, que será utilizada para diseñar itinerarios de visitas guiadas y exposiciones temáticas del jardín. 3.4. Documentación textual y gráfica Esta es la segunda vista en importancia pues el conocimiento botánico debe ser publicado para que sea aceptado por la comunidad investigadora en el área. En la vista del herbario todos los cambios taxonómicos y nomenclaturales deben estar acompañados por las citas bibliográficas a través de su asociación con la clase Documentation, la cual tiene dos subclases denominadas Textual y Graphic. Esto provee de fuentes para nuevas identificaciones de los ejemplares almacenados y de otra información no disponible en el herbario IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 5 como los tipos no designados para los diferentes taxones. El modelo está basado en las necesidades de recuperación de información de los Botánicos y no en la de los bibliotecólogos. 3.5. Seguridad El espíritu del sistema de base de datos diseñado es dual, primero él debe ser una herramienta útil para los Botánicos en la realización de sus investigaciones donde se comparte información en un ambiente seguro y segundo, él coloca información relevante y contrastada sobre la fitodiversidad Venezolana en Internet (WWW). Ambas aspectos necesitan control de seguridad referida a la autorización de los usuarios y a la seguridad e integridad de los datos. El control de autorización incluye el control de acceso, los modos de acceso, los privilegios, los roles de usuarios y multiniveles de seguridad, los cuales deben ser soportados por el sistema. Este es el aspecto más importante debido a que la información sobre la fitodiversidad del planeta es hoy en día, un aspecto estratégico luego de la Cumbre de Río de Janeiro. Adicionalmente, la investigación botánica en el seno de un grupo de investigación debe perentoriamente ser protegida antes de que los resultados de dicha investigación sean publicados. Este aspecto se maneja en la clase Project (figura 2). 4. CONCLUSIONES: El diseño de la base de datos presentado es completo y permite acumular información sobre los recursos fitogenéticos como una base de la investigación botánica para tomar decisiones ambientales y para manejar las colecciones de toda institución botánica, que pueden ser multi-institución, multi-proyecto y multi- investigador. Este modelo toma en cuenta también la privacidad de los datos entre los investigadores, proyectos e instituciones. La principal característica del modelo es el tratamiento de los taxones y de los especímenes relacionados con la información textual y gráfica, dándole las facilidades necesarias para construir sobre él un sistema hipermedia de información, el cual ya está en desarrollo. 5. REFERENCIAS BIBLIOGRÁFICAS: [1] The American Society of Collections. http://mobot.mobot.org/Pick/Search/pick.html. [2] The International Organization of Plan Information. http://chaos.mur.csu.edu.au/iopi/iopidpd1.html. [3] P. Chen. The entity-relationship model -Toward a unified view of data. ACM TODBS 1(1).1976. 9-36. [4] J. Smith and D. Smith. Database abstraction: Aggregation and generalization. ACM TODBS 2(2). 1977. 105-133. [5] D. Tsichritzis and F. Lochovsky. Data models. (Prentice-Hall, Inc., 1982) [6] T. Teorey and J. Fry. Design of database structures. (Prentice-Hall, Inc., 1982) [7] R. Elmasri, A. Hevner, and J. Weeldreyer. The category concept: An extension to the entity-relationship model. Data and Knowledge engineering 1(1). 1985. 75-116. [8] T. Teorey, D. Yang and J. Fry. A logical design methodology for relational databases using the Extended Entity-Relationship model. ACM Computing Surveys. 18(2). 1986. 197-222. [9] R. Hull and R. King. Semantic database modelling: surveys, applications, ans research issues. ACM Computing surveys. 19(3). 1987. 201-260. [10] P. Ng. Further analysis of the entity-relationship approach to database design. IEEE Transactions on software engineering. 7(1). 1981. 85-99. [11] R. Cattell, ed. The object database standard: ODMG-93. (Morgan Kaufmann, 1993) [12] M. Blaha, W. Premerlani and J. Rumbaugh. Relational database design using an object-oriented methodology. Communications of the ACM. 31(4). 414-427. [13] G. Booch, I. Jacobson, and J. Rumbaugh. Unified modeling language. Rational Software Corporation. 1997. Http://www.rational.com/uml/ [14] P.-A. Muller. Modélisation objet avec UML. (Paris, Eyrolles, 1997) [15] J. Rumbaugh, M. Blaha, W. Premerlani, F. Eddy, and W. Lorensen. Object-oriented modeling technique. (New Jersey; Prentice-Hall, Inc., 1991) [16] W. Kim. Modern database systems: The object model, interoperability, and beyond. (New York; ACM Press, Addison Wesley, 1995) [17] W. Greuter et al. (Ed.) International Code of Botanical Nomenclature (Tokyo Code). Regnun Vegetabile 131 (Königstein, Koeltz Scientific Books, 1994). Also in http://www.bgbm.fu- berlin.de/iapt/nomenclature/code/tokyo-e/ [18] W. Berendsohn. The concepts of “potential taxa” in databases. Taxon. 44. 1995. 207-212. IV Jornadas Cientítico Técnicas de la Facultad de Ingeniería. 16-21 de Noviembre de 1998. Mérida-Venezuela. 6
Compartir