Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
BASES DE DATOS BIOLÓGICAS Introducción Recordemos que en computación una Base de Datos (BD) es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior utilización. El objetivo principal del desarrollo de una BD es organizar los datos en un conjunto de registros estructurados que permitan recuperar fácilmente la información. Cada registro está compuesto por un número determinado de campos que contienen datos específicos, por ejemplo: nombres, números de teléfono, etc. Para recuperar un registro particular de la base de datos, un usuario puede especificar una pieza de información, llamada valor, que será encontrada en un campo en especial. La computadora entonces recuperará el registro completo. Este proceso es llamado consulta Aun cuando la recuperación de información es el principal objetivo de todas las BD, las BD biológicas a menudo tienen un requerimiento de más alto nivel, conocido como descubrimiento de conocimiento. Este se refiere a la identificación de conexiones entre piezas de información que no eran conocidas cuando la información fue introducida por primera vez. Por ejemplo, en las BD que contienen información cruda (sin procesar) de secuencias de ADN se pueden realizar tareas extras para identificar homología de secuencias o motivos conservados. Con lo cual se podría facilitar el descubrimiento de nuevos conocimientos biológicos a partir de datos crudos. Datos biológicos Por: Natalia Jiménez Lozano (2017). Se podría definir dato como el resultado de una medición. En este capítulo hablaremos de bases de datos (BD) que albergan información biológica por lo que el dato biológico sería un tipo particular de dato generado dentro del contexto de una investigación científica. Las mediciones que se realizan en el campo de la investigación no son simples ya que en la mayoría de los casos son el resultado de un complejo flujo de trabajo en el laboratorio donde se utilizan muy diversas técnicas. Podemos poner como ejemplo de dato biológico la secuencia de nucleótidos de un gen determinada mediante técnicas de secuenciación o la banda correspondiente a un fragmento de DNA separado mediante una electroforesis en gel de agarosa. Dato, información y conocimiento Existe mucha confusión entre los términos dato, información y conocimiento. De hecho, en muchas ocasiones estos términos son considerados erróneamente como sinónimos. La diferencia fundamental radica en que, mientras que a partir de conjuntos de datos se puede derivar la información directamente, el conocimiento normalmente se deriva de forma indirecta. Utilizaremos un ejemplo para poner de manifiesto la diferencia que existe entre estos tres conceptos. Ejemplo: Imagina que regentas un herbolario y que tienes una base de datos donde registras todos los datos de tus clientes de manera que conoces sus nombres y los productos que compran en tu establecimiento. Que los clientes Paula y Javier compren leche sin lactosa cada lunes es un dato que tú tienes almacenado en tu base de datos. Cada vez que quieras saber quiénes son los clientes que compran leche sin lactosa o cuantos litros de leche sin lactosa vendes cada día, consultaras a la base de datos y tendrás el resultado. Esto es información. Ahora imagina que hay otros 100 clientes que también compran leche sin lactosa y que todos ellos son alérgicos a la lactosa. Entonces podrás concluir que Paula y Javier deben ser alérgicos a la lactosa también. La alergia de Paula y Javier no se te ha proporcionado como dato y tampoco se puede extraer de la base de datos como información. Sin embargo, tú has extrapolado esta información de manera indirecta y a esto es a lo que llamamos conocimiento. Por lo tanto, el dato es objetivo y no abstracto y sin embargo la información y el conocimiento son subjetivos y requieren altos grados de abstracción. La organización de los datos biológicos en bases de datos facilita el descubrimiento de conocimiento ya que permite poner de manifiesto relaciones entre piezas de información que se desconocían en el momento en que la información fue introducida por primera vez (datos crudos o sin procesar). Otro ejemplo de generación de conocimiento sería el derivar los motivos conservados en un conjunto de secuencias proteicas crudas pertenecientes a una base de datos. Características Ahora que sabemos lo que es un dato biológico y lo distinguimos de la información y del conocimiento, veamos cuáles son sus características: Los datos biológicos son heterogéneos porque representan entidades diversas que van desde átomos hasta estudios poblacionales, pasando por secuencias de nucleótidos y proteínas, estructuras proteicas cristalinas, medidas de expresión génica, interacciones proteína-proteína o proteína-DNA, redes e interacción, células, estudios fenotípicos y estudios fisiológicos. Los datos biológicos son complejos. Para que te hagas una idea de la complejidad de los datos biológicos vamos a compararlos con los datos antropométricos. Imagina la diferencia que hay entre los datos correspondientes al peso de una persona y la determinación una estructura de una proteína sencilla como la insulina. En el primer caso lo único que tendríamos que hacer sería pesar al individuo con una báscula. Sin embargo, en el segundo caso tendríamos que purificar la proteína, cristalizarla, obtener el difractograma y a partir de este determinar las posiciones en el eje X, Y, Z de cada átomo de cada uno de los 110 aminoácidos de la proteína. El dato antropométrico es un número y el dato biológico es un fichero de más de mil líneas, 865 de las cuales corresponden a la posición de uno de los átomos de la estructura. Los datos biológicos pueden tener una naturaleza cuantitativa (Ej. peso molecular de una proteína) o cualitativa (Ej. función de una proteína). Los datos biológicos son necesariamente dinámicos porque van cambiando según van evolucionando las técnicas que los generan o van surgiendo nuevas técnicas que completan el dato. Ej. la primera secuencia proteica que se determinó, la insulina bovina, depositada en la base de datos UniProtKB en el año 1986 (Identificador P01317; hablaremos de esta base de datos en detalle más adelante) ha sufrido hasta la fecha 126 revisiones. Este dato, como el resto de datos biológicos es incompleto ya que seguir a evolucionando indefinidamente. Los datos biológicos pueden proceder de interpretaciones, de análisis computacionales o bien pueden ser datos confirmados experimentalmente. Veamos algunos ejemplos: Datos procedentes de interpretaciones: la descripción del nivel de expresión de un gen en un tejido determinado por la técnica de hibridación in situ. Mediante esta técnica, el experimentalista obtiene una imagen correspondiente a una sección del organismo que esté estudiando, y tiene que determinar si la expresión en los tejidos de interés es inexistente, débil, media, fuerte o muy fuerte. Por lo tanto, en este caso el experimentalista ha de interpretar el dato crudo (imagen obtenida de la técnica). Datos procedentes de análisis computacionales: estructura secundaria de una proteína es un ejemplo de dato obtenido computacionalmente a partir de la secuencia. En este caso el dato biológico está asociado a una probabilidad. Existe un gran abanico de aplicaciones que proporcionan este tipo de datos. Datos confirmados experimentalmente: la interacción entre dos proteínas observada mediante el experimento del doble híbrido. Bases de datos biológicas Historia Si hay un nombre ligado a la Bioinformática es sin lugar a dudas el de Margaret Dayhoff (1925-1983). Esta fisicoquímica estadounidense fue pionera en el campo de la Bioinformática. Su visión de futuro le llevó a publicar un libro en 1965 que reunía las 65 secuencias proteicas existentes hasta esa fecha con el objetivode facilitar el análisis de las mismas. Este libro titulado “Atlas of Protein Sequence and Structure” fue el precursor de PIR (Protein Information Resource), la primera base de datos en el campo de la Bioinformática. Definición Por: Universidad del País Vasco (2018). Una base de datos biológica es una biblioteca de información sobre ciencias de la vida, recogida de experimentos científicos, literatura publicada, tecnología de experimentación de alto rendimiento, y análisis computacional. Contiene información de áreas de investigación incluyendo genómica, proteómica, metabolómica, expresión génica mediante microarrays, y filogenética. La información contenida en bases de da-tos biológicas incluye funciones, estructura y localización (tanto celular como cromosómica) de genes, efectos clínicos de mutaciones, así como similitudes de secuencias y estructuras biológicas. En los últimos años, debido a la rápida evolución de las técnicas experimentales de alto rendimiento (Secuenciación del ADN, Cristalografía de rayos X, Microarreglo de ADN) se generó un crecimiento exponencial en la cantidad de datos biológicos (secuencias genómicas y de proteínas, estructuras de proteínas, expresión génica, mutaciones, etc) que generaron la necesidad de contar con formas eficientes de almacenar la información. Las bases de datos biológicas surgieron como una respuesta a los enormes volúmenes de datos generados por las tecnologías de secuenciación de ADN de bajo costo. Una de las primeras bases de datos que surgió fue GenBank, que es una colección de todas las secuencias de ADN y proteínas disponibles. Es mantenido por los Institutos Nacionales de Salud (NIH) y el Centro Nacional de Información de Biotecnología (NCBI). GenBank allanó el camino para el Proyecto Genoma Humano (HGP). El HGP permitió la secuenciación completa y la lectura del plano genético. Los datos almacenados en bases de datos biológicas se organizan para un análisis óptimo y se componen de dos tipos: sin procesar y curados (o anotados). Las bases de datos biológicas son complejas, heterogéneas, dinámicas y, sin embargo, inconsistentes. La inconsistencia se debe a la falta de estándares a nivel ontológico. Gracias a las nuevas tecnologías se está generando una ingente cantidad de datos biológicos y toda esta información se almacena en bases de datos. Estos datos pueden ser de cuatro tipos: secuencias biológicas, datos estructurales, datos funcionales y bibliografía. Cada categoría de datos presenta su propia estructura y requisitos, lo que influye decisivamente a la hora de diseñar las bases de datos. Los diversos tipos de datos están estrechamente relacionados entre sí: las secuencias codificantes de ADN dan lugar a proteínas con una estructura tridimensional y una función característica; con mucha frecuencia, las proteínas no funcionan solas, sino que forman parte de rutas metabólicas en las que establecen importantes relaciones con otros tipos de biomoléculas y, además, toda esta información está convenientemente reflejada en las publicaciones científicas. Se ha hecho un gran esfuerzo para que toda esta información sea accesible a través de la World Wide Web (www) de modo que tanto las bases de datos como sus herramientas de búsqueda se han convertido en parte esencial de la actividad investigadora. Todos los años, el primer número de la revista Nucleic Acids Research (NAR) está dedicado a las bases de datos: publica artículos que describen la creación de nuevas bases de datos y las https://es.wikipedia.org/wiki/Secuenciaci%C3%B3n_del_ADN https://es.wikipedia.org/wiki/Cristalograf%C3%ADa_de_rayos_X https://es.wikipedia.org/wiki/Microarreglo_de_ADN innovaciones que se han producido en las ya existentes y, además, contiene una lista exhaustiva de todas las bases de datos existentes y sus URL. Muchas de estas bases están alojadas en los sitios web de centros gubernamentales o privados que han creado un entorno gráfico uniforme que reúne un gran número de bases de datos. Ejemplos de este tipo de centros son: The National Center for Biotechnology Information, NCBI (http://www.ncbi.nlm.nih.gov/). The European Bioinformatics Institute, EBI (http://www.ebi.ac.uk). The Switzerland Institute of Bioinformatics, SIB (http:/www.isb-sib.ch/). The Sanger Institute (http://www.sanger.ac.uk). Un aspecto particularmente interesante de estos centros es que establecen conexiones entre las distintas bases de datos que permiten obtener de manera fácil y rápida toda la información relacionada con una biomolécula concreta. Descripción Por: Natalia Jiménez Lozano (2017). Las bases de datos biológicas constituyen una herramienta esencial para almacenar, estructurar, organizar, actualizar y manipular datos biológicos. La variedad de estos datos, así como también su rápido crecimiento, hacen a las bases de datos una herramienta clave. Se han convertido en un instrumento indispensable para los científicos experimentales del campo de la biología, como para aquellos científicos del área de la bioinformática que desarrollan experimentos in silico. Las bases de datos biológicas surgen a partir de los conceptos de bases de datos relacionales de las ciencias de la computación, y los conceptos de recuperación de información de las bibliotecas digitales. El diseño de estas bases de datos, su desarrollo y su gestión a largo plazo, forman un área nuclear dentro de la bioinformática. El contenido de los datos incluye secuencias génicas, descripciones textuales, atributos y clasificaciones ontológicas, estructuras de proteínas, anotaciones, entre otras. Estos son descritos a menudo como datos semiestructurados, y se pueden representar como tablas, registros delimitados por claves y estructuras XML. Son comunes las referencias cruzadas entre las diferentes bases de datos biológicas usando los números de acceso https://es.wikipedia.org/wiki/Biolog%C3%ADa https://es.wikipedia.org/wiki/Bioinform%C3%A1tica https://es.wikipedia.org/wiki/Base_de_datos_relacional https://es.wikipedia.org/wiki/Base_de_datos_relacional https://es.wikipedia.org/wiki/Ciencias_de_la_computaci%C3%B3n https://es.wikipedia.org/wiki/Recuperaci%C3%B3n_de_informaci%C3%B3n https://es.wikipedia.org/wiki/Recuperaci%C3%B3n_de_informaci%C3%B3n https://es.wikipedia.org/wiki/Biblioteca_digital https://es.wikipedia.org/wiki/Bioinform%C3%A1tica https://es.wikipedia.org/wiki/Ontolog%C3%ADa https://es.wikipedia.org/wiki/Estructura_de_datos https://es.wikipedia.org/wiki/XML (identificadores únicos de los registros en una base de datos, o también conocidos como Clave primaria). Las bases de datos para ayudan a los científicos a comprender y explicar una serie de fenómenos biológicos desde la estructura biomolecular de una proteína y su interacción, hasta el metabolismo completo de los organismos y a la comprensión de la evolución de las especies. Un recurso importante para la búsqueda de bases de datos biológicos es la edición anual de la revista Nucleic Acids Research (NAR). Una edición de bases de datos en NAR está disponible gratuitamente todos los años, donde se publican nuevas base de datos y algunas actualizaciones de las ya conocidas. Se encuentran clasificadas de acuerdo a su temática y están en línea a disposición de toda la comunidad científica. Las bases de datos biológicas se han convertido en un instrumento importante para ayudar a los científicos a comprender y explicar una serie de fenómenos biológicos desde la estructura biomolecular y su interacción, hasta el metabolismo completo de los organismos y a la comprensión de la evolución de las especies. Este conocimiento ayuda a facilitar la lucha contra las enfermedades, ayuda en el desarrollo de medicamentos, y en el descubrimiento de las relaciones básicas entre las especies en la historia de la vida. El conocimiento biológico se distribuye entre múltiples bases de datos generalesy especializadas. Esto a veces hace que sea difícil garantizar la coherencia de la información. Las bases de datos biológicas tienen referencias cruzadas con otras bases de datos con el número de acceso como una forma de vincular sus conocimientos relacionados con el conjunto. Un recurso importante para la búsqueda de bases de datos biológicos es un tema anual de la revista Nucleic Acids Research (NAR). Un artículo acerca de las bases de da-tos en NAR está disponible gratuitamente y se clasifican muchas de las bases de datos en línea a disposición del público relacionadas con la biología y bioinformática. Importancia Anteriormente, las bases de datos y los bancos de datos se consideraban bastante diferentes. Sin embargo, con el tiempo, “base de datos” se convirtió en un término preferible. Los datos se envían directamente a las bases de datos biológicas para la indexación, organización y optimización de datos. Ayudan a los investigadores a https://es.wikipedia.org/wiki/Clave_primaria https://es.wikipedia.org/wiki/Metabolismo https://es.wikipedia.org/wiki/Evoluci%C3%B3n_biol%C3%B3gica https://es.wikipedia.org/wiki/Especie https://es.wikipedia.org/w/index.php?title=Nucleic_Acids_Research&action=edit&redlink=1 encontrar datos biológicos relevantes al ponerlos a disposición en un formato legible en una computadora. Toda la información biológica es fácilmente accesible a través de herramientas de minería de datos que ahorran tiempo y recursos. Las bases de datos biológicas pueden clasificarse ampliamente como bases de datos de secuencia y estructura. Las bases de datos de estructuras son para estructuras de proteínas, mientras que las bases de datos de secuencias son para secuencias de ácidos nucleicos y proteínas. Durante las dos últimas décadas se han producido una gran variedad de desarrollos tecnológicos que han acelerado el ritmo de producción de datos biológicos. La inversión en tecnologías de alto rendimiento, comenzando por los análisis de expresión de microarrays a mitad de los años 90 y continuando con el conocimiento cada vez más detallado del genoma, transcriptoma, proteoma y metaboloma, ha dado lugar a un tremendo escalado en el ritmo de producción de datos biológicos crudos. Según Burge et al si se continúa el ritmo de generación de datos que se tiene hoy en día, en el 2020 habrá un millón de veces más datos que actualmente. Por lo tanto, el próximo reto en la investigación es hacer el análisis, la gestión y el acceso a los datos tan eficiente como la generación de los mismos. Las bases de datos surgen por tanto de manera natural ante la necesidad de preservar y organizar la avalancha de datos que se estaba generando solucionando así el problema del archivo de los datos, pero al mismo tiempo permitiendo el análisis de los mismos y su reutilización para otros propósitos. Los científicos dependen de la disponibilidad de los datos de otros científicos por lo que el dato biológico no tiene interés por sí mismo, sino que adquiere su valor en la medida en que la comunidad científica sea capaz de localizarlo, integrarlo y accederlo. Los primeros esfuerzos destinados a la creación de bases de datos bioinformáticas los realizaron grupos de investigación interesados en organizar y compartir los datos generados en su propio laboratorio. Conforme las bases de datos iban creciendo, el perfil de gestor de las mismas se fue profesionalizando, pasando a ser cada vez más computacional. A partir de ese momento surgieron proyectos internacionales que se hicieron cargo de estas bases de datos, dos de estas iniciativas son: European Bioinformatics Institute (EBI). National Centre for Biotechnology Information (NCBI). El EBI forma parte del EMBL (European Molecular Biology Laboratory) y se construyó en el año 1992 en el campus Wellcome Trust Genome en Hinxton (Inglaterra) para dar soporte a la gran cantidad de datos que se estaban generando con los proyectos de secuenciación del Instituto Sanger. Actualmente además de otras muchas bases de datos, el EBI alberga ENA (European Nucleotide Archive) para secuencias de nucleótidos y UniprotKB de secuencias de proteínas. El NCBI es parte de la Biblioteca Nacional de Medicina de los Estados Unidos (NLM) que es a su vez parte del Instituto Nacional de Salud (NIH). El NCBI está en Maryland y se fundó en 1988 para desarrollar sistemas de información en el campo de la biología molecular. Como bases de datos más relevantes tiene la de secuencias de nucleótidos GenBank y la de bibliografía biomédica PubMed. Estas bases de datos junto con muchas otras más, se pueden consultar a través del motor de búsqueda Entrez. Las bases de datos online se han convertido en importantes vías para publicar los datos biológicos. De hecho, es requisito imprescindible para la publicación en determinadas revistas, el archivo en la correspondiente base de datos. Como consecuencia de esto cada vez es más común encontrar en las publicaciones un apartado dentro de la sección de métodos que haga referencia a un identificador de secuencia, estructura tridimensional, gel bidimensional, etc. Las bases de datos comienzan a ser la piedra angular de la investigación biomédica moderna, citándose en la literatura miles de veces al año. Actualmente no se concibe ningún flujo de trabajo en investigación que no suponga en alguno de sus pasos la “consulta a” o la “integración con” alguna base de datos bioinformática. Por esta razón me gustaría hacer hincapié en la accesibilidad de los datos: una base de datos bioinformática, para que sea realmente de utilidad, ha de estar públicamente accesible online o ha de poder descargarse en su totalidad. Gestión de las bases de datos biológicas Para que una base de datos sea considerada de utilidad en el campo de la Bioinformática, ha de cumplir una serie de requisitos: Accesibilidad: Es requisito indispensable que todos los datos estén disponibles a la comunidad científica de manera gratuita y sin restricción ya que el progreso de la investigación en ciencias de la vida depende del acceso a estos datos. Por lo tanto, las bases de datos bioinformáticas deben ser accesibles online. Han de proporcionar conjuntos de datos completos y actualizados: para que una base de datos tenga realmente interés, esta ha de actualizarse periódicamente para incluir nuevos datos y ha de proporcionar referencias a otras bases de datos. Interfaces de acceso intuitivas y amigables que permitan el acceso y la incorporación de datos, así como herramientas que permitan hacer análisis de los mismos. Adoptar en lo posible estándares en el campo de la bioinformática para favorecer el intercambio de datos entre diversas colecciones. Cuando sea posible, los conjuntos de datos proporcionados por las bases de datos, estarán disponibles para su descarga. Calidad: Los datos biológicos almacenados en las bases de datos deberían estar revisados manual o automáticamente para asegurar la calidad y la extracción de anotaciones de los mismos. Por lo tanto, dejemos a un lado la visión que se tiene de las bases de datos como herramientas estáticas. Las bases de datos requieren un gran esfuerzo a nivel diseño, implementación, mantenimiento, organización, anotación, supervisión, depósito y almacenamiento. Clasificación de las bases de datos biológicos Las bases de datos biológicas se han desarrollado para diversos propósitos, almacenan varios tipos de datos heterogéneos y son curadas a distintos niveles con diferentes métodos, por lo tanto, hay diferentes criterios para su clasificación. Alcance y cobertura de los datos Según este criterio, las bases de datos pueden clasificarse en exhaustivas o especializadas: Exhaustivas: Abarcan diferentes tipos de datos de muchas especies. Ejemplos típicos son GenBank la base de datos moleculares mantenidos por el European Bioinformatics Institute EuropeanMolecular Biology Laboratory (EMBL- EBI) y DNA Data Bank of Japan (DDJB). Estas tres bases de datos fueron establecidas como una Colaboración Internacional de Bases de Datos de Secuencias de Nucleótidos en 1988, para colectar y compartir secuencias de ADN y ARN. https://es.wikipedia.org/wiki/GenBank https://es.wikipedia.org/wiki/European_Bioinformatics_Institute https://es.wikipedia.org/wiki/European_Bioinformatics_Institute https://es.wikipedia.org/wiki/Adn https://es.wikipedia.org/wiki/ARN Especializadas: Contienen información específica o de especies particulares. Por ejemplo WormBase que contiene información biológica y genómica de nemátodos. Según la fuente de los datos De acuerdo a este criterio, las bases de datos pueden clasificarse como primarias, secundarias y combinadas: Primarias: Contienen información solamente de la secuencia o la estructura, es decir que los datos experimentales son directamente subidos a la base de datos. En esta categoría encontramos las bases de datos GenBank, DNA Data Bank of Japan (DDJB)], UniProtKB/TrEMBL y Protein Data Bank (PDB). Secundarias: Contienen información derivada de las bases de datos primarias. Una base de datos secundaria de secuencia contiene información de la conservación de la secuencia, patrones de secuencia y residuos del sitio activo de familias de proteínas derivados de alineamientos múltiples entre secuencias evolutivamente relacionadas. Una base de datos secundaria de estructuras organiza las entradas de PDB clasificándolas, por ejemplo, de acuerdo a su estructura como todas alfa, todas beta, alfa-beta, etc. Algunos ejemplos de éstas bases de datos son: CATH y SCOP. Compuestas: Combinan una variedad de fuentes primarias de datos, como por ejemplo, el National Center for Biotechnology Information (NCBI) que alberga un conjunto de bases de datos de secuencia, taxonomía, genomas, mutaciones, entre otras y además herramientas como BLAST para búsquedas por similitud de secuencia. Nivel de curación De acuerdo al nivel de curación, pueden clasificarse en bases de datos primarias, secundarias o derivadas: Primarias: Contienen datos “crudos” a modo de repositorio de archivos como [[NCBI Sequence Read Archive] (SRA)'. Secundarias o derivadas: Almacena información que tiene un valor agregado por ser curada, por ejemplo NCBI RefSeq. Método de conservación https://es.wikipedia.org/w/index.php?title=WormBase&action=edit&redlink=1 https://es.wikipedia.org/w/index.php?title=UniProtKB/TrEMBL&action=edit&redlink=1 https://es.wikipedia.org/w/index.php?title=Protein_Data_Bank_(PDB)&action=edit&redlink=1 https://es.wikipedia.org/w/index.php?title=CATH&action=edit&redlink=1 https://es.wikipedia.org/w/index.php?title=SCOP&action=edit&redlink=1 https://es.wikipedia.org/wiki/National_Center_for_Biotechnology_Information https://es.wikipedia.org/wiki/BLAST https://es.wikipedia.org/w/index.php?title=NCBI_RefSeq&action=edit&redlink=1 El crecimiento explosivo de la cantidad de datos disponibles requiere de curación, integración y anotación, que se logra mediante la colaboración colectiva. Desde este punto de vista, las bases de datos biológicas pueden clasificarse como: Conservadas por expertos, por ejemplo RefSeq y [The Arabidopsis Information Resource]] (TAIR). Conservadas por una comunidad de investigadores, de forma colectiva y colaborativa, por ejemplo LncRNA Wiki y GeneWiki. Tipo de datos almacenados De acuerdo al tipo de datos almacenados en cada base de datos, las bases de datos biológicas pueden clasificarse de forma genérica en alguna de las siguientes categorías (se listan algunos ejemplos de bases de datos): Secuencias nucleotídicas (ADN y ARN): la colaboración de las tres bases de datos más importantes hace posible acceder a casi toda la información de secuencias de nucleótidos desde cualquiera de sus tres sedes: Bases de datos de EMBL en el European Bioinformatics Institute (EMBL- EBI). Enlace externo base de datos de nucleótidos de EMBL-EBI DNA Data Bank of Japan (DDJB). Enlace externo DDJB GenBank en el National Center for Biological Information (NCBI). Enlace externo GenBank Si bien son mantenidas por distintos organismos en distintos países, existe una coordinación entre las distintas bases. Una secuencia enviada a cualquiera de las bases se verá reflejada en las otras dos en aproximadamente una semana, ya que esa es la frecuencia de actualización entre las distintas bases genéticas. Por este motivo es indistinto que base se use para enviar nuevas secuencias, aunque normalmente los europeos utilizan EMBL y los americanos GenBank. Proteínas: bases de datos de secuencias, estructuras, e información relacionada. UniProtKB/Swiss-Prot contiene secuencias anotadas o comentadas, es decir, cada secuencia ha sido revisada, documentada y enlazada a otras bases de datos. Enlaces externos UniProtKB, Swissprot en el EBI UniProtKB/TrEMBL por Translation of EMBL Nucleotide Sequence Database incluye la traducción de todas las secuencias codificantes derivadas del (EMBL) y que todavía no han podido ser anotadas en Swiss-Prot. Enlaces http://www.ncbi.nlm.nih.gov/refseq/ https://es.wikipedia.org/w/index.php?title=LncRNA_Wiki&action=edit&redlink=1 https://es.wikipedia.org/wiki/%C3%81cido_desoxirribonucleico https://es.wikipedia.org/wiki/%C3%81cido_ribonucleico https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular http://www.ebi.ac.uk/services http://www.ebi.ac.uk/services http://www.ebi.ac.uk/services/dna-rna https://es.wikipedia.org/wiki/DNA_Data_Bank_of_Japan_(DDJB) http://www.ddbj.nig.ac.jp/ https://es.wikipedia.org/wiki/GenBank http://www.ncbi.nlm.nih.gov/ http://www.ncbi.nlm.nih.gov/genbank/ https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular https://es.wikipedia.org/wiki/GenBank https://es.wikipedia.org/wiki/Prote%C3%ADna https://es.wikipedia.org/wiki/Swiss-Prot https://es.wikipedia.org/w/index.php?title=UniProtKB&action=edit&redlink=1 https://es.wikipedia.org/w/index.php?title=Swissprot_en_el_EBI&action=edit&redlink=1 https://es.wikipedia.org/w/index.php?title=TrEMBL&action=edit&redlink=1 https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular https://es.wikipedia.org/wiki/Swiss-Prot externos TrEMBL, UniProtKB 'PIR por Protein Information Resource está dividida en cuatro sub-bases que tienen un nivel de anotación decreciente. Enlace externo PIR 'ENZYME enlaza la clasificación de actividades enzimáticas completa a las secuencias de Swiss-Prot. Enlace externo ENZYME 'PROSITE contiene información sobre la estructura secundaria de proteínas, familias, dominios, etc. Enlace externo PROSITE 'InterPro integra la información de diversas bases de datos de estructura secundaria como PROSITE, proporcionando enlaces a otras bases de datos e información más extensa. Enlace externo INTERPRO 'Protein Data Bank (PDB) es la base de datos de estructura terciaria 3D de proteínas que han sido cristalizadas. Enlace externo PDB Expresión El portal de EMBL-EBI ofrece una variedad de bases de datos de expresión génica. Enlace externo a bases de datos de expresión de EMBL-EBI Interactomas, reactomas y rutas metabólicas Reactome es una base de datos curada y revisada de EMBL-EBI de rutas de interacción y reacción de proteínas y enzimas. Enlace externo a Reactome APID6 es una base de datos de interacciones proteína-proteína que incluye interactomas completos para múltiples especies. Enlace externo a APID Variación genética (SNPs) y enfermedad dbSNP de NCBI, ofrece un repositorio central de variaciones genéticas que comprenden sustituciones simples de nucleótidos y polimorfismos de inserciones y deleciones cortas. Enlace a dbSNP COSMIC es un catálogo de mutaciones somáticas en cáncer, mantenida por el Wellcome Trust Sanger Institute. Enlace externo a COSMIC 'OMIM por Online Mendelian Inheritancein Man es un catálogo de genes humanos relacionados con desórdenes genéticos. Enlace externo OMIM Literatura Pubmed da acceso gratuito al índice de publicaciones de la Biblioteca Nacional de Medicina (NLM), con enlaces a artículos completos. Enlace externo PubMed Ontología http://www.ebi.ac.uk/trembl/ http://www.uniprot.org/ https://es.wikipedia.org/wiki/PIR https://web.archive.org/web/20140312021627/http:/pir.georgetown.edu/ https://es.wikipedia.org/w/index.php?title=ENZYME&action=edit&redlink=1 https://es.wikipedia.org/wiki/Swiss-Prot http://us.expasy.org/enzyme/ https://es.wikipedia.org/wiki/PROSITE http://us.expasy.org/prosite/ https://es.wikipedia.org/wiki/InterPro https://es.wikipedia.org/wiki/PROSITE http://www.ebi.ac.uk/interpro/index.html https://es.wikipedia.org/wiki/Protein_Data_Bank https://web.archive.org/web/20080828002005/http:/www.rcsb.org./pdb https://es.wikipedia.org/wiki/Expresi%C3%B3n_g%C3%A9nica https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular https://www.ebi.ac.uk/services/gene-expression https://es.wikipedia.org/wiki/Metabolismo https://es.wikipedia.org/w/index.php?title=Reactome&action=edit&redlink=1 https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular http://www.reactome.org/ https://es.wikipedia.org/wiki/Base_de_datos_biol%C3%B3gica#cite_note-6 http://apid.dep.usal.es/ https://es.wikipedia.org/wiki/Polimorfismo_de_nucle%C3%B3tido_simple https://es.wikipedia.org/w/index.php?title=DbSNP&action=edit&redlink=1 https://es.wikipedia.org/wiki/NCBI http://www.ncbi.nlm.nih.gov/projects/SNP/get_html.cgi?whichHtml=overview https://es.wikipedia.org/wiki/COSMIC_(base_de_datos) https://es.wikipedia.org/wiki/Wellcome_Trust_Sanger_Institute http://cancer.sanger.ac.uk/cosmic https://es.wikipedia.org/wiki/OMIM http://www.ncbi.nlm.nih.gov/omim/ https://es.wikipedia.org/wiki/Pubmed https://es.wikipedia.org/wiki/NLM http://www.ncbi.nlm.nih.gov/PubMed/ El proyecto de Ontología Génica (GO) es un esfuerzo colaborativo que surgió de la necesidad de tener descriptores consistentes de los productos de genes depositados en distintas bases de datos. Enlace externo a Gene Ontology Consortium Genomas Ensembl integra genomas eucariotas grandes, por el momento contiene genoma humano, ratón, rata, fugu, zebrafish, mosquito, Drosophila, C. elegans, y C. briggsae. Enlace externo Ensembl Genomes server y TIGR son portales con información o enlaces de todos los genomas secuenciados por el momento, desde virus a humanos. Enlace externo Genome Server, enlace externo TIGR Wormbase es el portal del genoma de gusano C. elegans. Enlace externo Wormbase Flybase es el portal de la mosca de la fruta Drosophila melanogaster. Enlace externo Flybase Otras Taxonomy es el portal de clasificación taxonómica de organismos. Enlace externo Taxonomy Browser Xenobase es el portal del organismo modelo Xenopus laevis. Enlace externo: Xenbase TAIR (The Arabidopsis Information Resource) es el portal de la planta modelo Arabidopsis thaliana. Enlace externo Arabidopsis GYPSY, base de datos de elementos genéticos móviles. Enlace externo The GYPSY Database of Mobile Genetic Elements Tipos de bases de datos biológicas Como hemos visto en secciones anteriores, existen multitud de bases de datos por lo que resulta útil clasificarlas en grupos. Se pueden hacer diferentes clasificaciones de las BD dependiendo de diferentes factores. En este capítulo vamos a estudiar las clasificaciones que atienden a la procedencia de los datos y a la revisión de los mismos. Luego hablaremos de una iniciativa encaminada a etiquetar las bases de datos de manera estándar (BioDBCore) y por último veremos cómo las instituciones de referencia en bioinformática como la revista Nucleic Acids Research, el EBI o el NCBI hacen su propia clasificación de los datos. https://es.wikipedia.org/wiki/Ontolog%C3%ADa_G%C3%A9nica http://geneontology.org/ http://geneontology.org/ https://es.wikipedia.org/wiki/Genoma https://es.wikipedia.org/wiki/Ensembl https://web.archive.org/web/20080102093839/http:/www.ebi.ac.uk/ensembl/index.html https://es.wikipedia.org/w/index.php?title=Genomes_server&action=edit&redlink=1 https://es.wikipedia.org/wiki/TIGR http://www.ebi.ac.uk/genomes/index.html http://www.jcvi.org/ https://es.wikipedia.org/w/index.php?title=Wormbase&action=edit&redlink=1 https://web.archive.org/web/20170420234209/http:/www.wormbase.org/ https://es.wikipedia.org/w/index.php?title=Flybase&action=edit&redlink=1 https://es.wikipedia.org/wiki/Drosophila_melanogaster https://web.archive.org/web/20090815020557/http:/flybase.bio.indiana.edu/ https://es.wikipedia.org/w/index.php?title=Taxonomy&action=edit&redlink=1 https://es.wikipedia.org/wiki/Taxonom%C3%ADa http://www.ncbi.nlm.nih.gov/Taxonomy/ https://es.wikipedia.org/w/index.php?title=Xenobase&action=edit&redlink=1 http://www.xenbase.org/ https://es.wikipedia.org/w/index.php?title=TAIR_(The_Arabidopsis_Information_Resource)&action=edit&redlink=1 http://www.arabidopsis.org/ https://es.wikipedia.org/w/index.php?title=GYPSY&action=edit&redlink=1 http://gydb.uv.es/index.php/Main_Page http://gydb.uv.es/index.php/Main_Page Procedencia de los datos En términos generales podríamos decir que las bases de datos primarias tienen datos originales que proceden directamente del experimento y normalmente son incorporadas por los autores a las bases de datos. Sin embargo, las bases de datos secundarias contienen datos derivados del análisis de los datos de las bases de datos primarias. Estos análisis se hacen computacionalmente o manualmente por un revisor. Bases de datos primarias: GenBank (secuencias nucleotídicas) y PDB (estructuras procedentes de las técnicas de rayos X y de Resonancia Magnética nuclear). Bases de datos secundarias: UniProt/SwissProt y PROSITE. Las bases de datos especializadas están centradas en un campo de investigación concreto como por ejemplo ZFIN (pez cebra), MGI (ratón), TRANSFAC (factores de transcripción). Revisión de los datos Las bases de datos revisadas están sujetas a un control de la calidad de los datos por parte de los revisores que se encargan de controlar el proceso de incorporación de los datos, la actualización y la consistencia de los mismos. Un buen ejemplo de base de datos sometida a un exhaustivo sistema de revisión tanto manual como computacional es UniProtKB, de la que hablaremos en detalle más adelante. Por otro lado, las bases de datos no revisadas no cuentan con la figura de los revisores, sino que son bases de datos donde los autores introducen libremente sus datos sin la guía de un experto ni de un vocabulario controlado u ontología. A las bases de datos no revisadas se las llama también repositorios. Los repositorios normalmente no incluyen información adicional al dato experimental y además suelen ser redundantes. Actualmente existen muy pocas bases de datos de este tipo. Clasificación EBI El European Bioinformatics Institute (EBI) clasifica las bases de datos en bases de datos clave y bases de datos especializadas. Las primeras proporcionan colecciones completas de valor genérico para las ciencias de la vida. Estas se dividen de forma grosera en dos categorías: aquellas que describen los componentes moleculares de los sistemas biológicos (por ejemplo, secuencias de nucle´otidos, secuencias de proteínas, estructuras macromoleculares y moléculas pequeñas) y las que describen sus comportamientos o los resultados de estos comportamientos (por ejemplo, trascripción, traducción e interacción). Como ejemplos de la primera tendíamos Ensembl de genomas, ENA de secuencias nucleotídicas, PDBe de estructuras proteicas o chEBI de entidades químicas. Sin embargo, las bases de datos PRIDE (proteomas), Reactome (rutas), ArrayExpress (expresi´on g´enica) o IntAct (interacciones moleculares) formarían parte de la segunda categoría. Además de las bases de datos clave,el EBI alberga un gran número de bases de datos especializadas como European Mutant Mouse Archive que proporciona información sobre las cepas mutantes de ratón para permitir a los investigadores enlazar la información fenotípica con las mutaciones o la NonRedundant Patent-Sequence Database Collection que proporciona acceso a secuencias con aplicaciones patentadas. Clasificación NCBI El National Centre for Biotechnology Information (NCBI) clasifica las bases de datos en las siguientes categorías: Referencias bibliográficas (PubMed). Genes y secuencias asociadas (Entrez Gene, UniGene). Genomas (Entrez Genome, Sequence Read Archive). Genotipos y fenotipos (dbGaP, dbSNP, OMIM). Expresión génicas (GEO, GENSAT). Estructura molecular y proteómica (MMDB). Clasificación NAR La revista Nucleic Acids Research publica desde el año 2001 un número anual dedicado a bases de datos que clasifica en 15 categorías: Secuencias de Nucle´otidos Secuencias de RNA Secuencias de proteínas Estructura Bases de Datos Genómicas (invertebrados) Rutas Metabólicas y de Señalización Genomas de Humano y otros Vertebrados Genes humanos y Enfermedades Datos de Microarrays y otras bases de datos de Expresión Bases de datos de Proteómica Otras bases de datos de Biología Molecular Bases de datos de organelas Bases de datos de Plantas Bases de datos Inmunológicas Biología celular Acceso Podemos hablar de tres maneras de acceder a los datos proporcionados por una base de datos. El sistema más común de acceso a una base de datos es a través de su interfaz web específica. Sin embargo, en los últimos años el crecimiento en el número de bases de datos origino la necesidad de unificar las interfaces de búsqueda para facilitar al usuario el proceso de consulta. Para ello se crearon los llamados entornos integrados como el EBI o el NCBI de los que hemos hablado en la Subsección. La incorporación de las bases de datos en entornos integrados llevó aparejado el desarrollo de motores de búsqueda. Así tenemos Entrez como motor de búsqueda del NCBI o el EB-Eye como motor de búsqueda del EBI. A través de los motores de búsqueda, el usuario puede obtener una panorámica de los resultados de un amplio conjunto de bases de datos pertenecientes a un repositorio haciendo una única consulta. Otro tipo de acceso, el programático, permite a una máquina y no una persona ejecutar la consulta y recibir del resultado de la misma. El acceso programático a las bases de datos permite que el resultado de la consulta a una base de datos sea la consulta a la siguiente sin la intervención humana. De esta manera se puede automatizar las consultas construyendo los llamados flujos de trabajo. El sitio web del EBI es visitado por 300.000 usuarios aproximadamente cada mes y recibe diariamente 3,5 millones de peticiones. Además, cerca de un millón de trabajos se ejecutan al mes a través de los servicios web. Búsqueda La búsqueda de información en las bases de datos bioinformáticas se suele hacer por analogía. Pongamos el caso de tener una secuencia proteica sin caracterizar. La secuencia es una sucesión de caracteres que por sí misma no proporciona mucha información. Sin embargo, si comparamos esta secuencia con las casi 23 millones secuencias proteicas existentes en UniProtKB (alineamiento de secuencias), encontraríamos un listado de secuencias similares a la nuestra. En algunos casos la similitud sería tan grande que podríamos atribuir a nuestra secuencia las anotaciones de las secuencias similares. Estaríamos de esta manera caracterizando nuestra secuencia a través de la búsqueda por semejanza. Imagina ahora que, con las veinte secuencias más parecidas a tu secuencia problema (extraídas a partir de la búsqueda por semejanza), generamos una secuencia genérica (patrón de secuencia) que reúna las características de todas ellas. Esta secuencia a su vez podría servir para buscar en bases de datos de patrones para encontrar otras secuencias genéricas similares a la que t´u has generado. Este tipo de búsqueda se encuadraría dentro del descubrimiento de patrones. La búsqueda en las bases de datos es un paso fundamental en la construcción de flujos de trabajo. Por ejemplo, para hacer la predicción de la estructura proteica a partir de su secuencia por el método de modelado por homología, el primer paso sería consultar a una base de datos de secuencias para extraer la secuencia más similar a la secuencia problema. Pero también se pueden hacer búsquedas más especializadas en las bases de datos. Este es el caso del análisis de la huella peptídica resultante de un experimento de espectrometría de masas donde normalmente se utilizan bases de datos centradas en el organismo que se esté estudiando. Bases de datos biológicas más relevantes Las bases de datos más relevantes en biología incluyen datos de secuencias de nucleótidos, proteínas, estructura de proteínas, genomas, expresión genética, bibliografía, taxonomía, metabolismo, factores de transcripción, etc. Nos podemos hacer una idea de las bases de datos disponibles en esta base de datos de bases de datos biológicas. Por: Bioinformatics at Comav (2018). Principales bases de datos se secuencias de nucleótidos: National Center for Biotechnology Information NCBI )(EEUU) European Nucleotide Archive (EMBL) (Europa) http://www.biodbs.info/ http://www.ncbi.nlm.nih.gov/ http://www.ebi.ac.uk/embl/ Bioinformation and DDBJ Center (DDBJ) (Japón) Algunas bases de datos de genomas de organismos concretos: Saccharomyces Genome Database SGD (Levadura) The Arabidopsis Information Resource TAIR (Arabidopsis) ENSEML (Hombre, ratón y otros) Principales bases de datos de proteínas: Uniprot Swiss-prot Protein Data Bank (PDB) 3D Macromolecular Structures (MMDB) Structural Classification of Proteins (SCOP) Bibliografía: Biblioteca Nacional de Medicina de EE. UU. Institutos Nacionales de Salud (Pubmed) Rutas metabólicas: Enciclopedia de Kyoto de genes y genomas (KEGG) Enfermedades genéticas humanas: Centro Nacional de Información Biotecnológica , Biblioteca Nacional de Medicina de EE . UU. (OMIM) BASES DE DATOS DE LAS CIENCIAS SOCIALES Por: Consejo Superior de Investigaciones Científicas (2016). Ciencias sociales http://www.ddbj.nig.ac.jp/ http://www.yeastgenome.org/ http://www.arabidopsis.org/ http://www.ensembl.org/index.html http://www.pir.uniprot.org/ http://expasy.org/sprot/ http://www.rcsb.org/pdb/home/home.do http://130.14.29.110/Structure/MMDB/mmdb.shtml http://scop.mrc-lmb.cam.ac.uk/scop/ https://www.nlm.nih.gov/ https://www.nlm.nih.gov/ http://www.ncbi.nlm.nih.gov/sites/entrez http://www.genome.jp/kegg/ https://www.ncbi.nlm.nih.gov/ https://www.nlm.nih.gov/ https://www.nlm.nih.gov/ https://www.nlm.nih.gov/ http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim ISOC-CSIC. Base de datos de la producción científica española de ciencias sociales y humanas. Agencia Española del ISBN. Bases de datos de libros y de editores españoles. APA Databases. Bases de datos de la Asociación Americana de Psicología. Biblioteca Nacional de España. Bibliografía Española en línea. EconLit. American Economic Association. Base de datos de economía. EBSCO host. ERIC. Educational Resources Information Center. HV Wilson Databases. Bases de Datos Wilson. ISI Web of Knowledge. ThomsonReuters-ISI. (público). ISI Web of Knowledge. ThomsonReuters-ISI. (acceso via FECYT). PAO. Periodicals Archive On Line. Base de datos de humanidades y ciencias sociales. PIO. Periodicals Index On Line. Base de datos de humanidades y ciencias sociales. SCOPUS. Base de datos multidisciplinar producida por Elsevier. Teseo. Base de datos de tesis doctorales españolas. Revistas Científicas Dialnet. Portal de difusión de la producción científica hispana DOAJ.Directorio de revistas Open Access. e-Revist@s. Plataforma Open Access de Revistas Científicas Electrónicas Españolas y Latinoamericanas EZB. Elektronische Zeitschriftenbibliothek. Electronic Journals Library. GIGA Journal Family. German Institute of Global and Area Studies. PERSEE. Portal de Revistas Científicas de Ciencias Humanas y Sociales. Portal de Revistas Científicas Complutenses. Raco. Revistas Catalanas con Acceso Abierto. Redalyc. Portal de revistas de Latinoamérica, España y Portugal. Revues.org. Fédération de Revues en Sciences Humaines et Sociales. Édition électronique scientifique SciELO. Scientific Electronic Library Online. Estadísticas http://www.cindoc.csic.es/servicios/dbinfo.htm http://www.mcu.es/libro/CE/AgenISBN.html http://www.apa.org/databases/ http://www.bne.es/esp/servicios/bibliografiaesplinea.htm http://www.aeaweb.org/econlit/index.php http://www.ebscohost.com/thisMarket.php?marketID=1 http://www.eric.ed.gov/ http://www.hwwilson.com/ftabsind_alpha.htm http://www.isiwebofknowledge.com/ http://www.accesowok.fecyt.es/login/ http://pao.chadwyck.co.uk/ http://pio.chadwyck.co.uk/ http://info.scopus.com/ https://www.micinn.es/teseo/login.jsp http://dialnet.unirioja.es/ http://www.doaj.org/ http://www.erevistas.csic.es/ http://ezb.uni-regensburg.de/index.phtml?bibid=AAAAA&colors=7&lang=en http://www.giga-hamburg.de/english/index.php?file=publications.html&folder=publications http://www.persee.fr/web/revues/home http://www.ucm.es/BUCM/revistasBUC/portal/modulos.php?name=principal&col=1 http://www.raco.cat/index.php/index/raco/ http://www.redalyc.org/ http://www.revues.org/ http://www.scielo.org/ Banco Mundial. Datos e Investigación. CEPAL. Comisión Económica para América Latina y el Caribe. EuroStat. Estadísticas de la Unión Europea. FAO. Organización de las Naciones Unidas para la Agricultura y la Alimentación. FMI. Fondo Monetario Internacional. INE. Instituto Nacional de Estadística. (España). OCDE. Organización para la Cooperación y el Desarrollo Económico. OMS. Organización Mundial de la Salud. UNESCO. Instituto de Estadísticas de la UNESCO. UNIDO. Datos Estadísticos Industriales de la UNIDO. Bases de datos especializadas en ciencias sociales Por: Águeda González & Lourdes Páez (2018). ABI/INFORM. Base de datos que recoge bibliografía de más de 2.770 revistas de comercio y finanzas, condiciones empresariales y económicas, técnicas de gestión, teoría y práctica de empresa, publicidad, marketing, economía, recursos humanos, impuestos, informática, etc., de las cuales, más de 1.840 se hallan accesibles a texto completo. Cobertura internacional ampliada. Acceso a información sobre más de 60.000 empresas con perfiles empresariales y ejecutivos. Aranzadi-Westlaw.es. Base de datos de legislación y jurisprudencia de Aranzadi. Contiene legislación estatal, autonómica, jurisprudencia del Tribunal Supremo, del Constitucional y del Tribunal Europeo de Derechos Humanos Communication Studies. Colección de 19 revistas a texto completo, publicadas por Sage, sobre periodismo, opinión pública, comunicación política y económica, estudios culturales, comunicación de masas, televisión. Incluye, además del texto completo, registros bibliográficos, resúmenes y referencias citadas. ECONLIT. Versión ampliada del Journal of Economic Literature. Proporciona diferentes tipos de documentos relativos a teoría económica, historia económica, econometría, finanzas públicas y de la empresa, instituciones financieras, demografía, economía internacional, mercado de capitales, etc... http://www.bancomundial.org/investigacion/ http://www.eclac.org/estadisticas/ http://epp.eurostat.ec.europa.eu/ http://www.fao.org/corp/statistics/es/ http://www.imf.org/external/data.htm http://www.ine.es/ http://www.oecd.org/ http://www.who.int/research/es/index.html http://www.uis.unesco.org/ http://www.unido.org/index.php?id=7836 ERIC. Base de datos bibliográfica del Educational Resources Information Center(ERIC). Contiene referencias con resúmenes de artículos de revistas y literatura gris ; algunos artículos permiten el acceso al texto completo. EINIRAS Database Network. Conjunto de bases de datos europeas sobre relaciones internacionales y geopolítica. HLAS Online (Handbook of Latin American studies). Base de datos bibliográfica sobre América Latina que incluye libros y artículos seleccionados y reseñados por especialistas. IUSTEL. Portal que recoge legislación y jurisprudencia española y comunitaria. La Ley. Colección de revistas especializadas en Derecho, incluyendo jurisprudencia, doctrinas, colaboraciones y comentarios. PARLIT database. Base de datos bibliográfica sobre parlamentos, procedimiento parlamentario, sistemas electorales, derecho constitucional y ciencia política en general. PeriodicalsArchive Online. Colección de más de 500 revistas a texto completo de humanidades y ciencias sociales de procedencia internacional. PsycInFo. Base de datos de la American PsychologicalAssociation (antigua PSYCLIT) PSICODOC. Base de datos de artículos de revista y libros del COP y la Facultad de Psicología de la UCM Social Work Abstracts. Base de datos bibliográfica que contiene resúmenes y citas de artículos referentes a trabajo social y servicios sociales SOCIOLOGICAL ABSTRACTS Literatura mundial en el campo de la sociología y disciplinas relacionadas. Contiene resúmenes de artículos de unas 2.500 revistas y de ponencias presentadas a distintos congresos, además de resúmenes de libros, capítulos de libros, tesis y conferencias.
Compartir