Logo Studenta

BASES DE DATOS BIOLÓGICAS Y DE LAS CIENCIAS SOCIALES

¡Este material tiene más páginas!

Vista previa del material en texto

BASES DE DATOS BIOLÓGICAS 
Introducción 
Recordemos que en computación una Base de Datos (BD) es un conjunto de datos 
pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior 
utilización. El objetivo principal del desarrollo de una BD es organizar los datos en un 
conjunto de registros estructurados que permitan recuperar fácilmente la información. 
Cada registro está compuesto por un número determinado de campos que contienen datos 
específicos, por ejemplo: nombres, números de teléfono, etc. Para recuperar un registro 
particular de la base de datos, un usuario puede especificar una pieza de información, 
llamada valor, que será encontrada en un campo en especial. La computadora entonces 
recuperará el registro completo. Este proceso es llamado consulta 
Aun cuando la recuperación de información es el principal objetivo de todas las BD, las 
BD biológicas a menudo tienen un requerimiento de más alto nivel, conocido como 
descubrimiento de conocimiento. 
Este se refiere a la identificación de conexiones entre piezas de información que no eran 
conocidas cuando la información fue introducida por primera vez. 
Por ejemplo, en las BD que contienen información cruda (sin procesar) de secuencias de 
ADN se pueden realizar tareas extras para identificar homología de secuencias o motivos 
conservados. Con lo cual se podría facilitar el descubrimiento de nuevos conocimientos 
biológicos a partir de datos crudos. 
Datos biológicos 
Por: Natalia Jiménez Lozano (2017). 
Se podría definir dato como el resultado de una medición. En este capítulo hablaremos de 
bases de datos (BD) que albergan información biológica por lo que el dato biológico sería 
un tipo particular de dato generado dentro del contexto de una investigación científica. 
Las mediciones que se realizan en el campo de la investigación no son simples ya que en 
la mayoría de los casos son el resultado de un complejo flujo de trabajo en el laboratorio 
donde se utilizan muy diversas técnicas. Podemos poner como ejemplo de dato biológico 
la secuencia de nucleótidos de un gen determinada mediante técnicas de secuenciación o 
la banda correspondiente a un fragmento de DNA separado mediante una electroforesis 
en gel de agarosa. 
Dato, información y conocimiento 
Existe mucha confusión entre los términos dato, información y conocimiento. De hecho, 
en muchas ocasiones estos términos son considerados erróneamente como sinónimos. La 
diferencia fundamental radica en que, mientras que a partir de conjuntos de datos se puede 
derivar la información directamente, el conocimiento normalmente se deriva de forma 
indirecta. Utilizaremos un ejemplo para poner de manifiesto la diferencia que existe entre 
estos tres conceptos. 
Ejemplo: Imagina que regentas un herbolario y que tienes una base de datos donde 
registras todos los datos de tus clientes de manera que conoces sus nombres y los 
productos que compran en tu establecimiento. Que los clientes Paula y Javier compren 
leche sin lactosa cada lunes es un dato que tú tienes almacenado en tu base de datos. Cada 
vez que quieras saber quiénes son los clientes que compran leche sin lactosa o cuantos 
litros de leche sin lactosa vendes cada día, consultaras a la base de datos y tendrás el 
resultado. Esto es información. Ahora imagina que hay otros 100 clientes que también 
compran leche sin lactosa y que todos ellos son alérgicos a la lactosa. Entonces podrás 
concluir que Paula y Javier deben ser alérgicos a la lactosa también. La alergia de Paula 
y Javier no se te ha proporcionado como dato y tampoco se puede extraer de la base de 
datos como información. Sin embargo, tú has extrapolado esta información de manera 
indirecta y a esto es a lo que llamamos conocimiento. 
Por lo tanto, el dato es objetivo y no abstracto y sin embargo la información y el 
conocimiento son subjetivos y requieren altos grados de abstracción. La organización de 
los datos biológicos en bases de datos facilita el descubrimiento de conocimiento ya que 
permite poner de manifiesto relaciones entre piezas de información que se desconocían 
en el momento en que la información fue introducida por primera vez (datos crudos o sin 
procesar). Otro ejemplo de generación de conocimiento sería el derivar los motivos 
conservados en un conjunto de secuencias proteicas crudas pertenecientes a una base de 
datos. 
 
 
Características 
Ahora que sabemos lo que es un dato biológico y lo distinguimos de la información y del 
conocimiento, veamos cuáles son sus características: 
 Los datos biológicos son heterogéneos porque representan entidades diversas que 
van desde átomos hasta estudios poblacionales, pasando por secuencias de 
nucleótidos y proteínas, estructuras proteicas cristalinas, medidas de expresión 
génica, interacciones proteína-proteína o proteína-DNA, redes e interacción, 
células, estudios fenotípicos y estudios fisiológicos. 
 Los datos biológicos son complejos. Para que te hagas una idea de la complejidad 
de los datos biológicos vamos a compararlos con los datos antropométricos. 
Imagina la diferencia que hay entre los datos correspondientes al peso de una 
persona y la determinación una estructura de una proteína sencilla como la 
insulina. En el primer caso lo único que tendríamos que hacer sería pesar al 
individuo con una báscula. Sin embargo, en el segundo caso tendríamos que 
purificar la proteína, cristalizarla, obtener el difractograma y a partir de este 
determinar las posiciones en el eje X, Y, Z de cada átomo de cada uno de los 110 
aminoácidos de la proteína. El dato antropométrico es un número y el dato 
biológico es un fichero de más de mil líneas, 865 de las cuales corresponden a la 
posición de uno de los átomos de la estructura. 
 Los datos biológicos pueden tener una naturaleza cuantitativa (Ej. peso molecular 
de una proteína) o cualitativa (Ej. función de una proteína). 
 Los datos biológicos son necesariamente dinámicos porque van cambiando según 
van evolucionando las técnicas que los generan o van surgiendo nuevas técnicas 
que completan el dato. Ej. la primera secuencia proteica que se determinó, la 
insulina bovina, depositada en la base de datos UniProtKB en el año 1986 
(Identificador P01317; hablaremos de esta base de datos en detalle más adelante) 
ha sufrido hasta la fecha 126 revisiones. Este dato, como el resto de datos 
biológicos es incompleto ya que seguir a evolucionando indefinidamente. 
 Los datos biológicos pueden proceder de interpretaciones, de análisis 
computacionales o bien pueden ser datos confirmados experimentalmente. 
Veamos algunos ejemplos: 
 Datos procedentes de interpretaciones: la descripción del nivel de expresión 
de un gen en un tejido determinado por la técnica de hibridación in situ. 
Mediante esta técnica, el experimentalista obtiene una imagen 
correspondiente a una sección del organismo que esté estudiando, y tiene 
que determinar si la expresión en los tejidos de interés es inexistente, débil, 
media, fuerte o muy fuerte. Por lo tanto, en este caso el experimentalista ha 
de interpretar el dato crudo (imagen obtenida de la técnica). 
 Datos procedentes de análisis computacionales: estructura secundaria de 
una proteína es un ejemplo de dato obtenido computacionalmente a partir 
de la secuencia. En este caso el dato biológico está asociado a una 
probabilidad. Existe un gran abanico de aplicaciones que proporcionan este 
tipo de datos. 
 Datos confirmados experimentalmente: la interacción entre dos proteínas 
observada mediante el experimento del doble híbrido. 
Bases de datos biológicas 
Historia 
Si hay un nombre ligado a la Bioinformática es sin lugar a dudas el de Margaret Dayhoff 
(1925-1983). Esta fisicoquímica estadounidense fue pionera en el campo de la 
Bioinformática. Su visión de futuro le llevó a publicar un libro en 1965 que reunía las 65 
secuencias proteicas existentes hasta esa fecha con el objetivode facilitar el análisis de 
las mismas. Este libro titulado “Atlas of Protein Sequence and Structure” fue el precursor 
de PIR (Protein Information Resource), la primera base de datos en el campo de la 
Bioinformática. 
Definición 
Por: Universidad del País Vasco (2018). 
Una base de datos biológica es una biblioteca de información sobre ciencias de la vida, 
recogida de experimentos científicos, literatura publicada, tecnología de experimentación 
de alto rendimiento, y análisis computacional. Contiene información de áreas de 
investigación incluyendo genómica, proteómica, metabolómica, expresión génica 
mediante microarrays, y filogenética. La información contenida en bases de da-tos 
biológicas incluye funciones, estructura y localización (tanto celular como cromosómica) 
de genes, efectos clínicos de mutaciones, así como similitudes de secuencias y estructuras 
biológicas. 
En los últimos años, debido a la rápida evolución de las técnicas experimentales de alto 
rendimiento (Secuenciación del ADN, Cristalografía de rayos X, Microarreglo de ADN) 
se generó un crecimiento exponencial en la cantidad de datos biológicos (secuencias 
genómicas y de proteínas, estructuras de proteínas, expresión génica, mutaciones, etc) 
que generaron la necesidad de contar con formas eficientes de almacenar la información. 
Las bases de datos biológicas surgieron como una respuesta a los enormes volúmenes de 
datos generados por las tecnologías de secuenciación de ADN de bajo costo. Una de las 
primeras bases de datos que surgió fue GenBank, que es una colección de todas las 
secuencias de ADN y proteínas disponibles. Es mantenido por los Institutos Nacionales 
de Salud (NIH) y el Centro Nacional de Información de Biotecnología (NCBI). GenBank 
allanó el camino para el Proyecto Genoma Humano (HGP). El HGP permitió la 
secuenciación completa y la lectura del plano genético. Los datos almacenados en bases 
de datos biológicas se organizan para un análisis óptimo y se componen de dos tipos: sin 
procesar y curados (o anotados). Las bases de datos biológicas son complejas, 
heterogéneas, dinámicas y, sin embargo, inconsistentes. La inconsistencia se debe a la 
falta de estándares a nivel ontológico. 
Gracias a las nuevas tecnologías se está generando una ingente cantidad de datos 
biológicos y toda esta información se almacena en bases de datos. Estos datos pueden ser 
de cuatro tipos: secuencias biológicas, datos estructurales, datos funcionales y 
bibliografía. Cada categoría de datos presenta su propia estructura y requisitos, lo que 
influye decisivamente a la hora de diseñar las bases de datos. 
Los diversos tipos de datos están estrechamente relacionados entre sí: las secuencias 
codificantes de ADN dan lugar a proteínas con una estructura tridimensional y una 
función característica; con mucha frecuencia, las proteínas no funcionan solas, sino que 
forman parte de rutas metabólicas en las que establecen importantes relaciones con otros 
tipos de biomoléculas y, además, toda esta información está convenientemente reflejada 
en las publicaciones científicas. 
Se ha hecho un gran esfuerzo para que toda esta información sea accesible a través de la 
World Wide Web (www) de modo que tanto las bases de datos como sus herramientas de 
búsqueda se han convertido en parte esencial de la actividad investigadora. Todos los 
años, el primer número de la revista Nucleic Acids Research (NAR) está dedicado a las 
bases de datos: publica artículos que describen la creación de nuevas bases de datos y las 
https://es.wikipedia.org/wiki/Secuenciaci%C3%B3n_del_ADN
https://es.wikipedia.org/wiki/Cristalograf%C3%ADa_de_rayos_X
https://es.wikipedia.org/wiki/Microarreglo_de_ADN
innovaciones que se han producido en las ya existentes y, además, contiene una lista 
exhaustiva de todas las bases de datos existentes y sus URL. Muchas de estas bases están 
alojadas en los sitios web de centros gubernamentales o privados que han creado un 
entorno gráfico uniforme que reúne un gran número de bases de datos. Ejemplos de este 
tipo de centros son: 
 The National Center for Biotechnology Information, NCBI 
(http://www.ncbi.nlm.nih.gov/). 
 The European Bioinformatics Institute, EBI (http://www.ebi.ac.uk). 
 The Switzerland Institute of Bioinformatics, SIB (http:/www.isb-sib.ch/). 
 The Sanger Institute (http://www.sanger.ac.uk). 
Un aspecto particularmente interesante de estos centros es que establecen conexiones 
entre las distintas bases de datos que permiten obtener de manera fácil y rápida toda la 
información relacionada con una biomolécula concreta. 
Descripción 
Por: Natalia Jiménez Lozano (2017). 
Las bases de datos biológicas constituyen una herramienta esencial para almacenar, 
estructurar, organizar, actualizar y manipular datos biológicos. La variedad de estos datos, 
así como también su rápido crecimiento, hacen a las bases de datos una herramienta clave. 
Se han convertido en un instrumento indispensable para los científicos experimentales 
del campo de la biología, como para aquellos científicos del área de la bioinformática que 
desarrollan experimentos in silico. 
Las bases de datos biológicas surgen a partir de los conceptos de bases de datos 
relacionales de las ciencias de la computación, y los conceptos de recuperación de 
información de las bibliotecas digitales. El diseño de estas bases de datos, su desarrollo y 
su gestión a largo plazo, forman un área nuclear dentro de la bioinformática. El contenido 
de los datos incluye secuencias génicas, descripciones textuales, atributos y 
clasificaciones ontológicas, estructuras de proteínas, anotaciones, entre otras. Estos son 
descritos a menudo como datos semiestructurados, y se pueden representar como tablas, 
registros delimitados por claves y estructuras XML. Son comunes las referencias cruzadas 
entre las diferentes bases de datos biológicas usando los números de acceso 
https://es.wikipedia.org/wiki/Biolog%C3%ADa
https://es.wikipedia.org/wiki/Bioinform%C3%A1tica
https://es.wikipedia.org/wiki/Base_de_datos_relacional
https://es.wikipedia.org/wiki/Base_de_datos_relacional
https://es.wikipedia.org/wiki/Ciencias_de_la_computaci%C3%B3n
https://es.wikipedia.org/wiki/Recuperaci%C3%B3n_de_informaci%C3%B3n
https://es.wikipedia.org/wiki/Recuperaci%C3%B3n_de_informaci%C3%B3n
https://es.wikipedia.org/wiki/Biblioteca_digital
https://es.wikipedia.org/wiki/Bioinform%C3%A1tica
https://es.wikipedia.org/wiki/Ontolog%C3%ADa
https://es.wikipedia.org/wiki/Estructura_de_datos
https://es.wikipedia.org/wiki/XML
(identificadores únicos de los registros en una base de datos, o también conocidos 
como Clave primaria). 
Las bases de datos para ayudan a los científicos a comprender y explicar una serie de 
fenómenos biológicos desde la estructura biomolecular de una proteína y su interacción, 
hasta el metabolismo completo de los organismos y a la comprensión de la evolución de 
las especies. 
Un recurso importante para la búsqueda de bases de datos biológicos es la edición anual 
de la revista Nucleic Acids Research (NAR). Una edición de bases de datos en NAR está 
disponible gratuitamente todos los años, donde se publican nuevas base de datos y algunas 
actualizaciones de las ya conocidas. Se encuentran clasificadas de acuerdo a su temática 
y están en línea a disposición de toda la comunidad científica. 
Las bases de datos biológicas se han convertido en un instrumento importante para ayudar 
a los científicos a comprender y explicar una serie de fenómenos biológicos desde la 
estructura biomolecular y su interacción, hasta el metabolismo completo de los 
organismos y a la comprensión de la evolución de las especies. Este conocimiento ayuda 
a facilitar la lucha contra las enfermedades, ayuda en el desarrollo de medicamentos, y en 
el descubrimiento de las relaciones básicas entre las especies en la historia de la vida. 
El conocimiento biológico se distribuye entre múltiples bases de datos generalesy 
especializadas. Esto a veces hace que sea difícil garantizar la coherencia de la 
información. Las bases de datos biológicas tienen referencias cruzadas con otras bases de 
datos con el número de acceso como una forma de vincular sus conocimientos 
relacionados con el conjunto. 
Un recurso importante para la búsqueda de bases de datos biológicos es un tema anual de 
la revista Nucleic Acids Research (NAR). Un artículo acerca de las bases de da-tos en 
NAR está disponible gratuitamente y se clasifican muchas de las bases de datos en línea 
a disposición del público relacionadas con la biología y bioinformática. 
Importancia 
Anteriormente, las bases de datos y los bancos de datos se consideraban bastante 
diferentes. Sin embargo, con el tiempo, “base de datos” se convirtió en un término 
preferible. Los datos se envían directamente a las bases de datos biológicas para la 
indexación, organización y optimización de datos. Ayudan a los investigadores a 
https://es.wikipedia.org/wiki/Clave_primaria
https://es.wikipedia.org/wiki/Metabolismo
https://es.wikipedia.org/wiki/Evoluci%C3%B3n_biol%C3%B3gica
https://es.wikipedia.org/wiki/Especie
https://es.wikipedia.org/w/index.php?title=Nucleic_Acids_Research&action=edit&redlink=1
encontrar datos biológicos relevantes al ponerlos a disposición en un formato legible en 
una computadora. Toda la información biológica es fácilmente accesible a través de 
herramientas de minería de datos que ahorran tiempo y recursos. Las bases de datos 
biológicas pueden clasificarse ampliamente como bases de datos de secuencia y 
estructura. Las bases de datos de estructuras son para estructuras de proteínas, mientras 
que las bases de datos de secuencias son para secuencias de ácidos nucleicos y proteínas. 
Durante las dos últimas décadas se han producido una gran variedad de desarrollos 
tecnológicos que han acelerado el ritmo de producción de datos biológicos. La inversión 
en tecnologías de alto rendimiento, comenzando por los análisis de expresión de 
microarrays a mitad de los años 90 y continuando con el conocimiento cada vez más 
detallado del genoma, transcriptoma, proteoma y metaboloma, ha dado lugar a un 
tremendo escalado en el ritmo de producción de datos biológicos crudos. Según Burge et 
al si se continúa el ritmo de generación de datos que se tiene hoy en día, en el 2020 habrá 
un millón de veces más datos que actualmente. Por lo tanto, el próximo reto en la 
investigación es hacer el análisis, la gestión y el acceso a los datos tan eficiente como la 
generación de los mismos. 
Las bases de datos surgen por tanto de manera natural ante la necesidad de preservar y 
organizar la avalancha de datos que se estaba generando solucionando así el problema del 
archivo de los datos, pero al mismo tiempo permitiendo el análisis de los mismos y su 
reutilización para otros propósitos. Los científicos dependen de la disponibilidad de los 
datos de otros científicos por lo que el dato biológico no tiene interés por sí mismo, sino 
que adquiere su valor en la medida en que la comunidad científica sea capaz de 
localizarlo, integrarlo y accederlo. Los primeros esfuerzos destinados a la creación de 
bases de datos bioinformáticas los realizaron grupos de investigación interesados en 
organizar y compartir los datos generados en su propio laboratorio. Conforme las bases 
de datos iban creciendo, el perfil de gestor de las mismas se fue profesionalizando, 
pasando a ser cada vez más computacional. A partir de ese momento surgieron proyectos 
internacionales que se hicieron cargo de estas bases de datos, dos de estas iniciativas son: 
 European Bioinformatics Institute (EBI). 
 National Centre for Biotechnology Information (NCBI). 
El EBI forma parte del EMBL (European Molecular Biology Laboratory) y se construyó 
en el año 1992 en el campus Wellcome Trust Genome en Hinxton (Inglaterra) para dar 
soporte a la gran cantidad de datos que se estaban generando con los proyectos de 
secuenciación del Instituto Sanger. Actualmente además de otras muchas bases de datos, 
el EBI alberga ENA (European Nucleotide Archive) para secuencias de nucleótidos y 
UniprotKB de secuencias de proteínas. 
El NCBI es parte de la Biblioteca Nacional de Medicina de los Estados Unidos (NLM) 
que es a su vez parte del Instituto Nacional de Salud (NIH). El NCBI está en Maryland y 
se fundó en 1988 para desarrollar sistemas de información en el campo de la biología 
molecular. Como bases de datos más relevantes tiene la de secuencias de nucleótidos 
GenBank y la de bibliografía biomédica PubMed. Estas bases de datos junto con muchas 
otras más, se pueden consultar a través del motor de búsqueda Entrez. 
Las bases de datos online se han convertido en importantes vías para publicar los datos 
biológicos. De hecho, es requisito imprescindible para la publicación en determinadas 
revistas, el archivo en la correspondiente base de datos. Como consecuencia de esto cada 
vez es más común encontrar en las publicaciones un apartado dentro de la sección de 
métodos que haga referencia a un identificador de secuencia, estructura tridimensional, 
gel bidimensional, etc. 
Las bases de datos comienzan a ser la piedra angular de la investigación biomédica 
moderna, citándose en la literatura miles de veces al año. Actualmente no se concibe 
ningún flujo de trabajo en investigación que no suponga en alguno de sus pasos la 
“consulta a” o la “integración con” alguna base de datos bioinformática. Por esta razón 
me gustaría hacer hincapié en la accesibilidad de los datos: una base de datos 
bioinformática, para que sea realmente de utilidad, ha de estar públicamente accesible 
online o ha de poder descargarse en su totalidad. 
Gestión de las bases de datos biológicas 
Para que una base de datos sea considerada de utilidad en el campo de la Bioinformática, 
ha de cumplir una serie de requisitos: 
 Accesibilidad: Es requisito indispensable que todos los datos estén disponibles a 
la comunidad científica de manera gratuita y sin restricción ya que el progreso de 
la investigación en ciencias de la vida depende del acceso a estos datos. Por lo 
tanto, las bases de datos bioinformáticas deben ser accesibles online. 
 Han de proporcionar conjuntos de datos completos y actualizados: para que una 
base de datos tenga realmente interés, esta ha de actualizarse periódicamente para 
incluir nuevos datos y ha de proporcionar referencias a otras bases de datos. 
 Interfaces de acceso intuitivas y amigables que permitan el acceso y la 
incorporación de datos, así como herramientas que permitan hacer análisis de los 
mismos. 
 Adoptar en lo posible estándares en el campo de la bioinformática para favorecer 
el intercambio de datos entre diversas colecciones. 
 Cuando sea posible, los conjuntos de datos proporcionados por las bases de datos, 
estarán disponibles para su descarga. 
 Calidad: Los datos biológicos almacenados en las bases de datos deberían estar 
revisados manual o automáticamente para asegurar la calidad y la extracción de 
anotaciones de los mismos. 
Por lo tanto, dejemos a un lado la visión que se tiene de las bases de datos como 
herramientas estáticas. Las bases de datos requieren un gran esfuerzo a nivel diseño, 
implementación, mantenimiento, organización, anotación, supervisión, depósito y 
almacenamiento. 
Clasificación de las bases de datos biológicos 
Las bases de datos biológicas se han desarrollado para diversos propósitos, almacenan 
varios tipos de datos heterogéneos y son curadas a distintos niveles con diferentes 
métodos, por lo tanto, hay diferentes criterios para su clasificación. 
Alcance y cobertura de los datos 
Según este criterio, las bases de datos pueden clasificarse en exhaustivas o especializadas: 
 Exhaustivas: Abarcan diferentes tipos de datos de muchas especies. Ejemplos 
típicos son GenBank la base de datos moleculares mantenidos por el European 
Bioinformatics Institute EuropeanMolecular Biology Laboratory (EMBL-
EBI) y DNA Data Bank of Japan (DDJB). Estas tres bases de datos fueron 
establecidas como una Colaboración Internacional de Bases de Datos de 
Secuencias de Nucleótidos en 1988, para colectar y compartir secuencias 
de ADN y ARN. 
https://es.wikipedia.org/wiki/GenBank
https://es.wikipedia.org/wiki/European_Bioinformatics_Institute
https://es.wikipedia.org/wiki/European_Bioinformatics_Institute
https://es.wikipedia.org/wiki/Adn
https://es.wikipedia.org/wiki/ARN
 Especializadas: Contienen información específica o de especies particulares. Por 
ejemplo WormBase que contiene información biológica y genómica de 
nemátodos. 
Según la fuente de los datos 
De acuerdo a este criterio, las bases de datos pueden clasificarse como primarias, 
secundarias y combinadas: 
 Primarias: Contienen información solamente de la secuencia o la estructura, es 
decir que los datos experimentales son directamente subidos a la base de datos. 
En esta categoría encontramos las bases de datos GenBank, DNA Data Bank of 
Japan (DDJB)], UniProtKB/TrEMBL y Protein Data Bank (PDB). 
 Secundarias: Contienen información derivada de las bases de datos primarias. 
Una base de datos secundaria de secuencia contiene información de la 
conservación de la secuencia, patrones de secuencia y residuos del sitio activo de 
familias de proteínas derivados de alineamientos múltiples entre secuencias 
evolutivamente relacionadas. Una base de datos secundaria de estructuras 
organiza las entradas de PDB clasificándolas, por ejemplo, de acuerdo a su 
estructura como todas alfa, todas beta, alfa-beta, etc. Algunos ejemplos de éstas 
bases de datos son: CATH y SCOP. 
 Compuestas: Combinan una variedad de fuentes primarias de datos, como por 
ejemplo, el National Center for Biotechnology Information (NCBI) que alberga 
un conjunto de bases de datos de secuencia, taxonomía, genomas, mutaciones, 
entre otras y además herramientas como BLAST para búsquedas por similitud de 
secuencia. 
Nivel de curación 
De acuerdo al nivel de curación, pueden clasificarse en bases de datos primarias, 
secundarias o derivadas: 
 Primarias: Contienen datos “crudos” a modo de repositorio de archivos 
como [[NCBI Sequence Read Archive] (SRA)'. 
 Secundarias o derivadas: Almacena información que tiene un valor agregado 
por ser curada, por ejemplo NCBI RefSeq. 
Método de conservación 
https://es.wikipedia.org/w/index.php?title=WormBase&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=UniProtKB/TrEMBL&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=Protein_Data_Bank_(PDB)&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=CATH&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=SCOP&action=edit&redlink=1
https://es.wikipedia.org/wiki/National_Center_for_Biotechnology_Information
https://es.wikipedia.org/wiki/BLAST
https://es.wikipedia.org/w/index.php?title=NCBI_RefSeq&action=edit&redlink=1
El crecimiento explosivo de la cantidad de datos disponibles requiere de curación, 
integración y anotación, que se logra mediante la colaboración colectiva. Desde este 
punto de vista, las bases de datos biológicas pueden clasificarse como: 
 Conservadas por expertos, por ejemplo RefSeq y [The Arabidopsis Information 
Resource]] (TAIR). 
 Conservadas por una comunidad de investigadores, de forma colectiva y 
colaborativa, por ejemplo LncRNA Wiki y GeneWiki. 
Tipo de datos almacenados 
De acuerdo al tipo de datos almacenados en cada base de datos, las bases de datos 
biológicas pueden clasificarse de forma genérica en alguna de las siguientes categorías 
(se listan algunos ejemplos de bases de datos): 
 Secuencias nucleotídicas (ADN y ARN): la colaboración de las tres bases de datos 
más importantes hace posible acceder a casi toda la información de secuencias de 
nucleótidos desde cualquiera de sus tres sedes: 
 Bases de datos de EMBL en el European Bioinformatics Institute (EMBL-
EBI). Enlace externo base de datos de nucleótidos de EMBL-EBI 
 DNA Data Bank of Japan (DDJB). Enlace externo DDJB 
 GenBank en el National Center for Biological Information (NCBI). Enlace 
externo GenBank 
Si bien son mantenidas por distintos organismos en distintos países, existe una 
coordinación entre las distintas bases. Una secuencia enviada a cualquiera de las bases se 
verá reflejada en las otras dos en aproximadamente una semana, ya que esa es la 
frecuencia de actualización entre las distintas bases genéticas. Por este motivo es 
indistinto que base se use para enviar nuevas secuencias, aunque normalmente los 
europeos utilizan EMBL y los americanos GenBank. 
 Proteínas: bases de datos de secuencias, estructuras, e información relacionada. 
UniProtKB/Swiss-Prot contiene secuencias anotadas o comentadas, es decir, cada 
secuencia ha sido revisada, documentada y enlazada a otras bases de datos. Enlaces 
externos UniProtKB, Swissprot en el EBI UniProtKB/TrEMBL por Translation of EMBL 
Nucleotide Sequence Database incluye la traducción de todas las secuencias codificantes 
derivadas del (EMBL) y que todavía no han podido ser anotadas en Swiss-Prot. Enlaces 
http://www.ncbi.nlm.nih.gov/refseq/
https://es.wikipedia.org/w/index.php?title=LncRNA_Wiki&action=edit&redlink=1
https://es.wikipedia.org/wiki/%C3%81cido_desoxirribonucleico
https://es.wikipedia.org/wiki/%C3%81cido_ribonucleico
https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular
http://www.ebi.ac.uk/services
http://www.ebi.ac.uk/services
http://www.ebi.ac.uk/services/dna-rna
https://es.wikipedia.org/wiki/DNA_Data_Bank_of_Japan_(DDJB)
http://www.ddbj.nig.ac.jp/
https://es.wikipedia.org/wiki/GenBank
http://www.ncbi.nlm.nih.gov/
http://www.ncbi.nlm.nih.gov/genbank/
https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular
https://es.wikipedia.org/wiki/GenBank
https://es.wikipedia.org/wiki/Prote%C3%ADna
https://es.wikipedia.org/wiki/Swiss-Prot
https://es.wikipedia.org/w/index.php?title=UniProtKB&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=Swissprot_en_el_EBI&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=TrEMBL&action=edit&redlink=1
https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular
https://es.wikipedia.org/wiki/Swiss-Prot
externos TrEMBL, UniProtKB 'PIR por Protein Information Resource está dividida en 
cuatro sub-bases que tienen un nivel de anotación decreciente. Enlace externo PIR 
 'ENZYME enlaza la clasificación de actividades enzimáticas completa a las 
secuencias de Swiss-Prot. Enlace externo ENZYME 
 'PROSITE contiene información sobre la estructura secundaria de proteínas, 
familias, dominios, etc. Enlace externo PROSITE 
 'InterPro integra la información de diversas bases de datos de estructura 
secundaria como PROSITE, proporcionando enlaces a otras bases de datos 
e información más extensa. Enlace externo INTERPRO 
 'Protein Data Bank (PDB) es la base de datos de estructura terciaria 3D de 
proteínas que han sido cristalizadas. Enlace externo PDB 
 Expresión 
 El portal de EMBL-EBI ofrece una variedad de bases de datos de expresión 
génica. Enlace externo a bases de datos de expresión de EMBL-EBI 
 Interactomas, reactomas y rutas metabólicas 
 Reactome es una base de datos curada y revisada de EMBL-EBI de rutas 
de interacción y reacción de proteínas y enzimas. Enlace externo 
a Reactome 
 APID6 es una base de datos de interacciones proteína-proteína que incluye 
interactomas completos para múltiples especies. Enlace externo a APID 
 Variación genética (SNPs) y enfermedad 
 dbSNP de NCBI, ofrece un repositorio central de variaciones genéticas que 
comprenden sustituciones simples de nucleótidos y polimorfismos de 
inserciones y deleciones cortas. Enlace a dbSNP 
 COSMIC es un catálogo de mutaciones somáticas en cáncer, mantenida por 
el Wellcome Trust Sanger Institute. Enlace externo a COSMIC 
 'OMIM por Online Mendelian Inheritancein Man es un catálogo de genes 
humanos relacionados con desórdenes genéticos. Enlace externo OMIM 
 Literatura 
 Pubmed da acceso gratuito al índice de publicaciones de la Biblioteca 
Nacional de Medicina (NLM), con enlaces a artículos completos. Enlace 
externo PubMed 
 Ontología 
http://www.ebi.ac.uk/trembl/
http://www.uniprot.org/
https://es.wikipedia.org/wiki/PIR
https://web.archive.org/web/20140312021627/http:/pir.georgetown.edu/
https://es.wikipedia.org/w/index.php?title=ENZYME&action=edit&redlink=1
https://es.wikipedia.org/wiki/Swiss-Prot
http://us.expasy.org/enzyme/
https://es.wikipedia.org/wiki/PROSITE
http://us.expasy.org/prosite/
https://es.wikipedia.org/wiki/InterPro
https://es.wikipedia.org/wiki/PROSITE
http://www.ebi.ac.uk/interpro/index.html
https://es.wikipedia.org/wiki/Protein_Data_Bank
https://web.archive.org/web/20080828002005/http:/www.rcsb.org./pdb
https://es.wikipedia.org/wiki/Expresi%C3%B3n_g%C3%A9nica
https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular
https://www.ebi.ac.uk/services/gene-expression
https://es.wikipedia.org/wiki/Metabolismo
https://es.wikipedia.org/w/index.php?title=Reactome&action=edit&redlink=1
https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular
http://www.reactome.org/
https://es.wikipedia.org/wiki/Base_de_datos_biol%C3%B3gica#cite_note-6
http://apid.dep.usal.es/
https://es.wikipedia.org/wiki/Polimorfismo_de_nucle%C3%B3tido_simple
https://es.wikipedia.org/w/index.php?title=DbSNP&action=edit&redlink=1
https://es.wikipedia.org/wiki/NCBI
http://www.ncbi.nlm.nih.gov/projects/SNP/get_html.cgi?whichHtml=overview
https://es.wikipedia.org/wiki/COSMIC_(base_de_datos)
https://es.wikipedia.org/wiki/Wellcome_Trust_Sanger_Institute
http://cancer.sanger.ac.uk/cosmic
https://es.wikipedia.org/wiki/OMIM
http://www.ncbi.nlm.nih.gov/omim/
https://es.wikipedia.org/wiki/Pubmed
https://es.wikipedia.org/wiki/NLM
http://www.ncbi.nlm.nih.gov/PubMed/
 El proyecto de Ontología Génica (GO) es un esfuerzo colaborativo que 
surgió de la necesidad de tener descriptores consistentes de los productos 
de genes depositados en distintas bases de datos. Enlace externo a Gene 
Ontology Consortium 
 Genomas 
 Ensembl integra genomas eucariotas grandes, por el momento contiene 
genoma humano, ratón, rata, fugu, zebrafish, mosquito, Drosophila, C. 
elegans, y C. briggsae. Enlace externo Ensembl 
 Genomes server y TIGR son portales con información o enlaces de todos 
los genomas secuenciados por el momento, desde virus a humanos. Enlace 
externo Genome Server, enlace externo TIGR 
 Wormbase es el portal del genoma de gusano C. elegans. Enlace 
externo Wormbase 
 Flybase es el portal de la mosca de la fruta Drosophila melanogaster. Enlace 
externo Flybase 
 Otras 
 Taxonomy es el portal de clasificación taxonómica de organismos. Enlace 
externo Taxonomy Browser 
 Xenobase es el portal del organismo modelo Xenopus laevis. Enlace 
externo: Xenbase 
 TAIR (The Arabidopsis Information Resource) es el portal de la planta 
modelo Arabidopsis thaliana. Enlace externo Arabidopsis 
 GYPSY, base de datos de elementos genéticos móviles. Enlace externo The 
GYPSY Database of Mobile Genetic Elements 
Tipos de bases de datos biológicas 
Como hemos visto en secciones anteriores, existen multitud de bases de datos por lo que 
resulta útil clasificarlas en grupos. Se pueden hacer diferentes clasificaciones de las BD 
dependiendo de diferentes factores. En este capítulo vamos a estudiar las clasificaciones 
que atienden a la procedencia de los datos y a la revisión de los mismos. Luego 
hablaremos de una iniciativa encaminada a etiquetar las bases de datos de manera estándar 
(BioDBCore) y por último veremos cómo las instituciones de referencia en 
bioinformática como la revista Nucleic Acids Research, el EBI o el NCBI hacen su propia 
clasificación de los datos. 
https://es.wikipedia.org/wiki/Ontolog%C3%ADa_G%C3%A9nica
http://geneontology.org/
http://geneontology.org/
https://es.wikipedia.org/wiki/Genoma
https://es.wikipedia.org/wiki/Ensembl
https://web.archive.org/web/20080102093839/http:/www.ebi.ac.uk/ensembl/index.html
https://es.wikipedia.org/w/index.php?title=Genomes_server&action=edit&redlink=1
https://es.wikipedia.org/wiki/TIGR
http://www.ebi.ac.uk/genomes/index.html
http://www.jcvi.org/
https://es.wikipedia.org/w/index.php?title=Wormbase&action=edit&redlink=1
https://web.archive.org/web/20170420234209/http:/www.wormbase.org/
https://es.wikipedia.org/w/index.php?title=Flybase&action=edit&redlink=1
https://es.wikipedia.org/wiki/Drosophila_melanogaster
https://web.archive.org/web/20090815020557/http:/flybase.bio.indiana.edu/
https://es.wikipedia.org/w/index.php?title=Taxonomy&action=edit&redlink=1
https://es.wikipedia.org/wiki/Taxonom%C3%ADa
http://www.ncbi.nlm.nih.gov/Taxonomy/
https://es.wikipedia.org/w/index.php?title=Xenobase&action=edit&redlink=1
http://www.xenbase.org/
https://es.wikipedia.org/w/index.php?title=TAIR_(The_Arabidopsis_Information_Resource)&action=edit&redlink=1
http://www.arabidopsis.org/
https://es.wikipedia.org/w/index.php?title=GYPSY&action=edit&redlink=1
http://gydb.uv.es/index.php/Main_Page
http://gydb.uv.es/index.php/Main_Page
Procedencia de los datos 
En términos generales podríamos decir que las bases de datos primarias tienen datos 
originales que proceden directamente del experimento y normalmente son incorporadas 
por los autores a las bases de datos. Sin embargo, las bases de datos secundarias contienen 
datos derivados del análisis de los datos de las bases de datos primarias. Estos análisis se 
hacen computacionalmente o manualmente por un revisor. 
Bases de datos primarias: GenBank (secuencias nucleotídicas) y PDB (estructuras 
procedentes de las técnicas de rayos X y de Resonancia Magnética nuclear). Bases de 
datos secundarias: UniProt/SwissProt y PROSITE. 
Las bases de datos especializadas están centradas en un campo de investigación concreto 
como por ejemplo ZFIN (pez cebra), MGI (ratón), TRANSFAC (factores de 
transcripción). 
Revisión de los datos 
Las bases de datos revisadas están sujetas a un control de la calidad de los datos por parte 
de los revisores que se encargan de controlar el proceso de incorporación de los datos, la 
actualización y la consistencia de los mismos. Un buen ejemplo de base de datos sometida 
a un exhaustivo sistema de revisión tanto manual como computacional es UniProtKB, de 
la que hablaremos en detalle más adelante. 
Por otro lado, las bases de datos no revisadas no cuentan con la figura de los revisores, 
sino que son bases de datos donde los autores introducen libremente sus datos sin la guía 
de un experto ni de un vocabulario controlado u ontología. A las bases de datos no 
revisadas se las llama también repositorios. Los repositorios normalmente no incluyen 
información adicional al dato experimental y además suelen ser redundantes. 
Actualmente existen muy pocas bases de datos de este tipo. 
Clasificación EBI 
El European Bioinformatics Institute (EBI) clasifica las bases de datos en bases de datos 
clave y bases de datos especializadas. Las primeras proporcionan colecciones completas 
de valor genérico para las ciencias de la vida. Estas se dividen de forma grosera en dos 
categorías: aquellas que describen los componentes moleculares de los sistemas 
biológicos (por ejemplo, secuencias de nucle´otidos, secuencias de proteínas, estructuras 
macromoleculares y moléculas pequeñas) y las que describen sus comportamientos o los 
resultados de estos comportamientos (por ejemplo, trascripción, traducción e interacción). 
Como ejemplos de la primera tendíamos Ensembl de genomas, ENA de secuencias 
nucleotídicas, PDBe de estructuras proteicas o chEBI de entidades químicas. Sin 
embargo, las bases de datos PRIDE (proteomas), Reactome (rutas), ArrayExpress 
(expresi´on g´enica) o IntAct (interacciones moleculares) formarían parte de la segunda 
categoría. 
Además de las bases de datos clave,el EBI alberga un gran número de bases de datos 
especializadas como European Mutant Mouse Archive que proporciona información 
sobre las cepas mutantes de ratón para permitir a los investigadores enlazar la información 
fenotípica con las mutaciones o la NonRedundant Patent-Sequence Database Collection 
que proporciona acceso a secuencias con aplicaciones patentadas. 
Clasificación NCBI 
El National Centre for Biotechnology Information (NCBI) clasifica las bases de datos en 
las siguientes categorías: 
 Referencias bibliográficas (PubMed). 
 Genes y secuencias asociadas (Entrez Gene, UniGene). 
 Genomas (Entrez Genome, Sequence Read Archive). 
 Genotipos y fenotipos (dbGaP, dbSNP, OMIM). 
 Expresión génicas (GEO, GENSAT). 
 Estructura molecular y proteómica (MMDB). 
Clasificación NAR 
La revista Nucleic Acids Research publica desde el año 2001 un número anual dedicado 
a bases de datos que clasifica en 15 categorías: 
 Secuencias de Nucle´otidos 
 Secuencias de RNA 
 Secuencias de proteínas 
 Estructura 
 Bases de Datos Genómicas (invertebrados) 
 Rutas Metabólicas y de Señalización 
 Genomas de Humano y otros Vertebrados 
 Genes humanos y Enfermedades 
 Datos de Microarrays y otras bases de datos de Expresión 
 Bases de datos de Proteómica 
 Otras bases de datos de Biología Molecular 
 Bases de datos de organelas 
 Bases de datos de Plantas 
 Bases de datos Inmunológicas 
 Biología celular 
Acceso 
Podemos hablar de tres maneras de acceder a los datos proporcionados por una base de 
datos. El sistema más común de acceso a una base de datos es a través de su interfaz web 
específica. Sin embargo, en los últimos años el crecimiento en el número de bases de 
datos origino la necesidad de unificar las interfaces de búsqueda para facilitar al usuario 
el proceso de consulta. Para ello se crearon los llamados entornos integrados como el EBI 
o el NCBI de los que hemos hablado en la Subsección. La incorporación de las bases de 
datos en entornos integrados llevó aparejado el desarrollo de motores de búsqueda. Así 
tenemos Entrez como motor de búsqueda del NCBI o el EB-Eye como motor de búsqueda 
del EBI. A través de los motores de búsqueda, el usuario puede obtener una panorámica 
de los resultados de un amplio conjunto de bases de datos pertenecientes a un repositorio 
haciendo una única consulta. 
Otro tipo de acceso, el programático, permite a una máquina y no una persona ejecutar la 
consulta y recibir del resultado de la misma. El acceso programático a las bases de datos 
permite que el resultado de la consulta a una base de datos sea la consulta a la siguiente 
sin la intervención humana. De esta manera se puede automatizar las consultas 
construyendo los llamados flujos de trabajo. 
El sitio web del EBI es visitado por 300.000 usuarios aproximadamente cada mes y recibe 
diariamente 3,5 millones de peticiones. Además, cerca de un millón de trabajos se 
ejecutan al mes a través de los servicios web. 
 
Búsqueda 
La búsqueda de información en las bases de datos bioinformáticas se suele hacer por 
analogía. Pongamos el caso de tener una secuencia proteica sin caracterizar. La secuencia 
es una sucesión de caracteres que por sí misma no proporciona mucha información. Sin 
embargo, si comparamos esta secuencia con las casi 23 millones secuencias proteicas 
existentes en UniProtKB (alineamiento de secuencias), encontraríamos un listado de 
secuencias similares a la nuestra. En algunos casos la similitud sería tan grande que 
podríamos atribuir a nuestra secuencia las anotaciones de las secuencias similares. 
Estaríamos de esta manera caracterizando nuestra secuencia a través de la búsqueda por 
semejanza. 
Imagina ahora que, con las veinte secuencias más parecidas a tu secuencia problema 
(extraídas a partir de la búsqueda por semejanza), generamos una secuencia genérica 
(patrón de secuencia) que reúna las características de todas ellas. Esta secuencia a su vez 
podría servir para buscar en bases de datos de patrones para encontrar otras secuencias 
genéricas similares a la que t´u has generado. Este tipo de búsqueda se encuadraría dentro 
del descubrimiento de patrones. 
La búsqueda en las bases de datos es un paso fundamental en la construcción de flujos de 
trabajo. Por ejemplo, para hacer la predicción de la estructura proteica a partir de su 
secuencia por el método de modelado por homología, el primer paso sería consultar a una 
base de datos de secuencias para extraer la secuencia más similar a la secuencia problema. 
Pero también se pueden hacer búsquedas más especializadas en las bases de datos. Este 
es el caso del análisis de la huella peptídica resultante de un experimento de 
espectrometría de masas donde normalmente se utilizan bases de datos centradas en el 
organismo que se esté estudiando. 
Bases de datos biológicas más relevantes 
Las bases de datos más relevantes en biología incluyen datos de secuencias de 
nucleótidos, proteínas, estructura de proteínas, genomas, expresión genética, bibliografía, 
taxonomía, metabolismo, factores de transcripción, etc. Nos podemos hacer una idea de 
las bases de datos disponibles en esta base de datos de bases de datos biológicas. 
Por: Bioinformatics at Comav (2018). 
Principales bases de datos se secuencias de nucleótidos: 
 National Center for Biotechnology Information NCBI )(EEUU) 
 European Nucleotide Archive (EMBL) (Europa) 
http://www.biodbs.info/
http://www.ncbi.nlm.nih.gov/
http://www.ebi.ac.uk/embl/
 Bioinformation and DDBJ Center (DDBJ) (Japón) 
Algunas bases de datos de genomas de organismos concretos: 
 Saccharomyces Genome Database SGD (Levadura) 
 The Arabidopsis Information Resource TAIR (Arabidopsis) 
 ENSEML (Hombre, ratón y otros) 
Principales bases de datos de proteínas: 
 Uniprot 
 Swiss-prot 
 Protein Data Bank (PDB) 
 3D Macromolecular Structures (MMDB) 
 Structural Classification of Proteins (SCOP) 
Bibliografía: 
 Biblioteca Nacional de Medicina de EE. UU. Institutos Nacionales de Salud 
(Pubmed) 
Rutas metabólicas: 
 Enciclopedia de Kyoto de genes y genomas (KEGG) 
Enfermedades genéticas humanas: 
 Centro Nacional de Información Biotecnológica , Biblioteca Nacional de 
Medicina de EE . UU. (OMIM) 
 
 
BASES DE DATOS DE LAS CIENCIAS SOCIALES 
Por: Consejo Superior de Investigaciones Científicas (2016). 
 Ciencias sociales 
http://www.ddbj.nig.ac.jp/
http://www.yeastgenome.org/
http://www.arabidopsis.org/
http://www.ensembl.org/index.html
http://www.pir.uniprot.org/
http://expasy.org/sprot/
http://www.rcsb.org/pdb/home/home.do
http://130.14.29.110/Structure/MMDB/mmdb.shtml
http://scop.mrc-lmb.cam.ac.uk/scop/
https://www.nlm.nih.gov/
https://www.nlm.nih.gov/
http://www.ncbi.nlm.nih.gov/sites/entrez
http://www.genome.jp/kegg/
https://www.ncbi.nlm.nih.gov/
https://www.nlm.nih.gov/
https://www.nlm.nih.gov/
https://www.nlm.nih.gov/
http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim
 ISOC-CSIC. Base de datos de la producción científica española de ciencias 
sociales y humanas. 
 Agencia Española del ISBN. Bases de datos de libros y de editores españoles. 
 APA Databases. Bases de datos de la Asociación Americana de Psicología. 
 Biblioteca Nacional de España. Bibliografía Española en línea. 
 EconLit. American Economic Association. Base de datos de economía. 
 EBSCO host. 
 ERIC. Educational Resources Information Center. 
 HV Wilson Databases. Bases de Datos Wilson. 
 ISI Web of Knowledge. ThomsonReuters-ISI. (público). 
 ISI Web of Knowledge. ThomsonReuters-ISI. (acceso via FECYT). 
 PAO. Periodicals Archive On Line. Base de datos de humanidades y ciencias 
sociales. 
 PIO. Periodicals Index On Line. Base de datos de humanidades y ciencias 
sociales. 
 SCOPUS. Base de datos multidisciplinar producida por Elsevier. 
 Teseo. Base de datos de tesis doctorales españolas. 
Revistas Científicas 
 Dialnet. Portal de difusión de la producción científica hispana 
 DOAJ.Directorio de revistas Open Access. 
 e-Revist@s. Plataforma Open Access de Revistas Científicas Electrónicas 
Españolas y Latinoamericanas 
 EZB. Elektronische Zeitschriftenbibliothek. Electronic Journals Library. 
 GIGA Journal Family. German Institute of Global and Area Studies. 
 PERSEE. Portal de Revistas Científicas de Ciencias Humanas y Sociales. 
 Portal de Revistas Científicas Complutenses. 
 Raco. Revistas Catalanas con Acceso Abierto. 
 Redalyc. Portal de revistas de Latinoamérica, España y Portugal. 
 Revues.org. Fédération de Revues en Sciences Humaines et Sociales. Édition 
électronique scientifique 
 SciELO. Scientific Electronic Library Online. 
Estadísticas 
http://www.cindoc.csic.es/servicios/dbinfo.htm
http://www.mcu.es/libro/CE/AgenISBN.html
http://www.apa.org/databases/
http://www.bne.es/esp/servicios/bibliografiaesplinea.htm
http://www.aeaweb.org/econlit/index.php
http://www.ebscohost.com/thisMarket.php?marketID=1
http://www.eric.ed.gov/
http://www.hwwilson.com/ftabsind_alpha.htm
http://www.isiwebofknowledge.com/
http://www.accesowok.fecyt.es/login/
http://pao.chadwyck.co.uk/
http://pio.chadwyck.co.uk/
http://info.scopus.com/
https://www.micinn.es/teseo/login.jsp
http://dialnet.unirioja.es/
http://www.doaj.org/
http://www.erevistas.csic.es/
http://ezb.uni-regensburg.de/index.phtml?bibid=AAAAA&colors=7&lang=en
http://www.giga-hamburg.de/english/index.php?file=publications.html&folder=publications
http://www.persee.fr/web/revues/home
http://www.ucm.es/BUCM/revistasBUC/portal/modulos.php?name=principal&col=1
http://www.raco.cat/index.php/index/raco/
http://www.redalyc.org/
http://www.revues.org/
http://www.scielo.org/
 Banco Mundial. Datos e Investigación. 
 CEPAL. Comisión Económica para América Latina y el Caribe. 
 EuroStat. Estadísticas de la Unión Europea. 
 FAO. Organización de las Naciones Unidas para la Agricultura y la Alimentación. 
 FMI. Fondo Monetario Internacional. 
 INE. Instituto Nacional de Estadística. (España). 
 OCDE. Organización para la Cooperación y el Desarrollo Económico. 
 OMS. Organización Mundial de la Salud. 
 UNESCO. Instituto de Estadísticas de la UNESCO. 
 UNIDO. Datos Estadísticos Industriales de la UNIDO. 
 
Bases de datos especializadas en ciencias sociales 
Por: Águeda González & Lourdes Páez (2018). 
 ABI/INFORM. Base de datos que recoge bibliografía de más de 2.770 revistas 
de comercio y finanzas, condiciones empresariales y económicas, técnicas de 
gestión, teoría y práctica de empresa, publicidad, marketing, economía, recursos 
humanos, impuestos, informática, etc., de las cuales, más de 1.840 se hallan 
accesibles a texto completo. Cobertura internacional ampliada. Acceso a 
información sobre más de 60.000 empresas con perfiles empresariales y 
ejecutivos. 
 Aranzadi-Westlaw.es. Base de datos de legislación y jurisprudencia de Aranzadi. 
Contiene legislación estatal, autonómica, jurisprudencia del Tribunal Supremo, 
del Constitucional y del Tribunal Europeo de Derechos Humanos 
 Communication Studies. Colección de 19 revistas a texto completo, publicadas 
por Sage, sobre periodismo, opinión pública, comunicación política y económica, 
estudios culturales, comunicación de masas, televisión. Incluye, además del texto 
completo, registros bibliográficos, resúmenes y referencias citadas. 
 ECONLIT. Versión ampliada del Journal of Economic Literature. Proporciona 
diferentes tipos de documentos relativos a teoría económica, historia económica, 
econometría, finanzas públicas y de la empresa, instituciones financieras, 
demografía, economía internacional, mercado de capitales, etc... 
http://www.bancomundial.org/investigacion/
http://www.eclac.org/estadisticas/
http://epp.eurostat.ec.europa.eu/
http://www.fao.org/corp/statistics/es/
http://www.imf.org/external/data.htm
http://www.ine.es/
http://www.oecd.org/
http://www.who.int/research/es/index.html
http://www.uis.unesco.org/
http://www.unido.org/index.php?id=7836
 ERIC. Base de datos bibliográfica del Educational Resources Information 
Center(ERIC). Contiene referencias con resúmenes de artículos de revistas y 
literatura gris ; algunos artículos permiten el acceso al texto completo. 
 EINIRAS Database Network. Conjunto de bases de datos europeas sobre 
relaciones internacionales y geopolítica. 
 HLAS Online (Handbook of Latin American studies). Base de datos 
bibliográfica sobre América Latina que incluye libros y artículos seleccionados y 
reseñados por especialistas. 
 IUSTEL. Portal que recoge legislación y jurisprudencia española y comunitaria. 
 La Ley. Colección de revistas especializadas en Derecho, incluyendo 
jurisprudencia, doctrinas, colaboraciones y comentarios. 
 PARLIT database. Base de datos bibliográfica sobre parlamentos, 
procedimiento parlamentario, sistemas electorales, derecho constitucional y 
ciencia política en general. 
 PeriodicalsArchive Online. Colección de más de 500 revistas a texto completo 
de humanidades y ciencias sociales de procedencia internacional. 
 PsycInFo. Base de datos de la American PsychologicalAssociation (antigua 
PSYCLIT) 
 PSICODOC. Base de datos de artículos de revista y libros del COP y la Facultad 
de Psicología de la UCM 
 Social Work Abstracts. Base de datos bibliográfica que contiene resúmenes y 
citas de artículos referentes a trabajo social y servicios sociales 
 SOCIOLOGICAL ABSTRACTS Literatura mundial en el campo de la sociología 
y disciplinas relacionadas. Contiene resúmenes de artículos de unas 2.500 revistas 
y de ponencias presentadas a distintos congresos, además de resúmenes de libros, 
capítulos de libros, tesis y conferencias.

Continuar navegando