BASES DE DATOS BIOLÓGICAS Y DE LAS CIENCIAS SOCIALES

Análisis de Datos

•

SIN SIGLA

Angel Anchundia

8/8/2023

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Análisis de Datos

8108 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

BASES DE DATOS BIOLÓGICAS
Introducción
Recordemos que en computación una Base de Datos (BD) es un conjunto de datos
pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior
utilización. El objetivo principal del desarrollo de una BD es organizar los datos en un
conjunto de registros estructurados que permitan recuperar fácilmente la información.
Cada registro está compuesto por un número determinado de campos que contienen datos
específicos, por ejemplo: nombres, números de teléfono, etc. Para recuperar un registro
particular de la base de datos, un usuario puede especificar una pieza de información,
llamada valor, que será encontrada en un campo en especial. La computadora entonces
recuperará el registro completo. Este proceso es llamado consulta
Aun cuando la recuperación de información es el principal objetivo de todas las BD, las
BD biológicas a menudo tienen un requerimiento de más alto nivel, conocido como
descubrimiento de conocimiento.
Este se refiere a la identificación de conexiones entre piezas de información que no eran
conocidas cuando la información fue introducida por primera vez.
Por ejemplo, en las BD que contienen información cruda (sin procesar) de secuencias de
ADN se pueden realizar tareas extras para identificar homología de secuencias o motivos
conservados. Con lo cual se podría facilitar el descubrimiento de nuevos conocimientos
biológicos a partir de datos crudos.
Datos biológicos
Por: Natalia Jiménez Lozano (2017).
Se podría definir dato como el resultado de una medición. En este capítulo hablaremos de
bases de datos (BD) que albergan información biológica por lo que el dato biológico sería
un tipo particular de dato generado dentro del contexto de una investigación científica.
Las mediciones que se realizan en el campo de la investigación no son simples ya que en
la mayoría de los casos son el resultado de un complejo flujo de trabajo en el laboratorio
donde se utilizan muy diversas técnicas. Podemos poner como ejemplo de dato biológico
la secuencia de nucleótidos de un gen determinada mediante técnicas de secuenciación o
la banda correspondiente a un fragmento de DNA separado mediante una electroforesis
en gel de agarosa.
Dato, información y conocimiento
Existe mucha confusión entre los términos dato, información y conocimiento. De hecho,
en muchas ocasiones estos términos son considerados erróneamente como sinónimos. La
diferencia fundamental radica en que, mientras que a partir de conjuntos de datos se puede
derivar la información directamente, el conocimiento normalmente se deriva de forma
indirecta. Utilizaremos un ejemplo para poner de manifiesto la diferencia que existe entre
estos tres conceptos.
Ejemplo: Imagina que regentas un herbolario y que tienes una base de datos donde
registras todos los datos de tus clientes de manera que conoces sus nombres y los
productos que compran en tu establecimiento. Que los clientes Paula y Javier compren
leche sin lactosa cada lunes es un dato que tú tienes almacenado en tu base de datos. Cada
vez que quieras saber quiénes son los clientes que compran leche sin lactosa o cuantos
litros de leche sin lactosa vendes cada día, consultaras a la base de datos y tendrás el
resultado. Esto es información. Ahora imagina que hay otros 100 clientes que también
compran leche sin lactosa y que todos ellos son alérgicos a la lactosa. Entonces podrás
concluir que Paula y Javier deben ser alérgicos a la lactosa también. La alergia de Paula
y Javier no se te ha proporcionado como dato y tampoco se puede extraer de la base de
datos como información. Sin embargo, tú has extrapolado esta información de manera
indirecta y a esto es a lo que llamamos conocimiento.
Por lo tanto, el dato es objetivo y no abstracto y sin embargo la información y el
conocimiento son subjetivos y requieren altos grados de abstracción. La organización de
los datos biológicos en bases de datos facilita el descubrimiento de conocimiento ya que
permite poner de manifiesto relaciones entre piezas de información que se desconocían
en el momento en que la información fue introducida por primera vez (datos crudos o sin
procesar). Otro ejemplo de generación de conocimiento sería el derivar los motivos
conservados en un conjunto de secuencias proteicas crudas pertenecientes a una base de
datos.

Características
Ahora que sabemos lo que es un dato biológico y lo distinguimos de la información y del
conocimiento, veamos cuáles son sus características:
Los datos biológicos son heterogéneos porque representan entidades diversas que
van desde átomos hasta estudios poblacionales, pasando por secuencias de
nucleótidos y proteínas, estructuras proteicas cristalinas, medidas de expresión
génica, interacciones proteína-proteína o proteína-DNA, redes e interacción,
células, estudios fenotípicos y estudios fisiológicos.
Los datos biológicos son complejos. Para que te hagas una idea de la complejidad
de los datos biológicos vamos a compararlos con los datos antropométricos.
Imagina la diferencia que hay entre los datos correspondientes al peso de una
persona y la determinación una estructura de una proteína sencilla como la
insulina. En el primer caso lo único que tendríamos que hacer sería pesar al
individuo con una báscula. Sin embargo, en el segundo caso tendríamos que
purificar la proteína, cristalizarla, obtener el difractograma y a partir de este
determinar las posiciones en el eje X, Y, Z de cada átomo de cada uno de los 110
aminoácidos de la proteína. El dato antropométrico es un número y el dato
biológico es un fichero de más de mil líneas, 865 de las cuales corresponden a la
posición de uno de los átomos de la estructura.
Los datos biológicos pueden tener una naturaleza cuantitativa (Ej. peso molecular
de una proteína) o cualitativa (Ej. función de una proteína).
Los datos biológicos son necesariamente dinámicos porque van cambiando según
van evolucionando las técnicas que los generan o van surgiendo nuevas técnicas
que completan el dato. Ej. la primera secuencia proteica que se determinó, la
insulina bovina, depositada en la base de datos UniProtKB en el año 1986
(Identificador P01317; hablaremos de esta base de datos en detalle más adelante)
ha sufrido hasta la fecha 126 revisiones. Este dato, como el resto de datos
biológicos es incompleto ya que seguir a evolucionando indefinidamente.
Los datos biológicos pueden proceder de interpretaciones, de análisis
computacionales o bien pueden ser datos confirmados experimentalmente.
Veamos algunos ejemplos:
 Datos procedentes de interpretaciones: la descripción del nivel de expresión
de un gen en un tejido determinado por la técnica de hibridación in situ.
Mediante esta técnica, el experimentalista obtiene una imagen
correspondiente a una sección del organismo que esté estudiando, y tiene
que determinar si la expresión en los tejidos de interés es inexistente, débil,
media, fuerte o muy fuerte. Por lo tanto, en este caso el experimentalista ha
de interpretar el dato crudo (imagen obtenida de la técnica).
 Datos procedentes de análisis computacionales: estructura secundaria de
una proteína es un ejemplo de dato obtenido computacionalmente a partir
de la secuencia. En este caso el dato biológico está asociado a una
probabilidad. Existe un gran abanico de aplicaciones que proporcionan este
tipo de datos.
 Datos confirmados experimentalmente: la interacción entre dos proteínas
observada mediante el experimento del doble híbrido.
Bases de datos biológicas
Historia
Si hay un nombre ligado a la Bioinformática es sin lugar a dudas el de Margaret Dayhoff
(1925-1983). Esta fisicoquímica estadounidense fue pionera en el campo de la
Bioinformática. Su visión de futuro le llevó a publicar un libro en 1965 que reunía las 65
secuencias proteicas existentes hasta esa fecha con el objetivode facilitar el análisis de
las mismas. Este libro titulado “Atlas of Protein Sequence and Structure” fue el precursor
de PIR (Protein Information Resource), la primera base de datos en el campo de la
Bioinformática.
Definición
Por: Universidad del País Vasco (2018).
Una base de datos biológica es una biblioteca de información sobre ciencias de la vida,
recogida de experimentos científicos, literatura publicada, tecnología de experimentación
de alto rendimiento, y análisis computacional. Contiene información de áreas de
investigación incluyendo genómica, proteómica, metabolómica, expresión génica
mediante microarrays, y filogenética. La información contenida en bases de da-tos
biológicas incluye funciones, estructura y localización (tanto celular como cromosómica)
de genes, efectos clínicos de mutaciones, así como similitudes de secuencias y estructuras
biológicas.
En los últimos años, debido a la rápida evolución de las técnicas experimentales de alto
rendimiento (Secuenciación del ADN, Cristalografía de rayos X, Microarreglo de ADN)
se generó un crecimiento exponencial en la cantidad de datos biológicos (secuencias
genómicas y de proteínas, estructuras de proteínas, expresión génica, mutaciones, etc)
que generaron la necesidad de contar con formas eficientes de almacenar la información.
Las bases de datos biológicas surgieron como una respuesta a los enormes volúmenes de
datos generados por las tecnologías de secuenciación de ADN de bajo costo. Una de las
primeras bases de datos que surgió fue GenBank, que es una colección de todas las
secuencias de ADN y proteínas disponibles. Es mantenido por los Institutos Nacionales
de Salud (NIH) y el Centro Nacional de Información de Biotecnología (NCBI). GenBank
allanó el camino para el Proyecto Genoma Humano (HGP). El HGP permitió la
secuenciación completa y la lectura del plano genético. Los datos almacenados en bases
de datos biológicas se organizan para un análisis óptimo y se componen de dos tipos: sin
procesar y curados (o anotados). Las bases de datos biológicas son complejas,
heterogéneas, dinámicas y, sin embargo, inconsistentes. La inconsistencia se debe a la
falta de estándares a nivel ontológico.
Gracias a las nuevas tecnologías se está generando una ingente cantidad de datos
biológicos y toda esta información se almacena en bases de datos. Estos datos pueden ser
de cuatro tipos: secuencias biológicas, datos estructurales, datos funcionales y
bibliografía. Cada categoría de datos presenta su propia estructura y requisitos, lo que
influye decisivamente a la hora de diseñar las bases de datos.
Los diversos tipos de datos están estrechamente relacionados entre sí: las secuencias
codificantes de ADN dan lugar a proteínas con una estructura tridimensional y una
función característica; con mucha frecuencia, las proteínas no funcionan solas, sino que
forman parte de rutas metabólicas en las que establecen importantes relaciones con otros
tipos de biomoléculas y, además, toda esta información está convenientemente reflejada
en las publicaciones científicas.
Se ha hecho un gran esfuerzo para que toda esta información sea accesible a través de la
World Wide Web (www) de modo que tanto las bases de datos como sus herramientas de
búsqueda se han convertido en parte esencial de la actividad investigadora. Todos los
años, el primer número de la revista Nucleic Acids Research (NAR) está dedicado a las
bases de datos: publica artículos que describen la creación de nuevas bases de datos y las
https://es.wikipedia.org/wiki/Secuenciaci%C3%B3n_del_ADN
https://es.wikipedia.org/wiki/Cristalograf%C3%ADa_de_rayos_X
https://es.wikipedia.org/wiki/Microarreglo_de_ADN
innovaciones que se han producido en las ya existentes y, además, contiene una lista
exhaustiva de todas las bases de datos existentes y sus URL. Muchas de estas bases están
alojadas en los sitios web de centros gubernamentales o privados que han creado un
entorno gráfico uniforme que reúne un gran número de bases de datos. Ejemplos de este
tipo de centros son:
The National Center for Biotechnology Information, NCBI
(http://www.ncbi.nlm.nih.gov/).
The European Bioinformatics Institute, EBI (http://www.ebi.ac.uk).
The Switzerland Institute of Bioinformatics, SIB (http:/www.isb-sib.ch/).
The Sanger Institute (http://www.sanger.ac.uk).
Un aspecto particularmente interesante de estos centros es que establecen conexiones
entre las distintas bases de datos que permiten obtener de manera fácil y rápida toda la
información relacionada con una biomolécula concreta.
Descripción
Por: Natalia Jiménez Lozano (2017).
Las bases de datos biológicas constituyen una herramienta esencial para almacenar,
estructurar, organizar, actualizar y manipular datos biológicos. La variedad de estos datos,
así como también su rápido crecimiento, hacen a las bases de datos una herramienta clave.
Se han convertido en un instrumento indispensable para los científicos experimentales
del campo de la biología, como para aquellos científicos del área de la bioinformática que
desarrollan experimentos in silico.
Las bases de datos biológicas surgen a partir de los conceptos de bases de datos
relacionales de las ciencias de la computación, y los conceptos de recuperación de
información de las bibliotecas digitales. El diseño de estas bases de datos, su desarrollo y
su gestión a largo plazo, forman un área nuclear dentro de la bioinformática. El contenido
de los datos incluye secuencias génicas, descripciones textuales, atributos y
clasificaciones ontológicas, estructuras de proteínas, anotaciones, entre otras. Estos son
descritos a menudo como datos semiestructurados, y se pueden representar como tablas,
registros delimitados por claves y estructuras XML. Son comunes las referencias cruzadas
entre las diferentes bases de datos biológicas usando los números de acceso
https://es.wikipedia.org/wiki/Biolog%C3%ADa
https://es.wikipedia.org/wiki/Bioinform%C3%A1tica
https://es.wikipedia.org/wiki/Base_de_datos_relacional
https://es.wikipedia.org/wiki/Base_de_datos_relacional
https://es.wikipedia.org/wiki/Ciencias_de_la_computaci%C3%B3n
https://es.wikipedia.org/wiki/Recuperaci%C3%B3n_de_informaci%C3%B3n
https://es.wikipedia.org/wiki/Recuperaci%C3%B3n_de_informaci%C3%B3n
https://es.wikipedia.org/wiki/Biblioteca_digital
https://es.wikipedia.org/wiki/Bioinform%C3%A1tica
https://es.wikipedia.org/wiki/Ontolog%C3%ADa
https://es.wikipedia.org/wiki/Estructura_de_datos
https://es.wikipedia.org/wiki/XML
(identificadores únicos de los registros en una base de datos, o también conocidos
como Clave primaria).
Las bases de datos para ayudan a los científicos a comprender y explicar una serie de
fenómenos biológicos desde la estructura biomolecular de una proteína y su interacción,
hasta el metabolismo completo de los organismos y a la comprensión de la evolución de
las especies.
Un recurso importante para la búsqueda de bases de datos biológicos es la edición anual
de la revista Nucleic Acids Research (NAR). Una edición de bases de datos en NAR está
disponible gratuitamente todos los años, donde se publican nuevas base de datos y algunas
actualizaciones de las ya conocidas. Se encuentran clasificadas de acuerdo a su temática
y están en línea a disposición de toda la comunidad científica.
Las bases de datos biológicas se han convertido en un instrumento importante para ayudar
a los científicos a comprender y explicar una serie de fenómenos biológicos desde la
estructura biomolecular y su interacción, hasta el metabolismo completo de los
organismos y a la comprensión de la evolución de las especies. Este conocimiento ayuda
a facilitar la lucha contra las enfermedades, ayuda en el desarrollo de medicamentos, y en
el descubrimiento de las relaciones básicas entre las especies en la historia de la vida.
El conocimiento biológico se distribuye entre múltiples bases de datos generalesy
especializadas. Esto a veces hace que sea difícil garantizar la coherencia de la
información. Las bases de datos biológicas tienen referencias cruzadas con otras bases de
datos con el número de acceso como una forma de vincular sus conocimientos
relacionados con el conjunto.
Un recurso importante para la búsqueda de bases de datos biológicos es un tema anual de
la revista Nucleic Acids Research (NAR). Un artículo acerca de las bases de da-tos en
NAR está disponible gratuitamente y se clasifican muchas de las bases de datos en línea
a disposición del público relacionadas con la biología y bioinformática.
Importancia
Anteriormente, las bases de datos y los bancos de datos se consideraban bastante
diferentes. Sin embargo, con el tiempo, “base de datos” se convirtió en un término
preferible. Los datos se envían directamente a las bases de datos biológicas para la
indexación, organización y optimización de datos. Ayudan a los investigadores a
https://es.wikipedia.org/wiki/Clave_primaria
https://es.wikipedia.org/wiki/Metabolismo
https://es.wikipedia.org/wiki/Evoluci%C3%B3n_biol%C3%B3gica
https://es.wikipedia.org/wiki/Especie
https://es.wikipedia.org/w/index.php?title=Nucleic_Acids_Research&action=edit&redlink=1
encontrar datos biológicos relevantes al ponerlos a disposición en un formato legible en
una computadora. Toda la información biológica es fácilmente accesible a través de
herramientas de minería de datos que ahorran tiempo y recursos. Las bases de datos
biológicas pueden clasificarse ampliamente como bases de datos de secuencia y
estructura. Las bases de datos de estructuras son para estructuras de proteínas, mientras
que las bases de datos de secuencias son para secuencias de ácidos nucleicos y proteínas.
Durante las dos últimas décadas se han producido una gran variedad de desarrollos
tecnológicos que han acelerado el ritmo de producción de datos biológicos. La inversión
en tecnologías de alto rendimiento, comenzando por los análisis de expresión de
microarrays a mitad de los años 90 y continuando con el conocimiento cada vez más
detallado del genoma, transcriptoma, proteoma y metaboloma, ha dado lugar a un
tremendo escalado en el ritmo de producción de datos biológicos crudos. Según Burge et
al si se continúa el ritmo de generación de datos que se tiene hoy en día, en el 2020 habrá
un millón de veces más datos que actualmente. Por lo tanto, el próximo reto en la
investigación es hacer el análisis, la gestión y el acceso a los datos tan eficiente como la
generación de los mismos.
Las bases de datos surgen por tanto de manera natural ante la necesidad de preservar y
organizar la avalancha de datos que se estaba generando solucionando así el problema del
archivo de los datos, pero al mismo tiempo permitiendo el análisis de los mismos y su
reutilización para otros propósitos. Los científicos dependen de la disponibilidad de los
datos de otros científicos por lo que el dato biológico no tiene interés por sí mismo, sino
que adquiere su valor en la medida en que la comunidad científica sea capaz de
localizarlo, integrarlo y accederlo. Los primeros esfuerzos destinados a la creación de
bases de datos bioinformáticas los realizaron grupos de investigación interesados en
organizar y compartir los datos generados en su propio laboratorio. Conforme las bases
de datos iban creciendo, el perfil de gestor de las mismas se fue profesionalizando,
pasando a ser cada vez más computacional. A partir de ese momento surgieron proyectos
internacionales que se hicieron cargo de estas bases de datos, dos de estas iniciativas son:
European Bioinformatics Institute (EBI).
National Centre for Biotechnology Information (NCBI).
El EBI forma parte del EMBL (European Molecular Biology Laboratory) y se construyó
en el año 1992 en el campus Wellcome Trust Genome en Hinxton (Inglaterra) para dar
soporte a la gran cantidad de datos que se estaban generando con los proyectos de
secuenciación del Instituto Sanger. Actualmente además de otras muchas bases de datos,
el EBI alberga ENA (European Nucleotide Archive) para secuencias de nucleótidos y
UniprotKB de secuencias de proteínas.
El NCBI es parte de la Biblioteca Nacional de Medicina de los Estados Unidos (NLM)
que es a su vez parte del Instituto Nacional de Salud (NIH). El NCBI está en Maryland y
se fundó en 1988 para desarrollar sistemas de información en el campo de la biología
molecular. Como bases de datos más relevantes tiene la de secuencias de nucleótidos
GenBank y la de bibliografía biomédica PubMed. Estas bases de datos junto con muchas
otras más, se pueden consultar a través del motor de búsqueda Entrez.
Las bases de datos online se han convertido en importantes vías para publicar los datos
biológicos. De hecho, es requisito imprescindible para la publicación en determinadas
revistas, el archivo en la correspondiente base de datos. Como consecuencia de esto cada
vez es más común encontrar en las publicaciones un apartado dentro de la sección de
métodos que haga referencia a un identificador de secuencia, estructura tridimensional,
gel bidimensional, etc.
Las bases de datos comienzan a ser la piedra angular de la investigación biomédica
moderna, citándose en la literatura miles de veces al año. Actualmente no se concibe
ningún flujo de trabajo en investigación que no suponga en alguno de sus pasos la
“consulta a” o la “integración con” alguna base de datos bioinformática. Por esta razón
me gustaría hacer hincapié en la accesibilidad de los datos: una base de datos
bioinformática, para que sea realmente de utilidad, ha de estar públicamente accesible
online o ha de poder descargarse en su totalidad.
Gestión de las bases de datos biológicas
Para que una base de datos sea considerada de utilidad en el campo de la Bioinformática,
ha de cumplir una serie de requisitos:
Accesibilidad: Es requisito indispensable que todos los datos estén disponibles a
la comunidad científica de manera gratuita y sin restricción ya que el progreso de
la investigación en ciencias de la vida depende del acceso a estos datos. Por lo
tanto, las bases de datos bioinformáticas deben ser accesibles online.
Han de proporcionar conjuntos de datos completos y actualizados: para que una
base de datos tenga realmente interés, esta ha de actualizarse periódicamente para
incluir nuevos datos y ha de proporcionar referencias a otras bases de datos.
Interfaces de acceso intuitivas y amigables que permitan el acceso y la
incorporación de datos, así como herramientas que permitan hacer análisis de los
mismos.
Adoptar en lo posible estándares en el campo de la bioinformática para favorecer
el intercambio de datos entre diversas colecciones.
Cuando sea posible, los conjuntos de datos proporcionados por las bases de datos,
estarán disponibles para su descarga.
Calidad: Los datos biológicos almacenados en las bases de datos deberían estar
revisados manual o automáticamente para asegurar la calidad y la extracción de
anotaciones de los mismos.
Por lo tanto, dejemos a un lado la visión que se tiene de las bases de datos como
herramientas estáticas. Las bases de datos requieren un gran esfuerzo a nivel diseño,
implementación, mantenimiento, organización, anotación, supervisión, depósito y
almacenamiento.
Clasificación de las bases de datos biológicos
Las bases de datos biológicas se han desarrollado para diversos propósitos, almacenan
varios tipos de datos heterogéneos y son curadas a distintos niveles con diferentes
métodos, por lo tanto, hay diferentes criterios para su clasificación.
Alcance y cobertura de los datos
Según este criterio, las bases de datos pueden clasificarse en exhaustivas o especializadas:
Exhaustivas: Abarcan diferentes tipos de datos de muchas especies. Ejemplos
típicos son GenBank la base de datos moleculares mantenidos por el European
Bioinformatics Institute EuropeanMolecular Biology Laboratory (EMBL-
EBI) y DNA Data Bank of Japan (DDJB). Estas tres bases de datos fueron
establecidas como una Colaboración Internacional de Bases de Datos de
Secuencias de Nucleótidos en 1988, para colectar y compartir secuencias
de ADN y ARN.
https://es.wikipedia.org/wiki/GenBank
https://es.wikipedia.org/wiki/European_Bioinformatics_Institute
https://es.wikipedia.org/wiki/European_Bioinformatics_Institute
https://es.wikipedia.org/wiki/Adn
https://es.wikipedia.org/wiki/ARN
Especializadas: Contienen información específica o de especies particulares. Por
ejemplo WormBase que contiene información biológica y genómica de
nemátodos.
Según la fuente de los datos
De acuerdo a este criterio, las bases de datos pueden clasificarse como primarias,
secundarias y combinadas:
Primarias: Contienen información solamente de la secuencia o la estructura, es
decir que los datos experimentales son directamente subidos a la base de datos.
En esta categoría encontramos las bases de datos GenBank, DNA Data Bank of
Japan (DDJB)], UniProtKB/TrEMBL y Protein Data Bank (PDB).
Secundarias: Contienen información derivada de las bases de datos primarias.
Una base de datos secundaria de secuencia contiene información de la
conservación de la secuencia, patrones de secuencia y residuos del sitio activo de
familias de proteínas derivados de alineamientos múltiples entre secuencias
evolutivamente relacionadas. Una base de datos secundaria de estructuras
organiza las entradas de PDB clasificándolas, por ejemplo, de acuerdo a su
estructura como todas alfa, todas beta, alfa-beta, etc. Algunos ejemplos de éstas
bases de datos son: CATH y SCOP.
Compuestas: Combinan una variedad de fuentes primarias de datos, como por
ejemplo, el National Center for Biotechnology Information (NCBI) que alberga
un conjunto de bases de datos de secuencia, taxonomía, genomas, mutaciones,
entre otras y además herramientas como BLAST para búsquedas por similitud de
secuencia.
Nivel de curación
De acuerdo al nivel de curación, pueden clasificarse en bases de datos primarias,
secundarias o derivadas:
Primarias: Contienen datos “crudos” a modo de repositorio de archivos
como [[NCBI Sequence Read Archive] (SRA)'.
Secundarias o derivadas: Almacena información que tiene un valor agregado
por ser curada, por ejemplo NCBI RefSeq.
Método de conservación
https://es.wikipedia.org/w/index.php?title=WormBase&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=UniProtKB/TrEMBL&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=Protein_Data_Bank_(PDB)&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=CATH&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=SCOP&action=edit&redlink=1
https://es.wikipedia.org/wiki/National_Center_for_Biotechnology_Information
https://es.wikipedia.org/wiki/BLAST
https://es.wikipedia.org/w/index.php?title=NCBI_RefSeq&action=edit&redlink=1
El crecimiento explosivo de la cantidad de datos disponibles requiere de curación,
integración y anotación, que se logra mediante la colaboración colectiva. Desde este
punto de vista, las bases de datos biológicas pueden clasificarse como:
Conservadas por expertos, por ejemplo RefSeq y [The Arabidopsis Information
Resource]] (TAIR).
Conservadas por una comunidad de investigadores, de forma colectiva y
colaborativa, por ejemplo LncRNA Wiki y GeneWiki.
Tipo de datos almacenados
De acuerdo al tipo de datos almacenados en cada base de datos, las bases de datos
biológicas pueden clasificarse de forma genérica en alguna de las siguientes categorías
(se listan algunos ejemplos de bases de datos):
Secuencias nucleotídicas (ADN y ARN): la colaboración de las tres bases de datos
más importantes hace posible acceder a casi toda la información de secuencias de
nucleótidos desde cualquiera de sus tres sedes:
 Bases de datos de EMBL en el European Bioinformatics Institute (EMBL-
EBI). Enlace externo base de datos de nucleótidos de EMBL-EBI
 DNA Data Bank of Japan (DDJB). Enlace externo DDJB
 GenBank en el National Center for Biological Information (NCBI). Enlace
externo GenBank
Si bien son mantenidas por distintos organismos en distintos países, existe una
coordinación entre las distintas bases. Una secuencia enviada a cualquiera de las bases se
verá reflejada en las otras dos en aproximadamente una semana, ya que esa es la
frecuencia de actualización entre las distintas bases genéticas. Por este motivo es
indistinto que base se use para enviar nuevas secuencias, aunque normalmente los
europeos utilizan EMBL y los americanos GenBank.
Proteínas: bases de datos de secuencias, estructuras, e información relacionada.
UniProtKB/Swiss-Prot contiene secuencias anotadas o comentadas, es decir, cada
secuencia ha sido revisada, documentada y enlazada a otras bases de datos. Enlaces
externos UniProtKB, Swissprot en el EBI UniProtKB/TrEMBL por Translation of EMBL
Nucleotide Sequence Database incluye la traducción de todas las secuencias codificantes
derivadas del (EMBL) y que todavía no han podido ser anotadas en Swiss-Prot. Enlaces
http://www.ncbi.nlm.nih.gov/refseq/
https://es.wikipedia.org/w/index.php?title=LncRNA_Wiki&action=edit&redlink=1
https://es.wikipedia.org/wiki/%C3%81cido_desoxirribonucleico
https://es.wikipedia.org/wiki/%C3%81cido_ribonucleico
https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular
http://www.ebi.ac.uk/services
http://www.ebi.ac.uk/services
http://www.ebi.ac.uk/services/dna-rna
https://es.wikipedia.org/wiki/DNA_Data_Bank_of_Japan_(DDJB)
http://www.ddbj.nig.ac.jp/
https://es.wikipedia.org/wiki/GenBank
http://www.ncbi.nlm.nih.gov/
http://www.ncbi.nlm.nih.gov/genbank/
https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular
https://es.wikipedia.org/wiki/GenBank
https://es.wikipedia.org/wiki/Prote%C3%ADna
https://es.wikipedia.org/wiki/Swiss-Prot
https://es.wikipedia.org/w/index.php?title=UniProtKB&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=Swissprot_en_el_EBI&action=edit&redlink=1
https://es.wikipedia.org/w/index.php?title=TrEMBL&action=edit&redlink=1
https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular
https://es.wikipedia.org/wiki/Swiss-Prot
externos TrEMBL, UniProtKB 'PIR por Protein Information Resource está dividida en
cuatro sub-bases que tienen un nivel de anotación decreciente. Enlace externo PIR
 'ENZYME enlaza la clasificación de actividades enzimáticas completa a las
secuencias de Swiss-Prot. Enlace externo ENZYME
 'PROSITE contiene información sobre la estructura secundaria de proteínas,
familias, dominios, etc. Enlace externo PROSITE
 'InterPro integra la información de diversas bases de datos de estructura
secundaria como PROSITE, proporcionando enlaces a otras bases de datos
e información más extensa. Enlace externo INTERPRO
 'Protein Data Bank (PDB) es la base de datos de estructura terciaria 3D de
proteínas que han sido cristalizadas. Enlace externo PDB
Expresión
 El portal de EMBL-EBI ofrece una variedad de bases de datos de expresión
génica. Enlace externo a bases de datos de expresión de EMBL-EBI
Interactomas, reactomas y rutas metabólicas
 Reactome es una base de datos curada y revisada de EMBL-EBI de rutas
de interacción y reacción de proteínas y enzimas. Enlace externo
a Reactome
 APID6 es una base de datos de interacciones proteína-proteína que incluye
interactomas completos para múltiples especies. Enlace externo a APID
Variación genética (SNPs) y enfermedad
 dbSNP de NCBI, ofrece un repositorio central de variaciones genéticas que
comprenden sustituciones simples de nucleótidos y polimorfismos de
inserciones y deleciones cortas. Enlace a dbSNP
 COSMIC es un catálogo de mutaciones somáticas en cáncer, mantenida por
el Wellcome Trust Sanger Institute. Enlace externo a COSMIC
 'OMIM por Online Mendelian Inheritancein Man es un catálogo de genes
humanos relacionados con desórdenes genéticos. Enlace externo OMIM
Literatura
 Pubmed da acceso gratuito al índice de publicaciones de la Biblioteca
Nacional de Medicina (NLM), con enlaces a artículos completos. Enlace
externo PubMed
Ontología
http://www.ebi.ac.uk/trembl/
http://www.uniprot.org/
https://es.wikipedia.org/wiki/PIR
https://web.archive.org/web/20140312021627/http:/pir.georgetown.edu/
https://es.wikipedia.org/w/index.php?title=ENZYME&action=edit&redlink=1
https://es.wikipedia.org/wiki/Swiss-Prot
http://us.expasy.org/enzyme/
https://es.wikipedia.org/wiki/PROSITE
http://us.expasy.org/prosite/
https://es.wikipedia.org/wiki/InterPro
https://es.wikipedia.org/wiki/PROSITE
http://www.ebi.ac.uk/interpro/index.html
https://es.wikipedia.org/wiki/Protein_Data_Bank
https://web.archive.org/web/20080828002005/http:/www.rcsb.org./pdb
https://es.wikipedia.org/wiki/Expresi%C3%B3n_g%C3%A9nica
https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular
https://www.ebi.ac.uk/services/gene-expression
https://es.wikipedia.org/wiki/Metabolismo
https://es.wikipedia.org/w/index.php?title=Reactome&action=edit&redlink=1
https://es.wikipedia.org/wiki/Laboratorio_Europeo_de_Biolog%C3%ADa_Molecular
http://www.reactome.org/
https://es.wikipedia.org/wiki/Base_de_datos_biol%C3%B3gica#cite_note-6
http://apid.dep.usal.es/
https://es.wikipedia.org/wiki/Polimorfismo_de_nucle%C3%B3tido_simple
https://es.wikipedia.org/w/index.php?title=DbSNP&action=edit&redlink=1
https://es.wikipedia.org/wiki/NCBI
http://www.ncbi.nlm.nih.gov/projects/SNP/get_html.cgi?whichHtml=overview
https://es.wikipedia.org/wiki/COSMIC_(base_de_datos)
https://es.wikipedia.org/wiki/Wellcome_Trust_Sanger_Institute
http://cancer.sanger.ac.uk/cosmic
https://es.wikipedia.org/wiki/OMIM
http://www.ncbi.nlm.nih.gov/omim/
https://es.wikipedia.org/wiki/Pubmed
https://es.wikipedia.org/wiki/NLM
http://www.ncbi.nlm.nih.gov/PubMed/
 El proyecto de Ontología Génica (GO) es un esfuerzo colaborativo que
surgió de la necesidad de tener descriptores consistentes de los productos
de genes depositados en distintas bases de datos. Enlace externo a Gene
Ontology Consortium
Genomas
 Ensembl integra genomas eucariotas grandes, por el momento contiene
genoma humano, ratón, rata, fugu, zebrafish, mosquito, Drosophila, C.
elegans, y C. briggsae. Enlace externo Ensembl
 Genomes server y TIGR son portales con información o enlaces de todos
los genomas secuenciados por el momento, desde virus a humanos. Enlace
externo Genome Server, enlace externo TIGR
 Wormbase es el portal del genoma de gusano C. elegans. Enlace
externo Wormbase
 Flybase es el portal de la mosca de la fruta Drosophila melanogaster. Enlace
externo Flybase
Otras
 Taxonomy es el portal de clasificación taxonómica de organismos. Enlace
externo Taxonomy Browser
 Xenobase es el portal del organismo modelo Xenopus laevis. Enlace
externo: Xenbase
 TAIR (The Arabidopsis Information Resource) es el portal de la planta
modelo Arabidopsis thaliana. Enlace externo Arabidopsis
 GYPSY, base de datos de elementos genéticos móviles. Enlace externo The
GYPSY Database of Mobile Genetic Elements
Tipos de bases de datos biológicas
Como hemos visto en secciones anteriores, existen multitud de bases de datos por lo que
resulta útil clasificarlas en grupos. Se pueden hacer diferentes clasificaciones de las BD
dependiendo de diferentes factores. En este capítulo vamos a estudiar las clasificaciones
que atienden a la procedencia de los datos y a la revisión de los mismos. Luego
hablaremos de una iniciativa encaminada a etiquetar las bases de datos de manera estándar
(BioDBCore) y por último veremos cómo las instituciones de referencia en
bioinformática como la revista Nucleic Acids Research, el EBI o el NCBI hacen su propia
clasificación de los datos.
https://es.wikipedia.org/wiki/Ontolog%C3%ADa_G%C3%A9nica
http://geneontology.org/
http://geneontology.org/
https://es.wikipedia.org/wiki/Genoma
https://es.wikipedia.org/wiki/Ensembl
https://web.archive.org/web/20080102093839/http:/www.ebi.ac.uk/ensembl/index.html
https://es.wikipedia.org/w/index.php?title=Genomes_server&action=edit&redlink=1
https://es.wikipedia.org/wiki/TIGR
http://www.ebi.ac.uk/genomes/index.html
http://www.jcvi.org/
https://es.wikipedia.org/w/index.php?title=Wormbase&action=edit&redlink=1
https://web.archive.org/web/20170420234209/http:/www.wormbase.org/
https://es.wikipedia.org/w/index.php?title=Flybase&action=edit&redlink=1
https://es.wikipedia.org/wiki/Drosophila_melanogaster
https://web.archive.org/web/20090815020557/http:/flybase.bio.indiana.edu/
https://es.wikipedia.org/w/index.php?title=Taxonomy&action=edit&redlink=1
https://es.wikipedia.org/wiki/Taxonom%C3%ADa
http://www.ncbi.nlm.nih.gov/Taxonomy/
https://es.wikipedia.org/w/index.php?title=Xenobase&action=edit&redlink=1
http://www.xenbase.org/
https://es.wikipedia.org/w/index.php?title=TAIR_(The_Arabidopsis_Information_Resource)&action=edit&redlink=1
http://www.arabidopsis.org/
https://es.wikipedia.org/w/index.php?title=GYPSY&action=edit&redlink=1
http://gydb.uv.es/index.php/Main_Page
http://gydb.uv.es/index.php/Main_Page
Procedencia de los datos
En términos generales podríamos decir que las bases de datos primarias tienen datos
originales que proceden directamente del experimento y normalmente son incorporadas
por los autores a las bases de datos. Sin embargo, las bases de datos secundarias contienen
datos derivados del análisis de los datos de las bases de datos primarias. Estos análisis se
hacen computacionalmente o manualmente por un revisor.
Bases de datos primarias: GenBank (secuencias nucleotídicas) y PDB (estructuras
procedentes de las técnicas de rayos X y de Resonancia Magnética nuclear). Bases de
datos secundarias: UniProt/SwissProt y PROSITE.
Las bases de datos especializadas están centradas en un campo de investigación concreto
como por ejemplo ZFIN (pez cebra), MGI (ratón), TRANSFAC (factores de
transcripción).
Revisión de los datos
Las bases de datos revisadas están sujetas a un control de la calidad de los datos por parte
de los revisores que se encargan de controlar el proceso de incorporación de los datos, la
actualización y la consistencia de los mismos. Un buen ejemplo de base de datos sometida
a un exhaustivo sistema de revisión tanto manual como computacional es UniProtKB, de
la que hablaremos en detalle más adelante.
Por otro lado, las bases de datos no revisadas no cuentan con la figura de los revisores,
sino que son bases de datos donde los autores introducen libremente sus datos sin la guía
de un experto ni de un vocabulario controlado u ontología. A las bases de datos no
revisadas se las llama también repositorios. Los repositorios normalmente no incluyen
información adicional al dato experimental y además suelen ser redundantes.
Actualmente existen muy pocas bases de datos de este tipo.
Clasificación EBI
El European Bioinformatics Institute (EBI) clasifica las bases de datos en bases de datos
clave y bases de datos especializadas. Las primeras proporcionan colecciones completas
de valor genérico para las ciencias de la vida. Estas se dividen de forma grosera en dos
categorías: aquellas que describen los componentes moleculares de los sistemas
biológicos (por ejemplo, secuencias de nucle´otidos, secuencias de proteínas, estructuras
macromoleculares y moléculas pequeñas) y las que describen sus comportamientos o los
resultados de estos comportamientos (por ejemplo, trascripción, traducción e interacción).
Como ejemplos de la primera tendíamos Ensembl de genomas, ENA de secuencias
nucleotídicas, PDBe de estructuras proteicas o chEBI de entidades químicas. Sin
embargo, las bases de datos PRIDE (proteomas), Reactome (rutas), ArrayExpress
(expresi´on g´enica) o IntAct (interacciones moleculares) formarían parte de la segunda
categoría.
Además de las bases de datos clave,el EBI alberga un gran número de bases de datos
especializadas como European Mutant Mouse Archive que proporciona información
sobre las cepas mutantes de ratón para permitir a los investigadores enlazar la información
fenotípica con las mutaciones o la NonRedundant Patent-Sequence Database Collection
que proporciona acceso a secuencias con aplicaciones patentadas.
Clasificación NCBI
El National Centre for Biotechnology Information (NCBI) clasifica las bases de datos en
las siguientes categorías:
Referencias bibliográficas (PubMed).
Genes y secuencias asociadas (Entrez Gene, UniGene).
Genomas (Entrez Genome, Sequence Read Archive).
Genotipos y fenotipos (dbGaP, dbSNP, OMIM).
Expresión génicas (GEO, GENSAT).
Estructura molecular y proteómica (MMDB).
Clasificación NAR
La revista Nucleic Acids Research publica desde el año 2001 un número anual dedicado
a bases de datos que clasifica en 15 categorías:
Secuencias de Nucle´otidos
Secuencias de RNA
Secuencias de proteínas
Estructura
Bases de Datos Genómicas (invertebrados)
Rutas Metabólicas y de Señalización
Genomas de Humano y otros Vertebrados
Genes humanos y Enfermedades
Datos de Microarrays y otras bases de datos de Expresión
Bases de datos de Proteómica
Otras bases de datos de Biología Molecular
Bases de datos de organelas
Bases de datos de Plantas
Bases de datos Inmunológicas
Biología celular
Acceso
Podemos hablar de tres maneras de acceder a los datos proporcionados por una base de
datos. El sistema más común de acceso a una base de datos es a través de su interfaz web
específica. Sin embargo, en los últimos años el crecimiento en el número de bases de
datos origino la necesidad de unificar las interfaces de búsqueda para facilitar al usuario
el proceso de consulta. Para ello se crearon los llamados entornos integrados como el EBI
o el NCBI de los que hemos hablado en la Subsección. La incorporación de las bases de
datos en entornos integrados llevó aparejado el desarrollo de motores de búsqueda. Así
tenemos Entrez como motor de búsqueda del NCBI o el EB-Eye como motor de búsqueda
del EBI. A través de los motores de búsqueda, el usuario puede obtener una panorámica
de los resultados de un amplio conjunto de bases de datos pertenecientes a un repositorio
haciendo una única consulta.
Otro tipo de acceso, el programático, permite a una máquina y no una persona ejecutar la
consulta y recibir del resultado de la misma. El acceso programático a las bases de datos
permite que el resultado de la consulta a una base de datos sea la consulta a la siguiente
sin la intervención humana. De esta manera se puede automatizar las consultas
construyendo los llamados flujos de trabajo.
El sitio web del EBI es visitado por 300.000 usuarios aproximadamente cada mes y recibe
diariamente 3,5 millones de peticiones. Además, cerca de un millón de trabajos se
ejecutan al mes a través de los servicios web.

Búsqueda
La búsqueda de información en las bases de datos bioinformáticas se suele hacer por
analogía. Pongamos el caso de tener una secuencia proteica sin caracterizar. La secuencia
es una sucesión de caracteres que por sí misma no proporciona mucha información. Sin
embargo, si comparamos esta secuencia con las casi 23 millones secuencias proteicas
existentes en UniProtKB (alineamiento de secuencias), encontraríamos un listado de
secuencias similares a la nuestra. En algunos casos la similitud sería tan grande que
podríamos atribuir a nuestra secuencia las anotaciones de las secuencias similares.
Estaríamos de esta manera caracterizando nuestra secuencia a través de la búsqueda por
semejanza.
Imagina ahora que, con las veinte secuencias más parecidas a tu secuencia problema
(extraídas a partir de la búsqueda por semejanza), generamos una secuencia genérica
(patrón de secuencia) que reúna las características de todas ellas. Esta secuencia a su vez
podría servir para buscar en bases de datos de patrones para encontrar otras secuencias
genéricas similares a la que t´u has generado. Este tipo de búsqueda se encuadraría dentro
del descubrimiento de patrones.
La búsqueda en las bases de datos es un paso fundamental en la construcción de flujos de
trabajo. Por ejemplo, para hacer la predicción de la estructura proteica a partir de su
secuencia por el método de modelado por homología, el primer paso sería consultar a una
base de datos de secuencias para extraer la secuencia más similar a la secuencia problema.
Pero también se pueden hacer búsquedas más especializadas en las bases de datos. Este
es el caso del análisis de la huella peptídica resultante de un experimento de
espectrometría de masas donde normalmente se utilizan bases de datos centradas en el
organismo que se esté estudiando.
Bases de datos biológicas más relevantes
Las bases de datos más relevantes en biología incluyen datos de secuencias de
nucleótidos, proteínas, estructura de proteínas, genomas, expresión genética, bibliografía,
taxonomía, metabolismo, factores de transcripción, etc. Nos podemos hacer una idea de
las bases de datos disponibles en esta base de datos de bases de datos biológicas.
Por: Bioinformatics at Comav (2018).
Principales bases de datos se secuencias de nucleótidos:
National Center for Biotechnology Information NCBI )(EEUU)
European Nucleotide Archive (EMBL) (Europa)
http://www.biodbs.info/
http://www.ncbi.nlm.nih.gov/
http://www.ebi.ac.uk/embl/
Bioinformation and DDBJ Center (DDBJ) (Japón)
Algunas bases de datos de genomas de organismos concretos:
Saccharomyces Genome Database SGD (Levadura)
The Arabidopsis Information Resource TAIR (Arabidopsis)
ENSEML (Hombre, ratón y otros)
Principales bases de datos de proteínas:
Uniprot
Swiss-prot
Protein Data Bank (PDB)
3D Macromolecular Structures (MMDB)
Structural Classification of Proteins (SCOP)
Bibliografía:
Biblioteca Nacional de Medicina de EE. UU. Institutos Nacionales de Salud
(Pubmed)
Rutas metabólicas:
Enciclopedia de Kyoto de genes y genomas (KEGG)
Enfermedades genéticas humanas:
Centro Nacional de Información Biotecnológica , Biblioteca Nacional de
Medicina de EE . UU. (OMIM)

BASES DE DATOS DE LAS CIENCIAS SOCIALES
Por: Consejo Superior de Investigaciones Científicas (2016).
Ciencias sociales
http://www.ddbj.nig.ac.jp/
http://www.yeastgenome.org/
http://www.arabidopsis.org/
http://www.ensembl.org/index.html
http://www.pir.uniprot.org/
http://expasy.org/sprot/
http://www.rcsb.org/pdb/home/home.do
http://130.14.29.110/Structure/MMDB/mmdb.shtml
http://scop.mrc-lmb.cam.ac.uk/scop/
https://www.nlm.nih.gov/
https://www.nlm.nih.gov/
http://www.ncbi.nlm.nih.gov/sites/entrez
http://www.genome.jp/kegg/
https://www.ncbi.nlm.nih.gov/
https://www.nlm.nih.gov/
https://www.nlm.nih.gov/
https://www.nlm.nih.gov/
http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim
ISOC-CSIC. Base de datos de la producción científica española de ciencias
sociales y humanas.
Agencia Española del ISBN. Bases de datos de libros y de editores españoles.
APA Databases. Bases de datos de la Asociación Americana de Psicología.
Biblioteca Nacional de España. Bibliografía Española en línea.
EconLit. American Economic Association. Base de datos de economía.
EBSCO host.
ERIC. Educational Resources Information Center.
HV Wilson Databases. Bases de Datos Wilson.
ISI Web of Knowledge. ThomsonReuters-ISI. (público).
ISI Web of Knowledge. ThomsonReuters-ISI. (acceso via FECYT).
PAO. Periodicals Archive On Line. Base de datos de humanidades y ciencias
sociales.
PIO. Periodicals Index On Line. Base de datos de humanidades y ciencias
sociales.
SCOPUS. Base de datos multidisciplinar producida por Elsevier.
Teseo. Base de datos de tesis doctorales españolas.
Revistas Científicas
Dialnet. Portal de difusión de la producción científica hispana
DOAJ.Directorio de revistas Open Access.
e-Revist@s. Plataforma Open Access de Revistas Científicas Electrónicas
Españolas y Latinoamericanas
EZB. Elektronische Zeitschriftenbibliothek. Electronic Journals Library.
GIGA Journal Family. German Institute of Global and Area Studies.
PERSEE. Portal de Revistas Científicas de Ciencias Humanas y Sociales.
Portal de Revistas Científicas Complutenses.
Raco. Revistas Catalanas con Acceso Abierto.
Redalyc. Portal de revistas de Latinoamérica, España y Portugal.
Revues.org. Fédération de Revues en Sciences Humaines et Sociales. Édition
électronique scientifique
SciELO. Scientific Electronic Library Online.
Estadísticas
http://www.cindoc.csic.es/servicios/dbinfo.htm
http://www.mcu.es/libro/CE/AgenISBN.html
http://www.apa.org/databases/
http://www.bne.es/esp/servicios/bibliografiaesplinea.htm
http://www.aeaweb.org/econlit/index.php
http://www.ebscohost.com/thisMarket.php?marketID=1
http://www.eric.ed.gov/
http://www.hwwilson.com/ftabsind_alpha.htm
http://www.isiwebofknowledge.com/
http://www.accesowok.fecyt.es/login/
http://pao.chadwyck.co.uk/
http://pio.chadwyck.co.uk/
http://info.scopus.com/
https://www.micinn.es/teseo/login.jsp
http://dialnet.unirioja.es/
http://www.doaj.org/
http://www.erevistas.csic.es/
http://ezb.uni-regensburg.de/index.phtml?bibid=AAAAA&colors=7&lang=en
http://www.giga-hamburg.de/english/index.php?file=publications.html&folder=publications
http://www.persee.fr/web/revues/home
http://www.ucm.es/BUCM/revistasBUC/portal/modulos.php?name=principal&col=1
http://www.raco.cat/index.php/index/raco/
http://www.redalyc.org/
http://www.revues.org/
http://www.scielo.org/
Banco Mundial. Datos e Investigación.
CEPAL. Comisión Económica para América Latina y el Caribe.
EuroStat. Estadísticas de la Unión Europea.
FAO. Organización de las Naciones Unidas para la Agricultura y la Alimentación.
FMI. Fondo Monetario Internacional.
INE. Instituto Nacional de Estadística. (España).
OCDE. Organización para la Cooperación y el Desarrollo Económico.
OMS. Organización Mundial de la Salud.
UNESCO. Instituto de Estadísticas de la UNESCO.
UNIDO. Datos Estadísticos Industriales de la UNIDO.

Bases de datos especializadas en ciencias sociales
Por: Águeda González & Lourdes Páez (2018).
ABI/INFORM. Base de datos que recoge bibliografía de más de 2.770 revistas
de comercio y finanzas, condiciones empresariales y económicas, técnicas de
gestión, teoría y práctica de empresa, publicidad, marketing, economía, recursos
humanos, impuestos, informática, etc., de las cuales, más de 1.840 se hallan
accesibles a texto completo. Cobertura internacional ampliada. Acceso a
información sobre más de 60.000 empresas con perfiles empresariales y
ejecutivos.
Aranzadi-Westlaw.es. Base de datos de legislación y jurisprudencia de Aranzadi.
Contiene legislación estatal, autonómica, jurisprudencia del Tribunal Supremo,
del Constitucional y del Tribunal Europeo de Derechos Humanos
Communication Studies. Colección de 19 revistas a texto completo, publicadas
por Sage, sobre periodismo, opinión pública, comunicación política y económica,
estudios culturales, comunicación de masas, televisión. Incluye, además del texto
completo, registros bibliográficos, resúmenes y referencias citadas.
ECONLIT. Versión ampliada del Journal of Economic Literature. Proporciona
diferentes tipos de documentos relativos a teoría económica, historia económica,
econometría, finanzas públicas y de la empresa, instituciones financieras,
demografía, economía internacional, mercado de capitales, etc...
http://www.bancomundial.org/investigacion/
http://www.eclac.org/estadisticas/
http://epp.eurostat.ec.europa.eu/
http://www.fao.org/corp/statistics/es/
http://www.imf.org/external/data.htm
http://www.ine.es/
http://www.oecd.org/
http://www.who.int/research/es/index.html
http://www.uis.unesco.org/
http://www.unido.org/index.php?id=7836
ERIC. Base de datos bibliográfica del Educational Resources Information
Center(ERIC). Contiene referencias con resúmenes de artículos de revistas y
literatura gris ; algunos artículos permiten el acceso al texto completo.
EINIRAS Database Network. Conjunto de bases de datos europeas sobre
relaciones internacionales y geopolítica.
HLAS Online (Handbook of Latin American studies). Base de datos
bibliográfica sobre América Latina que incluye libros y artículos seleccionados y
reseñados por especialistas.
IUSTEL. Portal que recoge legislación y jurisprudencia española y comunitaria.
La Ley. Colección de revistas especializadas en Derecho, incluyendo
jurisprudencia, doctrinas, colaboraciones y comentarios.
PARLIT database. Base de datos bibliográfica sobre parlamentos,
procedimiento parlamentario, sistemas electorales, derecho constitucional y
ciencia política en general.
PeriodicalsArchive Online. Colección de más de 500 revistas a texto completo
de humanidades y ciencias sociales de procedencia internacional.
PsycInFo. Base de datos de la American PsychologicalAssociation (antigua
PSYCLIT)
PSICODOC. Base de datos de artículos de revista y libros del COP y la Facultad
de Psicología de la UCM
Social Work Abstracts. Base de datos bibliográfica que contiene resúmenes y
citas de artículos referentes a trabajo social y servicios sociales
SOCIOLOGICAL ABSTRACTS Literatura mundial en el campo de la sociología
y disciplinas relacionadas. Contiene resúmenes de artículos de unas 2.500 revistas
y de ponencias presentadas a distintos congresos, además de resúmenes de libros,
capítulos de libros, tesis y conferencias.