Logo Studenta

TALLER_BD - Clase4

¡Este material tiene más páginas!

Vista previa del material en texto

Uniprot y PDB 
TALLER DE BD – UNM – FEBRERO 2020 
(Parte de las diapositivas fueron tomadas de la webpage de EMBL-EBI Training) 
EMBL-EBI 
UniProt: explorando la secuencia de 
proteínas e información funcional 
 www.uniprot.org 
 
 La misión de UniProt es proporcionar, a la comunidad científica, 
un recurso integral (de alta calidad y de libre acceso) de 
secuencia de proteínas e información funcional. 
http://www.uniprot.org/
http://www.uniprot.org/
http://www.uniprot.org/
http://www.uniprot.org/
http://www.uniprot.org/
Componentes de 
UniProt 
¿De dónde vienen los datos? 
Secuencias UniProtKB 
 Más del 95% de las secuencias de proteínas proporcionadas por 
UniProtKB provienen de traducciones de secuencias codificantes 
(CDS) enviadas a ENA/GenBank/DDBJ -> TrEMBL 
 Además de los CDS traducidos, las secuencias de proteínas 
UniProtKB pueden provenir de: 
 La base de datos PDB. 
 Secuencias obtenidas por secuenciación directa de proteínas y enviadas a 
UniProt. 
 Secuencias escaneadas de la literatura. 
 Secuencias derivadas de la predicción de genes pero que no se han 
enviado a ENA/GenBank/DDBJ. Estas se importan de recursos tales como 
ENSEMBL y RefSeq. 
Secuencias UniProtKB 
Secuencias UniParc y UniRef 
 Secuencias UniParc: UniParc está diseñado para capturar todos 
los datos de secuencia de proteínas disponibles en las 
principales BD de secuencias de proteínas. Una lista completa de 
las BD empleadas se encuentra disponible en el sitio de UniProt. 
 
 Secuencias UniRef: UniRef proporciona conjuntos de secuencias 
agrupadas de UniProtKB y seleccionadas de UniParc. 
Información funcional 
 La información funcional se encuentra en UniProtKB. 
Evidencia de datos 
1. Datos experimentales 
Evidencia de datos 
2. Datos copiados de un experimento caracterizado 
Evidencia de datos 
3. Datos importados 
Evidencia de datos 
4. Datos predichos 
Cómo acceder y navegar por UniProt 
Menú 
desplegable 
Datasets 
BLAST: 
alineación local 
básica. Sequence alignments: 
alineación de secuencias 
múltiples. 
Retrieve/ID mapping: lista de 
identificadores para recuperar/asignar 
entradas de UniProt (desde o hacia una BD 
externa). 
Peptide search: búsqueda de sec. peptídicas cortas, 
encuentra las entradas UniProtKB que tengan una 
coincidencia exacta con la secuencia de consulta. 
Cómo buscar en UniProt 
Entre su 
búsqueda. 
Seleccione 
el dataset 
Click en la búsqueda avanzada 
para más opciones. 
Para buscar uno de los conjuntos de datos de UniProt, proceda de la 
siguiente manera: 
1. Seleccione el conjunto de datos apropiado (la selección predeterminada 
es UniProtKB). 
2. Escriba su consulta. 
3. Presione el botón de búsqueda. 
Búsqueda avanzada 
Búsqueda avanzada 
Búsqueda avanzada 
Explorando los resultados 
Botones 
de acción Filtros 
Columnas 
Usando la “cesta” de UniProt 
Usando la “cesta” de UniProt 
Entrada de UniProtKB 
Opciones de visualización: 
entrada, publicaciones, etc. 
Opciones de visualización 
Ej. 1: usando Uniprot para encontrar 
la función proteica 
Buscar: “CDC7” 
Ej. 1: usando Uniprot para encontrar 
la función proteica 
Nombre, 
gen, 
organismo, 
estado 
Función (con evidencia en una 
publicación) 
Ej. 2: de enfermedad a proteína a 
variante 
Ej. 2: de enfermedad a proteína a 
variante 
Buscar: “SMA2” 
UniProt facilita la identificación y recuperación de proteínas 
relacionadas con una enfermedad y a las variantes que causan la 
misma. 
Ej. 2: enf. -> proteína -> variante 
Ej. 2: enf. -> proteína -> variante 
Ej. 2: enf. -> proteína -> variante 
Información adicional de la 
enfermedad: con un resumen y 
las variantes que la producen 
(con las publicaciones). 
Ej. 3: descargar el proteoma de E. coli 
(cepa K12) 
Ej. 3: descargar el proteoma de E. coli 
(cepa K12) 
Ej. 3: descargar el proteoma de E. coli 
(cepa K12) 
Opciones de 
visualización: 
generalidades, 
componentes, 
publicaciones 
Combinación con la información del 
Protein data bank (https://www.rcsb.org) 
Protein data bank (https://www.rcsb.org) 
El Protein Data Bank (PDB) (Banco de Datos de Proteínas) es una 
BD de estructuras tridimensionales de proteínas y ácidos nucleicos. 
Estos datos son generalmente obtenidos mediante cristalografía de 
rayos X o resonancia magnética nuclear. 
Ejercicio: buscar sólo proteínas con 
estructura conocida 
Ejercicio: buscar sólo proteínas con estructura 
conocida - ¿CÓMO? 
1. Haga clic en 'Avanzado' en el cuadro de búsqueda. 
2. Seleccione 'Nombre de proteína' del menú desplegable de 
campo e ingrese 'quinasa' en el cuadro de entrada. 
3. Seleccione 'Estructura' en la siguiente fila, luego 'Estructura 3D' 
y luego 'sí' en los campos desplegables consecutivos. 
4. Seleccione 'Organismo' en la siguiente fila e ingrese 'Homo 
Sapiens‘. 
5. Pulse el botón de búsqueda. 
6. Llegará a la página de resultados con todos los resultados 
coincidentes. 
Actividad con una secuencia extraída 
de PDB 
El objetivo de esta actividad es identificar elementos de estructura 
secundaria de dicha proteína “incógnita”: alfa-hélice, hoja-beta y 
loops. 
 Para esto, vaya a…. 
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html 
 
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html
Actividad con una secuencia extraída 
de PDB 
1. En la pestaña “File”, seleccione “Open file”, “PDB file”. Seleccione el archivo 
“incognita.pdb” y luego presione “load”. 
2. Visualice la proteína globalmente. Si mantiene presionado el botón izquierdo 
del mouse y mueve, va a ver que puede hacer rotar a la proteína en todas las 
direcciones. Intente identificar los distintos elementos de estructura 
secundaria. 
3. Cuente: Cuántas alfa hélices hay? Cuántas láminas beta? 
4. Hemos visto que la estructura de una proteína está ligada con su función. 
Puede identificar una conformación particular en esta proteína? 
5. Logra identificar en la imagen “algo” que no parece pertenecer a la proteína? 
De qué puede tratarse? Intente relacionarlo con la pregunta anterior.

Continuar navegando