TALLER_BD - Clase4

Principios de Banco de Datos

•

SIN SIGLA

Agustina Guerrero

19/9/2023

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Principios de Banco de Datos

1728 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Uniprot y PDB
TALLER DE BD – UNM – FEBRERO 2020
(Parte de las diapositivas fueron tomadas de la webpage de EMBL-EBI Training)
EMBL-EBI
UniProt: explorando la secuencia de
proteínas e información funcional
 www.uniprot.org

 La misión de UniProt es proporcionar, a la comunidad científica,
un recurso integral (de alta calidad y de libre acceso) de
secuencia de proteínas e información funcional.
http://www.uniprot.org/
http://www.uniprot.org/
http://www.uniprot.org/
http://www.uniprot.org/
http://www.uniprot.org/
Componentes de
UniProt
¿De dónde vienen los datos?
Secuencias UniProtKB
 Más del 95% de las secuencias de proteínas proporcionadas por
UniProtKB provienen de traducciones de secuencias codificantes
(CDS) enviadas a ENA/GenBank/DDBJ -> TrEMBL
 Además de los CDS traducidos, las secuencias de proteínas
UniProtKB pueden provenir de:
 La base de datos PDB.
 Secuencias obtenidas por secuenciación directa de proteínas y enviadas a
UniProt.
 Secuencias escaneadas de la literatura.
 Secuencias derivadas de la predicción de genes pero que no se han
enviado a ENA/GenBank/DDBJ. Estas se importan de recursos tales como
ENSEMBL y RefSeq.
Secuencias UniProtKB
Secuencias UniParc y UniRef
 Secuencias UniParc: UniParc está diseñado para capturar todos
los datos de secuencia de proteínas disponibles en las
principales BD de secuencias de proteínas. Una lista completa de
las BD empleadas se encuentra disponible en el sitio de UniProt.

 Secuencias UniRef: UniRef proporciona conjuntos de secuencias
agrupadas de UniProtKB y seleccionadas de UniParc.
Información funcional
 La información funcional se encuentra en UniProtKB.
Evidencia de datos
1. Datos experimentales
Evidencia de datos
2. Datos copiados de un experimento caracterizado
Evidencia de datos
3. Datos importados
Evidencia de datos
4. Datos predichos
Cómo acceder y navegar por UniProt
Menú
desplegable
Datasets
BLAST:
alineación local
básica. Sequence alignments:
alineación de secuencias
múltiples.
Retrieve/ID mapping: lista de
identificadores para recuperar/asignar
entradas de UniProt (desde o hacia una BD
externa).
Peptide search: búsqueda de sec. peptídicas cortas,
encuentra las entradas UniProtKB que tengan una
coincidencia exacta con la secuencia de consulta.
Cómo buscar en UniProt
Entre su
búsqueda.
Seleccione
el dataset
Click en la búsqueda avanzada
para más opciones.
Para buscar uno de los conjuntos de datos de UniProt, proceda de la
siguiente manera:
1. Seleccione el conjunto de datos apropiado (la selección predeterminada
es UniProtKB).
2. Escriba su consulta.
3. Presione el botón de búsqueda.
Búsqueda avanzada
Búsqueda avanzada
Búsqueda avanzada
Explorando los resultados
Botones
de acción Filtros
Columnas
Usando la “cesta” de UniProt
Usando la “cesta” de UniProt
Entrada de UniProtKB
Opciones de visualización:
entrada, publicaciones, etc.
Opciones de visualización
Ej. 1: usando Uniprot para encontrar
la función proteica
Buscar: “CDC7”
Ej. 1: usando Uniprot para encontrar
la función proteica
Nombre,
gen,
organismo,
estado
Función (con evidencia en una
publicación)
Ej. 2: de enfermedad a proteína a
variante
Ej. 2: de enfermedad a proteína a
variante
Buscar: “SMA2”
UniProt facilita la identificación y recuperación de proteínas
relacionadas con una enfermedad y a las variantes que causan la
misma.
Ej. 2: enf. -> proteína -> variante
Ej. 2: enf. -> proteína -> variante
Ej. 2: enf. -> proteína -> variante
Información adicional de la
enfermedad: con un resumen y
las variantes que la producen
(con las publicaciones).
Ej. 3: descargar el proteoma de E. coli
(cepa K12)
Ej. 3: descargar el proteoma de E. coli
(cepa K12)
Ej. 3: descargar el proteoma de E. coli
(cepa K12)
Opciones de
visualización:
generalidades,
componentes,
publicaciones
Combinación con la información del
Protein data bank (https://www.rcsb.org)
Protein data bank (https://www.rcsb.org)
El Protein Data Bank (PDB) (Banco de Datos de Proteínas) es una
BD de estructuras tridimensionales de proteínas y ácidos nucleicos.
Estos datos son generalmente obtenidos mediante cristalografía de
rayos X o resonancia magnética nuclear.
Ejercicio: buscar sólo proteínas con
estructura conocida
Ejercicio: buscar sólo proteínas con estructura
conocida - ¿CÓMO?
1. Haga clic en 'Avanzado' en el cuadro de búsqueda.
2. Seleccione 'Nombre de proteína' del menú desplegable de
campo e ingrese 'quinasa' en el cuadro de entrada.
3. Seleccione 'Estructura' en la siguiente fila, luego 'Estructura 3D'
y luego 'sí' en los campos desplegables consecutivos.
4. Seleccione 'Organismo' en la siguiente fila e ingrese 'Homo
Sapiens‘.
5. Pulse el botón de búsqueda.
6. Llegará a la página de resultados con todos los resultados
coincidentes.
Actividad con una secuencia extraída
de PDB
El objetivo de esta actividad es identificar elementos de estructura
secundaria de dicha proteína “incógnita”: alfa-hélice, hoja-beta y
loops.
 Para esto, vaya a….
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html

https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html
Actividad con una secuencia extraída
de PDB
1. En la pestaña “File”, seleccione “Open file”, “PDB file”. Seleccione el archivo
“incognita.pdb” y luego presione “load”.
2. Visualice la proteína globalmente. Si mantiene presionado el botón izquierdo
del mouse y mueve, va a ver que puede hacer rotar a la proteína en todas las
direcciones. Intente identificar los distintos elementos de estructura
secundaria.
3. Cuente: Cuántas alfa hélices hay? Cuántas láminas beta?
4. Hemos visto que la estructura de una proteína está ligada con su función.
Puede identificar una conformación particular en esta proteína?
5. Logra identificar en la imagen “algo” que no parece pertenecer a la proteína?
De qué puede tratarse? Intente relacionarlo con la pregunta anterior.