Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Uniprot y PDB TALLER DE BD – UNM – FEBRERO 2020 (Parte de las diapositivas fueron tomadas de la webpage de EMBL-EBI Training) EMBL-EBI UniProt: explorando la secuencia de proteínas e información funcional www.uniprot.org La misión de UniProt es proporcionar, a la comunidad científica, un recurso integral (de alta calidad y de libre acceso) de secuencia de proteínas e información funcional. http://www.uniprot.org/ http://www.uniprot.org/ http://www.uniprot.org/ http://www.uniprot.org/ http://www.uniprot.org/ Componentes de UniProt ¿De dónde vienen los datos? Secuencias UniProtKB Más del 95% de las secuencias de proteínas proporcionadas por UniProtKB provienen de traducciones de secuencias codificantes (CDS) enviadas a ENA/GenBank/DDBJ -> TrEMBL Además de los CDS traducidos, las secuencias de proteínas UniProtKB pueden provenir de: La base de datos PDB. Secuencias obtenidas por secuenciación directa de proteínas y enviadas a UniProt. Secuencias escaneadas de la literatura. Secuencias derivadas de la predicción de genes pero que no se han enviado a ENA/GenBank/DDBJ. Estas se importan de recursos tales como ENSEMBL y RefSeq. Secuencias UniProtKB Secuencias UniParc y UniRef Secuencias UniParc: UniParc está diseñado para capturar todos los datos de secuencia de proteínas disponibles en las principales BD de secuencias de proteínas. Una lista completa de las BD empleadas se encuentra disponible en el sitio de UniProt. Secuencias UniRef: UniRef proporciona conjuntos de secuencias agrupadas de UniProtKB y seleccionadas de UniParc. Información funcional La información funcional se encuentra en UniProtKB. Evidencia de datos 1. Datos experimentales Evidencia de datos 2. Datos copiados de un experimento caracterizado Evidencia de datos 3. Datos importados Evidencia de datos 4. Datos predichos Cómo acceder y navegar por UniProt Menú desplegable Datasets BLAST: alineación local básica. Sequence alignments: alineación de secuencias múltiples. Retrieve/ID mapping: lista de identificadores para recuperar/asignar entradas de UniProt (desde o hacia una BD externa). Peptide search: búsqueda de sec. peptídicas cortas, encuentra las entradas UniProtKB que tengan una coincidencia exacta con la secuencia de consulta. Cómo buscar en UniProt Entre su búsqueda. Seleccione el dataset Click en la búsqueda avanzada para más opciones. Para buscar uno de los conjuntos de datos de UniProt, proceda de la siguiente manera: 1. Seleccione el conjunto de datos apropiado (la selección predeterminada es UniProtKB). 2. Escriba su consulta. 3. Presione el botón de búsqueda. Búsqueda avanzada Búsqueda avanzada Búsqueda avanzada Explorando los resultados Botones de acción Filtros Columnas Usando la “cesta” de UniProt Usando la “cesta” de UniProt Entrada de UniProtKB Opciones de visualización: entrada, publicaciones, etc. Opciones de visualización Ej. 1: usando Uniprot para encontrar la función proteica Buscar: “CDC7” Ej. 1: usando Uniprot para encontrar la función proteica Nombre, gen, organismo, estado Función (con evidencia en una publicación) Ej. 2: de enfermedad a proteína a variante Ej. 2: de enfermedad a proteína a variante Buscar: “SMA2” UniProt facilita la identificación y recuperación de proteínas relacionadas con una enfermedad y a las variantes que causan la misma. Ej. 2: enf. -> proteína -> variante Ej. 2: enf. -> proteína -> variante Ej. 2: enf. -> proteína -> variante Información adicional de la enfermedad: con un resumen y las variantes que la producen (con las publicaciones). Ej. 3: descargar el proteoma de E. coli (cepa K12) Ej. 3: descargar el proteoma de E. coli (cepa K12) Ej. 3: descargar el proteoma de E. coli (cepa K12) Opciones de visualización: generalidades, componentes, publicaciones Combinación con la información del Protein data bank (https://www.rcsb.org) Protein data bank (https://www.rcsb.org) El Protein Data Bank (PDB) (Banco de Datos de Proteínas) es una BD de estructuras tridimensionales de proteínas y ácidos nucleicos. Estos datos son generalmente obtenidos mediante cristalografía de rayos X o resonancia magnética nuclear. Ejercicio: buscar sólo proteínas con estructura conocida Ejercicio: buscar sólo proteínas con estructura conocida - ¿CÓMO? 1. Haga clic en 'Avanzado' en el cuadro de búsqueda. 2. Seleccione 'Nombre de proteína' del menú desplegable de campo e ingrese 'quinasa' en el cuadro de entrada. 3. Seleccione 'Estructura' en la siguiente fila, luego 'Estructura 3D' y luego 'sí' en los campos desplegables consecutivos. 4. Seleccione 'Organismo' en la siguiente fila e ingrese 'Homo Sapiens‘. 5. Pulse el botón de búsqueda. 6. Llegará a la página de resultados con todos los resultados coincidentes. Actividad con una secuencia extraída de PDB El objetivo de esta actividad es identificar elementos de estructura secundaria de dicha proteína “incógnita”: alfa-hélice, hoja-beta y loops. Para esto, vaya a…. https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html Actividad con una secuencia extraída de PDB 1. En la pestaña “File”, seleccione “Open file”, “PDB file”. Seleccione el archivo “incognita.pdb” y luego presione “load”. 2. Visualice la proteína globalmente. Si mantiene presionado el botón izquierdo del mouse y mueve, va a ver que puede hacer rotar a la proteína en todas las direcciones. Intente identificar los distintos elementos de estructura secundaria. 3. Cuente: Cuántas alfa hélices hay? Cuántas láminas beta? 4. Hemos visto que la estructura de una proteína está ligada con su función. Puede identificar una conformación particular en esta proteína? 5. Logra identificar en la imagen “algo” que no parece pertenecer a la proteína? De qué puede tratarse? Intente relacionarlo con la pregunta anterior.
Compartir