Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
G E N Ó M I C A M I C R O B I A N A 197 U N ID A D 2 para el registro o anotación, el proceso de identificar los genes y otras regiones funcionales del genoma (se tratará en la próxima sección). Algunas veces la secuenciación y el ensamblado no produ- cen una secuencia completa del genoma y quedan huecos en él. Cuando ocurre esto, se emplean diversos enfoques para obtener secuencias individuales que cubran los huecos. Algunos proyec- tos genómicos tienen el objetivo de obtener un genoma cerrado, lo que pretende que toda la secuencia del genoma quede deter- minada. Otros proyectos se detienen en la fase de borrador, y prescinden de la secuenciación de los pequeños huecos. Puesto que la secuenciación al azar y el ensamblaje son procedimien- tos muy automatizados, pero el cierre de huecos no lo es, la obtención de un genoma cerrado es mucho más cara y lenta que la generación de una secuencia borrador del genoma, y por ello habitualmente necesita mucho más esfuerzo humano para completar el trabajo. MINIRREVISIÓN ¿Qué es la secuenciación al azar? ¿Cuáles son las características que definen los métodos de secuenciación de tercera y cuarta generación? ¿Qué se obtiene durante el ensamblado de un genoma? 6.3 Bioinformática y anotación del genoma Una vez completados la secuenciación y el ensamblaje, el siguiente paso es el registro o anotación del genoma, la con- versión de los datos iniciales de la secuencia en una lista de los genes y otras secuencias funcionales presentes en el genoma. La bioinformática se refiere al uso de la informática para almace- nar y analizar las secuencias y estructuras de los ácidos nuclei- cos y de las proteínas. Los métodos de secuenciación de última generación (Sección 6.2) están generando datos más rápida- mente de lo que pueden ser analizados adecuadamente. Por tanto, en la actualidad, la anotación es el cuello de botella de la genómica. La mayoría de los genes codifican proteínas, y en la mayoría de los genomas microbianos, especialmente en los de los procario- tas, la mayor parte del genoma consiste en secuencias codifican- tes. Como los genomas de los eucariotas microbianos contienen menos intrones ( Sección 4.9) que los genomas de los anima- les y de las plantas, y los procariotas no tienen prácticamente ninguno, los genomas microbianos consisten esencialmente en una serie de «marcos abiertos de lectura», u ORF (del inglés open reading frame), separados por regiones cortas regulado- ras y terminadores transcripcionales. Recordemos que un marco abierto de lectura es una secuencia de DNA o RNA que puede traducirse para producir un polipéptido ( Sección 4.11). ¿Cómo encuentra un ORF el ordenador? Un ORF funcional es una secuencia que codifica una proteína. Así, el modo más sencillo de localizar genes potenciales que codifican proteínas es realizar una búsqueda computarizada a través de la secuencia del genoma para identificar los ORF (Figura 6.6). Aunque cualquier gen se transcribe siempre desde (chip) de silicio, que se anuncia como «el medidor de pH más pequeño del mundo», detecta los protones. La secuenciación es extremadamente rápida con este método y los instrumentos son mucho menos costosos que los de las teconologías ante- riores. Por ejemplo, la máquina Ion Torrent puede secuenciar el genoma humano completo —casi 3.000 Mbp— en menos de un día. La tecnología de nanoporos (Figura 6.4b) se basa en una maquinaria microscópica que opera a la escala de una sola molé- cula. Los nanoporos detectores de DNA son poros extremada- mente estrechos que permiten el paso a través de ellos de una única cadena de DNA, de una en una. En el sistema de Oxford Nanopore Technologies el DNA pasa a través de nanoporos biológicos hechos de proteína (Figura 6.4b). Mientras la molé- cula de DNA transita por el poro, un detector recoge los cam- bios de la corriente eléctrica a través del nanoporo. Este cambio de corriente es diferente para cada una de las cuatro bases o combinaciones de estas bases. Las ventajas principales de la tecnología de nanoporos son su alta velocidad y la posibilidad de secuenciar moléculas largas de DNA (en vez de fragmentos cortos, como en los otros métodos). Además, muchos nanopo- ros pueden ensamblarse juntos en un área muy pequeña de un microchip, de modo que se pueden secuenciar simultánea- mente muchos fragmentos largos de DNA. Ensamblado del genoma Independientemente de cómo se secuencia el DNA, las secuen- cias deben ser ensambladas antes de que sean analizadas. El ensamblado de un genoma consiste en poner los fragmentos en el orden correcto y eliminar los solapamientos. En la práctica, es un ordenador el que examina muchos fragmentos pequeños de DNA secuenciados y deduce su orden a partir de los solapa- mientos (Figura 6.5). El ensamblado genera un genoma adecuado Fragmentos secuenciados T A G G T T A C C A C T C G A A T A G G T T A C C A C T C G A A C C A C T C G A A C T C G A A G G T T A C C A G T T A C C A C T T A G G T T T A C C A C T T A G G T T G T T A C C G G T T A C C A G T T A C C A C T T A C C A C T C C A C T C G A A C T C G A A G T T A C C El DNA se divide en fragmentos y se secuencia. El análisis informático encuentra solapamientos. Se deduce la secuencia. Secuencia de DNA desconocida Figura 6.5 Ensamblado de una secuencia de DNA por ordenador. La mayoría de los métodos de secuenciación del DNA generan gran cantidad de secuencias cortas (de 30 a varios centenares de bases) que deben ser ensambladas. Los algoritmos informáticos buscan solapamientos en estas secuencias cortas y los ordena hasta formar una secuencia única total. https://booksmedicos.org booksmedicos.org Botón1:
Compartir