Logo Studenta

Biologia de los microorganismos-1068 (415)

¡Estudia con miles de materiales!

Vista previa del material en texto

G E N Ó M I C A M I C R O B I A N A 197
U
N
ID
A
D
 2
para el registro o anotación, el proceso de identificar los genes y 
otras regiones funcionales del genoma (se tratará en la próxima 
sección).
Algunas veces la secuenciación y el ensamblado no produ-
cen una secuencia completa del genoma y quedan huecos en él. 
Cuando ocurre esto, se emplean diversos enfoques para obtener 
secuencias individuales que cubran los huecos. Algunos proyec-
tos genómicos tienen el objetivo de obtener un genoma cerrado, 
lo que pretende que toda la secuencia del genoma quede deter-
minada. Otros proyectos se detienen en la fase de borrador, y 
prescinden de la secuenciación de los pequeños huecos. Puesto 
que la secuenciación al azar y el ensamblaje son procedimien-
tos muy automatizados, pero el cierre de huecos no lo es, la 
obtención de un genoma cerrado es mucho más cara y lenta 
que la generación de una secuencia borrador del genoma, y por 
ello habitualmente necesita mucho más esfuerzo humano para 
completar el trabajo.
MINIRREVISIÓN
 ¿Qué es la secuenciación al azar?
 ¿Cuáles son las características que definen los métodos de 
secuenciación de tercera y cuarta generación?
 ¿Qué se obtiene durante el ensamblado de un genoma?
6.3 Bioinformática y anotación 
del genoma
Una vez completados la secuenciación y el ensamblaje, el 
siguiente paso es el registro o anotación del genoma, la con-
versión de los datos iniciales de la secuencia en una lista de los 
genes y otras secuencias funcionales presentes en el genoma. La 
bioinformática se refiere al uso de la informática para almace-
nar y analizar las secuencias y estructuras de los ácidos nuclei-
cos y de las proteínas. Los métodos de secuenciación de última 
generación (Sección 6.2) están generando datos más rápida-
mente de lo que pueden ser analizados adecuadamente. Por 
tanto, en la actualidad, la anotación es el cuello de botella de 
la genómica.
La mayoría de los genes codifican proteínas, y en la mayoría de 
los genomas microbianos, especialmente en los de los procario-
tas, la mayor parte del genoma consiste en secuencias codifican-
tes. Como los genomas de los eucariotas microbianos contienen 
menos intrones ( Sección 4.9) que los genomas de los anima-
les y de las plantas, y los procariotas no tienen prácticamente 
ninguno, los genomas microbianos consisten esencialmente en 
una serie de «marcos abiertos de lectura», u ORF (del inglés 
open reading frame), separados por regiones cortas regulado-
ras y terminadores transcripcionales. Recordemos que un marco 
abierto de lectura es una secuencia de DNA o RNA que puede 
traducirse para producir un polipéptido ( Sección 4.11).
¿Cómo encuentra un ORF el ordenador?
Un ORF funcional es una secuencia que codifica una proteína. 
Así, el modo más sencillo de localizar genes potenciales que 
codifican proteínas es realizar una búsqueda computarizada 
a través de la secuencia del genoma para identificar los ORF 
(Figura 6.6). Aunque cualquier gen se transcribe siempre desde 
(chip) de silicio, que se anuncia como «el medidor de pH más 
pequeño del mundo», detecta los protones. La secuenciación 
es extremadamente rápida con este método y los instrumentos 
son mucho menos costosos que los de las teconologías ante-
riores. Por ejemplo, la máquina Ion Torrent puede secuenciar 
el genoma humano completo —casi 3.000 Mbp— en menos de 
un día.
La tecnología de nanoporos (Figura  6.4b) se basa en una 
maquinaria microscópica que opera a la escala de una sola molé-
cula. Los nanoporos detectores de DNA son poros extremada-
mente estrechos que permiten el paso a través de ellos de una 
única cadena de DNA, de una en una. En el sistema de Oxford 
Nanopore Technologies el DNA pasa a través de nanoporos 
biológicos hechos de proteína (Figura 6.4b). Mientras la molé-
cula de DNA transita por el poro, un detector recoge los cam-
bios de la corriente eléctrica a través del nanoporo. Este cambio 
de corriente es diferente para cada una de las cuatro bases o 
combinaciones de estas bases. Las ventajas principales de la 
tecnología de nanoporos son su alta velocidad y la posibilidad 
de secuenciar moléculas largas de DNA (en vez de fragmentos 
cortos, como en los otros métodos). Además, muchos nanopo-
ros pueden ensamblarse juntos en un área muy pequeña de un 
microchip, de modo que se pueden secuenciar simultánea-
mente muchos fragmentos largos de DNA.
Ensamblado del genoma
Independientemente de cómo se secuencia el DNA, las secuen-
cias deben ser ensambladas antes de que sean analizadas. El 
ensamblado de un genoma consiste en poner los fragmentos en 
el orden correcto y eliminar los solapamientos. En la práctica, 
es un ordenador el que examina muchos fragmentos pequeños 
de DNA secuenciados y deduce su orden a partir de los solapa-
mientos (Figura 6.5). El ensamblado genera un genoma adecuado 
Fragmentos
secuenciados
T A G G T T A C C A C T C G A A 
T A G G T T A C C A C T C G A A
C C A C T C G A A
C T C G A A G G T T A C C A
G T T A C C A C T T A G G T T
T A C C A C T
T A G G T T
G T T A C C
G G T T A C C A
G T T A C C A C T
T A C C A C T
C C A C T C G A A
C T C G A A
G T T A C C
El DNA se divide en fragmentos
y se secuencia.
El análisis informático encuentra
solapamientos.
Se deduce la secuencia.
Secuencia
de DNA desconocida
Figura 6.5 Ensamblado de una secuencia de DNA por ordenador. La
mayoría de los métodos de secuenciación del DNA generan gran cantidad 
de secuencias cortas (de 30 a varios centenares de bases) que deben ser 
ensambladas. Los algoritmos informáticos buscan solapamientos en estas 
secuencias cortas y los ordena hasta formar una secuencia única total.
https://booksmedicos.org
	booksmedicos.org
	Botón1:

Continuar navegando