DETECCIÓN DE CNV MEDIANTE SNG, CONCEPTOS Y PARÁMETROS

Genética Humana y Médica

•

SIN SIGLA

Catalina Mercado

6/10/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Genética Humana y Médica

1593 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

DETECCIÓN DE CNV MEDIANTE SNG
La detección de este tipo de variantes se basa en dos principios: a) distancia de las lecturas
alineadas: generalmente las lecturas de tipo extremo pareado (paired-end) se generan a una
distancia conocida en el genoma y cuando las lecturas están alineadas al genoma de
referencia y sus “parejas” se alinean a una distancia diferente del tamaño esperado, o con
una orientación anómala, son indicativas de la presencia de CNV (figura 3-10a, b, c); b)
valores de profundidad de cobertura (depth of coverage) de las lecturas (figura 3-10d, e). Si
se asume que el proceso de secuenciación es uniforme, entonces el número de lecturas
alineadas a un genoma de referencia sigue una distribución de tipo Poisson, por lo que se
espera que sea proporcional al número de veces que esa región aparece en el genoma. Por lo
tanto, todas las regiones que contradigan esta hipótesis son posibles CNV. Esta
aproximación que infiere un análisis en el número de lecturas observadas respecto del
número de copias esperadas por azar representa una extensión de los análisis de tipo aCGH
(hibridación genómica comparativa en microarreglos) o CMA (chromosomal microarray
analysis).

FIGURA
3-10
Procedimientos bioinformáticos para la detección de CNV (deleciones y duplicaciones). A, B y C)
Aproximación de la distancia de las lecturas alineadas que suponen deleciones y duplicaciones. A y B,
respectivamente) En línea azul en gradiente se muestra la región variable y en líneas grises la posible
localización del punto de rotura. D y E) Aproximación por los valores de cobertura de las lecturas respecto
de la posición en el genoma. D) La línea roja indica una menor cobertura mientras que la línea azul señala un
aumento con respecto a la cobertura promedio (línea verde). E) Deleción en la región del cromosoma 1 en la
cual se observa una disminución del número de las lecturas (puntos por debajo de la línea gris); cada punto
representa una lectura en una posición específica (tomado y modificado a partir de Demkow U, Ploski R.
2016, Medvedev et al., 2009).

CONCEPTOS Y PARÁMETROS EN LA SNG
En la SNG existen conceptos utilizados con frecuencia en las publicaciones médicas, por lo
que es importante entenderlos para la interpretación y el análisis de los resultados. A
continuación se describen los principales:

1. Lecturas (o reads): se refiere a las secuencias de un tramo continuo de DNA producto
de la SNG. En general, el tamaño de las lecturas es variable en cada plataforma; en
Illumina, la longitud de todas las lecturas es idéntica y en las plataformas 454 y PacBio se
espera una variación en la longitud.
2. Profundidad de cobertura (depth of coverage): se emplea de manera indistinta como
profundidad o cobertura (depth, coverage) y se refiere al número promedio de veces que
un nucleótido o una región del genoma se secuenció y está presente en las lecturas (# de
lecturas, * amplitud de las lecturas/tamaño del genoma blanco). Es un valor que permite
evaluar la fiabilidad de la asignación en una posición específica del genoma. Una
profundidad >30X casi siempre se acepta para distinguir con seguridad las variantes
verdaderas de los errores posibles en la secuenciación. El término amplitud de cobertura
(breadth of coverage) se usa en términos del porcentaje del genoma que se secuenció por
lo menos con una lectura (tamaño del genoma ensamblado o el tamaño del genoma
blanco) (figura 3-11).

FIGURA
3-11
Visualización de los alineamientos de las lecturas con una secuencia de referencia. A) Diagrama que muestra
los conceptos de lectura, profundidad y amplitud de cobertura. B) Visualización de un alineamiento de las
lecturas con el programa Tablet v.1.13.05.02. En verde se representan las adeninas, en rojo las guaninas, en
amarillo las citosinas y en morado las timinas. Las regiones en blanco son zonas en las cuales no hay lecturas
presentes para esas posiciones. La secuencia consenso (contig) se deriva del alineamiento de las lecturas, ya
sea con una secuencia de referencia o en un ensamble de novo.

3. Genoteca: colección de fragmentos aleatorios de DNA de un tamaño homogéneo
provenientes de un genoma (para estudio de genoma completo o exoma) o grupo de
genes (con función específica, como panel de genes mitocondriales) de uno o más
individuos (genotecas metagenómicas). Es necesario unir a uno o ambos extremos de los
fragmentos y adaptadores específicos de cada una antes de someterlos a las plataformas
de secuenciación masiva.