Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
DETECCIÓN DE CNV MEDIANTE SNG La detección de este tipo de variantes se basa en dos principios: a) distancia de las lecturas alineadas: generalmente las lecturas de tipo extremo pareado (paired-end) se generan a una distancia conocida en el genoma y cuando las lecturas están alineadas al genoma de referencia y sus “parejas” se alinean a una distancia diferente del tamaño esperado, o con una orientación anómala, son indicativas de la presencia de CNV (figura 3-10a, b, c); b) valores de profundidad de cobertura (depth of coverage) de las lecturas (figura 3-10d, e). Si se asume que el proceso de secuenciación es uniforme, entonces el número de lecturas alineadas a un genoma de referencia sigue una distribución de tipo Poisson, por lo que se espera que sea proporcional al número de veces que esa región aparece en el genoma. Por lo tanto, todas las regiones que contradigan esta hipótesis son posibles CNV. Esta aproximación que infiere un análisis en el número de lecturas observadas respecto del número de copias esperadas por azar representa una extensión de los análisis de tipo aCGH (hibridación genómica comparativa en microarreglos) o CMA (chromosomal microarray analysis). FIGURA 3-10 Procedimientos bioinformáticos para la detección de CNV (deleciones y duplicaciones). A, B y C) Aproximación de la distancia de las lecturas alineadas que suponen deleciones y duplicaciones. A y B, respectivamente) En línea azul en gradiente se muestra la región variable y en líneas grises la posible localización del punto de rotura. D y E) Aproximación por los valores de cobertura de las lecturas respecto de la posición en el genoma. D) La línea roja indica una menor cobertura mientras que la línea azul señala un aumento con respecto a la cobertura promedio (línea verde). E) Deleción en la región del cromosoma 1 en la cual se observa una disminución del número de las lecturas (puntos por debajo de la línea gris); cada punto representa una lectura en una posición específica (tomado y modificado a partir de Demkow U, Ploski R. 2016, Medvedev et al., 2009). CONCEPTOS Y PARÁMETROS EN LA SNG En la SNG existen conceptos utilizados con frecuencia en las publicaciones médicas, por lo que es importante entenderlos para la interpretación y el análisis de los resultados. A continuación se describen los principales: 1. Lecturas (o reads): se refiere a las secuencias de un tramo continuo de DNA producto de la SNG. En general, el tamaño de las lecturas es variable en cada plataforma; en Illumina, la longitud de todas las lecturas es idéntica y en las plataformas 454 y PacBio se espera una variación en la longitud. 2. Profundidad de cobertura (depth of coverage): se emplea de manera indistinta como profundidad o cobertura (depth, coverage) y se refiere al número promedio de veces que un nucleótido o una región del genoma se secuenció y está presente en las lecturas (# de lecturas, * amplitud de las lecturas/tamaño del genoma blanco). Es un valor que permite evaluar la fiabilidad de la asignación en una posición específica del genoma. Una profundidad >30X casi siempre se acepta para distinguir con seguridad las variantes verdaderas de los errores posibles en la secuenciación. El término amplitud de cobertura (breadth of coverage) se usa en términos del porcentaje del genoma que se secuenció por lo menos con una lectura (tamaño del genoma ensamblado o el tamaño del genoma blanco) (figura 3-11). FIGURA 3-11 Visualización de los alineamientos de las lecturas con una secuencia de referencia. A) Diagrama que muestra los conceptos de lectura, profundidad y amplitud de cobertura. B) Visualización de un alineamiento de las lecturas con el programa Tablet v.1.13.05.02. En verde se representan las adeninas, en rojo las guaninas, en amarillo las citosinas y en morado las timinas. Las regiones en blanco son zonas en las cuales no hay lecturas presentes para esas posiciones. La secuencia consenso (contig) se deriva del alineamiento de las lecturas, ya sea con una secuencia de referencia o en un ensamble de novo. 3. Genoteca: colección de fragmentos aleatorios de DNA de un tamaño homogéneo provenientes de un genoma (para estudio de genoma completo o exoma) o grupo de genes (con función específica, como panel de genes mitocondriales) de uno o más individuos (genotecas metagenómicas). Es necesario unir a uno o ambos extremos de los fragmentos y adaptadores específicos de cada una antes de someterlos a las plataformas de secuenciación masiva.
Compartir