Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
VARIACIÓN DEL GENOMA NUCLEAR HUMANO Uno de los objetivos del Proyecto del Genoma Humano (PGH) fue conocer la forma en que está constituido el genoma humano nuclear. Iniciado a principios del decenio de 1990, el PGH publicó en 2001 el primer borrador de la secuencia del genoma humano y en 2003 una secuencia que comprendía ≈99.7% de la región eucromática, interrumpida tan sólo por ≈300 huecos y con un error de 1 nucleótido por cada 100 000 bases. En particular, la secuenciación del genoma humano proporcionó una mayor comprensión para catalogar e interpretar la variación genética entre los individuos. Los tipos principales de variaciones genéticas son polimorfismos en la longitud de los fragmentos de restricción (RFLP, restriction fragment length polymorphism), secuencias repetidas en tándem que comprenden a los minisatélites (VNTR, variable number of tandem repeats) y los microsatélites (STR, short tandem repeat), variantes de un solo nucleótido (SNV, single nucleotide variant) ahora llamados variantes de un solo nucleótido (SNV, single nucleotide variant), inserciones/deleciones o indel (insertion/deletion) y variaciones estructurales que incluyen a las variantes en el número de copias de una región genómica o CNV (copy-number variations) y los rearreglos cromosómicos balanceados crípticos. Cerca del 99.9% de la secuencia del DNA es idéntico entre dos individuos diferentes. El 0.1% restante es variable, corresponde a SNV y, aunque representa una pequeña proporción del genoma total, afecta a cerca de 10 millones de nucleótidos. En los años posteriores al PGH se crearon varios consorcios para analizar la variabilidad en los genomas; en particular, el Proyecto de los 1 000 genomas secuenció a 2 054 individuos de 26 poblaciones, lo que produjo información acerca de otros tipos de variaciones genéticas que incluyen la llamada variación estructural. Un genoma humano típico difiere del de referencia en 4.1 a 5.0 millones de sitios y, a pesar de que 99.9% de esas variantes corresponde a SNV e indel, las variantes estructurales afectan a un mayor número de nucleótidos. Por consiguiente, la escala de diversidad en el genoma humano es muy amplia, desde un nucleótido en la secuencia del DNA hasta pérdidas o ganancias de millones de pares de nucleótidos visibles al microscopio, lo que se traduce en una variación significativa en el fenotipo. POLIMORFISMOS EN LA LONGITUD DE LOS FRAGMENTOS DE RESTRICCIÓN (O RFLP) Los RFLP fueron las primeras variantes descritas en el genoma humano. Un RFLP es cualquier cambio en la secuencia del DNA que da lugar a la creación o eliminación de un sitio de reconocimiento para una endonucleasa de restricción específica. Se pueden identificar por la digestión del DNA genómico de un individuo con una endonucleasa de restricción y su posterior hibridación con una sonda de DNA que incluya la secuencia blanco para la enzima empleada (hibridación de tipo Southern). En la actualidad se utilizan oligonucleótidos que flanquean la secuencia variable para amplificar el segmento que la contiene y los amplicones obtenidos se digieren con una enzima de restricción (PCR- RFLP). De acuerdo con la presencia o ausencia del sitio de corte se pueden identificar los dos alelos posibles en una muestra de DNA y conocer si se hallan en estado homocigoto o heterocigoto (figura 1). Los RFLP pueden corresponder a variantes de tipo SNV o indel, que a menudo se relacionan con la creación o eliminación de un sitio de reconocimiento de una enzima de restricción. Los RFLP fueron los primeros marcadores moleculares empleados en los estudios de ligamiento para identificar genes causantes de enfermedades monogénicas. Además, los RFLP hicieron posible resolver los primeros casos de criminalística; en 1985, el genetista británico Alec J. Jeffreys descubrió que al usar sondas de DNA para secuencias cortas repetidas en tándem de loci hipervariables podía identificarse un patrón único de RFLP en cada individuo. Las diferencias en el tamaño de los fragmentos se deben a que forman bloques con un número variable de repeticiones en tándem (VNTR), que corresponden a DNA minisatélite; por lo tanto, existe variación entre los alelos y son muy polimórficos en las poblaciones. FIGURA 1 Tipos de variaciones genéticas en la secuencia y la estructura del genoma humano. A. Variante de un solo nucleótido (SNV) en estado heterocigoto. Este cambio genera un polimorfismo en la longitud de los fragmentos de restricción (RFLP) cuando se corta con la enzima de restricción Acc36I que reconoce la secuencia ACCTGC. B. Minisatélite (VNTR): repeticiones en tándem de número variable, unidad de 12pb en estado heterocigoto con 12 y 17 repeticiones de longitud. C. Microsatélite de clase dinucleótida (CA)n (STR), repeticiones cortas en tándem, en estado heterocigoto con cuatro y siete repeticiones. D. Variante por inserción/deleción (indel) en estado heterocigoto. E. Variante en el número de copias (CNV) que incluye la secuencia de referencia, la deleción del segmento B, la duplicación de B y la inversión de las secuencias B y C. VARIANTES DE REPETICIONES EN TÁNDEM Las variantes de las secuencias repetidas en tándem se clasifican de acuerdo con el tamaño de la unidad de repetición y la longitud del bloque de repeticiones en VNTR o minisatélite y STR o microsatélite, si bien hasta la fecha no existe un consenso acerca de la definición precisa de ambos tipos de repeticiones (figura 1). En este texto se considera el tamaño de la unidad de repetición de los VNTR de seis a varias centenas de nucleótidos, mientras que los STR comprenden desde repeticiones mononucleótidas [tractos de poli(A)] hasta los de clase pentanucleótida. La longitud completa del tracto de repeticiones también varía, de 102 a 103 pb y <10 a 102 pb para los minisatélites y microsatélites, respectivamente. El que las secuencias mini y microsatélite sean muy polimórficas es resultado de errores durante su replicación en la que, debido a la presencia de estructuras anómalas en el DNA, las DNA polimerasas incrementan o reducen el número de unidades de repetición. Los errores en la recombinación entre cromosomas homólogos o cromátidas hermanas también pueden modificar el número de unidades de repetición presentes en uno o ambos alelos. A diferencia de los SNV, que en general son bialélicos, las variantes de repeticiones en tándem poseen alelos múltiples en la población. En consecuencia, se ha calculado que no existen dos individuos con la misma combinación exacta de alelos y son la base para los análisis de las huellas génicas o de DNA, por lo que al analizar un número suficiente de estos marcadores se puede establecer un perfil de DNA único para cada persona. Los microsatélites tienen una tasa elevada de mutación y pueden ser variantes de riesgo en enfermedades complejas, constituir variantes patogénicas (como en los trastornos por amplificación de microsatélites), o emplearse en estudios de asociación y ligamiento, en genética forense y en estudios de genética de poblaciones. VARIANTES DE UN SOLO NUCLEÓTIDO (SNV) Se ha calculado que existe un SNV cada 300 a 1 000 pb en el genoma humano y de la mayoría sólo existen dos alelos y una minoría es trialélica (figura 1). Las ventajas de las SNV en estudios de asociación son su gran abundancia y el hecho de que pueden tipificarse de forma sencilla y rápida en el laboratorio, incluida la identificación de millones de ellas mediante arreglos; no obstante, su bajo polimorfismo reduce su utilidad como marcadores para estudios de ligamiento y mapeo génico. Las SNV se localizan en regiones génicas y extragénicas y las que ocurren en genes pueden hallarse en regiones codificantes o no. De la localización de la SNV depende el efecto que tenga en la regulación de los genes o en los productos codificados. En las regiones codificantes pueden incluirse en la redundancia del código genético y dar origen a SNV sinónimas, o cambiar el residuo de aminoácido en la proteína (SNV no sinónima). Existen variantes poco consideradas en los estudiosde asociación que se localizan en las regiones transcritas de los genes, afectan las funciones del RNA y en conjunto se conocen como SNV estructurales del RNA (rSNV). Los grupos de SNV contiguas en un mismo cromosoma se heredan en bloques y a este patrón de SNV en un bloque se lo conoce como haplotipo; el proyecto HapMap caracterizó este tipo de variación en las poblaciones humanas. INSERCIONES/DELECIONES (INDEL) Las indel reciben su nombre por una contracción de inserción y deleción, que se refiere a los cambios en las secuencias de DNA entre individuos debidos a la adición o la eliminación de nucleótidos, en los que es imposible determinar si ocurrió una ganancia o una pérdida respecto del genoma ancestral. Aunque el tamaño original de las indel comprendía 1 a 10 000 nucleótidos, la convención actual reserva este término para describir inserciones o deleciones de 1 a 50 nucleótidos, cifra arbitraria escogida por los resultados de los métodos de secuenciación masiva en paralelo. En sentido estricto, una indel corresponde a una variación en el número de copias y podría confundirse con una CNV; por ello se han definido con base en su tamaño. Las variaciones indel suscitan gran interés porque pueden alterar características fenotípicas y provocar enfermedades. Las nuevas tecnologías de secuenciación genómica de segunda generación, junto con los proyectos de secuenciación del exoma, han permitido identificar un gran número de indel en regiones codificantes, lo que sugiere que la mayoría de los seres humanos porta una carga genética sustancial de estas variaciones. Las indel cuya longitud no es múltiplo de 3 pb y que se ubican en regiones codificantes dan origen a mutaciones que recorren el marco de lectura. En las regiones codificantes del genoma se concentran indel que sí son múltiplos de 3 pb (repeticiones microsatélite). El proyecto de los 1 000 genomas, identificó 1.6 millones de indel en tres poblaciones y 22% de ellas correspondió a nuevas (dbSNP build 135). De manera interesante, 48% de las indel ocupa 4.03% del genoma y se agrupa en secuencias o tractos de homopolímeros, repeticiones en tándem o en puntos calientes (hotspots). En el resto del genoma, las indel son raras y 16 veces menos frecuentes que las SNV. Más de 75% de las indel se originan por “resbalones” de la DNA polimerasa durante la replicación, en tanto que las restantes son resultado de deleciones o duplicaciones por otros errores de replicación o recombinación. VARIACIÓN ESTRUCTURAL DEL GENOMA Las variantes estructurales del genoma humano comprenden formas no balanceadas que conducen a CNV e incluyen deleciones, duplicaciones e inserciones, y formas balanceadas como inversiones y translocaciones. La variación estructural visible al microscopio incluye heteromorfismos y rearreglos cromosómicos balanceados (translocaciones, inversiones, etc.) que pueden tener tamaños mayores de 3 Mb; sin embargo, también existen variaciones submicroscópicas de menor tamaño. En general, se considera que las CNV tienen un tamaño ≥50 pares de nucleótidos para distinguirlas de variantes más pequeñas, como las SNV o las indel. Por su tamaño, la variación estructural constituye el mayor porcentaje de diferencias entre los genomas individuales. Se ha calculado que en el genoma de un individuo existen 2 100 a 2 500 variantes estructurales: 1 000 deleciones grandes, 160 CNV, 1094 inserciones de elementos móviles o MEI (mobile element insertions) que incluyen 915 inserciones Alu, 128 inserciones L1 y 51 inserciones SVA (SINE/VNTR/Alu), 4 inserciones de genoma mitocondrial en el nuclear o NUMT (nuclear mitochondrial insertions) y 10 inversiones, que alteran a 20 millones de pares de nucleótidos en la secuencia del genoma. Las variantes estructurales, incluidas las CNV, se producen por varios mecanismos bien conocidos o formulados de manera hipotética de acuerdo con las evidencias existentes. En ellos tiene una participación notoria la presencia de secuencias repetidas de bajo número de copias (LCR, low copy repeats), las duplicaciones segmentarias y las repeticiones de número alto de copias (como Alu y L1). Éstas incluyen la recombinación homóloga no alélica (NAHR, non-allele homologous recombination), la unión de extremos no homólogos (NHEJ, non-homologous end joining), la unión de extremos mediada por microhomología (MMEJ, microhomology-mediated end joining), inserción de elementos móviles (MEI, mobile elements insertion), errores durante la replicación como la detención de la horquilla y salto de templado (FoSTeS, forkhead stalling and template switching) o mecanismos complejos que incluyen la cromotripsis (figura 2). La variación estructural presenta tasas de formación altas en locus específicos (variantes de novo que ocurren en el mismo locus genético entre individuos) identificadas hasta en 1/7 000 recién nacidos y que han sido muy difíciles de interpretar con respecto a sus consecuencias funcionales.
Compartir