Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA EN CIENCIAS (NEUROBIOLOGÍA) Análisis de la Carga Mutacional en el Genoma Mitocondrial en Fibroblastos de Pulpa Dental Humana TESIS Que para optar por el grado de: Maestro en Ciencias PRESENTA: Q.F.B. Bertha Guadalupe Rueda Zarazúa Tutor: Dr. Alfredo Varela Echavarría, INB. UNAM Comité Tutor: Dra. Teresa Edith Garay Rojas, INB. UNAM Dra. Aurea Orozco Rivas, INB. UNAM Querétaro, Qro, México. Julio 2017 1 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. Índice de contenido I. Dedicatorias............................................................................................................................................3 II. Agradecimientos....................................................................................................................................4 III. Abreviaturas.........................................................................................................................................5 IV. Resumen...............................................................................................................................................6 V. Summary................................................................................................................................................7 1. Antecedentes..........................................................................................................................................8 1.1 Generales........................................................................................................................................8 1.1.1 La mitocondria........................................................................................................................8 1.1.2 Fosforilación oxidativa...........................................................................................................9 1.1.3 El genoma mitocondrial........................................................................................................10 1.1.4 Herencia................................................................................................................................12 1.1.5 Dinámica mitocondrial.........................................................................................................14 1.1.6 Mutaciones............................................................................................................................15 1.1.7 Enfermedades mitocondriales y su diagnóstico....................................................................17 1.2 Antecedentes directos...................................................................................................................19 1.2.1 Dinámica de deleciones en cerebro de ratón........................................................................19 2. Planteamiento del proyecto..................................................................................................................24 2.1 Justificación..................................................................................................................................24 2.2 Hipótesis.......................................................................................................................................26 2.3 Objetivos.......................................................................................................................................26 2.3.1 Generales..............................................................................................................................26 2.3.2 Específicos............................................................................................................................26 3. Materiales y métodos...........................................................................................................................27 3.1 Diseño experimental.....................................................................................................................27 3.2 Muestras biológicas.......................................................................................................................29 3.3 Secuenciación masiva....................................................................................................................31 3.4 Análisis bioinformático.................................................................................................................31 4. Resultados............................................................................................................................................35 4.1 Procesamiento de las muestras.....................................................................................................35 4.2 Análisis bioinformático de deleciones..........................................................................................37 4.2.1 Deleciones recurrentes..........................................................................................................41 4.2.3 Distribución de las deleciones..............................................................................................45 4.2.4 Secuencias repetidas directas................................................................................................47 4.2.5 Deleciones comunes.............................................................................................................49 5. Discusión..............................................................................................................................................51 6. Conclusiones........................................................................................................................................60 7. Perspectivas..........................................................................................................................................61 8. Referencias...........................................................................................................................................62 VI. ANEXO..............................................................................................................................................69 2 I. Dedicatorias A mis padres Bertha y Paulino, y mi hermano César por su amor infinito, apoyo incondicional e incitarme siempre a alcanzar mis sueños. Al Dr. Alfredo Varela por aceptarme como parte de este proyecto y por su compromiso inquebrantable conmigo y el proyecto, su claridad de mente y sus valores. Al Dr. Jorge Tonatiuh por ser el guía más paciente y comprensivo, por aumentar mi tolerancia a la frustración, por sus palabras y sus regaños, por las lecciones en el laboratorio y la vida y su sincera amistad. Al Dr. Carlitos por siempre creer en mí y apoyarme incondicionalmente en todo momento, por todo su tiempo invertido en mí y este proyecto, por las horas de pláticas, risas y las aventuras dentro y fuera del laboratorio. A Manuel, Ricardo, Fer, Paco, Caro y Mariana por hacer mis días más divertidos, por todas las risas, las noches sin dormir en el laboratorio, las charlas, los bailes y todos los momentos que quedaron en mí de esta bonita amistad. A todas las personas en SLP y QRO que me quieren y apoyan incondicionalmente. Ellos que están siempre dispuestos a oír mis frustracionesy explicaciones acerca de lo que hago y siempre sonríen aunque entiendan la mitad de lo que digo. 3 II. Agradecimientos Fuentes de financiamiento: PAPIIT203713, FOMIX249744, CONACYT 232722, 238566, 271787, 282779, Beca Nacional Maestría CONACYT 420123 Universidad Nacional Autónoma de México e Instituto de Neurobiología Cirujano Dentista Mauricio Armando Noria Linares FES-Cuautitlán, UNAM Laura González Dávalos Laboratorio Nacional de Visualización Científica Avanzada, UNAM Luis Alberto Aguilar Bautista Instituto de Neurobiología, UNAM Laboratorio de Diferenciación Neural y Axogénesis Jorge Tonatiuh Ayala Sumuano Carlos Javier López Victorio Carlos Lozano Flores Rosa Martha Pérez Serrano . Laboratorio de Mapeo de Función Cerebral Leopoldo González Santos Unidad de Proteogenómica Adriana González Gallardo Anaid Antaramian Salas Michael Conrad Jeziorski Unidad de Cómputo Alberto Lara Ruvalcaba Omar González Hernández Ramón Martínez Olvera Unidad de Enseñanza Leonor Casanova Rico Guadalupe Amador Uribe Ma. Carmen Mendoza López 4 III. Abreviaturas ATP Trifosfato de Adenosina ADP Difosfato de Adenosina Ca2+ Calcio CINVESTAV Centro de Investigación y de Estudios Avanzados del Instituto Politécnico Nacional DMEM Modificación de Dulbecco del Medio Eagle DRP1 Proteína Relacionada con Dinamina ERO Especies Reactivas de Oxígeno FADH2 Dinucleótido de Falvina y Adenina gMT Genoma mitocondrial GNU GNU no es Unix, Sistema Operativo de Software libre GRCh38 Consorcio de Genoma de Referencia Humano número 38 Kb Kilobases (Mil pares de bases) LANGEBIO Laboratorio Nacional de Genómica para la Biodiversidad MFN Mitofusina MLPA Amplificación Dependiente de Ligación Múltiple NADH Dinucleótido de Nicotinamida y Adenina NGS Secuenciación de Nueva Generación OPA1 Atrofia Óptica 1 PCR Reacción en Cadena de la Polimerasa pb Pares de bases REDOX Reducción-Oxidación SNP Polimorfismo de Nucleótido Único 5 IV. Resumen La mitocondria es un organelo celular cuya principal función es la producción de energía por medio de la fosforilación oxidativa. Las mitocondrias tienen un genoma de ADN circular que contiene los genes que codifican para péptidos que son componentes fundamentales de la fosforilación oxidativa y parte de la maquinaria de traducción para la síntesis de esos componentes. En este genoma ocurren mutaciones de distintos tipos de las cuales las deleciones son los eventos más comunes y son causales de una amplia gama de enfermedades debilitantes y neurológicas de difícil diagnóstico debido a la naturaleza heterogénea de estas patologías y a las limitaciones en los métodos moleculares actuales. En este proyecto desarrollamos un método de aislamiento de ADN circular a partir de pulpa de dientes deciduos de individuos sanos para la identificación de la carga de deleciones en el genoma mitocondrial a través de secuenciación masiva. Los datos de NGS (Secuenciación de Nueva Generación) se mapearon con BLAT y para el análisis usamos comandos de Linux y otras herramientas bioinformáticas como SAMtools. Como parte de este trabajo identificamos deleciones de diversos tamaños distribuidas a lo largo de todo el genoma de las cuales las más abundantes son las deleciones de un solo nucleótido las cuales se encuentran distribuidas a lo largo de todo el genoma. Sin embargo, hay regiones de mayor prevalencia y otras, como en la región no codificante del d-loop, en la cual se detectaron un mínimo de deleciones. Sólo el 1.94% de las deleciones involucra en sus extremos repetidos directos de al menos 4 nucleótidos y el mayor identificado fue de 8 nucleótidos. Sólo 25 deleciones fueron comunes en las tres muestras analizadas y la mayoría son específicas de cada individuo. La deleción más abundante corresponde a la secuencia comprendida entre las posiciones 521-524 la cual se encuentra en dos de las tres muestras con 1.13% y 2.58% de heteroplasmia y corresponde a la región del d-loop. Estos hallazgos revelan la existencia de una gran diversidad de deleciones de baja frecuencia en el genoma mitocondrial de individuos sanos. Este trabajo es un primer estudio con este método en humanos para conocer la dinámica de las deleciones en condiciones normales y así sentar las bases para un nuevo método diagnóstico con una capacidad amplia de identificación de deleciones en cualquier región del genoma mitocondrial. 6 V. Summary The mitochondrion is a cellular organelle whose main function in the cell is energy production through oxidative phosphorylation. Mitochondria contain a genome of circular DNA that contains genes that encode peptides which are fundamental for oxidative phosphorylation and part of the mitochondrial translation machinery. Different types of recombination events occur in this genome, deletions being the most common among them and they could cause a wide spectrum of neurological and debilitating diseases whose diagnosis is difficult due to the heterogeneous nature of the pathologies and to limitations in current molecular methods. In this project, we established a method for isolation of circular DNA from pulp of deciduous teeth for the identification and quantification of deletion load in the mitochondrial genome from healthy individuals using massive sequencing. The NGS (New Generation Sequencing) data were mapping with BLAT and for the analysis we used Linux commands and other bioinformatic tools as SAMtools. As part of this work, we identified deletions of different sizes distributed throughout the genome, the majority of which involve the loss of a single nucleotide. There are regions, however, with a higher prevalence of deletions and others such as the non coding d-loop region, in which a minimum of deletion events were detected. Only 1.94% of the deletions involve in their extremes at least a 4 nucleotide direct repeat and the largest identified was 8 nucleotides long. Only 25 deletions were present in all three samples analyzed and most of them were specific to a single individual. The most abundant deletion corresponds to the sequence between the positions 521-524 which was in two of the three samples with 1.13% and 2.58% heteroplasmy and is part of the d-loop region. These findings reveal the existance of a high diversity of deletions present at low frequencies in the mitochondrial genome of healthy individuals. This work is the first study with this method in humans to understand the dynamics of deletions in the mitochondrial genome. It constitutes the groundwork for the development of a new diagnostics tool with a broad capacity to detect deletions throughout the mitochondrial genome. 7 1. Antecedentes 1.1 Generales 1.1.1 La mitocondria La mitocondria es un organelo citoplasmático cuya morfología puede variar dependiendo de los requerimientos de la célula. Las mitocondrias se pueden encontrar en forma individual o formando una retícula en las células eucarióticas (Pernas & Scorrano 2015). La teoría endosimbiótica postulada por Lynn Margulis en el año de 1967, establece que estos organelos tienen su origen evolutivo en alfaproteobacterias, que se incorporaron a células eucariotas hace millones de años. La teoría se basa en que existen múltiples características compartidas entre estos microorganismos y las mitocondrias incluyendo su mecanismo quimiosmótico para la obtención de energía (Pernas & Scorrano 2015, Margulis 1970). La mitocondria tiene una doble membrana que delimita compartimentos funcionalmente especializados. La membrana externa permite la importación y exportación de biomoléculas y simultáneamente protege al citosol de productos mitocondriales que podrían ser tóxicos como las especies reactivas de oxígeno (ERO) (Pernas & Scorrano 2015).La membrana interna separa el espacio intermembranal de la matriz mitocondrial y es menos permeable que la externa. La membrana interna forma crestas cuya base mantiene el contacto con la membrana externa y permite la importación de moléculas a la matriz mitocondrial. Las crestas son áreas funcionales ya que ahí se realizan la síntesis y traslocación de proteínas, favorecen el mantenimiento de los nucleoides, la biogénesis de proteínas con centros de Fe/S y ahí se anclan los complejos de la cadena respiratoria que realizan la fosforilación oxidativa (Pernas & Scorrano 2015). En células animales, la función primordial de las mitocondrias es la producción de energía en forma de adenosina trifosfato (ATP) (Wallace et al., 2014); sin embargo, hay otras funciones que se llevan a cabo en la mitocondria como son la regulación de Ca2+, la termogénesis, el control de la apoptosis y el metabolismo de azúcares mediante el ciclo de Krebs (Kowaltowski, 2000). 8 1.1.2 Fosforilación oxidativa La obtención de energía en las células eucariotas se da principalmente por medio de la fosforilación oxidativa que acopla el transporte de electrones a la síntesis de ATP. El metabolismo de carbohidratos, lípidos y proteínas convergen en el ciclo de Krebs que alimenta la cadena de transferencia de electrones para la generación de energía. La glucosa es el principal sustrato para este proceso; por cada molécula de la misma se sintetizan de 32 a 34 moléculas de ATP mientras que la glicólisis por sí misma produce únicamente 4 moléculas de ATP (Cooper, 2000). En las crestas mitocondriales hay cuatro complejos proteicos acoplados a una ATP sintetasa. Las moléculas NADH y FADH2 que se producen en el ciclo de Krebs son oxidadas por el complejo I (NADH deshidrogenasa) y el complejo II (succinato deshidrogenasa), respectivamente, liberando en ambos casos pares de electrones de alta energía. Los electrones son transportados por la coenzima Q al complejo III (citocromo C reductasa) y luego a través del citocromo C al complejo IV (citocromo C oxidasa). Una vez que esto ocurre vuelven a la matriz mitocondrial y se combinan con oxígeno para formar agua. La transferencia de electrones por los complejos permite el paso de protones (H+) de la matriz al espacio intermembranal. El transporte de iones genera un gradiente de protones que al volver a la matriz brinda la energía necesaria a la fracción F0 intermembranal de la ATP sintasa. Esta corriente hace rotar, por acción mecánica, las subunidades γε de la porción F1 lo cual induce un cambios conformacionales de las subunidades β que forman hexámeros intecalados con α. Las subunidades β pueden tener tres estados conformacionales que permiten la unión de nucleótidos: O, L y T. El T permite la fosforilación de las moléculas de ADP para formar ATP (de Paula et al. 2013, Cooper 2000). El espacio intermembranal es electroquímicamente positivo con un pH=7.0 y la matriz es negativa con un pH=8.0; esta diferencia proporciona el componente químico mientras que se establece un potencial eléctrico a través de la membrana debido al incremento de cargas positivas en el lado citosólico. Por ello se considera que la fosforilación oxidativa es un fenómeno electroquímico (Mitchell 1961) 9 1.1.3 El genoma mitocondrial Las mitocondrias tienen su propio genoma (gMT) que consiste en una doble hélice circular que en el humano contiene 16,569 pares de bases con 37 genes que codifican para 2 ARN ribosomales, 22 ARN de transferencia y 13 polipéptidos que forman parte de 4 de los 5 complejos involucrados en la Fosforilación oxidativa (Copeland & Longley, 2014, Ameur et al., 2011, Damas et al., 2014, Solano et al., 2001). Además se han identificado 2 orígenes de replicación OH y OL en los nucleótidos 407 y 5747 respectivamente y una región de control con conformación de triple cadena que facilita la síntesis de la cadena H o cadena pesada en el extremo 5' denominada “d-loop” (Figura 1) (Damas et al., 2014) . Cada célula tiene de cientos a miles de genomas dependiendo del tejido los cuales se encuentran agrupados formando nucleoides que contienen entre 2 y 10 moléculas circulares (Carelli et al. 2015). 10 Figura 1. Estructura genómica del genoma mitocondrial. El genoma mitocondrial consta de 37 genes que codifican para 2 ARN ribosomales, 22 ARN de transferencia para la síntesis de proteínas propias de la mitocondria y 13 ARN mensajeros que codifican para proteínas que participan en la fosforilación oxidativa. Adaptado de St John, J.C. et al. 2010. 11 1.1.4 Herencia La herencia mitocondrial no sigue patrones mendelianos sino que las mitocondrias son heredadas por línea germinal materna (Carelli et al., 2015). El estudio de las diferencias en el genoma mitocondrial han sido de gran importancia en el estudio filogenético de nuestra especie siguiendo la ascendencia por línea materna hasta el origen de nuestra especie que se ha definido como la Eva mitocondrial, la cual tiene una antigüedad aproximada de 200 000 años y su origen en África. Con base a las diferencias sistemáticas entre los genomas mitocondriales se ha desarrollado una clasificación en haplogrupos con una filogenia bien definida que ha permitido trazar el movimiento de las poblaciones y es la base de muchos estudios filogenéticos (Hart et al., 2014). En 1990 se define la nomenclatura de los haplogrupos con letras de la A a la Z, de acuerdo a su descubrimiento. Los haplogrupos A-G fueron asignados al linaje asiático y americano, mientras que H-K a las poblaciones europeas y L corresponde al grupo de mayor variación de las poblaciones africanas (Figura 2). Actualmente esta línea de investigación continua definiéndose con las nuevas tecnologías de secuenciación y nuevos estudios poblacionales (Kivisild, 2015). 12 Figura 2. Árbol filogenético de los haplogrupos mitocondriales de acuerdo a la herencia materna a partir de las secuencias del ADN mitocondrial (Adaptado de Phylotreemt. MtDNA tree Build 17 (18 Feb 2014)) 13 A pesar de la herencia mitocondrial materna, la mayoría de las proteínas mitocondriales están codificadas en el núcleo, el cual sí sigue una herencia mendeliana. Algunos estudios sugieren que en los ovocitos existe una subpoblación mitocondrial, que corresponde a las mitocondrias que se heredan, la cuál tiene cierto grado de quiescencia y no es funcionalmente activa por lo que al no estar en constante interacción con especies reactivas de oxígeno, su carga mutacional es menor a la del resto de las mitocondrias funcionales que participan activamente en la producción de energía (de Paula et al., 2013). Otros estudios han determinado que al momento de la fecundación pocas mitocondrias paternas se internalizan al ovocito y las que lo logran son eliminadas por medio de un mecanismo de marcaje que las dirige a degradación previo al reclutamiento de autofagosomas del ovocito. Este proceso de eliminación de las mitocondrias paternas parece ser crítico para la viabilidad de los embriones (Zhou et al. 2016, Wang et al. 2016). Durante la maduración del ovocito ocurre un fenómeno denominado “cuello de botella” en el cual se disminuye aleatoriamente el número de copias del gMT por célula seguida de la replicación de los mismos (Cao et al. 2009). A partir de este paso crítico en la herencia mitocondrial puede haber una expansión clonal de variantes genómicas específicas que se replican y prevalecen en el nuevo individuo, los cuales pueden ser canónicos y altamente funcionales pero también genomas mutados con distintos grados de deficiencia (Carelli et al. 2015). 1.1.5 Dinámica mitocondrial En condiciones normales existe un equilibrio entre la fusión y fisión mitocondrial. La fusión es un proceso mediante el cual las mitocondrias cambian su morfología y seunen permitiendo la transferencia de moléculas del gMT, proteínas, lípidos y metabolitos. De manera inversa la fisión mitocondrial es otro proceso en respuesta a señales citosólicas a partir del cual se producen una o más mitocondrias hijas. Esto se relaciona directamente con el recambio mitocondrial por biogénesis o con la degradación por mitofagia. Estos ajustes ocurren en función a las necesidades de los tejidos o células y la pérdida de este equilibrio está directamente relacionada con la muerte celular (Carelli et al. 2015, Jornayvaz & Shulman 2010). 14 La biogénesis mitocondrial requiere de entre 1000 y 1500 proteínas codificadas en el genoma nuclear y su coordinación con la síntesis de proteínas codificadas en el genoma mitocondrial. Algunos factores como el estrés oxidativo del medio, la restricción energética, bajas temperaturas, el mismo proceso de división o diferenciación celular afectan la biogénesis variando el número, talla y masa de las nuevas mitocondrias (Jornayvaz & Shulman 2010). La fusión mitocondrial permite que las mitocondrias con deficiencias leves a nivel de genoma o de proteínas, puedan complementarse con otras lo que mantiene la funcionalidad mitocondrial. Este proceso involucra moléculas de unión que juegan un papel fundamental; OPA-1 en la membrana interna y las mitofusinas MFN-1 y MNF-2 en la membrana externa (Pernas & Scorrano 2015). La fisión mitocondrial, permite a las mitocondrias con daños severos separarse de la retícula y se favorece su degradación por medio de la mitofagia (Carelli et al., 2015). Los cambios en el potencial de membrana de la mitocondria son señal de disfuncionalidad y pueden sensarse por el eje Pink1/Parkin activando una cascada de señalización intracelular que lleva a la remoción de las mitocondrias defectuosas. La fisión es coordinada por DRP1 que es una molécula que hidroliza GTP y divide la membrana interna y externa de la mitocondria para generar mitocondrias hijas. La GTPasa Rheb regula este proceso interactuando con Nix y LC3-II del autofagosoma luego de ser reclutada a la membrana externa. La mitofagia aumenta como consecuencia de una alta actividad energética en las células promoviendo a la vez el recambio mitocondrial y manteniendo la producción de energía (Lavie et al. 2013), Carelli et al. 2015). 1.1.6 Mutaciones A diferencia del genoma nuclear, en cada célula existen múltiples genomas mitocondriales que varían en número de un tejido a otro en función de su requerimiento energético. El mtADN solía considerarse como un conjunto de copias idénticas; sin embargo, en la actualidad se sabe que existe heteroplasmia que es la coexistencia en la misma célula de variantes genómicas producto de distintos eventos mutacionales (Damas et al., 2014, Carelli et al., 2015). Es también sabido que la tasa de mutación del genoma mitocondrial en vertebrados es de 10 a 17 veces mayor que la del genoma nuclear (Wallace et al., 2014), y 15 que estas mutaciones pueden ser de naturaleza somática y producirse de novo a lo largo del ciclo de vida del individuo (Carelli et al., 2015, Kang et al., 2016) o bien ser heredadas directamente por línea germinal de la madre. En el equilibrio dinámico de la mitocondria se producen mutaciones constantemente y existen algunas teorías sobre el origen de las mismas. i) La constante exposición a factores mutagénicos como las especies reactivas de oxígeno (ERO) (Khrapko & Turnbull, 2014), ii) Defectos en la funcionalidad de las enzimas POLG (polimerasa) y Twinkle (helicasa) (Damas et al., 2014), iii) Mutaciones en genes nucleares involucrados en replicación y mantenimiento mitocondrial (Carelli et al. 2015), iv) El proceso natural de envejecimiento y su correspondiente acumulación de mutaciones (Ameur et al., 2011, Williams et al., 2013, Kang et al., 2016). La diversidad de mutaciones que se han descrito en el genoma mitocondrial abarca mutaciones puntuales, sinónimas y no sinónimas, así como deleciones e inserciones de diversos tamaños que se han observado en humanos y otros mamíferos (Damas et al., 2014, Williams et al., 2013). Las mutaciones son muy diversas, ocurren en distintas regiones del genoma y afectan distintos genes, presentan grados variables de heteroplasmia, se han identificado en diversos tejidos y se sabe que dependiendo de estos factores la eficiencia en la función mitocondrial puede verse afectada (Kang et al., 2016). Si bien son aún desconocidos los mecanismo de formación y estabilización de las deleciones en el genoma mitocondrial, se han observado asociaciones entre éstas con repetidos directos, que son secuencias idénticas en posiciones contiguas de nucleótidos en distintas regiones del genoma que facilitan eventos de recombinación, así como con estructuras secundarias en el ADN del tipo “tallo-bucle” (Lakshmanan et al., 2012). Tanto repetidos directos como estructuras de tallo-bucle correlacionan con sitios de deleción en genomas de mamíferos de vida larga como monos y humanos pero no en especies como rata y ratón, lo cual podría ser una adaptación evolutiva ante mutaciones estables (Lakshmanan et al. 2012). La acumulación de mutaciones en el ADN mitocondrial causa disfunción mitocondrial en distintos grados. Deficiencias de la función mitocondrial afectan el metabolismo de las células y en consecuencia pueden llegar a tener efectos a nivel de tejidos o incluso sistémicos. Un mayor número de mutaciones se han relacionado con enfermedades como la enfermedad de 16 Parkinson, Alzheimer, infertilidad masculina y se ha sugerido que favorecen el desarrollo de algunas formas de cáncer de próstata, estómago, colon, mama y pulmón (Damas et al. 2014; Lakshmanan et al. 2012; Hoekstra et al. 2016, Hosseinzadeh et al., 2014; Wallace et al. 2014; Schwartz et al. 2006; Burgart et al. 1995). 1.1.7 Enfermedades mitocondriales y su diagnóstico Cargas mutacionales altas generalizadas afectan la eficiencia de la función mitocondrial pero también existen mutaciones particulares que se han asociado a fenotipos patológicos en humanos. En el año de 1988 se identificó la primera mutación patológica mitocondrial en humanos y desde entonces se han caracterizado más de 200 (Wallace et al., 2014, Solano et al., 2001, Chinnery et al., 2012) . Las enfermedades mitocondriales son un grupo de síndromes y patologías heterogéneas en las cuales la funcionalidad de las mitocondrias se ve afectada en uno o varios tejidos y en su mayoría tienen un origen genético ocasionado por mutaciones patológicas. Los tejidos más afectados por patologías mitocondriales son los que tienen mayor requerimiento energético, especialmente músculo y cerebro. Por ello la mayoría de las afecciones mitocondriales en el humano son neuromusculares y progresivas (Damas et al., 2014, Williams et al., 2013). Existe una gran variabilidad de enfermedades o síndromes que se han relacionado con mutaciones mitocondriales entre las cuales destacan la neuropatía óptica hereditaria de Leber, oftalmología progresiva externa crónica, síndrome de Kearns- Sayre, síndrome de Leigh y diabetes con sordera (Solano et al., 2001, Carelli et al., 2015, Lakshmanan et al., 2012). Un estudio epidemiológico en Inglaterra, entre 1990 y 2014, estimó que la incidencia mínima de mutaciones patológicas relacionadas con enfermedades mitocondriales es de 23 por cada 100 000 adultos, o sea 1 de cada 4300 personas, de los cuales 2.9 son debidas a mutaciones en genes mitocondriales codificados en el ADN nuclear y el resto a mutaciones del ADN mitocondrial. Así mismo se estimó que 12.5 por cada 100 000 adultos se encuentran afectados clínicamente y 10.7 por cada 100 000 se encuentran en riesgo de padecer alguna 17 enfermedadmitocondrial (Gorman et al., 2015). El diagnóstico de estas patologías resulta complejo debido a sus características: a) tienen cuadros clínicos diversos que van desde desórdenes motores o neurológicos, convulsiones, demencia, sordera y cardiomiopatía hasta disfunciones hepáticas y pancreáticas; b) el fenotipo patológico y la severidad de la enfermedad dependen de los grados variables de heteroplasmia; c) presentan heterogeneidad genética ya que una mutación específica puede dar lugar a fenotipos patológicos diferentes dependiendo del tejido en que se encuentren y un solo fenotipo puede ser producto de distintas mutaciones o de la combinación de más de una variante genómica y d) presentan mosaicismo genético, es decir que puede haber distintos genotipos desde un nivel celular hasta tisular, por lo que una mutación puede no ser detectable en un tejido pero sí en otro del mismo individuo. Por todo lo anterior, el diagnóstico de estas enfermedades es sumamente complejo, es fácil confundirlas con otros síndromes y para su confirmación requiere de una amplia gama de estudios clínicos, metabólicos, morfológicos, histoquímicos, bioquímicos y genéticos (Solano et al., 2001). Actualmente, la metodología para diagnóstico molecular de enfermedades mitocondriales más usada es la Amplificación Dependiente de Ligación Múltiple (MLPA) que es una prueba que usa sondas para variantes genómicas específicas que están relacionadas con las mutaciones causales más conocidas (Mayorga et al. 2015). Sin embargo, existe un gran sesgo en el uso de este método ya que está diseñado sólo para la identificación de mutaciones conocidas. 18 1.2 Antecedentes directos 1.2.1 Dinámica de deleciones en cerebro de ratón El genoma mitocondrial de ratón tiene 16 299 pares de bases, sólo 270 pb menos que el humano, y se encuentran codificados los mismos genes con una distribución similar. Existe una gran homología entre ambos genomas y las similitudes no son sólo genómicas sino también fisiológicas(Figura 3) (Kazachkova et al. 2013). De acuerdo a estudios previos de otros laboratorios con secuenciación sanger, se observaron deleciones en el genoma mitocondrial de ratones viejos pero no en jóvenes y las deleciones se encontraron en menos del 0.01% de los genomas considerando distintos tejidos, incluido cerebro. Además asocian algunas de las deleciones con secuencias repetidas directas, ya que en el genoma mitocondrial existen gran cantidad de sitios con secuencias repetidas directas, perfectas o imperfectas. Se observó que estas regiones de secuencias repetidas directas tienen un mayor contenido relativo de G/C, no abarcan los orígenes de replicación y se encuentran lo suficientemente separados entre sí para poder observar las moléculas deletadas revelando el producto de PCR en geles de agarosa. Una de las limitaciones de esta metodología es que sólo es posible detectar deleciones grandes (Tanhauser & Laipis, 1995). Otros estudios con PCR revelaron que al comparar la proporción de deleciones en la sustancia nigra, en ratón viejo se encuentra en menores niveles de heteroplasmia (menos de 0.5%) que en humano de edad avanzada (5%) (Guo et al., 2010). 19 Figura 3. Distribución de los genes codificados en el genoma mitocondrial. a) De humano (Homo sapiens, NC_012920) b) De ratón (Mus musculus, NC_005089) (Adaptado de Kazachkova et al., 2013). Estudios de nuestro laboratorio nos han permitido caracterizar la carga de deleciones en el 20 genoma mitocondrial de ratón desde ovocitos hasta tejido cerebral embrionario, adulto y anciano, observándose una alta diversidad de eventos de deleción en su mayoría con bajas frecuencias. En este estudio corroboró que la amplificación por desaplazamiento múltiple no introduce errores significativos de secuencia. Así mismo se usó como control de secuenciación para la plataforma Illumina un genoma clonado en fragmentos con E. coli, lo que permitió descartar las posibles deleciones introducidas por el método de secuenciación masiva. La mayoría de las deleciones detectadas fueron de un solo nucleótido. Sin embargo, deleciones de mayor tamaño, incluso de varias kilobases de longitud, fueron identificadas en todos los estadios (Ayala Sumuano et al. Resultados preliminares) (Figura 4). Estos estudios revelaron además que existen subpoblaciones de deleciones cuya frecuencia varía en las distintas etapas analizadas. Considerando algunos estudios de otros laboratorios se esperaría que las deleciones aumentaran su frecuencia conforme avanza la edad de los individuos (Kang et al. 2016). Sin embargo, en nuestro laboratorio se observó que sólo una fracción de las deleciones tiende a la acumulación conforme avanza la vida del individuo. Otros subgrupos de deleciones tienen distintas tendencias a través del tiempo ya que también se identificaron subpoblaciones de deleciones muy abundantes en ovocitos o embriones que mantienen su frecuencia a lo largo del tiempo y otras que incluso parecen disminuir y ser menos frecuentes en adultos mayores (Ayala Sumuano et al. Resultados preliminares). Las deleciones observadas se distribuyen a lo largo de todo el genoma mitocondrial, afectando regiones codificantes y regulatorias con una distribución no homogénea y con regiones discretas del genoma que muestran una mayor recurrencia de eventos. Estos hallazgos revelan que variantes del genoma mitocondrial que contienen deleciones son más abundantes que lo previamente observado y que son parte del repertorio normal de genomas mitocondriales presente desde células germinales y que se mantienen en tejidos somáticos (Ayala Sumuano et al. Resultados preliminares) (Figura 5). 21 Figura 4. Frecuencia relativa de las deleciones mitocondriales identificadas en tres estadios del cerebro de ratón clasificadas de acuerdo a su tamaño. Cada barra corresponde a un individuo (Ayala Sumuano et al. Resultados no publicados). 22 Figura 5. Distribución de las deleciones en el genoma mitocondrial de ratón clasificadas de acuerdo a su tamaño. Cada círculo representa las 16.3 Kb del genoma mitocondrial y la punta de flecha el origen de la numeración. Inicia de la circunferencia al centro a manera de espiral, y va trazando cada deleción como arcos que van del punto de ruptura inicial al final. Los radios (en el caso de las deleciones de menor tamaño) y los arreglos radiales que asemejan rebanadas de pastel (en deleciones de mayor tamaño) representan regiones con recurrencia de eventos, por el contrario las regiones blancas representan la ausencia de eventos en nuestras muestras en esa región. 23 2. Planteamiento del proyecto 2.1 Justificación Estudios de nuestro laboratorio con un método por el cual se analizan todas las regiones del genoma mitocondrial revelaron que en ratones existe una alta diversidad de deleciones de baja frecuencia en ovocitos y tejidos somáticos adultos. En el humano, sin embargo, no se han llevado a cabo estudios que analicen de manera integral la carga mutacional con este método. Esto es de gran relevancia pues se sabe que altos grados de heteroplasmia de mutaciones específicas se pueden correlacionar con enfermedades que cursan con disfunción mitocondrial. El diagnóstico de enfermedades mitocondriales resulta complicado debido a la variabilidad de los cuadros clínicos, su heterogeneidad genética, los grados de heteroplasmia, el mosaicismo que las caracteriza y a que los métodos de diagnóstico molecular actualmente usados tienen un gran sesgo técnico hacia deleciones conocidas. La mayoría de los métodos de diagnóstico molecular de enfermedades mitocondriales presentan sesgos ya que están dirigidas a mutaciones específicas relacionadas con las enfermedades mitocondriales más conocidasy muchos de ellos requieren del uso de PCR, lo cual genera mutaciones artefactuales en las muestras. Debido a esto el desarrollo de una técnica para el análisis que no tenga ese sesgo y permita identificar toda la gama de deleciones sin la carga mutacional introducida por la reacción de PCR, así como la identificación de un nivel basal de deleciones permitirá el desarrollo de un método diagnóstico que facilite la identificación enfermedades de origen mitocondrial con alta confiabilidad. Este trabajo representa una primera aproximación del método utilizado en ADN mitocondrial de ratón en muestras de origen humano, por lo que se ha considerado dar un enfoque global para la identificación de deleciones, considerando todos los tamaños, grados de heteroplasmia y ubicación en el genoma mitocondrial. 24 Debido a la naturaleza de este estudio se ha dejado de lado, por el momento, las características particulares de las muestras como el tejido, haplogrupos y otras características de origen. Estas consideraciones se hicieron con la intención de probar la metodología para la obtención de la información relevante para el desarrollo de un método de diagnóstico basado en NGS (Secuenciación de Nueva Generación). 25 2.2 Hipótesis El genoma mitocondrial de células humanas de individuos sanos contiene una alta diversidad de deleciones de baja frecuencia. 2.3 Objetivos 2.3.1 Generales Analizar la carga mutacional de deleciones en el genoma mitocondrial de células humanas de individuos sanos. 2.3.2 Específicos Desarrollar una técnica de aislamiento de ADN circular a partir de muestras de pulpa de dientes deciduos humanos. Secuenciar masivamente el ADN circular. Analizar la diversidad y frecuencia de deleciones presentes en el ADN mitocondrial. 26 3. Materiales y métodos 3.1 Diseño experimental La estrategia experimental para la realización de este proyecto se resume en la Figura 6 e incluye el procesamiento de muestras de células de pulpa dental obtenidas de dientes deciduos de individuos sanos en edad escolar, la secuenciación masiva de los genomas mitocondriales y el análisis bioinformático de las deleciones presentes. 27 Figura 6. Metodología para la determinación de la carga mutacional en células de pulpa dental humana. Se llevó a cabo una extracción de mtADN para realizar secuenciación masiva en la plataforma Illumina y determinar las mutaciones prevalentes mediante un análisis bioinformático. 3.2 Muestras biológicas 28 Selección de los candidatos Debido a que es el primer acercamiento experimental con este método en humanos, se utilizó un tejido de fácil obtención. Se seleccionó la pulpa de dientes deciduos ya que su obtención fue secundaria a procedimientos odontológicos previamente programados por el cirujano dentista responsable y no implicó procedimientos adicionales a los necesarios para el tratamiento planeado. Para la elección de los niños participantes en este protocolo de investigación se consideró que sus condiciones de salud generales fueran aparentemente buenas, sin ningún antecedente o diagnóstico conocido de enfermedad mitocondrial y que fueran pacientes programados para extracción de dientes deciduos por el cirujano. Con estas consideraciones se obtuvieron 3 muestras de pulpa dental provenientes de niños de edades entre 6 y 11 años, de nacionalidad mexicana y pertenecientes a una población urbana. Consentimiento informado Debido a que las muestras de material biológico provienen de menores de edad, se solicitó a los padres o tutores legales la lectura y firma del consentimiento informado donde se especifican las intenciones y alcances del proyecto así como la descripción de los procedimientos experimentales y el manejo de los datos personales con base a las leyes aplicables. Este proyecto fue previamente sometido a evaluación por el Comité de Ética en Investigación del Instituto de Neurobiología de la Universidad Nacional Autónoma de México (Protocolo 44.H). Obtención de la muestra Las pulpas dentales se obtuvieron al momento de la extracción odontológica realizada bajo condiciones de asepsia. Se recibió la pieza dental en PBS(AB) [Antibióticos [PBS 1X + Penicilina/Estreptomicina 5% + Anfotericina 3% + Enrofloxacino 1X] y se pasó a medio de aislamiento basal [DMEM F12 + Penicilina/Estreptomicina 5% + Anfotericina 3% + Enrofloxacino 1X] en frío para su traslado. Se extrajo y se disoció la pulpa por succión repetida con micropipeta seguida de ciclos de lavado con medio enriquecido de antibióticos 29 [Penicilina/Estreptomicina 2% + Anfotericina 0.2% + Enrofloxacino 1X] y centrifugado a 880 xg por 5 minutos]. Cultivo de células Las células de pulpa dental disociadas se sembraron en un pozo de una caja de cultivo de 96 pozos con Medio de crecimiento [DMEM F12 + SFB 20% + Ác. Ascórbico 0.1 mM + Glutamina 2 mM + Penicilina/Estreptomicina 1% + Anfotericina 0.1% + Factor de crecimiento fibroblástico 2.5 ng/mL] incubando a 37°C y 5% de CO2. Este cultivo que favorece el crecimiento de fibroblastos se mantuvo por tres semanas con lo que las bacterias presentes en la muestra se eliminaron. Los cultivos se extendieron hasta confluencia en 16 cajas de 100 mm por muestra. En esta etapa se generó un banco congelando 1 millón de células por vial de congelación. Para el procesamiento de las muestras se realizó cultivo de 24 horas partiendo de un vial de congelación, se resuspendieron las células por tratamiento con trispsina y se obtuvo por centrifugación una pastilla de células de cada muestra. Extracción y purificación del ADN Mitocondrial Para la obtención de ADN enriquecido en moléculas circulares a partir de células de pulpa dental cultivadas se utilizó una adaptación del protocolo de lisis alcalina basado en el “QIAprep Spin Miniprep Kit” de Qiagen (Cat. No. 27104, Hilden, Alemania). Se añadió SDS a la solución P1, para iniciar la lisis desde el primer paso y facilitar la extracción del ADN, así como dos lavados de 0.7 ml de buffer PE, centrifugando 10 segundos y 1 minuto, respectivamente, para hacer un lavado más eficiente y no mermar el material con la primera centrifugación. Los volúmenes y el resto de los pasos fueron los indicados por las instrucciones proporcionadas por el fabricante. Para eliminar remanentes de ADN lineal provenientes del genoma nuclear, se digirió la solución de ADN con una exonucleasa dependiente de ATP (PlasmidSafe, Epicentre. Madison, WI). Se llevó a cabo la digestión de todo el eluído de la columna de extracción en su volumen total de 60 µL con 20 unidades de DNasa y una incubación a 37°C por 16 hrs. Transcurrido ese tiempo de incubación se adicionó una segunda mezcla de reacción de 40 µL con 20 unidades de enzima y se incubó nuevamente a 37°C por 6 horas y finalmente se 30 inactivó la reacción incubando a 70°C por 30 minutos. Posteriormente se precipitó el ADN con 0.1 volúmenes de acetato de sodio 3 M y 2.5 volúmenes de etanol absoluto para proseguir con el protocolo de amplificación. Amplificación Para amplificar el ADN mitocondrial de las muestras y obtener cantidades suficientes para su secuenciación, se utilizó el método de amplificación por desplazamiento múltiple usando una polimerasa de alta fidelidad y oligonucleótidos aleatorios (Repli-G single cell, Cat. No. 150343, Qiagen, Hilden, Alemania) siguiendo las instrucciones del fabricante, ya que es un método que permite más uniformidad y menor frecuencia de errores que la amplificación por otros métodos. 3.3 Secuenciación masiva Secuenciación masiva Se secuenciaron tres muestras de mtADN con la plataforma Illumina NextSeq en modo de lecturas pareadas de 150 nucleótidos porla Unidad de Servicios Genómicos del LANGEBIO de CINVESTAV, Campus Irapuato. 3.4 Análisis bioinformático Control de calidad de lecturas La evaluación de la calidad de las lecturas se realizó con el paquete FastQC (High Throughput Sequence QC Report, Version 0.11.3, Andrews, Lindenbaum, Howard, Ewels 2011-15) y posteriormente fueron filtradas para eliminar contaminación por adaptadores y lecturas con bajo nivel de calidad en una escala PHRED33 con valor menor a 30 usando Trimmomatic (GNU, Version 0.36, Bolger, Lohse & Usadel, 2014, -phred33 ILLUMINACLIP:TruSeq3-PE-2.fa:2:30:10 CROP:150 HEADCROP:15 MINLEN:50 ). Luego del control de calidad se removieron 15 nucleótidos de uno de los extremos de las lecturas quedando lecturas de 135 nucleótidos para el análisis. 31 Mapeo de Secuencias Las lecturas se mapearon a la secuencia del mtADN contenida en la versión GRCh38 /hg38 (GCA_000001405.15. Dic 2013, NCBI genome / 51 Homo sapiens, Reference 38. Revised Cambridge Sequence (rCRS). GenBank J01415.2 y RefSeq accession number NC_012920.1., Haplogroup H2a2a), del genoma humano por medio del programa BLAT (Standalone BLAT v. 36X2, UCSC, Genome Bioinformatics de Kent Informatics, Inc., 2002, opciones de default), el cual nos permite identificar deleciones de distintos tamaños de forma directa en los archivos PSL de salida. Un archivo PSL contiene 21 campos con la siguiente información: 1. Mapeos 2. No mapeos 3. Mapeos repetidos 4. Número de Ns 5. Número de inserciones en lectura 6. Número de bases insertadas en lectura 7. Número de inserciones en referencia 8. Número de bases insertadas en referencia 9. Cadena (+ ó -) 10. Nombre de lectura 11. Tamaño de lectura 12. Posición de inicio en lectura 13. Posición de fin en lectura 14. Nombre de referencia 15. Tamaño de referencia 16. Posición de inicio en referencia 17. Posición de fin en referencia 18. Número de bloques 19. Tamaño de bloques (separador: “,”) 20. Posición de inicio en lectura (separador: “,”) 21. Posición de inicio en referencia (separador: “,”) Dada la naturaleza circular del genoma mitocondrial, el archivo fasta del genoma de referencia fue duplicado en el mismo archivo para así permitir la detección de las deleciones que incluyen el origen de la numeración de la secuencia del genoma. 32 Minería y cribado de datos de mapeo (Ver sección VI. Anexo) Para determinar la frecuencia y diversidad de las deleciones en el ADN mitocondrial de las muestras de pulpa dental utilizamos comandos del sistema operativo Linux para el procesamiento de archivos PSL resultado del mapeo. En primer lugar se concatenaron los archivos conteniendo las lecturas pareadas (R1 y R2) de cada muestra con el comando cat para luego filtrar las deleciones, usando awk, seleccionando aquéllas que cumplieran con los siguientes criterios: Tener dos bloques, lo que equivale a una deleción por lectura. Con inicio antes de la coordenada 16 569 para evitar duplicaciones. Sin inserciones en la misma lectura. Que los bloques tuvieran al menos 15 nucleótidos de longitud para reducir la ambigüedad en el mapeo. Con un mapeo de al menos 100 nucleótidos en la lectura. A partir de los archivos con el total de las deleciones, se determinó el tamaño de cada deleción y las frecuencias en cada muestra eliminando todas las deleciones con tamaño superior a 8299 nucleótidos, con la finalidad de evitar ambigüedades. A modo de convención, consideramos las deleciones como eventos independientes y una sola deleción por genoma. Para ello aplicamos una ecuación al cálculo de la frecuencia acumulada de las deleciones: p n= p n-1+(q n-1)(f n) donde p es la proporción acumulada de genomas mutados y q los genomas no mutados, así que la suma es igual al total de genomas o la unidad, p+q=1; f es la frecuencia normalizada de cada deleción individual. Por lo tanto, la frecuencia de cada evento de deleción se considera sobre q que son el resto de los genomas que no contienen la deleción ni nunguna 33 de las deleciones anteriores. Entonces q va reduciéndose conforme se va incluyendo el siguiente evento. Al contemplar el total de deleciones identificadas en la muestra, tenemos el porcentaje total de genomas mutados (p) y no mutados (q) para cada una de las muestras considerando eventos independientes y una sola deleción por genoma. Para calcular la profundidad de las lecturas en cada muestra se consideraron la longitud de las lecturas (135 nucleótidos), el número de lecturas por muestra y la longitud del genoma mitocondrial humano (16 569 nucleótidos). Con estos datos se normalizaron las frecuencias de las deleciones por millón de genomas. Para el análisis de repetidos directos en las deleciones de cada muestra se creó una población aleatoria con el mismo número de deleciones que la muestra de pulpa con mayor número de datos. Pares de números en el rango de 1 a 16569 se crearon al azar con el software de R ( GNU Project for Statistical Computing, 3.2.5 (2016-04-14), R Development Core Team, 2014) utilizando la función sample para crear los puntos de corte de deleciones virtuales en los extremos 5' y 3'. Tanto los archivos de las deleciones de la población aleatoria como los provenientes de pulpa dental se corrieron con el mismo script con el cual se obtuvieron las secuencias de los 20 nucleótidos previos a los puntos de corte de cada deleción con el comando getfasta de bedtools (GNU v2.17.0). Se consideran únicamente las deleciones mayores a 15 nucleótidos. Las deleciones comunes fueron identificadas con la herramienta de Venny 2.1.0 - BioinfoGP – CSIC. Las 28 deleciones fueron separadas de acuerdo a su tamaño y se relacionaron los puntos de corte de cada deleción con las coordenadas que delimitan los genes mitocondriales usando la base de datos de UCSC Genome Browser y el genoma de referencia GRCh38/hg38. 4. Resultados 4.1 Procesamiento de las muestras Las tres muestras de pulpa dental se procesaron para la obtención de ADN circular total en el cual se incluye al ADN mitocondrial. Obtuvimos concentraciones entre 580 y 824 ng/µL de 34 ADN cuantificados por fluorometría lo que significó una masa total de entre 40 y 58 µg por muestra (Tabla 1) . Con la intención de corroborar el aislamiento y amplificación del ADN mitocondrial a partir de nuestro protocolo, realizamos la amplificación por PCR de un fragmento que corresponde a las posiciones 14,445 a 14,700 del genoma mitocondrial, generando un producto amplificado de 255 pares de bases. En las tres muestras se logró la amplificación del fragmento esperado confirmando la presencia de ADN mitocondrial. Adicionalmente se corrieron las muestras de ADN circular amplificado en un gel de agarosa para descartar que el ADN estuviera degradado y en el cual se puede observar que son fragmentos mayores a 12 Kb confirmando así su integridad (Figura 7). Tabla 1. Concentración y masa total de ADN circular en cada una de las muestras de pulpa dental (P1-P3). 35 Figura 7. ADN mitocondrial en células de pulpa dental. A. Validación de la presencia de mtADN. Resultado de la PCR que valida la presencia de ADN mitocondrial en cada una de las muestras, amplificando un fragmento mitocondrial de 255pb en cada una. B. Integridad del ADN amplificado de las muestras de pulpa dental en agarosa al 1%. 4.2 Análisis bioinformático de deleciones Las lecturas secuenciadas luego del control de calidad fueron mapeadas contra el genoma de referencia. En un primer análisis de las deleciones destacan dos deleciones comunes y frecuentes en las tres muestras que son 3105-3107 y 3107-3109. Sin embargo, en el genoma de referencia mitocondrial usado en el mapeo de las secuencias la posición 3107 corresponde a una N [...CTAC(N)TTCAA...]. Luego de larevisión y re-análisis de la secuencia 36 de referencia de Cambridge del genoma mitocondrial humano en 1999, se determinó que correspondía a un error de secuenciación. Por convención se decidió introducir una N la posición 3107 para mantener la numeración histórica del genoma (Andrews et. al., 1999). El análisis de las lecturas de las muestras de este estudio que mapean a este sitio del genoma reveló que carecen de un nucleótido en esa posición y que la secuencia más abundante en las lecturas secuenciadas es [...CTACTTCAA..]. Por ello realizamos nuevamente el mapeo eliminando del genoma de referencia la N en la posición citada con lo cual las deleciones aparentes en esa región desaparecen en las tres muestras, lo cuál significa que no eran reales y por lo tanto se descartaron. Para el resto del análisis se mantuvo la numeración de acuerdo al genoma de referencia. Como resultado de la secuenciación y posterior al análisis de calidad con FastQC y Trimmomatic obtuvimos entre 42 y 61 millones de lecturas por muestra (53.4 millones ± 10 millones), luego del mapeo el número de lecturas correspondientes al genoma mitocondrial humano fueron entre 184 000 y 670 000 (354 mil ± 272 mil). Las profundidades de lectura equivalentes al número de genomas secuenciados fueron entre 1500 y 5500 (2885 ± 2219). Los datos normalizados a mil genomas muestran que el número de deleciones por muestra es similar entre las tres muestras ya que el número total de deleciones se encuentra entre 496 y 586 (533 ± 47) y las deleciones únicas entre 434 y 514 (474 ± 40) lo cual sugiere que existe una gran diversidad de deleciones en los genomas mitocondriales ya que las deleciones únicas sin considerar la frecuencia representan una buena proporción del total de eventos (Tabla 2, Figura 8). Tabla 2. Resultados numéricos de la secuenciación y mapeo de las muestras de pulpa dental. 37 Figura 8. Dispersión entre las muestras de las lecturas secuenciadas por Illumina Nextseq y lecturas mapeadas en el genoma mitocondrial de referencia para humano. La barra horizontal representa la mediana de la distribución de los valores de las tres muestras. Los puntos de corte de las deleciones se distribuyen a lo largo del genoma mitocondrial y es posible identificar coordenadas recurrentes en 5' como las posiciones 521, 5750, 2461, 6696 y en 3' las coordenadas 524, 5752, 6698, 2463 las cuales flanquean algunas de las deleciones más comunes en las muestras (Figura 9). 38 39 Figura 9. Puntos de corte de las deleciones identificadas en el genoma mitocondrial humano. En el eje X se representan las 16.5 Kb del genoma mitocondrial y en el eje Y representa las frecuencias de deleciones por cada diez mil genomas de los puntos de ruptura en escala logarítmica base 10. En azul se identifican los puntos de ruptura en 5' y en naranja los de 3', los picos observados representan sitios de ruptura comunes. 4.2.1 Deleciones recurrentes Las deleciones más abundantes en los tres individuos fueron de un solo nucleótido en las posiciones 521-524, 5750-5752 y 2462-2464. La primera tiene 1.13%, 2.58% de 40 heteroplasmia en P1, P2 respectivamente y no se encontró en P3 mientras que la segunda tiene 0.53%, 0.29% y 0.24% y la tercera 0.27%, 0.35% y 0.17% en las tres muestras de pulpa dental. Estas deleciones afectan la región del d-loop, una región intergénica entre el ARN de transferencia para Asparagina y el de Cisteína y el gen del ARN ribosomal 16S. Dado que los grados de heteroplasmia son bajos, es de esperarse que su presencia no afecte la funcionalidad mitocondrial (Figura 10). 41 Figura 10. Deleciones de mayor abundancia en el genoma mitocondrial humano. En rojo se observan las deleciones más abundantes de nuestro análisis. Las letras interiores representan los aminoácidos a los que corresponden los ARN de transferencia y por fuera se encuentran las coordenadas de los genes codificados en el genoma mitocondrial humano de acuerdo al genoma de referencia (NCBI Reference Sequence: NC_012920.1). 4.2.2 Tamaños de deleciones Las deleciones fueron clasificadas por tamaño y normalizadas para ser comparables entre sí. 42 Se identificaron deleciones de entre 1 y 8295 pares de bases con medianas de 1350, 1597 y 1252 pares de bases respectivamente en cada muestra. Observamos que la distribución de las deleciones por tamaño se mantiene entre las muestras, siendo las más abundantes las de un sólo nucleótido y en conjunto las de más de cinco mil pares de bases (Figura 11). 43 Figura 11. Distribución de las deleciones por tamaños en cada una de las tres muestras de pulpa dental. En el eje de las X, se representa el porcentaje de las frecuencias relativas acumuladas de las deleciones clasificadas por tamaño, considerando los eventos como independientes. La frecuencia total acumulada de las deleciones, con nuestras consideraciones no excede al total de genomas secuenciados en las tres muestras, lo que nos sugiere que no todas las 44 moléculas de ADN mitocondrial tienen deleciones y no es posible saber si hay más de una deleción por genoma. Si consideramos el cociente del total de deleciones entre el total de genomas secuenciados. Por muestra tenemos una relación de 0.52, 0.59 y 0.5 deleciones por genoma mitocondrial. Al asumir la independencia de cada evento de deleción, consideramos la frecuencia como una proporción de los genomas que no presentan ninguna de las deleciones anteriores. En cada caso la suma de los genomas con y sin deleciones es el 100%. Por lo que la frecuencia acumulada representa los genomas con deleciones y corresponde a 40.44%, 44.35% y 39.11% respectivamente en los tres individuos. 4.2.3 Distribución de las deleciones Con el propósito de conocer la distribución de las deleciones a lo largo del genoma mitocondrial, se graficaron las deleciones encontradas de acuerdo a los puntos de ruptura de inicio y fin en el genoma mitocondrial para detectar si hay regiones con mayor recurrencia de deleciones y observamos que existe una gran diversidad de eventos ya que las deleciones ocurren en cualquier punto del genoma mitocondrial aunque existen zonas con mayor recurrencia. (Figura 12). Se observa una región aproximadamente entre las posiciones 5 000 y 8 000 con abundantes deleciones de tamaño superior a 2 Kb y en las deleciones mayores a 5 Kb parecen tener una mayor recurrencia en el segundo tercio del genoma mitocondrial. Con respecto a la región del d-loop, observamos la presencia de deleciones de un solo nucleótido, pero considerando tamaños mayores se observa un mínimo de deleciones, lo cual sugiere una mínima recurrencia de eventos. 45 Figura 12. Distribución de las deleciones en el genoma mitocondrial humano por tamaño. Cada círculo representa las 16.5 Kb del genoma mitocondrial humano. Inicia de la circunferencia al centro a manera de espiral, y va trazando cada deleción como arcos que van del punto de ruptura inicial al final. Los radios (en el caso de las deleciones de menor tamaño) y los arreglos radiales que asemejan rebanadas de pastel (en deleciones de mayor tamaño) representan regiones con recurrencia de eventos, por el contrario las regiones blancas representan la ausencia de eventos en nuestras muestras en esa región. Los números debajo de cada círculo representan los eventos graficados en cada caso. 46 4.2.4 Secuencias repetidas directas Con el fin de determinar si las deleciones mayores a 15 nucleótidos se asociaban con secuencias repetidas directas analizamos la identidad de las secuencias adyacentes a cada deleción. Las secuencias repetidas directas son secuencias de nucleótidos idénticas en las regiones previas a los puntos de ruptura 5' y 3' de la deleción y según la literatura pueden favorecer eventosde recombinación. Al comparar las secuencias repetidas directas en las deleciones provenientes de nuestras muestras con los de una población de deleciones provenientes de una simulación aleatoria, observamos hay una menor probabilidad de encontrar las secuencias repetidas directas conforme aumenta el número de nucleótidos idénticos y por lo tanto longitudes mayores presentan frecuencias menores. Esta tendencia se observa tanto en las muestras como en la deleciones simuladas. Alrededor del 71.7% de las deleciones no tienen secuencias repetidas directas, el 26.4% tienen microhomologías de entre 1 y 3 nucleótidos y sólo alrededor del 1.9% de las deleciones de tamaño mayor a 15 nucleótidos tiene un repetido directo de al menos 4 nucleótidos y hasta 8 nucleótidos de longitud, que fue el mayor identificado. Sin embargo las frecuencias de deleciones con secuencias repetidas en sus puntos de corte mayores a tres nucleótidos son ligeramente mayores que las esperadas de manera aleatoria (Figura 13-A). Además no se observa alguna prevalencia por región del genoma de acuerdo a los repetidos directos (Figura 13-B), lo cual correlaciona con lo descrito previamente en ratón. La mayoría de los repetidos directos y los de mayor longitud fueron identificados en deleciones de mayor tamaño (Figura 13-C). 47 Figura 13. Repetidos directos de las deleciones en cada muestra de pulpa dental. A. Frecuencia relativa de repetidos directos en las deleciones de las muestras de pulpa dental comparada con la de una muestra de deleciones aleatorias. B. Distribución de los repetidos directos de las deleciones en el genoma mitocondrial. El círculo representa las 16.5 Kb del genoma mitocondrial humano. Se graficó una muestra de 100 deleciones por muestra y cada una se gráfica como una cuerda del punto de corte 3' al 5'. El color representa la longitud de los repetidos directos en cada muestra y el grosor de la línea la frecuencia de esa deleción. C. Repetidos directos identificados en los grupos de deleciones clasificadas por tamaño. En deleciones de tamaños entre 15 y 100 nucleótidos de longitud no encontramos deleciones con repetidos directos de 4 nucleótidos o 48 4.2.5 Deleciones comunes Luego del filtrado de las deleciones propias de cada muestra de acuerdo a sus puntos de ruptura, se identificaron las deleciones únicas compartidas entre las muestras sin considerar su frecuencia, sólo como eventos únicos. Del total de las deleciones identificadas, las comunes en las tres muestras representan el 0.7% (25 deleciones) y tienen porcentajes de heteroplasmia entre 0.02% y 0.53% en las muestras de pulpa dental (Figura 14-A). Sin embargo, la profundidad varía entre las tres muestras y afecta la proporción de deleciones ya que a mayor profundidad aumenta la probabilidad de identificar un mayor número de deleciones por muestra, por lo que la proporción entre las muestras debe tomarse con reservas. Por esta razón tomamos muestras aleatorias de P2 y P3 equivalentes al número de eventos de P1. Así es posible observar la proporción de deleciones compartidas entre las muestras sin el efecto de la profundidad. Con esta consideración, la mayor proporción de deleciones compartidas se observa entre P1 y P2 (33 deleciones), luego entre P2 y P3 (24 deleciones) y finalmente entre P1 y P3 (20 deleciones) (Figura 14-B). De las 25 deleciones identificadas originalmente como comunes, el 84.0% (21 deleciones) son de 1 solo nucleótido y de los genes afectados por estas deleciones, el gen que codifica para un polipéptido de la NADH Deshidrogenasa, ND2, fue el más afectado seguido de el gen para el polipéptido del citocromo C oxidasa, CO1 (Figura 14-B,C). De las cuatro deleciones que no son de un solo nucleótido, sólo una está asociada a un repetido directo de 4 nucleótidos. 49 Figura 14. Deleciones comunes en las muestras de pulpa dental. A. Deleciones compartidas entre los tres individuos de estudio y su variabilidad, cada círculo representa el universo de genomas mitocondriales de cada muestra de pulpa dental (P1, P2, P3); los números son las deleciones propias de cada muestra y en las intersecciones las deleciones comunes con su porcentaje en relación al universo de deleciones identificados en la muestra. B. Deleciones compartidas entre los tres individuos comparando el mismo número de deleciones en cada muestra: el total de 716 de P1 y las mismas cantidades de P2 y P3 seleccionadas de manera aleatoria del total de cada una. C. Las 28 deleciones comunes se observan en la tabla clasificadas con base a su tamaño D. La gráfica muestra los genes afectados por las deleciones comunes y su frecuencia general. 50 5. Discusión Este estudio es un trabajo inicial en el que se llevó a cabo el análisis de la carga de deleciones partiendo de datos de secuenciación masiva con poca profundidad. La información obtenida nos da una idea de carga mutacional de deleciones en el genoma mitocondrial humano en individuos sanos. Además, los métodos desarrollados nos permitirán un estudio más detallado que pueda confirmar nuestros resultados con una mayor certeza estadística. El genoma mitocondrial de individuos sanos contiene una alta abundancia de deleciones de baja frecuencias Hay estudios en humano de distintos grupos de edad, condiciones de salud y diferentes tejidos en los cuales se han identificado variantes en el genoma mitocondrial que sugieren que existe una carga mutacional basal. De las mutaciones identificadas la mayoría se encuentra en grados bajos de heteroplasmia ( 0.2% al 2%) y un mínimo número de variantes tienen hasta un 20% de heteroplasmia (Payne et al. 2013; Greaves et al. 2014). En resultados previos de nuestro laboratorio se identificó una gran diversidad de deleciones en distintos estadios de la vida del ratón, la mayoría de ellas con frecuencias bajas. Se estima que las deleciones afectan alrededor del 10% de los genomas mitocondriales de ratón, lo cual es menor al promedio estimado en nuestro estudio de 41.3% de genomas portadores de una deleción, asumiendo independencia de los eventos y una sola deleción por genoma. Sin embargo, existen limitaciones en nuestro método para saber si hay más de una deleción por genoma debido a que el ADN mitocondrial se fragmenta como paso previo a la secuenciación y se hacen genotecas de los fragmentos, en este caso de 135 nucleótidos. Debido a lo anterior no es posible saber qué lecturas corresponden a una misma molécula de ADN mitocondrial. 51 Nuestros resultados señalan que también existe una alta diversidad y baja frecuencia individual de deleciones y si consideramos la suma de todos los eventos podemos decir que la carga mutacional es alta, aún en condiciones de salud. Las deleciones se distribuyen en todo el genoma mitocondrial. Las deleciones específicas con mayor frecuencia fueron 521-524, 5750-5752 y 2462-2464; cuyas coordenadas corresponden respectivamente al d-loop, una región entre el ARN de transferencia para asparagina y el de cisteína y al gen de ARN ribosomal 16S. Estas deleciones tienen valores de heteroplasmia de entre 0.13% y 1.17%, lo cual contrasta con otros resultados donde describen mutaciones en el ADN mitocondrial de células provenientes de individuos sanos con porcentajes de heteroplasmia de hasta 97% en distintos genes mitocondriales tanto ARN ribosomal, ARN de transferencia, y polipéptidos, destacando deleciones en el d-loop (Kang et al. 2016). Cabe mencionar que ninguna de las deleciones más abundantes descritas en otros estudios en humano, ya sean en condiciones de salud o como deleciones patológicas las cuales se han asociado con alguna enfermedad fue identificada en las genotecas procedentes de nuestras muestras (Solano et al. 2001; DiMauro & Schon 2001; Kang et al.2016). En estudios previos de nuestro laboratorio en ratón identificamos deleciones distribuidas en todo el genoma mitocondrial. Sin embargo existen regiones discretas donde ocurren con mayor frecuencia lo cual fue similar con nuestros resultados (Ayala-Sumuano. Resultados preliminares). En un estudio previo se analizan deleciones como una compilación de resultados de distintos artículos con datos de secuenciación del ADN mitocondrial humano en condiciones patológicas y de salud (Damas et al. 2014). Al analizar los puntos de ruptura en 5' y 3', en otros estudios encontraron que se encuentran distribuidos en el genoma. Sin embargo hay una prevalencia en 5' en la región entre las coordenadas 6,000 y 10,000, iniciando en las secuencias del ARN de serina 1 y los genes CO2 y ATP8, mientras que para 3' la mayor 52 proporción se encuentra entre los nucleótidos 13,000 y 16,000 aproximadamente, en los genes ND5, CYTB y más marcadamente en el d-loop (Damas et al. 2014). Al realizar el análisis de la posición de los puntos de ruptura de nuestras deleciones parecen tener una distribución más uniforme a lo largo del genoma mitocondrial. Otros resultados de este mismo estudio en humanos revelan que el 98.8% de los genomas mitocondriales conservan la región del d-loop (Damas et al. 2014), o sea que no es común encontrar deleciones en esta región. En nuestro estudio observamos que la región circundante al origen, posiblemente en el d-loop, parece tener un mínimo de deleciones, sobre todo de gran tamaño. Sin embargo, se identificaron deleciones pequeñas e incluso el evento con mayor grado de heteroplasmia se encuentra en esta región (521-524). La baja incidencia de deleciones mayores en esta región no necesariamente significa que no ocurran. Es posible que las deleciones en el d-loop afecten severamente el genoma mitocondrial ya que en esta región se encuentra el origen de replicación OH de la cadena pesada y promotores de la transcripción. Las deleciones que afectan el origen de replicación OL de la cadena ligera también se consideran como mutaciones de alta severidad. Si un genoma deja de ser funcional ya no se replica y la célula lo elimina por lo que sería difícil identificar genomas con esta región deletada al momento del muestreo. En el caso de las regiones con alta incidencia de deleciones, éstas pueden seguir siendo funcionales gracias a que se pueden complementar con otros genomas. El genoma mitocondrial contiene deleciones de distinto tamaño y las más abundantes son las de un nucleótido Las deleciones identificadas en el ADN mitocondrial de células provenientes de sujetos sanos varían en tamaño. Sin embargo las de mayor abundancia son las de un nucleótido. Estos resultados concuerdan con los descritos en el ADN mitocondrial de ratón en distintos estadios en estudios previos de nuestro laboratorio (Ayala et al. Resultados preliminares). Las deleciones identificadas en nuestras muestras van de 1 a 8295 pares de bases con una mediana de 1350 pares de bases. La diversidad en el tamaño de las deleciones en el 53 genoma mitocondrial fueron descritas previamente en humano al identificarse en tejidos sanos deleciones de tamaño entre 3 y 15,628 pares de bases de longitud con una media de tamaño de 7,471 pares de bases (Damas et al. 2014). En otros estudios mencionan deleciones de distintos tamaños bajo otras condiciones y en otras células como espermatozoides (Colagar & Karimi 2014). Las deleciones van desde cambios en un sólo nucleótido hasta deleciones de 16 Kb, lo cual sugiere la posibilidad de circularización de los fragmentos que son producto de una deleción. Por ello en este estudio se consideraron sólo las deleciones menores a 8299 pares de bases, la mitad del genoma. Con esto evitamos la duplicación de eventos, ya que no es posible saber si estamos considerando tanto el fragmento genómico deletado y circularizado como el genoma del cuál se desprendió el fragmento como dos eventos independientes cuando en realidad podrían ser producto del mismo. La mayoría de las deleciones no están asociadas a secuencias repetidas directas. Se ha descrito que las secuencias repetidas directas están asociados a deleciones en el genoma mitocondrial ya que favorecen eventos de recombinación. Algunos estudios en humano, tanto en condiciones patológicas como en individuos sanos el 3.97% de las deleciones está asociada a secuencias idénticas de más de 10 nucleótidos y 16.5% tienen secuencias repetidas directas de más de 4 nucleótidos (Damas et al. 2014). Esto difiere de nuestros resultados en los que observamos que sólo el 1.9% de las deleciones mayores a 15 nucleótidos tienen secuencias idénticas de más de 4 nucleótidos. Las diferencias entre nuestros resultados y los obtenidos en otros estudios se relaciona directamente con nuestro método de muestreo. Este método nos permite observar un panorama más amplio e identificar deleciones de distinto tamaño en cualquier región del genoma mitocondrial con gran precisión. La metodología usada en otros estudios se limita a deleciones específicas cuya incidencia está relacionada patologías mitocondriales. 54 A pesar de que hay una baja proporción de deleciones asociadas a secuencias repetidas directas, éstas ocurren con una frecuencia un poco mayor a la esperada de manera aleatoria en nuestros datos, así como en otros estudios en humano (Damas et al. 2014; Lakshmanan et al. 2012). Esto sugiere que las secuencias repetidas directas no se encuentran únicamente por probabilidad en las deleciones sino que su presencia tiene un origen biológico. Nuestros datos sugieren que la mayoría de las deleciones no se asocian a eventos de recombinación favorecidos por secuencias homólogas y su origen podría ser a través de otros mecanismos. Lakshmanan, Damas y Colagar describen repetidos directos de 13 nucleótidos de longitud en humano. Nosotros detectamos secuencias de hasta 8 nucleótidos en nuestras muestras pero no puede descartarse que existan secuencias idénticas de mayor tamaño debido a la baja profundidad de nuestro estudio (Lakshmanan et al. 2012; Damas et al. 2014; Colagar & Karimi 2014). Los resultados previos de nuestro laboratorio en ratón son similares a lo observado en humano ya que la mayoría de las deleciones no están asociadas a repetidos directos y éstos se observan preferentemente en deleciones de varias kilobases. La ocurrencia de los eventos de deleción en ratón no está asociada a la longitud de los repetidos directos en las deleciones. No obstante, en ambas especies, el empleo del mismo método reveló que la diferencia entre la presencia de repetidos directos en las muestras comparadas con los datos aleatorios es mayor en ratón que en humano, sobre todo en longitudes mayores a 10 nucleótidos. En ratón se detectaron repetidos directos de 15 nucleótidos mientras que el más largo en humano fue de 8 nucleótidos de longitud. Sin embargo, estas diferencias pueden deberse a que el tamaño de las muestras de ratón es mayor al de las de humano. Entre mayor es la muestra mayor es el número de eventos analizados y aumenta la probabilidad de detectar eventos que ocurren más esporádicamente (Ayala, J. Resultados preliminares). 55 Al analizar las deleciones en el ADN mitocondrial de individuos sanos encontramos que hay una alta carga mutacional. Esto constituye un hallazgo relevante que sugiere que todo individuo tiene una carga de deleciones en el ADN mitocondrial que no causa disfuncionalidad mitocondrial. Las deleciones identificadas se encuentran en bajas frecuencias y es probable que sean transmitidas por línea materna dada la recurrencia de algunas deleciones en diferentes individuos. Esto es relevante ya que esta alta diversidad de deleciones presentes
Compartir