Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE CIENCIAS Relaciones filogenéticas y estructurales de la ligasa de ADN de Thermococcus gammatolerans. T E S I S QUE PARA OBTENER EL TÍTULO DE: BIÓLOGO P R E S E N T A : ARMANDO AVILA ROSAS DIRECTOR DE TESIS: DR. ENRIQUE RUDIÑO PIÑERA Ciudad Universitaria, Cd. Mx., 2019 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. 2 Datos sinodales Secretario tutor Dr. Enrique Rudiño Piñera Instituto de Biotecnología, UNAM. Presidente Dra. Adelaida Díaz Vilchis Instituto de Biotecnología, UNAM. Vocal Dr. Arturo Carlos II Becerra Bracho Instituto de Biotecnología, UNAM. Suplente 1 Dr. José Luis Puente García Instituto de Biotecnología, UNAM. / Facultad de Ciencias, UNAM. Suplente 2 Dr. Luis David Alcaraz Facultad de Ciencias, UNAM Datos de trabajo escrito Relaciones Filogenéticas y Estructurales de la ligasa de ADN de Thermococcus gammatolerans. p 61 2019 3 Dedicatoria Para Miriam, Jesús, Ernesto, Virginia y a mis amigos, porque siempre estuvieron ahí en las buenas, en las malas y en las peores. 4 Agradecimientos A mi familia A Miriam Margarita Rosas Olguín, A Jesús Ernesto Avila Nava, Ernesto Avila Nava y a Virginia Nava. Mi familia que siempre me apoyo en todas mis decisiones. A mi jurado Al Dr. Enrique Rudiño Piñera, a la Dra. Adelaida Díaz Vilchis, al Dr. Arturo Carlos II Becerra Bracho, al Dr. José Luis Puente García y al Dr. Luis David Alcaraz Peraza por su tiempo y sus consejos para volverme un buen científico. A mis mentores Al Dr. Enrique Rudiño Piñera por la confianza, la enseñanza y el apoyo. Al Dr. José Luis Puente García por abrirme las puertas al mejor instituto de nuestra universidad. Al Dr. Víctor Manuel Valdés López, por ser siempre un modelo a seguir. A la Q. Viviana Escobar Sánchez, por la paciencia y el apoyo incondicional. A la Dr. Norma Carolina Sánchez Aranda, por sentar las bases científicas que me llevaron hasta este punto de mi vida. Al Biol. Alfredo Rodríguez Arteaga que me guio y ayudo siempre. A mi alma mater A la Universidad Nacional Autónoma de México, (UNAM). A la Facultad de Ciencias de la UNAM. Al Instituto de Biotecnología de la UNAM por acogerme y ser como una segunda casa. A mis amigos de antaño Jaime Omar, Adrian, Aarón, Sergio, Arturo, Héctor, Gustavo y Julio. A mis amigos y colegas Samantha, Francisco, Miguel, Alan, Monserrat, Samuel, Isaac, Claudia, Aldo, Hugo, David Delgado, Miguel Ángel Cervantes, Jonathan, Laura, Jimena, Pablo, Catalina, Columba, María, Fernanda, Kenya, Coni, Aldo y Eirá por su amistad y hacer mi paso por la facultad más divertida y enriquecedora. A mis compañeros y colegas del laboratorio 8 del grupo de bioquímica estructural del Instituto de Biotecnología por sus críticas y ayuda. A Thermococcus gammatolerans por existir y ser un enigma de la naturaleza. A quien dedico parte de su valioso tiempo para leer este trabajo. 5 CONTENIDO 1. RESUMEN………………………………………………………………………………… 7 1.1 Abstract……………………………………………………………………………………. 8 2. INTRODUCCIÓN…………………………………………………………………………. 9 2.1 Biología estructural…………………………………………………………………………… 9 2.2 Evolución molecular…………………………………………………………………….……. 9 2.3 Cristalografía de proteínas con rayos X……………………………………………………10 2.4 Historia y relevancia de las DNA ligasas…………………………………………………..11 2.5 Mecanismos (pasos de reparación) y características de su función……………………12 2.6 Componentes estructurales de la enzima y sitios conservados (motivos y dominios).13 3. ANTECEDENTES………………………………………………………………………. 15 3.1 Dinámica durante la reparación del DNA por las DNA ligasas………………………… 15 3.2 Relaciones filogenéticas y el estudio de las relaciones a nivel de secuencia y estructura…………………………………………………………………………………………. 16 3.3 Características biológicas y radio resistencia de Thermococcus gammatolerans…... 17 3.4 Características intrínsecas de las proteínas para resistir temperaturas altas o a radiación………………………………………………………………………………………….. 18 4. HIPÓTESIS…………………………………………………………………………….... 19 5. OBJETIVOS……………………………………………………………………………... 19 6. METODOLOGÍA……………………………………………………………………….... 20 6.1 Criterios para la selección de estructuras cristalográficas de DNA ligasas del PDB... 20 6.2 Criterios de filtración de estructuras provenientes de la base de datos del PDB……. 20 6.3 Determinación de los dominios de las DNA ligasas obtenidas del PDB……………… 21 6.4 Relaciones estructurales de las DNA ligasas……………………………………………. 21 6.5 Formación de filogenias a partir del programa IQ-TREE……………………………….. 21 6.6 Análisis de los residuos de Glu y Asp expuestos al solvente en las estructuras de las DNA ligasas mediante el programa Charmm y GraphPad Prism 7…………………...…… 22 6.7 Visualización y conteo de puentes salinos con el programa VMD………………….…. 24 8.8 Identificación de la proporción de residuos de aminoácidos totales y cargados negativamente de las secuencias correspondientes de las estructuras de DNA ligasas depositadas en el PDB………………………………………………………………………….. 24 7. RESULTADOS………………………………………………………………………….. 25 7.1 Obtención de la base de datos proveniente del PDB…………………………………... 25 6 7.2 Árboles filogenéticos de las estructuras cristalográficas de las DNA ligasas depositadas en el PDB mediante el servidor DALI………………………………………….. 26 7.3 Alineamientos de las secuencias correspondientes a las estructuras cristalográficas de las DNA ligasas con el programa MEGA-X…………………………………………………... 29 7.4 Árboles filogenéticos de secuencias depositadas en UniProt correspondientes a las estructuras cristalográficas del PDB de las DNA ligasas con el programa IQ-TREE……. 31 7.5 Árbol filogenético de secuencias de DNA ligasas dependientes de ATP y NAD+ provenientes del servidor FASTA.ebi utilizando el programa IQ-TREE………………...… 34 7.6 Proporción de residuos cargados negativamente de secuencias depositadas en la base de datos de UniProt y de las estructuras cristalográficas utilizadas………………… 35 7.7 Residuos cargados negativamente expuestos al solvente de las estructuras cristalográficas de las DNA ligasas…………………………………….……………………… 38 7.8 Cuantificación de puentes salinos en las estructuras cristalográficas de las DNA ligasas mediante el programa VMD…………………………………………………………… 39 8. DISCUSIÓN……………………………………………………………………………… 40 9. CONCLUSIONES………………………………………………….……………………. 47 10. REFERENCIAS……………...…………………………………….……………………. 48 11. APÉNDICES……………………………………………………….……………………. 54 7 1. RESUMEN Las ligasas de ADN o DNA ligasas están presentes en todos los seres vivos y son unas de las enzimas más importantes en la vida, por su papel en la reparación del DNA uniendo los fragmentos de Okazaki o uniendo la doble hélice del DNA en los eventos que causan suruptura, como la exposición a dosis altas de radiación. Además, las DNA ligasas ha sido estudiadas a nivel de estructura y función. En diversos estudios se han determinado las estructuras primarias y terciarias de las DNA ligasas de diversos organismos, y esta información puede ser consultada en diversos servidores en internet p.e. Uniprot, PDB, EBI, entre otros. Los datos de dichos servidores muestran que existen diferencias en cuanto a estructura, tanto primaria, como terciaria, en DNA ligasas de arqueas y eucariontes con respecto a la aisladas a partir de bacterias. Esto debido a cambios en el orden o posicionamiento de sus dominios, e incluso al origen de un motivo adicional presente en las DNA ligasas de bacterias. Gracias a la cristalografía de proteínas y a la difracción de rayos X, así como a las herramientas de inferencia filogenética, se pueden detectar diferencias o características que pueden estar asociadas a la adaptación de las proteínas a diferentes ambientes, lo que permite la posibilidad de conocer particularidades en la estructura y evolución de esta importante enzima, tanto a nivel de secuencia, como de estructura tridimensional. Este trabajo de tesis, se enfoca en el estudio de la DNA ligasa de la arquea Thermococcus gammatolerans, ya que sus adaptaciones a ambientes extremos son de interés científico y biotecnológico. T. gammatolerans es el organismo más resistente a la radiación reportado a la fecha y cuya proteína estructural, con la que también interactúa la DNA ligasa, llamada antígeno nuclear de células en proliferación (PCNA), se ha demostrado en nuestro grupo de investigación, que es resistente a altas dosis de radiación ionizante, debido a su composición de aminoácidos. Esta tesis, muestra mediante análisis in silico de la estructura, primaria y terciaria, y la resolución de la filogenia de la DNA ligasa de T. gammatolerans, que comparte características estructurales en común con la PCNA del mismo organismo. La DNA ligasa, al igual que la PCNA, forma filogenias discretas, mostrando que esta enzima puede ser buen candidato de una enzima que resista la radiación ionizante. Y que la orientación relativa de los dominios que la componen, durante el proceso catalítico de la reparación del DNA, podría no ser extrapolable entre integrantes de distintos dominios de la vida. Por 8 otro lado, en este trabajo se muestra que existen diferencias entre las DNA ligasas de organismos termófilos y mesófilos. Específicamente en la proporción de los residuos de aminoácidos, las interacciones en las que están involucradas, sus características químicas, entre otras, que pueden estar asociadas con la adaptación de diferentes presiones de selección en diferentes ambientes. 1.1 Abstract The DNA ligases, are present in all living organisms and they are one of the most important enzymes in life for their role in the repair of the DNA, joining the Okazaki fragments or joining the double hélix of DNA in events that cause it's breaking, like high radiation exposure. Also, these enzymes have been studied in several works, at a level of function and structure, and their sequences and three-dimensional structures of these enzymes are deposited in different public databases. These data show the existence of differences in primary and tertiary structures among DNA ligases from archaea, eukarya, and bacteria, these particularities can be explained thanks to the domain order and the novel origin of an additional motive in bacterial DNA ligases. On the other hand, thanks to X-ray crystallography determinations and the use of phylogenetic inference tools, we can detect differences or features that can be associated with the effect of adaptation in extreme environments, allowing us to open the possibility to undercover the existence of particularities in the structure and evolution process of this crucial enzyme. This work, focus on the study of the DNA ligase from the archaea Thermococcus gammatolerans, due to the extreme resistance of this organism against ionizing radiation, together, with previous studies of our group proving that another protein coming from these organisms: PCNA (Proliferating Cell Nuclear Antigen), is intrinsically resistant to ionizing radiation, will allow us to propose some characteristics product of adaptations to proteins in extreme environments, with potential implications both in scientific descriptions and future biotechnological applications. Finally, my job shows, using an in silico analysis of the structure and phylogeny of the DNA ligase of T. gammatolerans, that this enzyme shares structural features in common with the PCNA of the same organism, and in likeness, PCNA forms discrete phylogenies, exhibit that DNA ligase could be a good candidate to display resistance to ionizing radiation and that the relative orientation of the domains that compose it, during the 9 catalytic process of DNA repair, could not be extrapolated among members of different domains of life. Thus, in this work is shown that there are differences among the DNA ligases of different thermophilic and mesophilic organisms, specifically in the proportion of the amino acid residues, the interactions in which they are involved, their chemical characteristics, among others, that can be associated with the adaptation of different selection pressures in different environments. 2. INTRODUCCIÓN 2.1 Biología estructural. Durante el siglo XlX Charles Darwin publicó su aclamado libro “El origen de las especies”. A partir de su publicación en el año 1859, nació un nuevo campo en la ciencia y el entendimiento sobre la diversidad, su clasificación y origen de los seres vivos, gracias a la idea de cambios en las poblaciones a través del tiempo, y que la evolución era tratada como un hecho y no como una suposición (de Queiroz, 1988). Posteriormente, en el siglo XX a partir de las nuevas ideas evolutivas y el nacimiento de la biología molecular, producto del trabajo en el modelo de la doble hélice del DNA generado por J. Watson y F. Crick sustentada en las imágenes de fibras de DNA difractadas con rayos X de R. Franklin, nació la escuela de la biología estructural (Franklin & Gosling, 1953; Stent, 1968; WATSON & CRICK, 1953). En la revista Nature, se reporta que la biología estructural es un área que se enfoca en el estudio de la estructura molecular y dinámica de las macromoléculas biológicas, particularmente proteínas y ácidos nucleicos, y cómo las alteraciones en sus estructuras afectan su función, utilizando como bases los principios de la biología molecular, la bioquímica y la biofísica (“Structural biology - Latest research and news | Nature,” n.d.). Evolución molecular. En el siglo XX también como consecuencia de la teoría evolutiva y las nuevas ideas de la bióloga molecular nació la evolución molecular, que es una rama de la biología que estudia los cambios a un nivel molecular. Esta área incluye la tasa de cambio en las secuencias, la importancia adaptativa relativa, los cambios neutrales y los cambios en la estructura del genoma y que al final tienen un impacto en la función de las proteínas o RNA’s que codifican (Ajawatanawong, n.d.; Futuyma, 2005; “Molecular evolution - Latest research and news | Nature,” n.d.). Por otro lado, la evolución molecular se basa primordialmente en inferir relaciones filogenéticas, a partir del estudio comparativo de las 10 secuencia de biomoléculas tales como los nucleótidos en los genes, o entre las secuencias de aminoácidos que componen a las proteínas, con el fin de conocer el papel y la historia evolutiva en los cambios que han tenido a través de la historia natural las diferentes especies (Ajawatanawong, n.d.; Futuyma, 2005; KIMURA, 1991). Cristalografía de proteínas con rayos X. Dentro de la biología estructural, la técnica de cristalografíapor rayos X desarrollada a partir de observaciones de W. H. Bragg y W. L. Bragg en 1912, representa una herramienta fundamental para conocer las estructuras tridimensionales de las biomoléculas. Dicha técnica provee datos muy precisos de las interacciones de los átomos que componen a los ácidos nucleicos, carbohidratos y proteínas a un nivel de resolución muy alto (incluso mayor a 2Å), por lo que, representa ser la técnica más empleada para conocer la estructura tridimensional de las macromoléculas. La importancia de la técnica llega a tal punto, que trabajos que fueron un parteaguas en la biología estructural, como el de Linus Pauling (1954), Max F. Perutz y John Kendrew (1962) y Dorothy Hodgkin (1964) ganaron los premios nobel de química, con trabajos realizados con esta técnica (Ferry, 2014; Nakamura & Csikszentmihalyi, 2001; Rupp, 2010; Stent, 1968; Strandberg, Dickerson, & Rossmann, 2009). Dicha técnica, consiste primeramente en determinar las condiciones fisicoquímicas idóneas para la formación de un cristal de una macromolécula, posteriormente el cristal es sometido a un haz de rayos X, el cual pasa a través del cristal produciendo un patrón de difracción, con el cual a través de diferentes modelos matemáticos como las series de Fourier, se resuelve el problema de las fases (FT) y se obtiene un mapa de densidad electrónica, que es fundamental para conocer la estructura atómica de las moléculas que componen el cristal, datos con los cuales se obtiene la estructura completa de una proteína, como se ve en la figura 1 (Drenth & Mesters, 2007; Rhodes, 2006; Rupp, 2010). 11 Fig. 1. Pasos para determinación de estructuras de macromoléculas mediante la técnica de cristalografía de proteínas (imagen tomada y modificada de Rupp, 2010) Historia y relevancia de las ligasas de ADN ó DNA ligasas. Miles de macromoléculas han sido determinadas por la cristalografía de proteínas y las ligasas de ADN o DNA ligasas como les llamare a lo largo de este trabajo, no son una excepción. Estas son enzimas que estan presentes en todos los seres vivos, pertenecen a la familia de las nucleotidil transferasas, que incluyen a las ligasas de DNA, RNA y tRNA. Desde su descubrimiento en 1967 (Becker, Lyn, Gefter, & Hurwitz, 1967; Gellert, 1967; Little, Zimmerman, Oshinsky, & Gellert, 1967; Masamune & Richardson, 1968; Olivera, Hall, & Lehman, 1968),hasta nuestros días han sido objeto de estudio dada su amplia utilidad como herramienta en la tecnología del DNA recombinante, en la medicina y la biotecnología (Chambers & Patrick, 2015; Eun & Eun, 1996). Además, esta enzima es esencial en la reparación, replicación y recombinación del DNA, ya que esta tiene la capacidad de catalizar la formación de los enlaces fosfodiéster del sitio hidroxil-3´, con el sitio fosforil-5´de la cadena de DNA. La reparación puede ser por escisión de nucleótidos, o de bases, de cadena única o de cadena doble por vía de unión no homóloga. Varias de las estructuras de estas DNA ligasas se encuentran depositadas en la base de datos Protein Data Bank (PDB) (Lehnman, 1974; Shuman, 2009). La importancia de esta enzima radica en que está involucrada en contener el número de mutaciones y aberraciones genéticas que podrían comprometer la vida, al no haber un elemento biológico molecular que uniera los fragmentos de Okazaki en el proceso de replicación, o la reparación del DNA por eventos mutagénicos que rompieran los enlaces fosfodiéster de la doble cadena (Eun & Eun, 1996). 12 . Por otro lado, las DNA ligasas tienen una masa molecular aproximada de 77 kDa, se componen de tres dominios generalmente y pueden ser clasificadas en dos tipos. El primer tipo son aquellas DNA ligasas que son dependientes de ATP, que por lo general son encontradas en virus, arqueas y eucariontes. El segundo tipo son dependientes de NAD+ que se encuentran en bacterias (Nelson, Cox, & Lehninger, 2014). Se piensa, que el ancestro común de las DNA ligasas originalmente utilizaba ATP como sustrato. Esto se ha sugerido por la adquisición del motivo presente en las DNA ligasas dependientes de NAD+ que ayuda a la unión y liberación de nicotinamida mononucleótido (NMN) (Shuman, 2009). Mecanismos (pasos de reparación) y características de su función. El mecanismo de las DNA ligasas puede ser dividido en tres etapas. La primera etapa consiste en que la DNA ligasa dependiente de ATP sea activada, para esto requiere que el AMP sea transferido a un residuo de lisina en el sitio activo de la enzima. Esto ocasiona que se libere un pirofosfato proveniente del ATP, y permite que la enzima logre transfiera la parte adenilo al grupo fosfato 5’-terminal de la cadena de DNA. La segunda etapa inicia al activarse el fosfato 5’-terminal, que ayuda al ataque nucleofílico por parte del grupo 3’- hidroxilo, permitiendo así la formación del enlace fosfodiéster y en consecuencia inicia la tercera etapa. La tercera etapa consiste en el desplazamiento o eliminación del AMP y sellado de la mella del DNA. La diferencia entre los dos tipos de DNA ligasas, es que las DNA ligasas dependientes de NAD+ como es el caso dela enzima de Escherichia coli y de todas las bacterias, en lugar de liberar pirofosfato durante el proceso de adenilación liberan NMN (Mathews, 2013; Nelson et al., 2014). Todo este proceso se muestra en la figura 2. 13 Fig. 2. Mecanismo de acción de la DNA ligasa. Para DNA ligasas dependientes de NAD+ o dependientes de ATP el mecanismo es el mismo, únicamente difieren en que las DNA ligasas dependientes de ATP liberan un PPi tras las adenilación y las de NAD+ liberan un NMN (Imagen tomada y modificada de Nelson et al., 2014) Componentes estructurales de la enzima y sitios conservados (motivos y dominios). Como se dijo antes, las DNA ligasas se componen generalmente de tres dominios. Sin embargo, las DNA ligasas pequeñas como las virales y de algunas bacterias psicrófilas como el caso de Psychromonas sp., son una excepción a la regla, ya que se componen principalmente de dos dominios, tal como es el caso de la enzima del virus T7. En cambio, en eucariontes, arqueas y bacterias las DNA ligasas siempre se componen de tres dominios y seis motivos (l, ll, lll, lV, V y Vl) altamente conservados. Entre las DNA ligasas dependientes de NAD+ y las dependientes de ATP, los motivos del l al V se agrupan primordialmente en el sitio de unión de ATP o NAD+ de la enzima. Es decir, en el primer dominio en el caso de las DNA ligasas dependientes de NAD+ o el segundo dominio en el caso de las dependientes de ATP como se muestra en la figura 3 (Pascal, O’Brien, Tomkinson, & Ellenberger, 2004; Williamson, Rothweiler, & Leiros, 2014). 14 Fig.3. Ejemplo de la distribución de los dominios y motivos conservados en las DNA ligasas dependientes de ATP, como la DNA ligasa l del humano (Figura tomada y modificada de Pascal, O’Brien, Tomkinson, & Ellenberger, 2004). Los dominios que componen de manera general a las DNA ligasa son tres. El primer dominio o dominio de adenilación (AdD), encargado de realizar la adenilación del residuo de lisina por el AMP. Conectado a este primer dominio está el segundo dominio o dominio de unión a oligonucleótidos (OBD), que tiene la función de reconocer nucleótidos como la cadena del DNA y ayuda a mejorar la actividad de adenilación del dominio AdD. El tercer dominio es el de unión al DNA (DBD) que está ampliamente conservado en eucariontes. Este último dominio es análogo al dominio hélice-horquilla-hélice (HhH) en las DNA ligasas dependientes de NAD+ y aunque no se sabe con exactitud su función, in vitro se cree que favorece hacer un mellado en la cadena y también estudios in silico sugieren que puede estar involucrado en la interacción entre la DNA ligasas y la PCNA (Doherty & Suh, 2000; Ellenberger & Tomkinson, 2008; Pascal et al., 2006; Tanabe, Ishino, & Nishida,2015). Por último, en ambos tipos de DNA ligasas el orden de los dominios se encuentra en dos formas diferentes como se muestra en la figura 4. 15 Fig. 4. Comparación en la distribución de los dominios de las DNA ligasas dependientes de ATP y dependientes de NAD+. 3. ANTECEDENTES Dinámica durante la reparación del DNA por las DNA ligasas. El movimiento que realiza la DNA ligasa ha sido inferido a partir de sus diferentes estructuras tridimensionales depositadas en el PDB, sugiriendo que es similar tanto para las DNA ligasas dependientes de ATP como para las de NAD+. En ambos casos el movimiento es parecido al de una pinza que al encontrarse en ausencia de su sustrato, se mantiene en una conformación abierta y adopta una conformación cerrada al tener contacto con su sustrato, mediante el movimiento de los dominios OBD y DBD/HhH (Pascal et al., 2004; Tanabe et al., 2015). Dicho proceso, inicia cuando el dominio AdD es adenilado en el paso uno del mecanismo de acción de la DNA ligasa, como se muestra en la figura 5. Por otro lado, Flores-Hernández E. (2017) hace esta misma sugerencia, pero con un mayor número de estructuras de DNA ligasas dependientes de ATP depositadas en el PDB. 16 Fig. 5. Movimiento conformacional sugerido de las DNA ligasas en base a las estructuras cristalográficas de las DNA ligasas de Sulfolobus solfataricus (SsoLig-rojo), Pyrococcus furiosus (Pfu-azul) y la DNA ligasa I del Homo sapiens (hLig1-verde) (Tomada y modificada de M. Tanabe el al, 2015). Relaciones filogenéticas y el estudio de las relaciones a nivel de secuencia y estructura. Para comprender como la DNA ligasa se relaciona evolutivamente con sus homólogos en diferentes organismos, las estructuras terciarias son una buena herramienta. Desde los años ochenta, se han realizado trabajos de relaciones filogenéticas a partir de estructuras terciarias. En estos se considera que las estructuras de las proteínas se encuentran más conservadas, que las secuencias de aminoácidos responsables del plegamiento de estas (Bajaj & Blundell, 1984; Johnson, Šali, & Blundell, 1990). Por otro lado, los cambios en las secuencias de las proteínas y enzimas pueden repercutir de manera más notable, en el acomodo de los aminoácidos en área expuesta al solvente o en estructuras secundarias en la región hidrofóbica de las proteínas (Johnson et al., 1990). Por lo general, una forma de inferir las relaciones filogenéticas entre las estructuras terciarias de las proteínas, es la media cuadrática (RMS), que permite conocer las diferencias en la translación y rotación de las alfa hélices y las láminas beta de dos o más http://dx.doi.org/10.1155/2015/267570 http://dx.doi.org/10.1155/2015/267570 17 estructuras (Chothia & Lesk, 1986). O bien, mediante diferentes valores estadísticos dentro de una matriz, que representan las desviaciones estándar entre las distancias carbonos alfa, dentro de un mismo plano 2D de diferentes estructuras como es el caso del valor Z que emplea el servidor DALI (Gu & Bourne, 2009). Trabajos previos, basados en la construcción filogenética de proteínas a partir de estructuras terciarias como el de S. J. Remington y B. W. Matthews (1980), hasta uno de los más recientes trabajos de nuestro grupo realizado por Rodríguez-Arteaga A. (2018), han demostrado la importancia de las estructuras terciarias y cuaternarias, para inferir relaciones estructurales y funcionales en diferentes grupos de proteínas. En este último ejemplo, se demostraron las relaciones filogenéticas y estructurales de la PCNA de Thermococcus gammatolerans, con otros grupos de organismos eucariontes y arqueas a partir de estructuras depositadas en el PDB de esta proteína. A su vez, se ha demostrado que comparando secuencias de aminoácidos y comparando estructuras terciarias, ambas hacen coherencia o sentido filogenético a nivel de especies o a nivel de familias de proteínas, por lo que es un buen método para inferir las relaciones evolutivas entre proteínas o para encontrar proteínas divergentes (Johnson et al., 1990). Características biológicas y radio resistencia de Thermococcus gammatolerans. El grupo de los termófilos son de particular de interés, dada la poca información de la evolución molecular en ellos. Primero, los organismos termófilos se caracterizan en que sus tasas de crecimiento óptimas, que varían entre los 65o y 85o C, como es el caso de Thermococcus gammatolerans. Este organismo fue aislado de las chimeneas hidrotermales en La Cuenca de Guaymas ubicada en la dorsal mesoatlántica. T. gammatolerans pertenece a la clase Thermococci del grupo de las arqueobacterias, y se caracteriza por ser un organismo anaerobio estricto y heterótrofo (Zivanovic et al., 2009). Grey (Gy) es unidad internacional para medir la cantidad de radiación que se deposita en un cuerpo por kilogramo de masa, T. gammatolerans llega a tolerar hasta 30 kGy de radiación gamma, por lo que es considerado el organismo más radio resistente descrito hasta el momento, rebasando por mucho los niveles de resistencia de otros organismos radio resistentes como los tardígrados, cuya resistencia no llega a ser mayor de 8 kGy o de la bacteria extremófila Deinococcus radiodurans cuya resistencia llega hasta los 20 kGy (Krisko & Radman, 2013; Palma, Taboada, & Nervi, 2010; Zivanovic et al., 2009). La 18 resistencia a la radiación en estos organismos puede ser atribuible a un eficiente sistema de reparación del DNA (Krisko & Radman, 2013; Tapias, Leplat, & Confalonieri, 2009). Características intrínsecas de las proteínas para resistir temperaturas altas o la radiación. Se piensa que la resistencia a altas temperaturas, es una adaptación que ha dado como resultado que diferentes microorganismos como las arqueas y las bacterias sean capaces a su vez de resistir altas dosis de radiación ionizante dado que ambos generan condiciones de estrés oxidativo que afectan considerablemente la integridad de las macromoléculas (Halliwell & Gutteridge, 1992; Riley, 1994; Stadtman, 1993). Además dicha adaptación requiere de mecanismos para la protección del genoma y proteínas, y también mecanismos eficientes de reparación del material genético para restaurar la funcionalidad del mismo genoma (Pavlopoulou et al., 2016). Dentro de los organismos que componen los tres dominios de la vida, existen múltiples características en las proteínas que permiten la vida en ambientes extremos. En el caso de las arqueas existe un aumento en la frecuencia de los aminoácidos Asp, Glu, Gly, Ile, Tyr y Val con respecto a los procariontes y eucariontes. De manera más específica, entre los microorganismos mesófilos y termófilos, existe una diferencia significativa en la cantidad de aminoácidos cargados negativamente en sus proteínas, predominando sobre todo el ácido glutámico o glutamato en los organismos termófilos (Chen, Shao, & Chen, 2013; Devi, Sharma, Savitri, & Bhalla, 2013). Además, se ha reportado que algunos residuos como la valina, el ácido aspártico y el ácido glutámico demuestran tener una gran estabilidad frente a grandes cantidades de radiación gamma (Cataldo et al., 2011). Por otro lado, se ha demostrado que otros factores como la orientación de los residuos de aminoácidos hidrofóbicos, hacia la parte expuesta al solvente y un alto número de puentes salinos, juegan también un papel importante en la estabilidad conformacional en proteínas provenientes de microorganismos termófilos (Elcock, 1998; Melchionna, Sinibaldi, & Briganti, 2006). Por lo que es importante decir, que las bacterias y arqueas extremófilas son un buen modelo de termorresistencia y radioresistencia, ya que estos organismos poseen proteínas estructurales que permiten la reparación y protección del material genético a altas temperaturas y a la radiación gamma, gracias a la presencia de aminoácidos 19cargados negativamente como el glutamato (Morgunova, Gray, Macneill, & Ladenstein, 2009). Un ejemplo de una proteína con estas características, ha sido previamente estudiada en nuestro grupo, la PCNA (Proliferating Cell Nuclear Antigen) de Thermococcus gammatolerans también llamadas ß-Clamp’s en bacterias. Estas proteínas estructurales están involucradas en el proceso de replicación y reparación del DNA, se encuentran presentes en todos los seres vivos y poseen sitios de unión con diferentes proteínas o enzimas incluyendo a la DNA ligasa (N. Mailand et al, 2013). Por otro lado, las PCNA’s tiene la particularidad de formar filogenias claras a diferentes niveles estructurales, que permiten reconocer clados discretos en la clase de los Thermococci. Lo sugiere que dichas propiedades intrínsecas de resistencia a altas temperaturas y radiación pueden estar compartidas entre miembros de la misma clase, dado que posiblemente tienen las mismas presiones de selección (Rodríguez Arteaga, 2018). Por consiguiente, dos preguntas surgen a partir de los datos provenientes de la literatura. Primero ¿El posicionamiento relativo de los dominios de las DNA ligasas como los describe la literatura, son totalmente extrapolables basándose únicamente por la posición de las estructuras cristalográficas de las DNA ligasas dependientes de ATP? Y segundo ¿Es posible que las características intrínsecas de radioresistencia de una proteína estructural puedan ser extrapolables a una enzima, siendo que ambas provienen del mismo organismo, ambas interaccionan entre sí y están involucradas en la reparación y síntesis del DNA? 4. HIPÓTESIS La relación filogenética, estructural y otras características en la estructura de la enzima DNA ligasa permitirá reconocer características especiales asociadas a la dinámica y resistencia a la radiación en la DNA ligasa de T. gammatolerans. 5. OBJETIVOS General: Comparar las características estructurales intrínsecas y filogenéticas de la DNA ligasa de T. gammatolerans, con otras DNA ligasas de organismos extremófilos y mesófilos. 20 Específicos: ● Producir una base de datos de las DNA ligasas de los tres diferentes dominios de la vida provenientes de las plataformas del PDB, UniProt y FASTA.ebi. ● Realizar comparaciones y alineamientos a nivel de estructura primaria y terciaria entre DNA ligasas de diferentes organismos. ● Definir una reconstrucción filogenética de las DNA ligasas de diferentes organismos a partir de sus estructuras primarias. ● Conocer las particularidades estructurales de las DNA ligasas depositadas en el PDB en cuanto a la proporción de residuos, orientación de sus residuos con carga negativa y el número de puentes salinos. 6. METODOLOGÍA. Criterios para la selección de estructuras cristalográficas de DNA ligasas del PDB. Para la selección de estructuras cristalográficas de DNA ligasas obtenidas del PDB, se tomaron únicamente aquellas que cumplían con los siguientes criterios: 1. Las estructuras que tenían una resolución mayor a 3.02 Å. 2. Se seleccionó únicamente la cadena A de la unidad asimétrica. 3. Las estructuras redundantes que difieren solo en el ligando, pero cuya estructura siempre es igual no fueron tomadas en cuenta, pero si poseían un grupo espacial diferente si fueron tomadas en cuenta. 4. Solo se seleccionaron las secuencias silvestres (sin mutaciones). Criterios de filtración de estructuras provenientes de la base de datos del PDB. En el servidor del PDB, se realizó la selección de estructuras mediante la búsqueda de palabras clave en buscador de la página del PDB (https://www.rcsb.org/), primero como DNA ligase. Posteriormente, se seleccionó en el servidor la opción de Enzymeclassification. Por último, se seleccionó la opción en el recuadro de método experimental la opción de X-ray. De las estructuras obtenidas se elaboró un archivo en formato excel con los datos de la tabla 1. https://www.rcsb.org/ 21 Tabla 1. Búsqueda de texto por: dna ligase y opción seis de la página Enzymeclassification: opción Ligase y Método experimental X-ray. PDB ID. Ligand ID Chain ID. Temperature (K) Collection Temperature pH Value Refinement Resolution Taxonomy ID Structure Title Primary Citation Author Resolution Sequence Classification Chain Length Determinación de los dominios de las DNA ligasas obtenidas del PDB. Desde la base del PDB se utilizó el enlace con la base de datos de Uniprot (https://www.uniprot.org/) de cada estructura. Lo anterior, con la finalidad de obtener la información de la base Pfam (https://pfam.xfam.org/). Esta base se utilizó como marco de referencia para determinar la ubicación de manera precisa de las regiones y los dominios de los que se componen las DNA ligasas. Para eso se utilizó el hipervínculo que tiene cada depósito de UniProt para acceder al Pfam. Relaciones estructurales de las DNA ligasas. De los dominios determinados con el servidor Pfam, fueron seleccionados los archivos de texto .pdb seleccionando únicamente las coordenadas de los aminoácidos que corresponden a un mismo dominio. Previamente, los dominios fueron visualizados con los programas PyMol y Chimera con el fin de confirmar que las regiones de los dominios fueran correctas. Posteriormente, se realizó la relación estructural utilizando el servidor DALI: Protein Structure Comparation Server (http://ekhidna2.biocenter.helsinki.fi/dali/), mediante el método de todos contra todos (All against all) con los archivos .pdb ya seleccionados. Se elaboraron tres árboles no enraizados, correspondientes a cada uno de los tres dominios de las DNA ligasas (AdD, OBD y DBD/HhH) y posteriormente fueron editados mediante el servidor iTOL (https://itol.embl.de/). En dichos árboles, el número de https://www.uniprot.org/ https://pfam.xfam.org/ http://ekhidna2.biocenter.helsinki.fi/dali/ https://itol.embl.de/ 22 estructuras no fue la misma debido a que en el PDB hay estructuras que sólo contiene el dominio AdD como se muestra en la tabla 3. Formación de filogenias a partir del programa IQ-TREE. Para la producción de filogenias, se utilizaron las secuencias de aminoácidos provenientes de la base de datos de Fasta.ebi. Se realizaron cinco árboles, que corresponden a las secuencias depositadas en el servidor UniProt de las estructuras de DNA ligasas depositadas en el PDB y de estos cinco árboles, cuatro corresponden a secuencias de los dominios AdD, OBD y DBD/HhH, uno más corresponde a las secuencias completas de las estructuras. Para la realización de los árboles de las secuencias de los dominios, se realizó un alineamiento con el algoritmo de MUSCLE en el programa MEGA-X (https://www.megasoftware.net/). En estos lineamientos no se eliminó ninguna secuencia. El número máximo de interacciones con este algoritmo fueron 16. Todas las configuraciones utilizadas fueron las predeterminadas por el programa como se muestra en el apéndice 1. El último árbol, corresponde a las secuencias obtenidas del servidor de Fasta.ebi (https://www.ebi.ac.uk/Tools/sss/fasta/) y pertenecen a las secuencias de DNA ligasas dependientes de ATP y dependientes de NAD+. Las secuencias de estos árboles pasaron por un proceso de selección después de alineamiento con el algoritmo MUSCLE en el programa MEGA-X. La selección del alineamiento, consistió en eliminar secuencias correspondientes a fragmentos incompletos de las secuencias, secuencias en isoformas, secuencias de organismos cuya especie y/o género no ha sido identificado, es decir, especies candidatas o putativas y secuencias de organismos muy divergentes, esto último se decidió con el fin de incrementar la precisión del alineamiento al eliminar los gaps y en consecuencia la penalización que estos producían en el alineamiento con riesgo de perder información. En los cinco árboles, las configuraciones paragenerar cada árbol fueron las mismas, los alineamientos se cargaron en el programa IQ-TREE (http://www.iqtree.org/) en formato FASTA. Se empleó el método de máxima verosimilitud y se realizaron mil Bootstrap. Posteriormente, los árboles fueron editados con el servidor iTOL (https://itol.embl.de/) como se muestra en el apéndice 2. https://www.megasoftware.net/ https://www.ebi.ac.uk/Tools/sss/fasta/ http://www.iqtree.org/ https://itol.embl.de/ 23 Análisis de los residuos de Glu y Asp expuestos al solvente en las estructuras de las DNA ligasas mediante el programa Charmm y GraphPad Prism 7. Se prepararon los datos del programa Charmm en el servidor del programa Charmm-Gui (http://www.charmm-gui.org/) utilizando los archivos .pdb correspondientes a las DNA ligasas de la tabla 2. Posteriormente, se utilizaron los archivos .tgz descargados del servidor para utilizarlos en el programa Charmm mediante los pasos que se explican en el apéndices 3 y 4. Los análisis estadísticos de las diferencias en la exposición de los residuos se realizaron en el programa GraphPad Prism 7 (https://www.graphpad.com/scientific-software/prism/) como se ve en el apéndice 5. Tabla 2. Códigos PDB de las estructuras completas de DNA ligasas usadas en el servidor Charmm-gui. Código PDB Especie 1A0I Fago T7 1DGS Thermus filiformis 1FVI Chlorella virus 1V9P Thermus filiformis 1X9P Homo sapiens Lig l 2CFM Pyrococcus furiosus 2HIX Sulfolobus solfataricus 2OWO Escherichia coli 3GDE Archaeoglobus fulgidus 3L2P Homo sapiens Lig lll 3RR5 Thermococcus sp. 3W1G Homo sapiens Lig lV http://www.charmm-gui.org/ https://www.graphpad.com/scientific-software/prism/ 24 4D05 Psychromonas sp. 4EQ5 Thermococcus sibiricus 5TT5 Escherichia coli 6BKG Homo sapiens Lig lV 6DT1 Fago T4 *TgLig Thermococcus gammatolerans *Estructura no depositada aun en el PDB. Visualización y conteo del número de puentes salinos con el programa VMD. Para conocer el número de puentes salinos presentes en las estructuras de las DNA ligasas, se empleó el programa VMD desarrollado por la universidad de Illinois (https://www.ks.uiuc.edu/Research/vmd/). En este programa se utilizaron únicamente las estructuras completas de las DNA ligasas, ya que aquellas estructuras que solo contaban con el dominio AdD carecen de datos suficientes para el análisis. Los parámetros empleados para la búsqueda de los puentes salinos, fueron los estándares que arroja el programa (Apéndice 6). La gráfica correspondiente a los resultados fue hecha y modificada en el programa estadístico GraphPad Prism 7. Identificación en la proporción de residuos de aminoácidos totales y cargados negativamente de las secuencias correspondientes a las estructuras de DNA ligasas depositadas en el PDB. Para obtener la proporción en datos normalizados de los residuos con carga negativa y residuos totales, se acceso a las secuencias de las DNA ligasas por medio del vínculo a la base UniProt que cada estructura tiene en el PDB. Una vez en la base de datos de Uniprot, se tomaron las secuencias en formato FASTA y se analizaron en el servidor SAPS: Statistical Analysis of Protein Sequences (https://www.ebi.ac.uk/Tools/seqstats/saps/) con las configuraciones predeterminadas del servidor. Los datos normalizados del porcentaje de cada aminoácido de la secuencia, fue representado con un histograma hecho y modificado en el programa estadístico GraphPad Prism 7. https://www.ks.uiuc.edu/Research/vmd/ https://www.ebi.ac.uk/Tools/seqstats/saps/ 25 7. RESULTADOS Obtención de la base de datos proveniente del PDB. La Tabla 3. Tiene la lista de códigos depositados en el PDB de las estructuras de DNA ligasas depositadas hasta el momento que se hizo este proyecto, que cumplen con la selección establecida previamente. Además, se enmarcan las DNA ligasas dependientes a ATP o NAD, aquellas cuya estructura carece de algún dominio aun siendo las estructuras completas (flechas verdes y rojas) y estructuras no completas que presentan un solo dominio (flechas moradas). Tabla 3. Lista de códigos de acceso al PDB de las estructuras de las DNA ligasas depositadas en el PDB. *La DNA ligasa de T. gammatolerans fue determinada por (Hernández, 2017) en nuestro grupo y hasta la realización de este escrito no cuenta con un deposito en el PDB. 26 Árboles filogenéticos de las estructuras cristalográficas de las DNA ligasas depositadas en el PDB mediante el servidor DALI. Fig. 6. Árbol de relación estructural del dominio AdD. El árbol no enraizado presenta una agrupación clara en tres taxones diferentes. Se presenta una relación estrecha del dominio entre las arqueas, una relación cercana entre el dominio de las bacterias y una cercanía estructural en el dominio de adenilación entre las DNA ligasas pequeñas, como la de los virus y la bacteria Psychromonas sp. Por otro lado, la DNA ligasa l de H. sapiens muestra ser la más divergente y no se relaciona estructuralmente con la DNA ligasa lll y lV, posiblemente por la enorme diferencia en el número de aminoácidos que componen a la ligasa l con respecto a la lll y lV. 27 Fig. 7. Árbol estructural del dominio DBD/HhH. El árbol no enraizado presenta una agrupación en los taxones de bacterias y arqueas. Sin embargo, el árbol muestra una relación más divergente en este dominio de las DNA ligasas pequeñas en el caso del fago T4. Por otro lado, la relación entre las DNA ligasas del H. sapiens muestra que la DNA ligasa l es la más divergente, y no guarda una relación estructural cercana como sí la presentan las DNA ligasas lll y Vl. Esto lo que nos indica es que estructuralmente el dominio DBD/HhH es más variable de los tres dominios. 28 Fig. 8. Árbol estructural del dominio OBD. El árbol no enraizado presenta el agrupamiento de los taxones de bacterias, arqueas y DNA ligasas pequeñas. Pero, la DNA ligasa l del H. sapiens parece tener una relación estructural con la DNA ligasa de S. solfataricus. Esto nos indica que este dominio puede tener menos variabilidad que el dominio AdD. 29 Alineamientos de las secuencias correspondientes a las estructuras cristalográficas de las DNA ligasas con el programa MEGA-X. Fig. 9. Alineamiento del dominio AdD. El alineamiento muestra los cinco motivos conservados implicados en el proceso de adenilación de la lisina por el ATP o NAD+ dependiendo del caso. Dado que el tamaño de estas enzimas es variable entre dominios, no es exacto determinar en número de resido en donde están ubicados los motivos. 30 Fig. 10. Alineamiento del dominio DBD/HhH. Este alineamiento llama la atención ya que sugiere que existen dos posibles motivos cuya función no está descrita en la literatura, uno compuesto de glicina y acido aspártico en las DNA ligasas dependientes de ATP y alanina y acido aspártico en las dependientes de NAD+, mientras que el otro ubicado a unos cuantos residuos compuesto de leucina y treonina en las dependientes de ATP y metionina y glicina en las dependientes de NAD+. El dominio OBD no mostró resultados relevantes aparentes, por lo que se desistió de agregar el alineamiento de este, así como, el alineamiento completo de DNA ligasas de secuencias provenientes de FASTA.Ebi, dichas secuencias alineadas no proveen información relevante para fines de este trabajo. 31 Árboles filogenéticos de secuencias depositadas en UniProt correspondientes a las estructuras cristalográficas del PDB de las DNA ligasas con el programa IQ-TREE. Fig. 11. Árbol filogenético no enraizado del dominio AdD. Hay que resaltar que el domino AdD muestra ser con respecto a su secuencia el que mejor presenta sentido filogenético lo cual nos puede sugerir que representa mejor la filogenia. Además, llama la atención que el grupo de las arqueas muestra ser eldominio menos divergente con respecto a las demás, por lo que las secuencias de este dominio en este grupo de organismos cambian muy poco, indicando que debe ser muy estable en las condiciones en las que viven estos organismos. Los círculos azules son la proporción cualitativa del análisis de soporte de grupo Bootstrap. 32 Fig. 12. Relación filogenética de los dominios OBD y DBD. (A) Dominio OBD. Aunque el número de datos es ligeramente menor que en el caso del dominio AdD, esta filogenia muestra que los dominios se agrupan en clados correspondientes a taxas definidos como el caso de arqueas y bacterias, salvo el caso de S. solfataricus y el fago T7, que muestran ser muy similares a las DNA ligasa l y lll de H. sapiens respectivamente. Esto puede ser debido a la falta de datos o bien porque el dominio puede tener un nivel de divergencia muy alto. (B) Dominio DBD. Este dominio muestra ser poco divergente en el clado de las arqueas. Sin embargo, no se forman taxas concretos entre los eucariontes y DNA ligasas pequeñas. Es importante remarcar que se utilizaron menos datos en este análisis, debido a la incertidumbre de la región precisa de los dominios en la secuencia de aminoácidos, en el caso de las DNA ligasas dependientes de NAD+. 33 Fig. 13. Filogenias de las secuencias completas correspondientes a las DNA ligasas depositadas en el PDB. La filogenia completa muestra ser muy precisa cuando se agrupa a los taxas a excepción de S. solfataricus, posiblemente por la alta divergencia de los dominios OBD y DBD de esta DNA ligasa, o bien, por la falta de datos que concreten con mayor exactitud los taxas. Esto se ve reflejado porque en el árbol completo de las DNA ligasas dependientes de ATP y NAD+ de la figura 14, se muestra que no hay un agrupamiento entre arqueas y eucariontes. A pesar de todo, la filogenia puede representar de manera muy precisa que las DNA ligasas de los organismos termotolerantes se agrupan en un solo taxa, como lo hacen los árboles de las figuras 6-8. 34 Árbol filogenético de secuencias de DNA ligasas dependientes de ATP y NAD+ provenientes del servidor FASTA.ebi usando el programa IQ-TREE. Fig. 14. Árbol filogenético de las DNA ligasas dependientes de NAD+ y dependientes de ATP. A partir de esta filogenia, que se ajusta evolutivamente a la relación de los tres dominios de la vida, representada como un árbol enraizado que como grupo externo posee a la DNA ligasa dependiente de ATP de Psychromona sp. Se puede inferir que hay una división filogenética bien marcada entre las DNA ligasas según su sustrato y que el grupo de DNA ligasas de los Thermococci (verde fosforescente), muestra ser un grupo monofilético y poco divergente con respecto a otras arqueas basándonos en la longitud de 35 las ramas, esta filogenia también resalta que la DNA ligasa de los Thermococci son filogenéticamente distantes a la de los Deinococci (naranja). Proporción de residuos cargados negativamente de secuencias depositadas en la base de datos de UniProt y de las estructuras cristalográficas utilizadas. Fig. 15. Comparación en la proporción de ácido glutámico (Glu) y ácido aspártico (Asp). (A) En las secuencias de residuos de aminoácidos de organismos termófilos y mesófilos, 36 se puede notar que en la PCNA la proporción de residuos con carga negativa, es mayor que en la de organismos mesófilos, a diferencia de la DNA ligasa donde no se ve tan marcada la diferencia en la proporción de aminoácidos cargados negativamente. Sin embargo, la DNA ligasa de T. gammatolerans si muestra una mayor la proporción con carga negativa con respecto a la mayoría de las secuencias. (B) Distribución electroestática de las estructuras 3D de la DNA ligasa y PCNA de T. gammatolerans, se observa que los potenciales electroestáticos en los dominios que corresponden a los dominios de reconocimiento (OBD) y reparación de DNA (AdD) es negativo hacia la parte exterior de la enzima y positivo hacia la parte interna que tiene contacto con el DNA, mientras que en el trímero de la PCNA al igual que en la DNA ligasa las cargas positivas se agrupan en la región donde hace contacto con el DNA y las cargas negativas se ubican en la parte exterior de la proteína. C) Diferencias entre las proporciones de residuos de aminoácidos entre la DNA ligasa y la PCNA de T. gammatolerans. Fig. 16. Comparación en la proporción de residuos de aminoácidos cargados negativamente, en las secuencias de las DNA ligasas que están depositadas en el PDB entre organismos termófilos (contorno rojo) y no termófilos (contorno azul). Nótese que la proporción de Glu es mayor que la de Asp. Sin embargo, no hay diferencias marcadas en 37 la proporción de Asp entre las secuencias, mientras que en Glu si hay una proporción ligeramente mayor en organismos que se encuentran en ambientes extremos. Fig. 17. Proporción de residuos de aminoácidos totales correspondientes a las secuencias depositadas en UniProt de las estructuras de DNA ligasas depositadas en el PDB. Las DNA ligasas, en especial las de organismos termófilos, carecen de residuos como las cisteínas, metioninas, triptófanos, tirosinas e histidinas que son algunos de los residuos que se dañan más fácilmente por radiación, mientras que el resto de los residuos su proporción es variable. Proporción de residuos correspondientes a organismos termófilos (rojo) y no termófilos (negro). 38 Figura 18. Proporción de residuos de aminoácidos entre las DNA ligasas de T. gammatolerans y D. radiodurans. Comparación entre las DNA ligasas de los dos organismos más radioresistentes reportados. La DNA ligasa de D. radiodurans tiene una proporción mayor de alanina y glucina y menor de ácido glutámico con respecto a la DNA ligasa de T. gammatolerans. La tendencia en la composición de los residuos de ambas DNA ligasas se mantiene, especialmente en los residuos de aminoácidos que son sensibles a la radiación ionizante. Exposición de residuos cargados negativamente al área del solvente de las estructuras cristalográficas de las DNA ligasas. 39 Fig. 19. Promedios del área de los residuos con carga negativa expuestas al solvente. Se muestra que los promedios mostraron no tener diferencias significativas en la prueba de ANOVA con comparación múltiple, teniendo como referencia o control el promedio del área de T. gammatolerans. De manera general, se puede ver que los residuos con carga negativa en las DNA ligasas se orientan preferentemente hacia el área expuesta al solvente, tomando como una cohorte que todos los valores por debajo de 6 Å2 son indicadores de que el residuo no está expuesto, esto debido a que 6 Å2 es el área mínima que en donde una molécula de agua puede interactuar sobre la cadena lateral de un residuo, según los análisis del programa Charmm. Los valores máximos de exposición para el ácido glutámico son de 138 Å2 mientras que para el ácido aspártico es de 106 Å2 (Miller, Janin, Lesk, & Chothia, 1987). Cuantificación de puentes salinos en las estructuras cristalográficas de las DNA ligasas mediante el programa VMD. Fig. 20. (A) Número de puentes salinos en las estructuras completas de DNA ligasas. (B) Proporción de puentes salinos en función del tamaño de la enzima. 40 Fig. 21. Número de puentes salinos en estructuras cristalográficas de diferentes PCNA’s en conformación de trímero (izquierda) y monómero (derecha). T. gammatolerans (Tg), T. kodakaraensis (Tk1), T. kodakaraensis (Tk2), P. furiosus (Pf), H. volcanii (Hv), A. fulgidus (Af), S. cerevisiae (Sc), A. thaliana (At1), A. thaliana (At2), L. vannamei (Lv), D. melanogaster (Dm), H. sapiens (Hs). Graficas tomadas de Marín Tovar et al, no publicado. 8. DISCUSIÓN De los datos obtenidos de la tabla 2, es importante recalcarque los datos arrojados por Pfam son precisos más no exactos, por lo que, dichas regiones que corresponden a la delimitación de los dominós fueron también determinadas de manera manual mediante el programa de visualización de proteínas PyMol. Esto pone de manifiesto la importancia de corroborar de manera manual los datos obtenidos de las bases de datos automatizadas. Con respecto a las relaciones estructurales entre las DNA ligasas, se puede inferir a partir de las figuras 6-8, que los dominios el OBD y el DBD/HhH son los más divergentes y que presentan conformaciones estructurales muy diferentes, de acuerdo al dominio en el que se encuentran como las arqueas y las bacterias. Por otro lado, es difícil ubicar a las DNA ligasas eucariontes agrupadas en un solo grupo, posiblemente por las diferencias en los tamaños de la DNA ligasa I y lll de H. sapiens. A pesar de este detalle, se ve claramente que las conformaciones entre arqueas, bacterias y DNA ligasas de virus se agrupan en clados discretos, por lo que estos datos sugieren que las conformaciones estructurales son distintas y en consecuencia, la dinámica de las DNA ligasas no puede ser la misma en todo este grupo de enzimas. Además, la enorme variación de los dominios OBD y 41 DBD/HhH pueden ser señal de que estos dominios están sujetos a una mayor presión de selección a diferencia del dominio AdD. Esto hace sentido ya que las regiones que le proveen función son menos propensas a recibir mutaciones importantes que comprometan la función y el plegamiento (Nei, 2005). Es posible que si se contara con más estructuras completas de DNA ligasas en el PDB los grupos serían más claros y ayudaría a soportar más esta idea. Por su parte, los análisis filogenéticos mostraron que dada la distancia evolutiva de las especies que componen las secuencias de los alineamientos correspondientes a las estructuras, es plausible esperar que el nivel de penaltis sea tan grande. Además, se debe considerar que los tamaños de los dominios que componen a cada grupo filogenético al igual que toda la enzima tienen un tamaño variable según la especie, tal como es el caso de la DNA ligasa l del H. sapiens, que tiene una longitud de 919 residuos de aminoácidos en contraste con la DNA ligasa de T. gammatolerans que tiene una longitud de 559 residuos de aminoácidos, de acuerdo a datos de UniProt. A pesar de esto, las filogenias producidas a partir del alineamiento de las secuencias que corresponden a las estructuras, muestran una gran similitud en el ordenamiento de los taxas con los árboles de los alineamientos estructurales (fig. 6-8). Por otro lado, tanto el alineamiento de las secuencias de las estructuras como el de las secuencias de DNA ligasas dependientes de ATP y NAD obtenidas del servidor FASTA.ebi hacen sentido filogenético. También cabe resaltar que los árboles producidos mediante el alineamiento de secuencias correspondientes a dominios, proveen información más confiable que el alineamiento de secuencias completas. Esto se ve reflejado particularmente en la figura 6 y 11, donde el dominio AdD parece ser el más conservado tal y como dice la literatura, pero además es el dominio que mejor describe la historia evolutiva en este grupo de enzimas a nivel de secuencia y estructura ya que es el que más sentido filogenético hace. Este resultado concuerda y refuerza la idea de que los dominios de una proteína pueden ser objeto de estudio para conocer el proceso evolutivo de los seres vivos (Gu & Bourne, 2009; Pascal et al., 2004). Un aspecto que valida estas hipótesis filogenéticas (fig. 11-14), es que los árboles fueron generados a partir del método estadístico de máxima verosimilitud que se sustenta en ser un modelo específico, que se basa en la reconstrucción de filogenias a partir de la 42 determinación de parámetros como las longitudes de rama, la topología del árbol y parámetros evolutivos como la tasa de transiciones o transversiones, frecuencias de bases o aminoácidos y variación de las tasas entre sitios diferentes (Morrone, 2013). Dicho método se escogió, como el método bayesiano o de máxima parsimonia, ya que el método de máxima verosimilitud es más conservador y robusto ya que utiliza todos los datos depositados desde el alineamiento, lo que lo hace menos propenso a soportar hipótesis filogenéticas incorrectas, distinguiéndose como un modelo con una alta precisión, a pesar de que este requiere un mayor poder de cómputo y es menos rápido que el método bayesiano o el de máxima parsimonia (Ajawatanawong, n.d.; Morrone, 2013). Además, el árbol obtenido en este trabajo, por el método de máxima verosimilitud comparó múltiples métodos de estadísticos (datos no mostrados) en automático por el programa IQ-TREE, ya que este programa tiene la primicia de realizar una búsqueda del modelo que mejor se ajusta, de acuerdo a los datos depositados en el alineamiento para formar la mejor filogenia (Kalyaanamoorthy, Minh, Wong, von Haeseler, & Jermiin, 2017). Es decir, lo que arroja el programa, es un árbol resuelto cuya topología ha sido comparada con otros métodos de determinación de filogenética por máxima verosimilitud, dando como resultado un árbol que satisface una hipótesis filogenética consistente a los datos y comparado entre varios métodos de inferencia filogenética. Por otro lado, los árboles pasaron por una evaluación de soporte de grupos de Bootstrapping con 1000 repeticiones. Esta evaluación, funciona como una medida de confianza en los resultados obtenidos mediante la obtención de intervalos de confianza, basados en un muestreo aleatorio que detecta la proporción de cladogramas donde los grupos aparecen agrupados o acomodados con la misma topología (Morrone, 2013). Entonces, con los datos obtenidos a partir de los árboles de estructuras terciarias, podemos inferir que el movimiento que propone Tanabe el al, (2015), Hernández-Flores E. (2017) y Pascal et al. (2004) parecen ser una extrapolación errónea, o no tan sólida, ya que en dichas hipótesis generalizan el movimiento de las DNA ligasas como un movimiento en forma de pinza, que cierra y abre gracias a los movimientos de los dominios OBD y DBD/HhH. Sin embargo, existe un sesgo en lo que proponen, ya que solo se enfocan en estructuras que corresponden a DNA ligasas dependientes de ATP y 43 que están filogenéticamente muy distanciadas entre ellas. Además, en estas suposiciones dejan de lado a las DNA ligasas dependientes de NAD+, las cuales podrían tener un movimiento muy diferente dado que son aún más distantes estructuralmente hablando, como se muestra en los árboles de las figuras 6-8. En consecuencia, es posible que la DNA ligasa de T. gammatolerans tenga un movimiento de los dominios OBD y DBD diferentes a los que la literatura reporta y que puede estar actuando en la forma que la que su plegamiento es estable a altas temperaturas y/o a altos niveles de radiación, además de que este puede estar muy conservado en el grupo de los Thermococci. Además, esta propuesta de que no son extrapolables, se sustenta en el hecho de que tanto los árboles de las relaciones estructurales como la de los árboles filogenéticos correspondientes a las secuencias de aminoácidos (fig. 11-14) coinciden bastante bien en su topología (fig. 6-8), lo que nos confirma que la secuencia primaria determina la estructura terciaria (Pevsner, 2015) y que el árbol filogenético completo de las DNA ligasas (fig. 14), es un buen modelo para predecir no solo la historia evolutiva de estas enzimas, sino también que el movimiento, las conformaciones y las propiedades intrínsecas de las DNA ligasas que son propias de cada taxa y no son fácilmente extrapolables entre organismos de diferentes reinos o dominios. En consecuencia, esto podría indicarnos que las propiedades intrínsecas de la DNA ligasa de T. gammatolerans quele permiten la posible resistencia a la radiación son únicas en este grupo de arqueas (los Thermococci) ya que este mismo patrón de agrupamiento de taxas ocurre con las PCNA’s de diferentes organismos según Rodríguez Arteaga (2018). Un aspecto interesante de la filogenia obtenida de la secuencia de DNA ligasa dependientes de ATP y NAD+ (fig. 14), es ver que las DNA ligasas de T. gammatolerans y D. radiodurans se encuentran muy distanciadas filogenéticamente y que esta última a diferencia de la primera, es más divergente basándonos en la longitud de rama que nos provee el árbol, es posible que en la evolución de estos organismos ambos encontraron DNA ligasas tolerantes a ambientes extremos, y que de algún modo pueden estar implicados en la putativa resistencia a radiación ionizante, encontrando la solución por caminos diferentes sugiriendo así que puede ser un caso de una convergencia evolutiva. Además, llama la atención que la composición entre amabas DNA ligasas. En la DNA ligasa de D. radiodurans hay una proporción mayor de residuos hidrofóbicos como los son la alanina y glicina, y menor de ácido glutámico en comparación con la DNA ligasa de T. 44 gammatolerans (fig. 18). Es posible, que en el caso de la DNA ligasa de D. radiodurans la composición de su esqueleto hidrofóbico sea preponderantemente de alanina y leucina, y los residuos con carga negativa como el ácido glutámico que están en baja proporción en la DNA ligasa de D. radiodurans, puedan no estar implicados en el mecanismo de tolerancia a la radiación ionizante. Sin embargo, la tendencia en la proporción de residuos de aminoácidos que son sensibles a la radiación ionizante se conserva en ambas DNA ligasas, aun siendo DNA ligasas lejanamente emparentadas y con un nivel de identidad bajo (20.87%). Esto último, apoya la idea de que ambas DNA ligasas puedan competir contra la radiación ionizante mediante mecanismos diferentes. La DNA ligasa de T. gammatolerans y la de algunos otros organismos termófilos muestran poseer una mayor abundancia en residuos cargados negativamente con respecto a otros organismos mesófilos (fig. 16 y 17). Esto coincide con lo reportado en la literatura donde los organismos termófilos presentan una abundancia mayor de este tipo de aminoácidos en su proteoma (Chen et al., 2013; Devi et al., 2013). Sin embargo, T. gammatolerans no parece ser el termófilo con mayor cantidad de residuos cargados negativamente, ese lugar, lo tienen T. filiformis en el caso de Glu y S. aureus en el caso de Asp. Lo anterior podría sugerir que los aminoácidos cargados negativamente, Glu puede ser más importante para la termoestabilidad de la enzima que Asp, ya que este último se encuentra distribuido de manera prácticamente igualitaria en todos los organismos comparados. Llama la atención, este tipo de distribución de los residuos cargados negativamente ya que, en experimentos para analizar la resistencia a altas temperaturas de los aminoácidos, el Asp muestra más resistencia en formar compuestos secundarios a altas temperaturas que el Glu en condiciones 1 mol H2O /mol debidos a las diferencias en su entalpia estándar de formación, pero llama aún más la atención que Glu es menos propenso a perder los enlaces peptídicos (Weiss, Muth, Drumm, & Kirchner, 2018). Esto podría indicarnos, que hay una presión de selección que favorece la presencia de Glu con respecto a Asp en los organismos termófilos, ya que el Glu es menos propenso a la disociación de los enlaces peptídicos de las proteínas a altas temperaturas, y es posible que esta propiedad puede influir en que la PCNA resista la radiación gamma y que la DNA ligasa pueda en todo caso resistir la radiación a su vez. Otra posible explicación y no excluyente de la anterior, es que los residuos cargados negativamente de la PCNA y de la 45 DNA ligasa de T. gammatolerans, fungen como una coraza compuesta de cargas negativas que puede verse en el potencial electroestático de estas proteínas (fig. 15.B) y que repele a los radicales libres o especies reactivas de oxígeno, generados por la radiación ionizante. Ya que los residuos con carga negativa están oxidados, las especies reactivas de oxigeno no tienen forma de desestabilizar a la DNA ligasa y a la PCNA de T. gammatolerans. Esto permite que ambas proteínas sean estables en condiciones de alto estrés oxidativo como en la exposición a radiación ionizante o a la exposición a altas temperaturas. Por otro lado, en similitud la DNA ligasa y la PCNA, poseen en ambos casos una abundancia de residuos cargados negativamente (fig. 15A). Al comparar los potenciales electroestáticos de la DNA ligasa y la PCNA de T. gammatolerans podemos encontrar similitud en el potencial electroestático, en el sentido de que las cargas positivas están orientadas hacia las regiones donde existe contacto con el DNA y las cargas negativas están orientadas hacia la periferia, esto podría sugerirnos que las cargas negativas cubren o protegen a las regiones donde hay interacción con el DNA de las altas temperaturas o de la radiación. En el caso del dominio DBD de la DNA ligasa de T. gammatolerans, muestra que al contrario de los dominós AdD y OBD no hay una distribución del potencial electroestático bien diferenciado, sino que el potencial electroestático predominante es principalmente positivo. Esto tiene sentido, ya que este dominio ha sido propuesto como el dominio que tiene interacción con la PCNA, por lo que es posible que las cargas positivas del dominio DBD, tengan atracción hacia las cargas negativas de la periferia de la PCNA (Pascal et al., 2006). Por otro lado, es posible, que la diferencia en la distribución y la alta proporción de los residuos negativos o positivos entre estas dos proteínas, juegue un papel importante en ellas para cumplir su función biológica, dándole estabilidad a estas proteínas en las condiciones donde habita este organismo, como ocurre en algunos virus donde los residuos cargados y su distribución en las proteínas que forman la cápside, influyen en el proceso de infección del hospedero, o en la preservación de la estabilidad de la cápside que permite la activación del virus aún a altas temperaturas (Carrillo, Hervás, Rodríguez-Huete, Pérez, & Mateu, 2018). Sin embargo, aún no existen datos experimentales que soportan esta misma idea para el caso de estas dos proteínas. 46 A diferencia de la PCNA, la DNA ligasa de T. gammatolerans no presenta un mayor número de puentes salinos con respecto a las DNA ligasas de especies mesófilas como E. coli o el fago T4 (fig. 20 y 21). Sin embargo, la DNA ligasa de T. filiformis si presenta esa característica. Esto podría indicarnos, que es posible que tener un alto número de puentes salinos podrían ser más bien una propiedad que ayuda a estabilizar a la enzima frente a condiciones extremas, más en DNA ligasa de bacterias que en la de las arqueas dado que ambos grupos evolucionaron de manera paralela es posible que ambos hayan encontrado diferentes formas para soportar condiciones de vida extremas. Ver la proporción normalizada de puentes salinos por estructura ayuda a ver que en el caso de los eucariontes como las DNA ligasas de H. sapiens muestran que a pesar de poseer un número mayor de residuos y ser estructuralmente más grandes carecen de puentes salinos con respecto a las bacterias y las arqueas (fig. 20). Esto puede deberse a que las DNA ligasas de eucariontes como el caso del H. sapiens no tienen una presión de selección que obligue a las enzimas a poseer elementos que las estabilicen frente a condiciones de altas temperaturas como sí parece ser el caso de las arqueas, bacterias y algunos virus. Otro carácter peculiar de la DNA ligasa de T. gammatolerans con respecto al de otros organismos, es que comparte con ellos el hecho que sus residuos cargados se encuentren expuestos alsolvente en todos los casos estudiados. Esto al igual que los puentes salinos, nos podría indicar que la exposición de residuos cargados negativamente hacia el área expuesta al solvente, no representan ser una característica única o especial en el caso de la DNA ligasa de T. gammatolerans u otros extremófilos, por lo que el hecho de que los residuos negativos se encuentren expuestos, no representa aparentemente una gran importancia para la posible resistencia a hábitats con temperaturas muy altas, o incluso a posibles ambientes con grandes cantidades de radiación, lo cual enriquece el conocimiento, ya que estos residuos no habían sido analizados pensando en su papel como agentes involucrados en la termo o radio estabilidad a diferencia de trabajos previos como el de Melchionna et al., 2006. Finalmente, a partir de los resultados obtenidos es posible saber qué características intrínsecas comparten la DNA ligasa de T. gammatolerans con la PCNA. Donde destaca que ambos tienen una proporción alta de residuos cargados negativamente, ambos, difieren en el número de puentes salinos y distribución de los aminoácidos cargados en 47 general. A pesar de esto, llama la atención que una de las características que más comparten en es aquello que tienen ausente, como el caso de bajos niveles de metioninas y tirosinas, ausencia de iones metálicos y puentes de disulfuro, que son elementos de la estructura terciaria que más sufren por radiación (McGeehan et al., 2009; Murray & Garman, 2002; Weik et al., 2002). Esto podría indicar que hay una posible presión de selección hacia las proteínas reparadoras del DNA, por no tener elementos que son sensibles a radiación. Además, la mayor cantidad de glutámicos en contraste a la de aspárticos presentes en las secuencias de organismos termófilos, nos indica que es posible que haya una presión de selección que favorece a Glu, dado que la región de los enlaces peptídicos de un polipéptido, tanto en la parte amino como el carboxilo es menos propenso a perder sus enlaces peptídicos como se dijo antes (Weiss et al., 2018), pudiendo influir, tal vez, en la resistencia a radiación y a altas temperaturas. Dos preguntas podrían surgir a partir de las ideas y datos obtenidos en este trabajo, alcanzados gracias a las bases de datos y el uso de la bioinformática ¿Podría ser que otras características estructurales aún no descritas son las responsables de la radioresistencia? O bien, ¿Lejos de que la evolución agregue nuevas propiedades incrementado su complejidad para resolver un problema, quite algunas para solucionar elegantemente problemas complejos? Sin duda, un dato que nos ayudará a saber qué es lo que pasa serían datos experimentales de daño por radiación ionizante mediante difracción de rayos X en cristales de la DNA ligasa de T. gammatolerans. 9. CONCLUSIONES ● La ubicación de los dominios en una proteína o enzima, no deben ser determinados exclusivamente de manera automática por un servidor, programa o algoritmo, sino que deben de ser comprobados visualmente preferentemente para tener exactitud de su ubicación. Esta aseveración podría no ser exclusiva para las DNA ligasas. ● Los dominios de cada DNA ligasa se relacionan estructuralmente de acuerdo al grupo taxonómicos al que pertenecen. ● Las filogenias correspondientes a cada dominio y a las secuencias completas mostraron que el dominio AdD es la mejor unidad taxonómica que muestra las relaciones evolutivas entre las DNA ligasas, por su alto nivel de conservación. 48 ● Tanto los árboles de relaciones estructurales como los árboles filogenéticos coinciden en su topología, lo que sugiere propiedades estructurales y dinámicas comunes a los miembros de cada taxa y muy difícilmente extrapolables fuera de ellos. ● De existir una radioresistencia en las DNA ligasas de T. gammatolerans y D. radiodurans esto sería resultado de un notable evento de convergencia evolutiva. Adicionalmente, como mostró esta tesis las distancias evolutivas entre ambos organismos haría complicado que esta convergencia evolutiva se presentara. ● La DNA ligasa y la PCNA de T. gammatolerans comparten características como una abundancia en residuos cargados negativamente, no poseer puentes disulfuro, tener bajo contenido de metioninas, triptófano, histidinas y glutaminas, todos ellos componentes sensibles a la radiación ionizante. ● La posición y exposición al solvente de los residuos cargados negativamente en la DNA ligasa de T. gammatolerans no difiere del resto de DNA ligasas de organismos mesófilos y otros termófilos, por lo que no parece conferir una característica especial a esta DNA ligasa. ● La DNA ligasa del organismo termófilo T. gammatolerans posee más puentes salinos que las DNA ligasas de organismos mesófilos. 10. REFERENCIAS Ajawatanawong, P. (n.d.). Molecular Phylogenetics: Concepts for a Newcomer. Advances in Biochemical Engineering/Biotechnology, 160, 185–196. https://doi.org/10.1007/10_2016_49 Bajaj, M., & Blundell, T. (1984). Evolution and the Tertiary Structure of Proteins. Annual Review of Biophysics and Bioengineering, 13(1), 453–492. https://doi.org/10.1146/annurev.bb.13.060184.002321 Becker, A., Lyn, G., Gefter, M., & Hurwitz, J. (1967). The enzymatic repair of DNA, II. Characterization of phage-induced sealase. Proceedings of the National Academy of Sciences of the United States of America, 58(5), 1996–2003. Retrieved from https://www.ncbi.nlm.nih.gov/pubmed/4295584 Carrillo, P. J. P., Hervás, M., Rodríguez-Huete, A., Pérez, R., & Mateu, M. G. (2018). Systematic analysis of biological roles of charged amino acid residues located throughout the structured inner wall of a virus capsid. Scientific Reports, 8(1), 9543. https://doi.org/10.1038/s41598-018-27749-8 49 Cataldo, F., Ornella, bullet, bullet, U., Angelini, G., bullet, A., Ursini, O., … Manchado, A. (2011). Radiolysis and radioracemization of 20 amino acids from the beginning of the Solar System. In Rendiconti Lincei. Scienze Fisiche e Naturali (Vol. 22). https://doi.org/10.1007/s12210-011-0116-6 Chambers, C. R., & Patrick, W. M. (2015). Archaeal Nucleic Acid Ligases and Their Potential in Biotechnology. Archaea, Vol. 2015. https://doi.org/10.1155/2015/170571 Chen, W., Shao, Y., & Chen, F. (2013). Evolution of complete proteomes: guanine- cytosine pressure, phylogeny and environmental influences blend the proteomic architecture. BMC Evolutionary Biology, 13(1), 219. https://doi.org/10.1186/1471- 2148-13-219 Chothia, C., & Lesk, A. M. (1986). The relation between the divergence of sequence and structure in proteins. The EMBO Journal, 5(4), 823–826. Retrieved from https://www.ncbi.nlm.nih.gov/pubmed/3709526 de Queiroz, K. (1988). Systematics and the Darwinian revolution. Philosophy of Science, 55(2). Devi, S., Sharma, N., Savitri, & Bhalla, T. C. (2013). Comparative analysis of amino acid sequences from mesophiles and thermophiles in respective of carbon-nitrogen hydrolase family. 3 Biotech, 3(6), 491–507. https://doi.org/10.1007/s13205-012-0111- 3 Doherty, A. J., & Suh, S. W. (2000). Structural and mechanistic conservation in DNA ligases. Nucleic Acids Research, 28(21), 4051–4058. Retrieved from http://www.ncbi.nlm.nih.gov/pubmed/11058099 Drenth, J., & Mesters, J. (2007). Principles of protein x-ray crystallography. Springer. Elcock, A. H. (1998). The stability of salt bridges at high temperatures: implications for hyperthermophilic proteins. Journal of Molecular Biology, 284(2), 489–502. https://doi.org/10.1006/JMBI.1998.2159 Ellenberger, T., & Tomkinson, A. E. (2008). Eukaryotic DNA ligases: structural and functional insights. Annual Review of Biochemistry, 77, 313–338. https://doi.org/10.1146/annurev.biochem.77.061306.123941 Eun, H.-M., & Eun, H.-M. (1996). Ligases. Enzymology Primer for Recombinant DNA Technology, 109–144.
Compartir