Logo Studenta

Apuntes de Clase

Esta es una vista previa del archivo. Inicie sesión para ver el archivo original

TEMA 1. ESTRUCTURA Y FUNCIÓN DE LOS ÁCIDOS NUCLÉICOS
1.1 Genes y Material genético.
La información genética almacenada en el ADN se encuentra “arreglada” (configurada) en unidades hereditarias denominadas “genes”, que controlan las características que identifican a un organismo.
Se podría decir que la definición más simple de gen es “una unidad de ADN que contiene la información para la síntesis específica de una cadena polipeptídica única o de un RNA funcional (como el RNAt).
Una única molécula de ADN en cada cromosoma de los organismos superiores (plantas o animales) puede contener varios miles de genes.
En términos moleculares, un gen se define comúnmente como la “secuencia completa de ácido nucleico que es necesario para la síntesis de un producto funcional (polipéptido o ARN).
De acuerdo a ésta definición, un gen incluye más de la secuencia de nucleótidos codificantes o un ARN funcional, y que se conoce como “región codificante”.
Un gen también incluye todas las secuencias de ADN requeridas para la síntesis de un transcrito de ARN particular sin importar donde se encuentren localizadas éstas secuencias en relación a la región codificante.
Por ejemplo, en los genes eucariotes, las regiones de control de la transcripción, conocidas como potenciadores, pueden encontrarse a 50 kb o más de la región codificante.
Aunque la mayoría de los genes se transcriben a ARNm, los cuales codifican para proteínas, algunas secuencias de ADN se transcriben en ARNs que no codifican para proteínas, como los ARNt, ARNr y micro ARNs.
Debido a que también el ADN que codifica para ARNt, ARNr y micro ARNs pueden causar fenotipos específicos cuando éstas regiones de ADN mutan, éstas regiones de ADN generalmente se denominan como genes para ARNt, ARNr y micro ARN, aun cuando los productos finales de éstos genes sean moléculas de ARN y no proteínas.
Muchos genes eucariotes contienen intrones y producen RNAm que codifican para proteínas únicas.
Muchos de los ARNm’s bacterianos incluyen una región codificante para varias proteínas que funciona de manera conjunta en un proceso biológico.
Éstos ARNm’s se dice que son “policistrónicos” (un “cistrón” es una unidad genética que codifica para un polipéptido único).
En contraste, la mayoría de los ARNm’s eucariotes son monocistrónicos, es decir, cada molécula de ARNm codifica para una proteína única. Ésta diferencia entre ARNm’s policistrónicos y monocistrónicos se correlaciona con las diferencias fundamentales en su traducción.
Dentro de un ARNm policistrónico bacteriano, los sitios de unión a ribosoma se loclizan cerca del sitio de unión para cada una de las regiones codificantes para proteínas, o cistrones. El inicio de la translación puede comenzar en cualquiera de éstos sitios múltiples internos, produciendo múltiples proteínas.
En la mayoría de los ARNm’s eucariotes, la estructura 5’-cap dirige la unión del ribosoma y la translación inicia lo más cerca al codón de inicio AUG. Como resultado, la traducción inicia solo en este sitio.
A diferencia de los genes bacterianos y de levadura, que generalmente carecen de intrones, la mayoría de los genes en animales multicelulares y plantas contienen intrones, que son removidos durante el procesamiento del ARN en el núcleo antes de que el ARNm totalmente procesado sea exportado al citoplasma para la traducción.
En muchos casos, los intrones en un gen son considerablemente mayores (en pb) que los exones. Aunque muchos intrones son de aproximadamente 90 pb de longitud, la longitud media de un intrón en un gen humano es de 3.3 kpb.
En comparación, muchos de los exones humanos contienen solo 50 – 200 pb. El típico gen humano codificante para proteínas tiene un tamaño promedio de 50,000 pb de largo, pero más del 95% de dicha secuencia está presente en intrones y flanqueada por las regiones no codificantes 5’ y 3’.
Muchas proteínas grandes en organismos superiores que presentan dominios repetidos son codificadas por genes que consisten de repeticiones de exones similares separados por intrones de longitud variable.
Unidades de transcripción simples y complejas se encuentran en genomas eucariotes.
Los genes y las unidades de transcripción a menudo pueden distinguirse en procariotes, debido a que una unidad de transcripción única contiene varios genes cuando son parte de un operón (o son controlados por un operón).
En contraste, muchos genes eucariotes se expresan de unidades de transcripción separadas, y cada ARNm se traduce en una proteína única.
Las unidades de transcripción eucariotes se clasifican en dos tipos, dependiendo del destino del transcrito primario.
El transcrito primario producido por una unidad de transcripción simple se procesa para generar un tipo único de ARNm que codifica para una proteína única.
Las mutaciones en exones, intrones y en las regiones de control de la transcripción pueden influenciar/modificar la expresión de la proteína codificada por una unidad de transcripción simple.
En el caso de unidades de transcripción complejas el ARN transcrito primario puede ser procesado en más de una forma, llevando a la formación de ARNm’s que contienen diferentes exones.
Sin embargo, cada ARNm alterno (alternativo) es monocistrónico, ya que se traduce en un polipéptido único, con una traducción que usualmente inicia en el primer AUG del ARNm. Múltiples ARNm’s pueden originarse de un transcrito primario.
Éste fenómeno de “splicing alternativo” aumenta el número de proteínas codificadas por los genomas de organismos superiores.
Se estima que aproximadamente el 60% de los genes humanos están contenidos dentro de unidades de transcripción complejas.
Una mutación en la región de control o en un exón generada por un splicing alternativo del ARNm podría afectar a todas las proteínas alternas codificadas por una unidad de transcripción compleja dada.
Por otro lado, mutaciones en un exón presente en solo uno de los ARNm alternos pudiera afectar solo a la proteína codificada por ese ARNm.
Las diferentes proteínas codificadas por ARNm’s de splicing alternativo expresados de un gen se denominan “isoformas”.
Los genes codificantes para proteínas pueden ser “solitarios” o pueden pertenecer a una “familia” de genes.
En los organismos multicelulares, aproximadamente del 25 – 50 % de los genes codificantes para proteínas están representados (se encuentran presentes) solo una vez en el genoma haploide, y entonces se denominan como genes “solitarios”.
Los genes duplicados constituyen un segundo grupo de genes codificantes para proteínas. Éstos son genes con secuencias similares/parecidas pero no idénticas que a menudo están localizadas entre 5 – 50 pb una de otra.
Un set (conjunto) de genes duplicados que codifican proteínas con una secuencia de aminoácidos similar, pero no idéntica, se denomina una “familia de genes”; y las proteínas homólogas codificadas, estrechamente relacionadas, constituyen una “familia de proteínas”.
Unas pocas familias de proteínas, como las proteíncinasas, las inmunoglobulinas de vertebrados y los receptores olfatorios, incluyen cientos de miembros.
Sin embargo, la mayoría de las familias de proteínas incluyen de solo unos pocos a alrededor de 30 miembros; ejemplos comunes son las proteínas del citoesqueleto, la cadena pesada de la miosina y las globinas y en vertebrados.
Duplicaciones de segmentos de un cromosoma (llamado “duplicación segmental”) ocurrieron con bastante frecuencia durante la evolución de las plantas y animales multicelulares. Como resultado, una gran fracción de los genes en éstos organismos aún hoy conservan los segmentos duplicados, permitiendo que el proceso denominado “derivación de secuencia” (sequence drift) genere familias de genes y pseudigenes.
El grado de divergencia de las secuencias entre copias duplicadas del genoma y la caracterización de las secuencias homólogas del genoma de organismos relacionados permiten estimar el tiempo en el que la duplicación ocurrió durante la historia evolutiva.
Por ejemplo, los genes de la -globina humana fetal
(G y A) evolucionaron siguiendo (por la) la duplicación de una región de 5.5 kpb en el locus de la -globina que incluye un único gen de -globina en los ancestros comunes de los primates catherrine (monos, simios y humanos del viejo mundo) y de los primates platyrrhine (monos del nuevo mundo) hace aproximadamente 50 millones de años.
Aunque miembros de familias de genes que han aparecido relativamente recientemente durante la evolución comúnmente se encuentran cerca entre ellos en el mismo cromosoma, los miembros de las familias de genes pueden también encontrarse en diferentes cromosomas en el mismo organismo.
Los productos génicos más usados son codificados por copias múltiples de genes.
En vertebrados e invertebrados, los genes que codifican ARNr’s y algunos otros ARNs que no codifican proteínas, se presentan como “arreglos repetidos en tándem”.
Éstos “tándems” se distinguen de los genes duplicados de las familias de genes en que los genes repetidos en tándem múltiple codifican proteínas idénticas o casi idénticas o ARNs funcionales.
Muy comúnmente copias de una secuencia se presentan una después de otra, configuradas en forma de “cabeza-cola” sobre un tramo largo de ADN.
Dentro de un arreglo en tándem de genes de ARNr, cada copia es casi exactamente igual a las otras. Aunque las porciones transcritas de los genes de ARNr son las mismas en un individuo dado, las regiones de espacio no codificante entre las regiones transcritas pueden variar.
Éstos genes de RNA repetidos en tándem son necesarios para cubrir la gran demanda celular por sus transcritos.
Para entender por qué, considere que hay un número máximo fijo de copias de ARN que pueden producirse de un gen único durante una generación células cuando el gen está completamente ocupado con moléculas de ARN polimerasa.
Si se requiere más ARN del que puede ser transcrito por un gen, se necesitan múltiples copias del gen.
Genes que no codifican proteínas codifican ARNs funcionales.
Además de los genes para ARNr y los ARNt, hay cientos de genes adicionales que se transcriben en ARNs que no codifican proteínas, algunos con varias funciones conocidas, y muchos otros con funciones que se desconocen.
Por ejemplo, los ARNs pequeños nucleares (snRNAs) actúan en el empalme (splicing) del ARN. El ARN de la ARNasa P puede actuar en el procesamiento de ARNt, y una gran familia (aprox 1000 miembros) de micro ARNs (miARNs) regulan la estabilidad y la traducción de ARNm’s específicos.
Los genomas de muchos organismos contienen mucho ADN no funcional.
Las comparaciones del ADN cromosómico total por célula en varias especies sugirieron que mucho del ADN en ciertos organismos no codifica ARN o no tiene en apariencia función regulatoria.
Una secuenciación detallada y la identificación de exones en el ADN cromosomal dio evidencia directa de que los genomas de los eucariotes superiores contienen grandes cantidades de ADN no codificante.
La densidad de los genes varía ampliamente en regiones diferentes del ADN cromosómico humano, desde regiones “ricas en genes” hasta grandes regiones de pocos genes conocidas como “desiertos de genes”.
Del 96% del ADN genómico humano secuenciado hasta ahora, solo aproximadamente el 1.5% corresponde a secuencias que codifican proteínas (exones).
Se piensa que aproximadamente un tercio del ADN genómico humano se transcribe en precursores pre-ARNm o en ARNs que no codifican para proteínas (dependiendo del tipo celular), pero alrededor del 95% de estas secuencias son intrónicas, y entonces se eliminan por splicing del ARN. Ésta cantidad corresponde a una gran fracción del genoma total.
Los dos tercios restantes del ADN humano es ADN no codificante entre genes así como regiones de secuencias de ADN repetidas que forman los centrómeros y los telómeros de los cromosomas humanos.
Como consecuencia, aproximadamente el 98.5% del ADN humano es no codificante.
Las secuencias de ADN más simples están concentradas en locaciones (áreas) cromosómicas específicas.
Además de los genes codificantes para proteínas duplicados y de los genes repetidos en tándem, las células eucariotes contienen múltiples copias de otras secuencias de ADN en el genoma, generalmente denominadas como ADN repetitivo.
De los dos tipos de ADN repetitivo, el de menos prevalencia es el “ADN de secuencia simple” o “ADN satélite”, y que constituye aproximadamente el 6% del genoma humano y está compuesto de perfectas, o casi perfectas, repeticiones de secuencias cortas.
El tipo más común de ADN repetitivo, se denominan colectivamente como “repeticiones intercaladas” y están constituidas de muchas secuencias largas.
La longitud de cada repetición en un ADN de secuencia simple puede variar de 1 a 500 pb.
ADNs de secuencia simple en los cuales las repeticiones contienen de 1 a 13 pares de bases a menudo se denominan microsatélites.
Mucho del ADN microsatélite tiene una longitud de repetición de 1 a 4 pb y usualmente se presentan en tándem de 150 repeticiones o menos.
Se piensa que el ADN microsatélite se originó por “deslizamiento hacia atrás” de una “hebra hija” sobre su “hebra madre” durante la replicación del ADN, por lo que la misma corta secuencia se copia dos veces.
Mucho de éste ADN se encuentra cerca de los centrómeros, en la región cromosómica discreta que fija a los microtúbulos del huso mitótico durante la mitosis y la meiosis.
Datos experimentales sugieren que éstas secuencias se requieren para formar una estructura de cromatina especializada llamada “heterocromatina centromérica” necesaria para la adecuada segregación de los cromosomas a las células hijas durante la mitosis.
Los ADN de secuencia simple también se encuentran en largas repeticiones en tándem al final de los cromosomas, los telómeros, donde funcionan para mantener (estructuralmente) los extremos (finales) de los cromosomas y prevenir que se unan a los extremos de otras moléculas de ADN.
ADN “espaciador” inespecífico ocupa una porción significativa en el genoma.
Aproximadamente el 25% del ADN humano se encuentra entre unidades de transcripción y no se repite en ninguna otra parte en el genoma.
Mucho de éste ADN se generó de elementos transponibles (algo así como “móviles”) antiguos que se acumularon tras muchas mutaciones durante la evolución.
Las regiones para el control de la transcripción en el orden de 50 – 200 pb que ayudan a regular la transcripción desde promotores distantes también pueden presentarse en éstos largos tramos de ADN espaciador no clasificado.
En algunos casos, secuencias de éste ADN aparentemente no funcional son, no obstante, conservadas durante la evolución, indicando que estas secuencias pudieran llevar a cabo una función significativa que aún no se comprende.
Elementos de ADN transponible (móviles).
Las repeticiones intercaladas están compuestas de un número muy grande de copias de unas (relativamente) pocas familias de secuencias.
También conocidos como “ADN moderadamente repetido” o “ADN repetido intermedio”, éstas secuencias se encuentran intercaladas a través (y a lo largo) de los genomas de mamíferos y constituyen del 20 – 25 % del ADN mamífero (aproximadamente el 45% del ADN humano).
Debido a que las repeticiones intercaladas tienen la habilidad única de “moverse” a través del genoma, colectivamente se les refiere como elementos de ADN transponibles o elementos de ADN móviles (se usan ambos términos de manera intercambiable).
Aunque originalmente los elementos de ADN móviles se descubrieron en eucariotes, también son encontrados en procariotes.
El proceso por el cual éstas secuencias se copian e insertan en un nuevo sitio en el genoma se denomina “transposición”.
Los elementos de ADN móviles son esencialmente simbiontes moleculares que en la mayoría de los casos no tienen función específica aparente en la biología del organismo huésped, pero existen para mantenerse solo a sí mismos. Por ésta razón, Francis Crick se refirió a ellos como “ADN egoísta” (selfish DNA).
Cuando la transposición ocurre en células germinales, las secuencias transpuestas
en sus sitios nuevos se transfieren a las generaciones sucesivas.
De ésta forma, los elementos móviles se han multiplicado y acumulado lentamente en los genomas eucariotes durante la evolución. Y debido a que los elementos móviles se eliminan de los genomas muy lentamente, ahora constituyen una porción significativa del genoma de muchos eucariotes.
Las transposiciones ocurren muy raramente: en humanos, aproximadamente hay una transposición en una nueva línea germinal por cada ocho individuos.
Debido a que el 98.5% de nuestro ADN es no codificante, la mayoría de las transposiciones no tienen efectos eliminatorios (deleterios; deleterious). Pero a través del tiempo han jugado una parte esencial en la evolución de genes que tienen múltiples exones y de genes cuya expresión está restringida a tipos celulares o periodos del desarrollo específicos.
En otras palabras, aunque los elementos móviles probablemente están involucrados como simbiontes celulares, aún así han jugado un papel central en la evolución de organismos multicelulares complejos.
La transposición también puede ocurrir dentro de una célula somática; en este caso la secuencia que se ha movido se transmite únicamente a la célula hija derivada de ella.
En casos raros la transposición en una célula somática da como consecuencia una mutación en la célula somática con efectos fenotípicos perjudiciales, como por ejemplo la inactivación de un gen supresor de tumores.
El movimiento de los elementos móviles involucra un intermediario de ADN o de ARN.
Se ha encontrado que los elementos móviles caen en dos categorías: 1) aquellos que se transponen directamente como ADN y 2) aquellos que se transponen vía un intermediario de ARN trasncrito del elemento móvil por una ARN polimerasa y después es convertido nuevamente en un ADN de doble cadena por una transcriptasa reversa.
Los elementos móviles que se transponen directamente como ADN generalmente se conocen como “transposones de ADN” o simplemente “transposones”.
Los transposones de ADN eucarioticos se “quitan” a sí mismos de un lugar en el genoma, dejando ese sitio y moviéndose a otro.
Los elementos móviles que se transponen a sitios nuevos en el genoma vía un intermediario de ARN se denominan “retrotransposones”.
Los retrotransposones hacen una copia de ARN de sí mismos e introducen esta copia nueva dentro de otro sitio en el genoma, mientras permanecen en su sitio original.
Los retrotransposones pueden re-clasificarse en base a su mecanismo de retrotransposición específico.
Se puede resumir diciendo que los transposones de ADN pueden ejemplificarse como una transposición mediante un mecanismo de “copiar y pegar”, mientras que los retrotransposones se mueven mediante un mecanismo de “copiar y pegar” en el cual la copia es un intermediario de ARN.
ADN de organelos.
Aunque la mayoría del ADN en la mayoría de los eucariotes se encuentra en el núcleo, algo del ADN está presente dentro de la mitocondria de animales, plantas y hongos, y dentro de los cloroplastos de las plantas.
Estos organelos son los sitios celulares básicos para la formación de ATP, durante la fosforilación oxidativa en la mitocondria y la fotosíntesis en cloroplastos.
Las mitocondrias y los cloroplastos contienen ADN que codifica para algunas proteínas esenciales para la función del organelo, así como los ARNs ribosomales y de transferencia requeridos para la síntesis de éstas proteínas.
Entonces, las células eucariotes tienen sistemas genéticos múltiples: un sistema nuclear predominante y sistemas secundarios con su propio ADN, ribosomas y ARNs de transferencia en mitocondria y cloroplastos.
El ADN mitocondrial está localizado en el interior de la matriz mitocondrial. Los estudios han mostrado que en la mayoría de los organismos el ADN mitocondrial se replica a través de la interfase. Durante la mitosis cada célula hija recibe aproximadamente el mismo número de mitocondrias, pero desde que no hay un mecanismo que permita proporcionar el mismo número exacto de mitocondrias a las células hijas, algunas células contienen más ADN mitocondrial que otras.
Se ha observado que cada mitocondria contienen múltiples copias de moléculas de ADN mitocondrial. Entonces la cantidad total de ADN mitocondrial en una célula depende del número de mitocondrias, el tamaño del ADN mitocondrial y el número de moléculas de ADN mitocondrial por mitocondria. Cada uno de éstos parámetros varía grandemente entre los diferentes tipos celulares.
En mamíferos y la mayoría de los organismos multicelulares el esperma contribuye poco (y si lo hace) al citoplasma del cigoto y virtualmente todas las mitocondrias en el embrión se derivan de las mitocondrias en el óvulo. Estudios en mamíferos han mostrado que el 99.99% del ADN mitocondrial se hereda por vía materna, pero una pequeña parte (0.01%) se hereda por vía del padre. En plantas superiores, el ADN mitocondrial se hereda exclusivamente de forma uniparental a través de la contribución femenina (huevo), no de la masculina (polen).
El tamaño del ADN mitocondrial, el número y la naturaleza de las proteínas que codifica, e inclusive el código genético mitocondrial en sí mismo varía ampliamente entre los diferentes microorganismos.
Los ADNs mitocondriales de la mayoría de los animales multicelulares son moléculas circulares de aproximadamente 16 kpb que codifican genes con menor cantidad de intrones configurados de manera compacta en las dos hebras.
Los ADNs mitocondriales de vertebrados codifican los dos ARNs ribosomales encontrados en los ribosomas mitocondriales, los 22 ARNs de transferencia usados para traducir los ARN mensajeros mitocondriales y 13 proteínas involucradas en el transporte de electrones y la síntesis de ATP.
En contraste con los ADN mitocondriales de los animales multicelulares, los ADNs mitocondriales de plantas son varias veces mayores, y la mayoría del ADN no codifica para proteínas. La mayoría del ADN mitocondrial de plantas consiste de intrones largos, pseudogenes, elementos móviles de ADN restringidos a mitocondrias y piezas de ADN extranjero (cloroplasto, nuclear y viral) que probablemente se insertaron en los genomas mitocondriales de plantas durante su evolución. Las secuencias duplicadas también contribuyen a la gran longitud de los ADNs mitocondriales de plantas.
Las diferencias en el número de genes codificados por el ADN mitocondrial de varios organismos pudieran evidenciar el movimiento de ADN entre la mitocondria y el núcleo durante la evolución. Se piensa que éste tipo de mecanismos involucran un mecanismo de transcripción reversa similar al que genera pseudogenes procesados en el genoma nuclear de los ARN mensajeros que codifican en el núcleo.
Además de las grandes diferencias en los tamaños de los ADNs mitocondriales en los diferentes eucariotes, la estructura de los ADNs mitocondriales también varía mucho.
Como se mencionó, el ADN mitocondrial en la mayoría de los animales es una molécula circular; sin embargo, el ADN mitocondrial de muchos organismos (como algunos protistas) existen como concatómeros lineales “cabeza-cola” de secuencias repetidas.
En muchos de los ejemplos extremos, el ADN mitocondrial de las protistas está compuesto de varios cientos de distintas moléculas lineales cortas.
Lo que se conoce hasta ahora, es que todos los ARN transcritos a partir de ADN mitocondrial y sus productos de traducción permanecen en la mitocondria en la cual se produjeron, y todas las proteínas codificadas por ADN mitocondrial se sintetizan en ribosomas mitocondriales.
El ADN mitocondrial codifica a los ARN ribosomales que forman a los ribosomas mitocondriales, aunque la mayoría de las proteínas mitocondriales se importan desde el citoplasma.
En animales y hongos, todos los ARN de transferencia usados para la síntesis de proteínas en mitocondria también son codificados por ADNs mitocondriales. Sin embargo en plantas y muchos protozoarios, la mayoría de los ARNt mitocondriales se codifican por ADN nuclear y se importan hacia adentro de la mitocondria.
El código
genético usado en mitocondrias animales y de hongos, es diferente del código genético standard empleado en todos los genomas nucleares procariotes y eucariotes; y en realidad, el código es aún diferente en diferentes especies. El por qué y el cómo de éstas diferencias se dieron durante la evolución es un misterio.
Por ejemplo, UGA es normalmente un codón de paro, pero se lee como un triptófano por el sistema de traducción mitocondrial de humanos y hongos; sin embargo, en mitocondrias de plantas, UGA sigue siendo reconocido como un codón de paro. AGA y AGG, los codones nucleares standard para arginina, también codifican para arginina en ADN mitocondrial de plantas y hongos, pero son codones de paro en ADN mitocondrial de mamíferos y codones para serina en ADN mitocondrial de drosphila.
La severidad de las enfermedades causadas por una mutación en ADN mitocondrial depende de la naturaleza de la mutación y de la proporción de ADN mitocondrial mutante y ADN mitocondrial silvestre presente en un tipo celular específico.
Investigación reciente sugiere que la acumulación de mutaciones en el ADN mitocondrial es un componente importante del envejecimiento en mamíferos. Se ha observado que las mutaciones en el ADN mitocondrial se acumulan con el envejecimiento, quizá debido a una disminución de la habilidad de capacidad de lectura de la ADN polimerasa.
Organización estructural de los cromosomas eucariotes.
Debido a que la longitud total del ADN celular es superior a cientos de miles de veces la longitud de una célula, el empaquetamiento del ADN es crucial para la arquitectura de la célula.
La tarea de compactar y organizar el ADN cromosomal recae en abundantes proteínas nucleares llamadas “histonas”. Los complejos de histonas + proteínas no histonas + ADN constituye la cromatina, la cual existe en diversos grados de plegamiento o compactación.
La cromatina, la cual es aproximadamente la mitad de masa por ADN y la mitad de masa por proteínas, está dispersa a través del núcleo en las células en interfase (aquellas que no están llevando a cabo mitosis).
Aunque cada cromosoma eucariote incluye millones de moléculas proteicas, cada cromatina contiene solo una molécula de ADN lineal extremadamente larga. La molécula de ADN más larga en los cromosomas humanos consta de 2.8 x 108 pares de bases o aproximadamente 10 cm de longitud.
La organización estructural de la cromatina permite que este ADN tan largo sea compactado dentro de los límites microscópicos del núcleo celular.
Todavía, la cromatina está organizada de tal forma que secuencias específicas de ADN dentro de la cromatina estén rápidamente disponibles para los procesos celulares como la transcripción, la replicación, la reparación y la recombinación de moléculas de ADN.
La cromatina existe en forma condensada y extendida.
Las histonas, las proteínas más abundantes en la cromatina, constituyen una familia de pequeñas proteínas básicas.
Los cinco tipos más comunes de proteínas histonas, denominados H1, H2A, H2B, H3 y H4, son ricas en aminoácidos básicos cargados positivamente (carga neta positiva) que interactúan con los grupos fosfatos cargados negativamente en el ADN.
A bajas concentraciones de sal, en ausencia de cationes divalentes como el Mg+2, la cromatina aislada se observa como “cuentas de un collar”. En esta forma extendida, la hebra está compuesta de ADN libre denominado “ADN de enlace” que conecta las estructuras tipo cuenta denominadas “nucleosomas”.
Compuestos de ADN e histonas, los nucleosomas tienen aproximadamente 10 nm de diámetro y son las unidades estructurales primarias de la cromatina.
Si la cromatina se aísla a concentraciones fisiológicas de sales, toma una forma más condensada tipo fibra que tiene unos 30 nm de diámetro.
Estructura de Nucleosomas.
Un nucleosoma está consitituido por un centro proteico con ADN unido a su superficie como hilo alrededor de un carrete.
El centro (carrete) es un octámero conformado por dos copias de cada tipo de histonas (H2A, H2B, H3 y H4). Estudios de cristalografía de rayos X mostraron que el centro de histonas es una estructura parecida a un disco hecha de subunidades de histonas interconectadas.
Los nuecleosomas de todos los eucariotes contienen 147 pb de ADN enrollados con vueltas de uno y dos tercios alrededor del centro proteico. La longitud del ADN de enlace es más variable entre las especies y aún entre las diferentes células de un organismo, variando desde 10 a 90 pares de bases.
Durante la replicación celular, el ADN se configura en nucleosomas casi inmediatamente después de que pase la horquilla de replicación. Este proceso depende de las chaperonas específicas que se unan a las histonas y se “ensamblen” junto con nuevo ADN replicado en nucleosomas.
Estructura de las Fibras de 30 nm.
Estudios actuales, que incluyen cristalografía de rayos X de la configuración de nucleosomas muestran que la fibra de 30 nm presenta una estructura de “listón en zig-zag” que está unido dentro de una hélice de “dos inicios” hechas de dos hebras de nucleosomas “aplilados” unos sobre otros como monedas.
Las dos hebras de nucleosomas empacados se unen entonces en una doble hélice similar a la doble hélice del ADN, excepto que esta hélice es de giro izquierdo en lugar de giro derecho como en el ADN.
La fibra de 30 nm también incluye a H1, la quinta histona más común. H1 está unida al ADN como si entrara y perteneciera al centro del nucleosoma, pero su estructura en el nucleosoma no se conoce a resolución atómica.
La cromatina en las regiones cromosómicas que no serán transcritas o replicadas se configuran predominantemente en la forma condensada de fibra de 30 nm, y en estructuras plegadas de alto orden de las que su conformación detallada no se conoce a resolución atómica.
Conservación de la estructura de la cromatina.
La estructura de la cromatina es claramente similar en las células de todos los eucariotes, incluyendo hongos, plantas y animales; indicando que la estructura de la cromatina se “optimizó” temprano en la evolución de las células eucariotes.
Las secuencias de aminoácidos para las cuatro histonas (H2A, H2B, H3 y H4) están altamente conservadas entre especies relativas distantes.
Existen también variantes menores de histonas codificadas por genes que difieren de los tipos mayores altamente conservados, de manera particular en vertebrados.
Por ejemplo, una forma especial de H2A, denominada H2AX, se incorpora dentro de los nucleosomas en lugar de H2A, en una fracción pequeña de los nucleosomas en todas las regiones de la cromatina.
En los sitios en los que la doble hélice del ADN cromosómico se rompe, H2AX se fosforila y participa en el proceso de reparación del cromosoma, probablemente funcionando como sitio de unión para las proteínas reparadoras.
En los nucleosomas de los centrómeros, H3 es reemplazada por otra variante de histona denominada CENP-A, que participa en la unión de los microtúbulos del huso durante la mitosis.
La mayoría de las variantes menores de histonas difieren solo ligeramente en secuencia de las histonas mayores. Éstos cambios ligeros en la secuencia de histonas pueden influenciar en la estabilidad de los nucleosomas así como en su tendencia a plegarse en la fibra de 30 nm y en otras estructuras de alto orden.
La modificación de las colas de las histonas controla la condensación de la cromatina y su función.
Cada una de las proteínas histonas que conforman el centro del nucleosoma presentan un extremo N-terminal flexible de 19 a 39 residuos que se extiende desde la estructura globular del nuclosoma; las proteínas H2A y H2B también contienen un extremo C-terminal que se extiende desde el centro octamérico globular de histonas.
Éstos términos se denominan “colas de histonas”. Las colas de histonas se requieren para que la cromatina se condense desde la conformación de cuentas de collar a la fibra de 30 nm.
Por ejemplo, experimentos recientes indican que la cola N-terminal de la histona H4, particularmente la lisina 16, es crítica para
la formación de la fibra de 30 nm. Ésta lisina cargada positivamente interactúa con un “parche” con carga neta negativa en la interfase H2A-H2B del siguiente nucleosoma de la pila de nucleosomas (nucleosomas apilados) de la fibra de 30 nm.
Las colas de histonas están sujetas a múltiples modificaciones post traduccionales como la acetilación, la metilación, la fosforilación y la ubiquitinación. Una proteína histona en particular no sufre todas las modificaciones al mismo tiempo, pero las histonas en un nucleosoma dado pueden contener colectivamente varios tipos diferentes de modificaciones.
La combinación particular de modificaciones post traduccionales encontradas en las diferentes regiones de la cromatina ha sugerido que constituyen un “código de histonas” que influencia las funciones de la cromatina al crear o remover sitios de unión para proteínas asociadas a cromatina.
Acetilación de Histonas.
Las lisinas de las colas de histonas sufren acetilaciones y desacetilaciones reversibles por enzimas que actúan específicamente en lisinas del extremo N-terminal.
En la forma acetilada, se neutraliza la carga positiva del grupo -amino de la lisina. (como ejemplo) la lisina 16 en la histona H4 es particularmente importante para el plegamiento en forma de fibra de 30 nm porque interactúa con un “parche” cargado negativamente en la superficie del nucleosoma vecino en la fibra.
Consecuentemente, cuando la lisina 16 en H4 se acetila, la cromatina tiende a formar la estructura de cuentas de collar de una manera menos condensada lo que afecta la transcripción y la replicación.
La acetilación en otros sitios en H4 y en otras histonas está relacionado con un aumento en la sensibilidad del ADN de la cromatina a la digestión por nucleasas.
Se piensa que el control de la acetilación de los extremos N-terminal de las histonas en regiones cromosómicas específicas contribuye al control transcripcional de la expresión génica.
Mientras los genes se encuentren en regiones condensadas y plegadas de la cromatina, serán menos accesibles a ADNasas exógenas que los genes en regiones no condensadas extendidas de la cromatina.
La ARN polimerasa y otras proteínas requeridas para la transcripción también se ven inhibidas por la interacción con ADN en cromatina condensada.
Otras modificaciones de Histonas.
Los grupos -amino de la lisina pueden metilarse, un proceso que previene la acetilación, manteniendo así su carga positiva. Los grupos -amino de la lisina pueden metilarse una, dos y hasta tres veces.
Las cadenas laterales de arginina también pueden metilarse. Las cadenas laterales de serina y treonina pueden fosforilarse de manera reversible, lo que permite introducir cargas negativas.
Una única molécula de ubiquitina de 76 aminoácidos puede adicionarse de manera reversible en las colas C-terminal de H2A y H2B. Se debe recordar que la adición de múltiples moléculas unidas de ubiquitina en una proteína pueden “marcarla” para degradación por el proteasoma. Sin embargo, en este caso, la adición de una única molécula de ubiquitina no afecta la estabilidad de una histona aunque influencie la estructura de la cromatina.
Como ya se mencionó, es la precisa combinación de aminoácidos modificados en las colas de histonas la que ayuda en el control de la condensación, o compactación, de la cromatina y en su habilidad para ser transcrita, replicada y reparada.
Esto puede ilustrarse al comparar las modificaciones específicas observadas en la cromatina altamente condensada, conocida como “heterocromatina”, con aquellas en cromatina menos condensada, conocida como “eucromatina”.
La heterocromatina no se “descondensa” totalmente durante la mitosis, permaneciendo en un estado compacto durante la interfase. Se encuentra típicamente en los centrómeros y en los telómeros de los cromosomas así como en algunas otras zonas discretas. Cundo las células se tratan con tinciones que se unen a ADN, las regiones de la heterocromatina se tiñen muy obscuro.
En contraste, las áreas de la eucromatina, las cuales se encuentran en un estado menos compacto durante la interfase, se tiñen ligeramente con los tintes de unión a ADN. Típicamente muchas de las regiones transcritas del ADN se encuentran en la eucromatina, mientras que la heterocromatina permanece transcripcionalmente inactiva.
Leyendo el código de Histonas.
El “código de histonas” es “leído” por proteínas que se unen a las colas de histonas modificadas y como consecuencia promueven una condensación o una “decondensación” de la cromatina, formando estructuras de cromatina “abiertas” o “cerradas”.
Los eucariotes superiores expresan varias proteínas que contienen un “cromodominio” que se une a las colas de histonas cuando están metiladas en lisinas específicas.
Un ejemplo es la “heterochromatin protein 1” (HP1). HP1 es una de las proteínas más comunes asociadas con la heterocromatina, además de las histonas.
El cromodominio de HP1 se une a la cola N-terminal de H3 solo cuando esta está trimetilada en la lisina 9. HP1 también presenta un segundo dominio denominado “chromoshadow domain” debido a que se encuentra frecuentemente en proteínas que contienen un cromodominio. El chromoshadow domain se une a otros dominios chromoshadow.
Consecuentemente, la cromatina que contenga a H3 trimetilada en la lisina 9 (H3K9Me3) se ensambla en una estructura de cromatina condensada por acción de HP1, aunque la estructura de ésta cromatina no se ha entendido del todo.
Adicionalmente a la unión a dominios iguales a él, el chromoshadow domain también se une con la enzima “histone methyl transferase (HMT)” que metila a la lisina 9 de H3 (H3K9).
Como consecuencia, los nucleosomas adyacentes a una región de heterocromatina que contenga HP1 también serán metilados en la lisina 9. Esto crea un sitio de unión para otra HP1 que puede unir a la H3K9 methyl transferase, lo que resulta en una “dispersión” (reacción en cadena) de la estructura de heterocromatina a través del cromosoma hasta que se encuentre un “elemento de unión” que bloquee la dispersión.
Los elementos de unión caracterizados a la fecha son generalmente regiones en la cromatina donde varias proteínas no histona se unen al ADN, posiblemente bloqueando la metilación de las histonas a los alrededores de los elementos de unión.
El modelo de la formación de la heterocromatina provee una explicación para cómo las regiones heterocromáticas de un cromosoma se restablecen después de la replicación del ADN durante la fase S del ciclo celular.
Cuando el ADN en la heterocromatina es replicado, los octameros de histonas que estén trimetilados en la lisina 9 de H3 se distribuyen en ambos cromosomas “hijos” entre un número igual de octámeros de histonas nuevamente ensamblados.
La H3K9 histone methyl transferase asociada con los nucleosomas trimetilados en la lisina 9 de H3 de los nucleosomas ensamblados nuevamente, regenera la heterocromatina en ambos cromosomas hijo.
Otros dominios proteicos se asocian con las modificaciones típicas de las colas de histonas de eucromatina. Por ejemplo, el “bromodominio” se une a las colas de histona acetiladas y por lo tanto se asocia con la cromatina activa transcripcionalmente.
TFIID, una proteína involucrada en la transcripción, contiene dos bromodominios cercanos, que probablemente ayudan a TFIID a asociarse con cromatina transcripcionalmente activa (por ejemplo la eucromatina). Esta proteína también tiene una actividad de acetilasa de histonas que pudiera mantenera a la cromatina en un estado hiperacetilado “conductivo”/favorable para la transcripción.
Aunque las histonas son las proteínas predominantes en la cromatina, hay presencia menos abundante de proteínas asociadas a cromatina de naturaleza no histona, y aún la molécula de ADN en sí misma, también es crucial para la estructura del cromosoma.
Estudios micromecánicos de grandes cromosomas en metafase en presencia de proteasas o nucleasas indican que el ADN, y no la proteína, es el responsable de la integridad mecánica de un cromosoma en metafase
cuando este está siendo “jalado” por sus extremos.
La integridad de la estructura del cromosoma requiere el complejo completo de cromatina, con ADN, los octámeros de histonas y las proteínas no histonas asociadas a cromatina.
Experimentos de hibridación in situ con varias sondas de ADN de un cromosoma humano de células en interfase marcadas con fluorescencia apoyan el modelo en el cual la cromatina se conforma en bucles (loops) grandes.
De los datos de estos ensayos se pudo observar que los bucles varían en tamaño (longitud) desde un millón hasta cuatro millones de pares de bases en células de mamífero en interfase.
También se observó que los genes se localizan preferentemente dentro de los bucles (loops). Los loops se encuentran configurados en sus bases por un mecanismo que no rompe la doble hélice de ADN.
La cromatina de un cromosoma en una célula en interfase no se encuentra “disperso” a través del núcleo. En lugar de eso, la cromatina en interfase está organizada en “territorios cromosomales”. Ensayos de hibridación in situ de núcleos en interfase con sondas específicas para cromosomas marcadas con fluorescencia muestran que las sondas se visualizan dentro de zonas restringidas del núcleo en lugar de aparecer a través del núcleo.
El uso de sondas específicas para diferentes cromosomas muestra un poco de sobrelapamiento entre los cromosomas en un núcleo en interfase. Sin embargo, la posición precisa de los cromosomas no es reproducible entre células.
Estructura tipo anillo de complejos proteicos SMC.
Caracterización con proteínas asociadas con cromosomas en metafase permitió identificar a una pequeña familia de proteínas denominadas “structural maintenance of chromosome proteins” o proteínas SMC.
Estas proteínas no histonas son críticas para el mantenimiento de la estructura morfológica de los cromosomas. Se ha visto que mutaciones que generan defectos en las proteínas SMC fallan al asociar a las cromátides hijas después de la replicación del ADN en la fase S. Como resultado, los cromosomas no se segregan propiamente a las células hijas durante la mitosis.
Proteínas relacionadas a proteínas SMC son necesarias para la adecuada segregación de los cromosomas en bacteria y archaea, lo que indica que esta clase de proteínas son un ancestro vital para la estructura de los cromosomas y su segregación en todos los reinos de la vida.
Un monómero SMC contiene dos dominios globulares, un dominio “cabeza” y un dominio de interacción (hinge) que están separados por un largo dominio tipo bucle. El dominio cabeza está formado por los extremos amino y carboxilo del polipéptido, los cuales están plegados juntos en la estructura nativa de la proteína. El dominio de interacción se forma en donde el polipéptido se pliega sobre sí mismo. El dominio de interacción de un monómero se une al dominio de interacción del segundo monómero, formando una estructura de complejo dimérico tipo “U”. Los dominios cabeza de los monómeros tienen actividad ATPasa y están relacionados a miembros de otra familia de pequeñas proteínas denominadas “kleisinas”.
Estructura de cromosomas en metafase.
La condensación de los cromosomas durante la profase podría involucrar la formación de muchos más loops de cromatina, por lo tanto la longitud de cada loop se ve reducida en comparación con los loops de células en interfase.
Sin embargo, el plegamiento de la cromatina en cromosomas en metafase aún no se clarifica del todo. Análisis microscópicos de cromosomas mamíferos mientras se condensan durante la profase indican que la fibra de 30 nm se pliega en una fibra de 100 – 130 nm denominada fibra “cromonema”.
Entonces después, la fibra cromonema se pliega en una estructura con un diámetro de 200 – 250 nm denominada “cromátide de profase media”, la cual a su vez se pliega en cromátides de 500 – 750 nm observadas durante la metafase.
Proteínas no histonas adicionales regulan la transcripción y la replicación.
La cromatina en interfase y los cromosomas en metafase también contienen pequeñas cantidades de complejos de otras proteínas. Por ejemplo, cientos de miles de factores de transcripción diferentes se asocian con la cromatina en interfase. Estos factores ayudan a regular la transcripción.
Otras pocas proteínas no histona de unión a ADN se presentan en mayores cantidades que los factores de transcripción o replicación. Muchas de estas proteínas han sido designadas como proteínas HMG (high-movility group).
Se ha visto que algunas proteínas HMG se encuentran unidas a ADN de manera cooperativa con factores de transcripción que se unen a secuencias de ADN específicas, estabilizando complejos multiproteicos que regulan la transcripción de un gen vecino.
El número de cromosomas, sus tamaños y sus formas, durante la metafase son especie – específicos.
Cada cromosoma en metafase consiste de dos cromátides hermanas, que se encuentran unidas por una región “apretada”, denominada centrómero.
El número, los tamaños y las formas de los cromosomas en metafase constituyen en “cariotipo”, el cual es distintivo para cada especie.
En la mayoría de las especies, todas las células tienen el mismo cariotipo. Sin embargo, especies que aparentemente son bastante similares pueden tener cariotipos muy diferentes, indicando que el potencial genético similar puede organizarse en los cromosomas de muy diferente manera.
Por ejemplo, dos especies de ciervos pequeños, los muntjac indios y los muntjac Reeves, contienen aproximadamente la misma cantidad de ADN genómico. En una especie, el ADN está organizado en 22 pares de autosomas homólogos y dos cromosomas sexuales físicamente separados. En contraste, la otra especie el número más pequeño de cromosomas de cualquier mamífero, solo tres pares de autosomas un cromosoma sexual físicamente separado, mientras que el otro se encuentra unido a uno de los extremos finales de uno de los autosomas.
Tres elementos funcionales se requieren para la replicación y la herencia estable de cromosomas.
Cualquier cromosoma eucariote debe contener tres elementos funcionales par ser replicado y segregado correctamente: 1) orígenes de replicación en los cuales las ADN polimerasas y otras proteínas inicien la síntesis del ADN; 2) el centrómero, la región apretada requerida para la adecuada segregación de los cromosomas hijos; y 3) los dos extremos finales, o telómeros.
Las secuencias de los centrómeros varían mucho en longitud.
Los centrómeros de todos los eucariotes están unidos por nucleosomas mediante una variante de la histona H3, especializada y centrómero – específica, denominada CENP-A, que es esencial para la función de los centrómeros.
En plantas y animales, los centrómeros tienen “megabases” de longitud y están compuestos de múltiples repeticiones de secuencias simples de ADN.
En humanos los centrómeros contienen arreglos de 2 – 4 megabases de una secuencia simple de ADN de 171 pb denominada “ADN alphoide” (alphoid DNA) que está unido por nucleosomas que contienen a CENP-A, así como otras repeticiones de secuencias simples de ADN.
En eucariotes superiores, una estructura de complejo proteico denominada “cinetocoro” (kinetochore) se ensambla en el centrómero y se asocia con múltiples fibras del huso mitótico durante la mitosis.
La adición de secuencias teloméricas por la telomerasa previene el acortamiento de los cromosomas.
La secuenciación de los telómeros de muchos organismos, incluyendo humanos, muestra que la mayoría están conformados por oligómeros repetitivos con un alto contenido de Guanina (G) en la hebra con su extremo 3’terminal hacia el final del cromosoma.
La secuencia repetida telomérica en humanos y otros vertebrados es “TTAGGG”. Esta simple secuencia se repite en los “verdaderos extremos finales” de los cromosomas por un total de unos pocos cientos de pares de bases en levaduras y protozoarios y unos pocos miles de pares de bases en vertebrados.
El extremo 3’ terminal de la hebra rica en G se extiende de 12-16 nucleótidos más allá del extremo 5’ terminal de la hebra complementaria
rica en C. Esta región está unida por proteínas específicas que protegen los extremos terminales de los cromosomas lineales de ataques por exonucleasas.
La necesidad de una región especializada en los extremos finales de los cromosomas eucariotes es clara cuando se considera que todas las ADN polimerasas elongan las cadenas de ADN en el extremo 3’ terminal, y que todas requieren un iniciador de ADN o de ARN (primer).
En el momento en que la horquilla de replicación alcanza el extremo de un cromosoma lineal, la síntesis de la cadena principal continúa hacia el extremo terminal de la hebra de ADN modelo, completando una doble hélice de ADN hija. Sin embargo, debido a que la cadena modelo se copia de forma discontinua, no puede ser replicada en su totalidad.
Cuando se remueve el primer de ARN final, no hay una hebra “up-stream” sobre la cual la ADN polimerasa pueda actuar para llenar el hueco resultante. Si no existiera un mecanismo especial, la hebra de ADN hija resultante de la hebra modelo pudiera acortarse con cada división celular.
El problema del acortamiento de los telómeros se resuelve con una enzima que adiciona secuencias teloméricas (TEL) en los extremos de cada cromosoma. La enzima es un complejo de ARN-proteína denominada “telomere terminal transferase” o “telomerase” (transferasa de telómero terminal o telomerasa”.
Debido a que la secuencia de ARN asociada a la telomerasa, sirve como modelo para la adición de desoxiribonucleótidos en los extremos de los telómeros, el origen de la enzima y no el origen del primer de ADN telomérico determina la secuencia añadida.
Entonces, la telomerasa es una forma especializada de transcriptasa reversa que “lleva” su propio “molde/templado” de ARN interno para dirigir la síntesis de ADN.
Los genes humanos que expresan a la telomerasa y al ARN asociado a la telomerasa están activos en células germinales y células madre (stem cells), pero se encuentran apagados en la mayoría de las células de tejidos adultos que se replican solo un número limitado de veces, o de los que no se volverán a replicar (éstas células se denominan “postmitóticas”).
Sin embargo, estos genes están activados en la mayoría de células cancerígenas humanas, donde la telomerasa se requiere para las múltiples divisiones celulares necesarias para formar un tumor.
Éste fenómeno ha dirigido la atención a la investigación sobre inhibidores de la telomerasa humana como agentes terapéuticos potenciales para el tratamiento del cáncer.
1.2 Dogma Central de la Biología Molecular.
El Ácido Desoxiribonucleico o ADN (Deoxyribonucleic acid; DNA) es una molécula de información que contiene en la secuencia de sus nucleótidos la información necesaria para construir todas las proteínas de un organismo, y “armar” las células y tejidos de ése organismo.
Está diseñada idealmente a nivel molecular para llevar a cabo su función. Químicamente es extraordinariamente estable en las condiciones terrestres, y como ejemplo se puede citar la facilidad para recuperar secuencias de ADN de fósiles que tienen millones de años.
Debido a esto, y también a que el mecanismo de reparación que opera en las células vivas, los largos polímeros que conforman a la molécula de ADN tienen más de 109 nucleótidos de largo.
Virtualmente toda la información requerida para el desarrollo de un embrión humano fértil a su estado adulto compuesto de trillones de células con funciones especializadas pueden almacenarse en la secuencia de cuatro posibles nucleótidos que conforman más de 3x109 pares de bases en el genoma humano.
La información en ésta molécula se copia fácilmente con una proporción de error de < 1 en 109 nucleótidos por generación.
La replicación exacta de la información en cualquier especie asegura su continuidad genética de generación a generación y es crítica para el desarrollo normal de cualquier individuo.
El ADN cumple éstas funciones perfectamente que es la fuente de información genética en todas las formas de vida conocida. El hecho de que virtualmente todas las formas de vida conocidas usan ADN para codificar su información genética, y que además usan prácticamente el mismo código de secuencia de ácidos nucleicos para especificar una secuencia de aminoácidos, implica que todas las formas de vida descienden de un ancestro común con base de almacenamiento de información en secuencia de ácidos nucleicos.
Esta información se mantiene disponible y se replica por “apareamiento” entre bases específicas.
La información almacenada en el ADN se configura en unidades hereditarias, ahora conocidas como genes, que controlan las características que identifican a un organismo.
En el proceso de transcripción, la información almacenada en el ADN se copia en un Ácido Ribonucleico o ARN (Ribonucleic acid; RNA), que juega tres papeles distintos en la síntesis de proteínas.
Porciones de secuencias de nucleótidos del ADN se copian en moléculas de ARN mensajero (messenger RNA; mRNA) que dirigen la síntesis de proteínas específicas.
La secuencia de nucleótidos de una molécula de mRNA contiene la información que especifica el orden correcto de los aminoácidos durante la síntesis de una proteína.
El ensamblaje por pasos, notablemente exacto, de aminoácidos dentro de una proteína se lleva a cabo por “traducción” del mRNA.
En éste proceso, la secuencia de nucleótidos de una molécula de mRNA se “lee” mediante un segundo tipo de ARN denominado ARN de transferencia (transfer RNA; tRNA) con la ayuda de un tercer tipo de ARN, ARN ribosomal (ribosomal RNA; rRNA), y sus proteínas asociadas.
Mientras los aminoácidos correctos son puestos en secuencia por los tRNAs, se van uniendo por enlaces peptídicos para “construir” las proteínas.
La síntesis de RNA se denomina “transcripción” porque el “lenguaje de secuencia de nucleótidos” es copiado precisamente o “transcrito” hacia la secuencia de nucleótidos de una molécula de RNA.
La síntesis de proteína se denomina “traducción” debido a que el lenguaje de secuencia de nucleótidos del DNA y del RNA se “traduce” en el “lenguaje de secuencia de aminoácidos” de las proteínas.
El descubrimiento de la estructura del DNA en 1953 y la subsecuente elucidación de cómo el DNA dirige la síntesis del RNA, que a su vez, dirige el “ensamblaje” de proteínas, el denominado “dogma central”, fueron descubrimientos notables que marcaron los “primeros días” de la biología molecular.
Las proteínas son mayormente responsables de la regulación de la expresión génica, el proceso global en que la información codificada en el DNA es “decodificada” hacia una variedad de proteínas en las células correctas en el tiempo de desarrollo correcto.
Ésta regulación de la expresión génica permite que la hemoglobina se exprese únicamente en las células de la médula espinal (reticulocitos) destinados a desarrollarse como células de glóbulos rojos circulantes (eritrocitos), y dirigir el desarrollo de neuronas para que se generen las sinapsis (conexiones) adecuadas con otras 1011 neuronas en desarrollo en el cerebro humano.
El proceso genético molecular preciso de la replicación del DNA, transcripción y traducción debe llevarse a cabo con extraordinaria fidelidad, velocidad y exacta regulación de forma que los organismos procariotes y eucariotes complejos se desarrollen normalmente.
Esto se logra por medio de procesos químicos que operan con extraordinaria exactitud acoplados con múltiples niveles de puntos de control, o supervivencia, que son mecanismos que prueban que pasos críticos para estos procesos se hallan llevado a cabo correctamente antes de que el siguiente paso se inicie.
La expresión de genes tan altamente regulada es necesaria para el desarrollo de un organismo multicelular y requiere integración de la información de señales enviadas de células distantes en el organismo en desarrollo, así como de células vecinas, y un programa intrínseco de desarrollo determinado por los pasos iniciales en la embriogénesis tomado de las células progenitoras.
Toda esta regulación depende de secuencias control
en el DNA que funcionan junto con proteínas denominadas “factores de transcripción” para coordinar la expresión de cada gen.
Entonces los ácidos nucleicos funcionan como el “cerebro y el sistema nervioso central” de la célula, mientras que las proteínas llevan a cabo las funciones que ellos “especifican”.
1.3 Composición de los Ácidos Nucleicos.
El DNA y el RNA son muy similares químicamente. La estructura primaria de ambos son polímeros lineales compuestos de monómeros denominados “nucleótidos”.
Ambos funcionan primariamente como moléculas de información, llevando la información en secuencias exactas de éstos nucleótidos.
A pesar de sus similitudes químicas, el DNA y el RNA presentan algunas diferencias muy importantes. Por ejemplo, el RNA puede también funcionar como molécula catalítica. Por lo que se ha visto, son sus diferencias y propiedades únicas las que hacen que el DNA y el RNA tengan sus roles específicos en la célula.
Una cadena de ácido nucleico es un polímero lineal con una direccionalidad extremo-a-extremo.
En todos los organismos, el DNA y el RNA se componen solo por cuatro diferentes nucleótidos. Todos los nucleótidos consisten en una base orgánica unida a un azúcar de cinco carbonos que tiene un grupo fosfato “anclado” al carbono 5. En el RNA, el azúcar es ribosa; en el DNA, desoxirribosa.
Los nucleótidos usados en la síntesis del DNA y del RNA contienen cuatro de cinco diferentes bases. Las bases “adenina” (A) y “guanina” (G) son “purinas”, las cuales contienen un par de anillos fusionados; las bases “citosina” (C), “timina” (T) y “uracilo” (U) son “pirimidinas”, las cuales contienen un solo anillo. Tres de éstas bases: A, G y C se encuentran tanto en DNA como en RNA; sin embargo, la T solo se encuentra en el DNA, y el U solo en el RNA.
Una hebra única de ácido nucleico tiene un “esqueleto” compuesto de unidades de pentosa-fosfato repetidas desde las cuales las bases purinas y pirimidinas se extienden como grupos laterales.
Como un polipéptido, una hebra de ácido nucleico tiene una orientación química extremo-a-extremo: el extremo 5’ tiene un grupo hidroxilo o un grupo fosfato en el carbono 5’ de su azúcar terminal; el extremo 3’ usualmente tiene un grupo hidroxilo en el carbono 3’ de su azúcar terminal.
Esta direccionalidad, además de que la síntesis procede 5’ 3’, ha generado la convención de que las secuencias de polinucleótidos se “escriben” y se “leen” en la dirección 5’ 3’ (de izquierda a derecha); por ejemplo, se asume que la secuencia AUG debe ser (5’)AUG(3’). Y, como se verá, la direccionalidad 5’ 3’ de una hebra de ácido nucleico es una propiedad importante de la molécula.
El enlace químico entre los nucleótidos adyacentes, denominado comúnmente “enlace fosfodiéster”, en realidad consiste en dos enlaces fosfoéster, uno en el lado 5’ del fosfato y otro en el lado 3’.
La secuencia lineal de nucleótidos “enlazados” por enlaces fosfodiéster constituye la estructura primaria de los ácidos nucleicos.
Como los polipéptidos, los polinucleótidos pueden girar y plegarse en conformaciones tridimensionales estabilizadas por enlaces no covalentes.
Aunque las estructuras primarias del DNA y del RNA son generalmente similares, sus conformaciones tridimensionales son algo diferentes. Estas diferencias estructurales son críticas para las diferentes funciones de los dos tipos de ácido nucleico.
1.4 Estructura del DNA (ADN).
El DNA nativo es una doble hélice de hebras antiparalelas complementarias.
La era moderna de la biología molecular inició en 1953 cuando James D. Watson y Francis H. C. Crick propusieron que el DNA es una estructura de doble hélice. Su propuesta basada en los análisis de patrones de difracción de rayos x generados por Rosalind Franklin y Maurice Wilkins, y acoplados cuidadosamente con modelos físicos, probó ser correcto y abrió la vía para el entendimiento moderno sobre cómo funciona el DNA como material genético.
El DNA consiste (está conformado) de dos hebras de polinucleótidos asociadas que se entrelazan para formar una doble hélice.
Los dos “esqueletos” de azúcar fosfato están orientados hacia afuera de loa doble hélice, y las bases se proyectan hacia el interior. Las bases adyacentes en cada hebra se “empacan” unas sobre otras en planos paralelos.
La orientación de las hebras de ADN es antiparalelas, es decir, sus direccionalidades 5’ 3’ son opuestas. Las dos hebras se encuentran conformadas de forma precisa por la formación de los “pares de bases” entre las dos hebras: A está “apareada” con T a través de dos puentes de hidrógeno; G está apareada con C a través de tres puentes de hidrógeno.
Esta complementaridad de pares de bases es una consecuencia del tamaño, la forma y la composición química de las bases. La presencia de cientos de puentes de hidrógeno en la molécula de ADN contribuye grandemente a la estabilidad de la doble hélice.
Interacciones hidrofóbicas y de van der Waals entre los pares de bases adyacentes también estabilizan la estructura de la doble hélice.
En la naturaleza en el DNA, A siempre está apareada con T y G con C. Estas asociaciones, siempre entre una purina más grande y una pirimidina más chica, se conocen como “pares de bases de Watson y Crick”.
Sin embargo, en teoría y en DNAs sintéticos, pueden formarse otros pares de bases. Por ejemplo, G teóricamente puede formar puentes de hidrógeno con T, lo que causaría solo una pequeña distorsión en la hélice. El espacio disponible en la hélice también puede permitir un apareamiento entre la citosina y la timina.
Aunque los pares de bases no standard G-T y C-T normalmente no se encuentran en el DNA, el par de bases guanina-timina (G-T) son comunes en regiones de doble hélice que se forman dentro de algunas cadenas simples de RNA.
La mayoría del DNA en las células se presenta como una hélice con “sentido diestro” (los giros en su estructura son hacia la derecha). Los patrones de difracción de rayos x del DNA indican que en la configuración de las bases estás están espaciadas regularmente a una distancia de 0.34 nm a lo largo del eje de la hélice.
La hélice completa una vuelta cada 3.4 nm; entonces eso indica que hay aproximadamente 10.1 pares de bases por vuelta. Esta configuración se refiere como la “forma B” del DNA, que es la conformación normal que presenta la mayoría del DNA en las células.
En el exterior de la forma B del DNA, los espacios entre las hebras entrelazadas forman dos surcos helicoidales de diferente grosor denominados como “surco mayor” y “surco menor”.
Como consecuencia los átomos en los extremos de cada base dentro de estos surcos están accesibles desde fuera de la hélice, formando dos tipos de superficies de unión. Las proteínas de unión a DNA pueden leer la secuencia de bases en la doble hélice del DNA al interactuar con átomos ya sea del surco mayor o en el surco menor.
Adicionalmente, otras estructuras de DNA se han descrito además de la forma B mayoritaria. En condiciones de laboratorio en las que la mayoría del agua se ha removido del DNA, la estructura cristalográfica del DNA cambia de la forma B a la “forma A”, que es más ancha y corta, con los pares de bases orientadas de manera inclinada en lugar de perpendicular al eje de la hélice. Hélices de RNA-DNA y RNA-RNA existen en ésta forma en células e in vitro.
Moléculas de DNA cortas compuestas de nucleótidos de purina-pirimidina intercalados (especialmente G’s y C’s) adoptan una configuración alternativa con torsión (vuelta) hacia la izquierda, en lugar de la forma de torsión hacia la derecha considerada “normal”.
Esta estructura se denomina DNA Z debido a que las bases parecen seguir un patrón en zig-zag cuando se observan de lado. La evidencia sugiere que este DNA Z puede presentarse en células, aunque su función sea desconocida.
Por mucho, las modificaciones más importantes en la estructura del DNA B son resultado de unión de proteínas a secuencias de DNA específicas.
Aunque la multitud de puentes de hidrógeno y enlaces hidrofóbicos entre las bases proveen estabilidad
al DNA, la doble hélice es flexible sobre su eje más largo. A diferencia de las -hélices en las proteínas no hay puentes de hidrógeno paralelos al eje de la hélice del DNA.
Esta propiedad permite al DNA “doblarse” cuando está formando parte de un complejo DNA-proteína. La capacidad del DNA para doblarse es crítica para el empaquetamiento del DNA en la cromatina.
¿Por qué es el DNA la molécula encargada de “contener” la información genética y no el RNA?. El hidrógeno en la posición 2’ en la desoxirribosa del DNA la hace una molécula mucho más estable que el RNA, el cual tiene un grupo OH en esa misma posición.
Los grupos OH en la posición 2’ en las ribosas del RNA participan en la lenta hidrólisis de enlaces fosfodiéster a pH neutro. La ausencia de grupos OH en la posición 2’ en el DNA previene este proceso; por lo tanto la hace efectivamente más estable, lo que es crítico para su función de “almacén a largo plazo” de la información genética.
El DNA puede sufrir una separación de cadenas reversible.
Durante la replicación y la transcripción del DNA, las hebras de la doble hélice pueden separase para permitir que los bordes internos de los pares de bases puedan re-aparearse con las bases de las cadenas de polinucleótidos sintetizadas de novo.
La separación de las cadenas de DNA, conocida como “desnaturalización” puede inducirse experimentalmente al incrementar la temperatura de una solución de DNA. Conforme la energía termal aumenta, el incremento en el movimiento molecular resultante eventualmente rompe los puentes de hidrógeno y otras fuerzas que estabilizan la doble hélice; entonces las cadenas se separan y se alejan una de otra debido a una repulsión electrostática por la carga neta negativa del “esqueleto” de desoxirribosas fosfato de cada cadena libre resultante.
Cerca de la temperatura de desnaturalización, un pequeño incremento en la temperatura causa una pérdida rápida, casi simultánea, de múltiples interacciones débiles que mantienen unidas a las cadenas a lo largo de toda la molécula del DNA.
La temperatura a la cual las cadenas del DNA se separan (melting temperatura; Tm) depende de varios factores. Las moléculas que contienen una gran proporción de pares G-C requieren una temperatura mayor para desnaturalizarse debido a que los tres puentes de hidrógeno en estos pares los hacen más estables que los pares de bases A-T, que solo tiene dos puentes de hidrógeno.
La concentración iónica también influencia a Tm debido a que los grupos fosfato cargados negativamente en las dos hebras están “escudados” (cubiertos) por iones cargados positivamente. Cuando la concentración de iones es baja, este “escudo” disminuye, incrementando así las fuerzas de repulsión entre las hebras y disminuyendo Tm.
Los agentes que desestabilizan los puentes de hidrógeno, como formamida o urea, también disminuyen a Tm. También, pH’s extremos desnaturalizan al DNA a baja temperatura. A pH bajo (ácido), las bases se protonan y se cargan positivamente, repeliéndose una a la otra. A pH alto (alcalino/básico), las bases pierden protones y se cargan negativamente, repeliéndose una a la otra también debido a la carga similar. En las células el pH y la temperatura normalmente están controladas y son constantes. Éstas características de la separación del DNA son más que útiles para manipularlo en el laboratorio.
Las moléculas de DNA de una solo hebra que resultan de la desnaturalización forman “rollos” sin una estructura organizada. La disminución de la temperatura, el aumento en la concentración de iones, o la neutralización del pH, causan que las dos hebras complementarias se re-asocien en una doble hélice perfecta.
El grado de “renaturalización” depende del tiempo, la concentración de DNA, y de la concentración de iones. Dos hebras de DNA no relacionadas en secuencia permanecerán como rollos y no se renaturalizarán; más importante, no inhibirán la renaturalización de aquellas hebras complementarias que se hayan “encontrado” en la mezcla (solución).
La desnaturalización y la renaturalización del DNA son la base de la “hibridación de ácidos nucleícos” una técnica usada para estudiar la relación de dos muestras de DNA y detectar y aislar moléculas de DNA específicas en una mezcla que contenga numerosas secuencias de DNA diferentes.
1.5 Estructura del RNA.
La estructura primaria del RNA es, generalmente, similar a la del DNA con dos excepciones: el azúcar componente del RNA, la ribosa, tiene un grupo hidroxilo en su posición 2’, y la timina en el DNA la remplaza el uracilo en el RNA.
La presencia de la timina en lugar del uracilo en el DNA es importante para la estabilidad a largo plazo del DNA debido a su función en la reparación de la molécula.
Como ya se había mencionado, el grupo OH en el C2 de la ribosa hace al RNA químicamente más lábil que el DNA. Como resultado, el RNA puede cortarse en mononucleótidos por soluciones alcalinas, mientras que con el DNA no se puede. El grupo OH del C2 en el RNA también provee un grupo químicamente reactivo que participa en la catálisis mediada por RNA.
Como el DNA, el RNA es un polinucleótido largo que puede ser de doble hélice o de hélice única, lineal o circular. También pude ser partícipe de una hélice híbrida compuesta de una hebra de RNA y una hebra de DNA. Y como ya se había comentado, las dobles hélices RNA-RNA y RNA-DNA tienen una conformación compacta como la forma A del DNA.
La mayoría de los RNA’s celulares son de cadena única y pueden presentar varias conformaciones. Las diferencias en los tamaños y en las conformaciones de los diferentes tipos de RNA les permiten llevar a cabo funciones específicas en la célula.
La estructura secundaria más simple en RNA’s de cadena sencilla se forma por el apareamiento de bases complementarias dentro de una secuencia lineal.
Las “horquillas” (hairpins) se forman por el apareamiento de bases entre 5 – 10 nucleótidos de cada lado, y los “bucles con tallo” (stem-loops) se forman por apareamiento de bases que se encuentran separadas por 10 o más (cientos) nucleótidos.
Estos plegamientos sencillos pueden cooperar para formar estructuras terciarias mas complejas una de las cuales se denomina “pseudoknot”.
Como ya se había comentado, las moléculas de tRNA adoptan en solución una arquitectura tridimensional bien definida que es crucial para la síntesis de proteínas.
Las moléculas más grandes de rRNA también presentan estructuras tridimensionales localmente bien definidas, con uniones más flexibles en el medio de la estructura.
Estructuras secundarias y terciarias también se observan en el mRNA, particularmente cerca de los extremos de las moléculas.
Claramente, entonces, las moléculas de RNA son como proteínas en las que se presentan dominios estructurados conectados por áreas flexibles menos estructuradas.
Los dominios plegados de las moléculas de RNA no solo son análogas estructuralmente a las -hélices o a las láminas- encontradas en las proteínas, pero en algunos casos también tienen capacidades catalíticas.
Éstos RNA’s catalíticos son los ribosomas. Aunque los ribosomas normalmente se asocian con proteínas que estabilizan la estructura ribosomal, es el RNA el que actúa como catalizador.
Algunos ribosomas pueden catalizar el “splicing”, proceso en el que una secuencia interna de RNA se corta y “remueve”, y las dos cadenas resultantes se unen nuevamente por sus extremos. Éste proceso ocurre durante la formación de la mayoría de las moléculas de mRNA’s funcionales en los eucariotes multicelulares, y también ocurre en eucariotes de una sola célula como levadura, bacteria y arquea.
Notablemente, algunos RNA’s pueden realizar “auto-splicing”, debido a la actividad catalítica que reside en la secuencia que es removida. Y como ya también se mencionó, rRNA tiene un papel catalítico en la formación de los enlaces peptídicos durante la síntesis de proteínas.
TEMA 2: REPLICACIÓN, TRANSCRIPCIÓN Y TRADUCCIÓN DEL MATERIAL GENÉTICO.
2.1 Síntesis de ADN en procariotes y eucariotes. Replicación del ADN.
El “copiado” preciso
de las secuencias de DNA durante la replicación es el paso preparatorio para la división celular.
La replicación del DNA se lleva a cabo mediante un mecanismo “semiconservativo” (semiconservative), en el que las hebras “parentales” se encuentran separadas y cada una forma una molécula doble con la hebra “hija” mediante apareamiento de bases.
El “copiado” de una cadena de DNA “molde” a una cadena complementaria es, como se sabe, una característica común de la replicación del DNA, la transcripción del DNA a RNA y de la reparación y recombinación del DNA. En todos los casos, la información en el molde, en forma de secuencias específicas de nucleótidos, se preserva.
La DNA polimerasa requiere de un “primer” para iniciar la replicación.
El DNA se sintetiza a partir de precursores desoxinucleósidos-5’-trifosfato (deoxynucleoside-5’-triphosphate) dNTPs.
La síntesis del DNA siempre procede en la dirección 5’ 3’ debido a que el crecimiento de la cadena se debe a la formación de enlaces fosfoéster entre el oxígeno 3’ de la cadena en crecimiento y el fosfato de un dNTP.
Las DNA polimerasas no pueden iniciar la síntesis de una cadena “de novo”; en realidad requieren de un RNA o DNA pequeño preexistente, denominado primer (inicaidor), para comenzar el crecimiento de la cadena.
Con un iniciador apareado a la cadena molde, una DNA polimerasa agrega (adiciona) dNTPs al grupo OH libre en el extremo 3’ del primer dirigida por la secuencia de la cadena molde:
Cuando el primer es de RNA, la cadena hija que se forma es RNA en el extremo 5’ y DNA en el extremo 3’.
La doble cadena del DNA se separa y las cadenas hijas se forman en la horquilla de replicación del DNA.
Para que la doble hélice del DNA pueda funcionar como molde durante la replicación, las dos cadenas deben separarse para que las bases estén disponibles para el apareamiento con las bases de los dNTPs que se polimerizarán en una cadena hija recién sintetizada.
La separación de las cadenas de DNA parentales se lleva a cabo por helicasas específicas, que inician la separación de las cadenas en segmentos específicos en la molécula del DNA denominados “orígenes de replicación” o simplemente “orignes”.
Las secuencias de nucleótidos de los orígenes de diferentes organismos varía mucho, aunque usualmente contienen secuencias ricas en A-T.
Una vez que las helicasas han separado a la doble hélice de DNA parental en el origen, una polimerasa de RNA especializada, denominada “primasa”, forma un primer de RNA complementario a las cadenas molde parentales.
El primer, aún apareado a su cadena de DNA complementaria, es “elongado” (alargado) por una DNA polimerasa, formando finalmente una nueva cadena hija.
La región de DNA en la cual todas estas proteínas se juntan para llevar a cabo la síntesis de las hebras hijas se denomina “horquilla de replicación”, u “horquilla de crecimiento”.
Mientras se lleva a cabo la replicación, la horquilla de replicación y las proteínas asociadas a ella se van moviendo alejándose del origen.
La separación localizada de la doble hélice del DNA produce stress torsional, el cual es “aliviado” por la “topoisomerasa I”.
A fin de que la DNA polimerasa se mueva a lo largo del DNA y lo copie, la helicasa debe separar a las dos cadenas secuencialmente, y la topoisomerasa debe eliminar los superenrrollamientos que se forman.
Una complicación común en la opeación de la horquilla de replicación del DNA viene de dos propiedades: las dos cadenas de la doble hélice parental son antiparalelas, y la DNA polimerasa puede adicionar nucleótidos a las nuevas cadenas en crecimiento solamente en la dirección 5’ 3’.
La síntesis de una de las cadenas hijas, denominada “filamento principal” (leading strand), puede proceder continuamente desde el primer de RNA en la dirección 5’ 3’ que es la misma dirección del movimiento de la horquilla de replicación. El problema se presenta en la síntesis de la otra cadena hija, denominada “filamento rezagado” (lagging strand).
Debido a que el crecimiento del filamento rezagado debe ocurrir en la dirección 5’ 3’, el copiado de su cadena molde debe darse en la dirección opuesta del movimiento de la horquilla de replicación.
La célula “enfrenta” esta situación sintetizando un nuevo primer cada pocos cientos de bases en la segunda cadena parental, mientras se va exponiendo la cadena desapareada. Cada uno de estos primers, apareados complementariamente a su cadena molde, se elongan en la dirección 5’ 3’, formando segmentos discontinuos denominados “fragmentos Okazaki” (en honor a quien los “descubrió”: Reili Okazaki). El primer de RNA de cada fragmento de Okazaki se elimina y se remplaza por cadena de DNA en crecimiento del fragmento de Okazaki vecino; finalmente una enzima llamada DNA ligasa une los fragmentos adyacentes.
Varias proteínas participan en la replicación del DNA.
La comprensión detallada de las proteínas eucariotes que participan en la replicación del DNA ha sido fruto mayoritariamente de estudios con pequeños DNA virales, particularmente el DNA SV40, que es el genoma circular de un pequeño virus que infecta simios.
Gracias a estos estudios, se sabe que la DNA polimerasa contribuye a la síntesis del DNA cromosómico celular, aunque su papel exacto todavía sea desconocido. Otras polimerasas de DNA especializadas están involucradas en la reparación de errores y lesiones en DNA dañado. Una topoisomerasa se asocia con el DNA parental más allá de la helicasa para liberar stress torsional consecuencia del desacople de las cadenas parentales.
Las ribonucleasas H y FEN I remueven los nucleótidos del extremo 5’ de los fragmentos de Okazaki; los cuales son reemplazados por desoxinucleótidos adicionados por la DNA polimerasa mientras estos se extienden “rio arriba” de los fragmentos de Okazaki. Fragmentos de Okazaki sucesivos se acoplan mediante una DNA ligasa a través de enlaces fosfoéster standard 5’ 3’.
La replicación de una molécula lineal de DNA presenta un problema especial en los extremos de la molécula debido a que en su extremo 5’ la mayoría de los primers en el filamento rezagado no pueden ser reemplazados por DNA mediante este mecanismo. En la mayoría de los eucariotes, este problema se resuelve por un complejo RNA-proteína denominada “telomerasa” la cual contiene su propia cadena molde.
La replicación del DNA usualmente ocurre de manera bidireccional en cada origen.
Como se sabe, ambas cadenas parentales de DNA se “exponen” por desapareamiento local en una horquilla de replicación y se copian en una cadena hija. El consenso general es que todas las células procariotes y eucariotes emplean un mecanismo bidireccional para la replicación del DNA. Las moléculas de DNA cromosómico eucariote contienen múltiples orígenes de replicación separados por decenas a cientos de kilobases.
Una proteína de seis subunidades denominada ORC, por “complejo de reconocimiento de origen” (origin recognition complex), se une a cada origen y se asocia con otras proteínas requeridas para “reclutar” helicasas hexaméricas compuestas por seis proteínas MCM homólogas (por “minichromosome maintenance”; la búsqueda genéticia inicialmente usada para identificar los genes que las codifican).
Dos helicasas MCM opuestas separan las cadenas parentales en un origen, junto con proteínas RPA unidas a las cadenas de DNA únicas resultantes. La síntesis de los primers y de los pasos subsecuentes en la replicación del DNA celular es un proceso que ya ha sido completamente clarificado.
La replicación del DNA celular y otros eventos que llevan a la proliferación de las células están altamente regulados, por lo que el apropiado número de células constituyentes de cada tejido se producen durante el desarrollo y a lo largo de toda la vida de un organismo.
Como en la transcripción de la mayoría de los genes, el control del paso de inicio es el mecanismo primario para la regulación de la replicación del DNA celular. La activación de la actividad de helicasa de MCM, requerida para iniciar la replicación del DNA

Otros materiales