Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
V.- EXPRESION Y VARIACION GENETICA Unidad 14. Regulación génica en procariontes. Sistemas inducibles y represibles. Regulación en eucariontes. Niveles donde puede actuar la regulación: regulación transcripcional, regulación a nivel de procesamiento, regulación traduccional. La transcripción de cada gen está controlada por una región de ADN próxima al lugar donde se inicia la transcripción. Algunas regiones reguladoras, son simples y actúan como interruptores activados por una señal única. Otras regiones reguladoras, son complejas respondiendo a una variedad de señales, que interpretan e integran para decidir si activan o no el gen vecino. Sean simples o complejos estos dispositivos interruptores constan de dos tipos de componentes fundamentales: Cortas secuencias de ADN definidas Proteínas de regulación génica que las reconocen y se unen a ellas. Con respecto al ADN de unión a proteínas, se han identificado ciertas secuencias nucleotídicas de ADN, con una longitud de menos de 20 pares de bases, que actúan como componentes fundamentales de los interruptores genéticos. Son lugares de reconocimiento para la unión de proteínas de regulación génica específicas. Se han identificado centenares de estas secuencias de ADN, cada una de ellas reconocida por una única proteína reguladora o por una serie de ellas muy relacionadas. Las proteínas reguladoras deben reconocer secuencias específicas en el interior de la estructura de doble hélice del ADN. Sin embargo, actualmente se sabe que las proteínas reguladoras pueden reconocer la información acerca de la secuencia de ADN, desde el exterior de la doble hélice, sin necesidad de abrirla. El borde de cada par de bases está expuesto en la superficie de la doble hélice, presentando un patrón característico de aceptores y dadores de enlaces de H y parches hidrofóbicos reconocibles por proteínas, tanto en el surco mayor como en el menor. Pero únicamente en el surco mayor los patrones son únicos, para cada uno de los cuatro apareamientos de bases. Un rasgo relacionado e importante de la estructura del ADN, es la deformación de la doble hélice. Para una proteína que debe reconocer y unirse a una secuencia concreta de ADN, debe existir un apareamiento estrecho entre el ADN y la proteína y frecuentemente la conformación normal del ADN, se distorsiona para aumentar este apareamiento. Las interacciones ADN – proteínas, se encuentran entre las interacciones moleculares más fuertes y específicas de las conocidas en biología. El primer motivo estructural de unión a ADN que se descubrió fue el de hélice – giro – hélice. Identificado originalmente en proteínas bacterianas, se ha encontrado en centenares de proteínas de unión de ADN, tanto eucariotas como procariotas. Consta de dos hélices α, conectadas por una corta cadena de aminoácidos que forman el giro. Las dos hélices se mantienen en un cierto ángulo, fundamentalmente por interacciones entre ambas hélices. La hélice más próxima al extremo carboxilo, se denomina hélice de reconocimiento, pues se adapta al surco mayor del ADN Otro grupo de unión a ADN, es el que utiliza una o más moléculas de Zinc como elemento estructural. Las proteínas que utilizan el zinc para unir aminoácidos, se denominan proteínas con dedos de zinc. En este caso, la proteína está formada por una lámina β antiparalela y una hélice α y el zinc se encuentra uniendo los cisteínas de la lámina β y los histidinas de la hélice α. Pero en todos los casos, el reconocimiento de las secuencias específicas en el surco mayor del ADN, lo realiza la hélice α. Hay proteínas reguladoras que reconocen el ADN como dímero. En este caso, se denomina motivo cremallera de leucina, donde la proteína está formada por dos hélices α que se separan formando una estructura en forma de Y. Las cadenas laterales de la Y quedan unidas por aa, frecuentemente leucina, y en esta forma toman contacto con el ADN. El motivo hélice – bucle – hélice es otro modo de unión. Está formada por una hélice α corta, conectada por un bucle a una hélice α más larga. El bucle es flexible y hace que la hélice larga se doble y quede alineada a la otra. Esta estructura de dos hélices, se une tanto al ADN, como al motivo hélice-bucle-hélice de otra proteína con motivo hélice-bucle- hélice. Si la 2º proteína es la misma, se habla de un homodímero, pero si es diferente, se obtiene un heterodímero y la hélice α es la que establece el contacto con el ADN. Hay promotores de escasa función que pueden recuperar la función normal, mediante proteínas reguladoras que se unen en un lugar próximo del ADN, contactando con la ARN polimerasa de forma que incrementan enormemente la probabilidad de que se inicie el transcrito. Este modo de regulación se denomina control positivo, porque la forma activa de la proteína de unión al ADN, activa los genes y las proteínas reguladoras que funcionan de este modo, se denominan activadores transcripcionales o proteínas activadoras génicas. En el caso del control negativo la expresión génica se produce siempre a menos que sea desconectada por algún tipo de molécula reguladora. En cambio en el control positivo la transcripción se produce sólo si una molécula reguladora estimula directamente la producción de ARN. Los dos tipos de control pueden ser inducibles o reprimibles. En procariotas, los genes que codifican enzimas con funciones relacionadas, tienden a estar organizados en grupos y a menudo se encuentran bajo el control genético coordinado de una única unidad reguladora. Esta unidad (promotor y operador) está casi siempre localizada, corriente arriba del grupo génico que controla. Se define entonces al operón, como al grupo de genes que regula y se expresa como una unidad. La región reguladora junto a los genes estructurales, forman el operón. El operón y el gen regulador adyacente funcionan en conjunto para proporcionar una respuesta rápida la presencia o ausencia de un nutriente. La degradación de la lactosa pone en funcionamiento al operón lac y nos ilustra acerca de un mecanismo que opera por la presencia de proteínas de regulación génica. El operón lac, está constituido por tres genes estructurales necesarios para el metabolismo de la lactosa y un sitio regulador adyacente formado por el promotor y el operador. La degradación de la lactosa en glucosa y galactosa en una célula bacteriana, proporciona a la célula los intermediarios metabólicos y energía. El primer paso se realiza gracias a la presencia de la enzima β- galactosidasa que hidroliza los enlaces entre los dos azúcares. La presencia de lactosa en la bacteria, determina inducción de la síntesis de la β- galactosidasa. Si la lactosa se encuentra en cantidades mínimas, no hay razón para que la célula produzca la enzima, por tanto los genes causantes de la degradación están reprimidos. Se encontró que la inducción de la β- galactosidasa, siempre la acompañaba la inducción de otras dos proteínas, la galactósido permeasa (proteína de membrana que permite la entrada a la célula de la lactosa) y la trancetilasa (probablemente encargada de la eliminación de la célula de los subproductos tóxicos de la digestión de la lactosa). Los genes para estas tres funciones están en el mapa muy juntos (z, y, a). Se propuso que la expresión de los tres genes, estaba determinada por un elemento común que gobernaba la síntesis de las proteínas. A este elemento genético, lo llamaron gen represor (i). Numerosas investigaciones establecieron que el gen i, debe ser el causante de la producción de un producto regulador real, que se difunde a través de la célula e interactúa con otros fragmentos de ADN. Se llama represor al producto del gen i, debido a que reprime la expresión de los genes estructurales en ausencia de un inductor. El represor actúa sobre un elemento controlador, el operador. El operador no actúa por la producción de un producto citoplasmático, sino que es un sitio en el cromosoma, con el cual se combinael represor. Se determinó que el operador era un sitio en el ADN, adyacente a los genes estructurales que determinaba que los genes estructurales fueran o no transcritos. En ausencia de lactosa, el producto del gen i se combina con el operador y no puede tener lugar la transcripción de los tres genes estructurales. Sin embargo cuando la lactosa está en el medio, ésta entra en las células combinándose con el represor y altera las propiedades de unión de éste, de manera que ya no podía unirse con el sitio operador. En ausencia de un complejo represor – operador, la transcripción de los genes estructurales se mantenía. Puesto que la transcripción de los genes estructurales se produce sólo cuando el represor NO se une a la región operadora, se dice que la regulación se encuentra bajo control negativo. Hay otro componente molecular implicado en la represión del operón lac, es la llamada proteína activadora por catabolito (CAP), esta inhibición se denomina represión por catabolito. Este tipo de mecanismo se da cuando en el medio de cultivo está presente la glucosa y la célula refleja la preferencia de metabolizar la glucosa, aún cuando la lactosa, está asimismo en el mismo medio de cultivo y en condiciones de inducción. La proteína activadora bacteriana CAP (proteína activadora por catabolito), ejerce un control positivo uniéndose al sitio de unión CAP, lo que facilita que la ARN polimerasa se una al promotor, activa la transcripción de los genes que capacitan a E. coli, para usar fuentes alternativas de carbono cuando la glucosa, su fuente preferida, no es accesible. La disminución de los niveles de glucosa en el medio, induce un incremento del nivel de la molécula señalizadora intracelular AMP cíclico (cAMP) que se une a la proteína CAP, capacitándola para unirse a secuencias de ADN específicas, próximas a ciertos promotores y de este modo activa los genes adecuados. En este caso, la expresión del gen diana es inducida o reprimida, en función de que los niveles de cAMP sean altos o bajos respectivamente. El nivel de AMPc depende de una enzima la adenil ciclasa que cataliza la conversión de ATP a AMPc. Por lo tanto la glucosa inhibe la actividad de la adenil ciclasa, lo que provoca la disminución del nivel de AMPc, por lo tanto CAP-AMPc no se puede formar, que es esencial para el control positivo de la transcripción. Por otra parte, cinco genes en E. coli codifican la producción del aminoácido triptófano y están organizados en un grupo en el cromosoma, transcribiéndose desde un único promotor como una larga molécula de ARN. Cuando hay triptófano en el medio y éste penetra en la célula, estas enzimas ya no se necesitan y su producción se detiene. Dentro del promotor que dirige la transcripción de los genes biosintéticos de triptófano, se encuentra un operador. Este operador, es una corta secuencia de ADN regulador de secuencia definida, denominada represor del triptófano. El promotor y el operador se encuentran organizados de forma que, cuando el operador está unido al represor del triptófano se bloquea el acceso de la ARN polimerasa al promotor, de modo que se impide la expresión de las enzimas productoras de triptófano. La proteína represora sólo puede unirse al ADN del operador, cuando se ha unido a su vez a dos moléculas del aa triptófano. La unión del triptófano, desplaza el represor, de modo que se pueden presentar de manera apropiada en el surco mayor del ADN; sin triptófano, la proteína es incapaz de unirse al operador. Puesto que el triptófano participa en la represión se lo denomina correpresor Así pues, el represor del triptófano es un dispositivo simple que controla la producción de las enzimas biosintéticas del triptófano, activando o desactivando dicha producción, en función de la disponibilidad de triptófano libre. A este modo de regulación se le denomina control negativo, ya que la forma activa de la proteína de unión a ADN, desactiva los genes y a las proteínas reguladoras que actúan de ese modo, se las denomina represores transcripcionales o proteínas represoras génicas. En bacterias la expresión de ciertos genes es inhibida por la terminación prematura de la transcripción, en un fenómeno denominado atenuación de la transcripción. Cuando se no se requiere el producto génico, ciertas proteínas reguladoras se unen a la cadena de ARN naciente e interfieren, permitiendo de ese modo que se termine la transcripción. Se descubrió que en presencia de alta concentración de triptófano, la síntesis del ARNm generalmente se termina a unos 140 nucleótidos del inicio del transcrito. Sin embargo si no hay triptófano o las concentraciones son bajas la transcripción se inicia y no termina prematuramente. Se han identificado los componentes principales de la atenuación, donde el sitio de atenuación se conoce como atenuador. El mecanismo explica que la secuencia inicial de ADN que se transcribe genera una molécula de ARNm que tienen el potencial de plegarse en dos estructuras mutuamente excluyentes denominadas horquillas. Si hay exceso de trp, la horquilla que se forma se comporta como una estructura de terminación y casi siempre la transcripción termina prematuramente. En cambio si hay poco trp, se forma la horquilla alternativa conocida como horquilla de antiterminación y se permite la transcripción de la secuencia implicada. Se descubrió que para que se forme la horquilla de antiterminación debe traducirse el transcrito líder. El transcrito líder incluye dos tripletes que codifican triptófano, precedido corriente arriba por una secuencia AUG de inicio de la traducción por los ribosomas. Cuando hay cantidad adecuada de trp también hay ARNt cargado con trp. En consecuencia la traducción continúa después de estos tripletes y se forma la horquilla de terminación. Si las células no disponen de trp tampoco disponen de ARNt cargado con trp, entonces los ribosomas paran la traducción por falta de ARNt cargados con trp y se forma la horquilla de antiterminación en el transcrito. En consecuencia se supera la atenuación y la transcripción continúa y se expresa el grupo completo de genes. Dado que la atenuación implica sincronía entre transcripción y traducción este fenómeno es exclusivo de procariotas. En las bacterias, hay diferentes estrategias de control de la expresión génica. Hay interruptores complicados combinando controles negativos y positivos. Por ejemplo el operon lac en E. coli, a diferencia del operón trp, está controlado por controles transcripcionales negativos y positivos: el represor lac y la proteína CAP respectivamente. El operón lac codifica las proteínas necesarias para la degradación de la lactosa y CAP capacita a la bacteria para utilizar fuentes de carbono alternativas a la glucosa, como por ejemplo la lactosa. Esta organización permite al operón lac, responder integrando dos señales diferentes, de forma que sólo se activa cuando las condiciones son las adecuadas: no debe haber glucosa pero sí lactosa. Cualquier de las otras combinaciones posibles de señales mantiene al operón inactivo. Las bacterias también tienen otras estrategias para el control de la transcripción génica. La subunidad σ debe interactuar con el núcleo de la ARN polimerasa y dirigirla específicamente hacia diferentes promotores. Esta estrategia permite desactivar un gran grupo de genes y activar otro, simplemente reemplazando una subunidad σ por otra. Así pues individualmente las proteínas reguladoras eucariotas no tienen ninguna función activadora o represora, pero actúan como unidades reguladoras que se utilizan para construir complejos, cuya función final dependerá del ensamblaje de todos sus componentes. Una proteína puede actuar en un caso como parte de un complejo que activa la transcripción y en otro caso como parte de un complejo que la inhibe. La regulación génica en eucariotas es más compleja que en procariotas. Por ello la regulación de la expresión génica puede producirse a muchos niveles.Las diferencias entre distintos tipos de células están dadas por la expresión de genes concretos. La vía que conduce desde el ADN hacia las proteínas está formada por varias etapas y por lo tanto todas ellas se pueden regular. Así las células pueden controlar la síntesis de proteínas: Regulando el momento y la frecuencia de la transcripción de genes concretos (control transcripcional) Controlando el modo de maduración o procesamiento de los transcritos primarios de ARN (control del procesamiento del ARN) Seleccionando los ARNm maduros que van a ser exportados al citoplasma (control del transporte del ARNm) Seleccionando los ARNm citoplasmáticos que van a ser traducidos por ribosomas (control traduccional) Desestabilizando algunas moléculas de ARNm citoplasmático (control de la degradación de los ARNm) Activando, inactivando o ubicando de modo selectivo las proteínas ya sintetizadas (control de la actividad proteica). Durante la interfase del CC los cromosomas están desempaquetados y la organización nuclear de los cromosomas y los cambios dinámicos de la estructura de la cromatina son elementos claves para controlar la expresión génica en eucariontes. En el núcleo interfásico cada cromosoma ocupa un dominio discreto denominado territorio cromosómico que lo separa de los otros cromosomas. Los cromosomas se organizan en el núcleo según el tamaño y densidad génica, de manera que los más pequeños con menos genes, se localizan en la periferia y los cromosomas con mayor densidad génica, en la parte más interna. Los canales que hay entre los cromosomas se llaman compartimentos intercromosómicos. Cada compartimiento es un espacio entre cromosomas que contienen muy poco o nada de ADN. La ubicación de los cromosomas se reajusta, los genes transcripcionalmente activos se desplazan hasta el borde de los territorios cromosómicos, en la frontera de los canales de los dominios intercromosómicos. Diversos estudios sugieren que la transcripción ocurre cuando los cromosomas están en el límite en contacto directo con el dominio intercromosómico. Cuando el cromosoma se ha desplazado hacia el extremo del territorio cromosómico, la iniciación de la expresión génica requiere dos pasos: 1) remodelación y activación de la cromatina, lo que hace que los sitios promotores queden accesibles a la maquinaria transcripcional 2) el reclutamiento de las proteínas necesarias para la transcripción. De la estructura de la cromatina y sus efectos sobre la expresión de los genes, se han podido extraer dos principios generales. En primer lugar, los nucleosomas no son un obstáculo ni para las proteínas reguladoras, ni para la ARN polimerasa. Los incrementadores pueden actuar a pesar de ellos, las histonas que bloquean un promotor pueden ser desplazadas y, una vez que ha comenzado la transcripción, pol II puede transcribir a través de los nucleosomas, sin desorganizarlos. El segundo principio general es que, algunas formas del empaquetamiento del ADN de orden superior, hacen el ADN inaccesible, tanto para las proteínas reguladoras, como para los factores generales de la transcripción. Este empaquetamiento del ADN, sirve para mantener silenciosas grandes secciones del genoma, en algunos casos de forma reversible y en otras de forma irreversible. Aunque se puede transcribir ADN empaquetado en nucleosomas, en algunas formas especiales de cromatina, el ADN parece ser inaccesible a las proteínas activadoras. Se cree que estas formas inactivas, que influyen en la cromatina especialmente condensada, denominada heterocromatina, contienen proteínas específicas que hacen que su ADN sea especialmente inaccesible, al estar empaquetado, determinando inactividad de ciertos genes. Este proceso se denomina silenciamiento. El mecanismo de silenciamiento no es conocido, pero parece que supone un ensamblaje cooperativo de proteínas en el ADN, que una vez establecido, es heredable a través de la replicación del ADN. El silenciamiento en ocasiones, suele deberse a un efecto de posición, en donde la actividad de un gen es dependiente de su posición en el genoma y se cree que son reflejos de los diferentes grados de empaquetamiento de la cromatina en diferentes puntos del cromosoma y de la tendencia de estos estados, a extenderse a los genes situados en las proximidades. Los cambios en la organización de la cromatina denominados remodelación de la cromatina son esenciales para muchos procesos tales como unión de las polimerasas, inicio de la transcripción etc. La remodelación de la cromatina implica un cambio en la interacción entre el ADN y las histonas en los nucleosomas. La remodelación es realizada por un grupo diverso de complejos proteicos con actividad ATPasa. Uno de los complejos de remodelación mejor estudiados es el complejo SWI/SNF. Es un gran complejo de 11 unidades ampliamente distribuido en varios eucariotas, hasta en humanos. Las proteínas de este complejo son activadores transcripcionales. Los complejos de remodelación, pueden alterar la estructura de los nucleosomas mediante diversos mecanismos diferentes. Esto puede llevar a la alteración de los contactos entre el ADN y las proteínas histónicas de los nucleosomas, lo que provoca que el nucleosoma se deslice por la molécula de ADN. Alternativamente, puede alterarse el camino seguido por el ADN alrededor de la partícula central del nucleosoma, lo que empuja al ADN fuera del nucleosoma. Otra posibilidad es que se pueda alterar la estructura de la partícula central del nucleosoma, produciendo un nucleosoma dimérico. El segundo mecanismo de alteración de la cromatina es la modificación de las histonas. La alteración química de las histonas, se realiza por acción de las enzimas histona acetiltransferasas (HAT). Cuando se agrega un grupo acetato a un aa básico en las colas de las histonas, disminuye su atracción por el ADN ácido. Asimismo histonas desacetilasas (HDAC), pueden eliminar los grupos acetatos de las colas de las histonas. Además de las acetilaciones, las histonas pueden modificarse por fosforilaciones y metilaciones. Estas alteraciones estructurales, se producen en aa específicos de las histonas y son reversibles produciendo la activación o silenciamiento génico. Estos patrones de modificación mediadas por enzimas, constituyen una serie de señales conocidas como el código de histonas. Hay pruebas que las modificaciones histónicas sirven de sitio de unión, para las proteínas implicadas en la regulación génica. El mecanismo que desempeña una función importante en la regulación génica, es la modificación química mediante la adición o eliminación de grupos metilo a las bases del ADN. Los nucleótidos del ADN pueden ser modificados de forma covalente y en vertebrados la metilación de citosina, parece constituir un mecanismo importante para distinguir genes activos de los que no lo son. Niveles bajos de metilación, se asocian a niveles altos de expresión génica y niveles altos de metilación, se asocian a niveles bajos de expresión génica o sea represión de la traducción de los ARNm y de su degradación. Aunque la ausencia de grupos metilo en el ADN, se relaciona con un incremento de la expresión génica, la metilación no puede considerarse como un mecanismo general de regulación génica, dado que, la metilación no es fenómeno general en los eucariontes. En Drosophila el ADN no se metila, por lo tanto la metilación, puede representar una de las diversas maneras de producir cambios genómicos para regular la expresión génica. Consecuentemente un sencillo mecanismo, permite que un patrón preexistente de metilación del ADN, se herede directamente por las moléculas de ADN hijas. Una enzima llamada metilasa de mantenimiento, actúa preferentemente sobre las secuencias CG metilada, como consecuencia, el patrón preexistente de metilación de la cadena parental de ADN, actúa como un molde para la metilación de las cadenas de ADN hijas, haciendo que el patrón sea heredado directamente a travésde la replicación del ADN. Algunas observaciones apoyan la idea de que la metilación del ADN en vertebrados, está relacionada con la inactivación génica, pero que sólo es un mecanismo de refuerzo de una decisión adoptada previamente por otro mecanismo. Sin embargo, cuando un gen que estaba inactivo, se activa durante el desarrollo, pierde parte de su metilación únicamente después de haber sido activado. De manera similar, el cromosoma X femenino primero se condensa e inactiva y sólo posteriormente incrementa el nivel de metilación de sus genes. Se han demostrado diferencias en las frecuencias de transcripción entre los genes que se transcriben, con gran frecuencia en un tipo celular y con baja frecuencia en otro tipo celular y la metilación del ADN podría ser responsable, de al menos una parte de esta diferencia. Uno de los sistemas modelo utilizado para estudiar la regulación génica en eucariontes, fueron los genes de la levadura que codifican las enzimas para la degradación de la galactosa. La expresión de estos genes gal es inducible, regulados por la presencia o ausencia de galactosa. En ausencia de galactosa estos genes no transcriben. Sin embargo la transcripción sólo se activa si la concentración de glucosa es baja. O sea que presenta un segundo nivel de control, la represión por catabolito, aunque es diferente a la que se presenta en bacterias. En levadura este fenómeno requiere una enzima (proteína quinasa) y no AMPc. La transcripción de los genes GAL1 y GAL10, está controlada por una región de control central denominada UASG. La estructura de la cromatina en UASG está abierta, hipersensible a la ADNasa, o sea no asociada a nucleosomas. Esta estructura requiere de la acción del complejo de remodelación SWI/SNF. En UASG hay cuatro grupos de secuencias llamados Gal 4 para la proteína. Estos sitios están ocupados permanentemente por la proteína Gal4p si los genes están activados o no. A su vez Gal4p, es negativamente regulada por Gal80p. Gal80p siempre está unida a Gal 4p, cubriendo su dominio de activación. La inducción se produce cuando el inductor, la galactosa fosforilada se une a Gal80p o a Gal4p y causa una alteración estructural que hace que el dominio de activación Gal4 quede expuesto. Como en E. coli estos genes se encuentran bajo un segundo nivel de control, la represión por catabolito, que no se activa ante la presencia de glucosa. El catabolito no opera por el AMPc, sino a través de un complejo que implica una proteína quinasa. Estos factores remodelan más la cromatina y exponen más sus cajas TATA a TBP. Gal4p está formada por 881 aa que incluye un dominio de unión al ADN y dos dominios funcionales de activación, por lo que la deleción de una de estas regiones no afecta la funcionalidad, dado que la otra queda intacta. Un ejemplo interesante de regulación por controles combinatorios, lo ofrece el complejo proteico que controla la transcripción del gen eve en Drosophila, el que juega un papel importante en el desarrollo del embrión. Si un gen se inactiva, muchas partes del embrión no se forman y el embrión muere en una fase temprana del desarrollo. En esta etapa es una única célula gigante con múltiples núcleos y un solo citoplasma. El citoplasma no es uniforme, sino que contiene una mezcla de proteínas reguladoras, que no se distribuyen uniformemente a lo largo del eje del embrión, suministrando información posicional para distinguir entre una parte del embrión y otra. Aunque inicialmente los núcleos son idénticos, rápidamente empieza a expresar genes diferentes, ya que están expuestos a un conjunto de proteínas reguladoras diferentes. Por ejemplo los núcleos próximos al extremo anterior del embrión en desarrollo, está expuesto a un conjunto de proteínas reguladoras diferentes, a las que se encuentran afectando a los núcleos del extremo posterior del embrión. El gen eve se expresa en siete franjas, cada una de las cuales tiene un espesor de 5 a 6 núcleos y situadas con precisión sobre el eje anteroposterior del embrión. La región reguladora del gen eve es muy larga, de aproximadamente 20.000 pares de nucleótidos. Está formada por una serie de módulos reguladores simples, cada uno de los cuales, contiene múltiples secuencias reguladoras y es responsable de una franja de expresión de eve en el embrión. La franja 2, es una región que contiene secuencias de reconocimiento para dos proteínas reguladoras, que activan la transcripción de eve y para otras dos proteínas reguladoras, que reprimen su transcripción. Las concentraciones relativas de estas cuatro proteínas, determinan que complejos se formarán en el módulo de la franja 2, que activan la transcripción del gen eve. Aunque no se conocen los detalles exactos, es probable que para inactivar el módulo de la franja 2 sea suficiente, que cualquiera de los dos represores esté unido al ADN, mientras que para activarlo sea necesario que se unan ambos activadores. O sea que el módulo de la franja 2 se activa sólo en aquellos núcleos, en los que los niveles de proteínas reguladoras que activan la transcripción, son elevados y no existen las proteínas reguladoras de represión de la trascripción. A su vez, se pueden unir simultáneamente al ADN, muchos conjuntos de proteínas reguladoras influyendo en el promotor del gen. La regulación de la expresión de eve es un ejemplo extremo de control combinado. Siete combinaciones reguladoras (una combinación por cada franja) activan la expresión de eve, mientras que muchas otras combinaciones (todas las que se encuentran en las regiones entre franjas) mantienen el gen silencioso. Se cree que los otros módulos de franja, tienen un diseño similar al descrito para el módulo de franja 2. La región de control completa, ocupa 20.000 pares de nucleótidos y es capaz de unir más de 20 proteínas distintas. Se ha estimado que un cierto porcentaje de la capacidad de codificación de un genoma de mamífero, está dedicado a la síntesis de proteínas que actúan como reguladores de la transcripción génica. Es frecuente encontrar un gen, con una región de control con una longitud de 50.000 pb. Uno de los ejemplos mejor conocidos de región reguladora compleja en mamíferos, es la del gen β- globina humano y en pollos, que se expresa exclusivamente en los eritrocitos, en un momento determinado de su desarrollo y en diferentes tejidos. Las cadenas de α y β globina que forman la hemoglobina (Hb) humana del adulto son codificadas por genes independientes, localizados en los cromosomas 16 y 11. La familia de α-globina mapea en la región subtelomérica del brazo corto del cromosoma 16; contiene 3 genes que producen polipéptidos de 141 aminoácidos: HBZ, HBA2 y HBA1; 2 genes que se transcriben, aunque los productos de traducción no fueron detectados en humanos (HBM y HBQ1) y 2 pseudogenes (HBZP y HBAP1). La familia de genes de β- globina humana, se ubica en el brazo corto del cromosoma 11. Se compone del gen ε, de expresión embrionaria (HBE1), 2 genes que codifican las cadenas de γ-globina, de expresión fetal: Gγ (HBG2) y Aγ (HBG1), 2 genes que codifican las cadenas tipo β del adulto: δ-globina (HBD) y β-globina (HBB) y un pseudogen de β-globina: ψβ (HBBP). La expresión del gen está controlada por un conjunto de complejos de proteínas reguladoras, algunas de las cuales actúan como activadores y otras como represores. Se cree que las concentraciones de muchas de estas proteínas reguladoras cambian durante el desarrollo y que sólo una combinación particular de todas ellas induce, la transcripción del gen. A su vez las proteínas de regulación génica están reguladas. Las proteínas se sintetizan cuando se las necesita, si hay un exceso son destruidas por proteólisis. La proteína puede encontrarse en el interior de la célula en forma inactiva y una señal la activa. Estas activaciones pueden realizarse por fosforilaciones o puede liberarse de un complejo que la mantenía inactiva. Un cambio en el grado de empaquetamiento delADN ocurre aún antes de que se inicie la transcripción de los genes de globinas, sugiriendo que los genes están regulados en dos etapas. En la primera etapa, la cromatina que contiene el grupo de genes de globina se descondensa, lo cual al parecer, facilita el acceso de algunas de las proteínas reguladoras al ADN. En la segunda etapa las proteínas reguladoras restantes se ensamblan en el ADN y dirigen la transcripción hacia cada uno de los genes. Existe una transcripción basal de los genes de esta familia a partir de sus promotores. No obstante, para que haya alta eficiencia transcripcional, es necesaria la presencia de un elemento regulador distal, el locus de la región de control (Locus Control Region, LCR), que se ubica aproximadamente de 6 a 20 kb corriente arriba de HBE1. El locus LCR está constituido por 5 sitios eritroide-específicos, HS1 a HS5. En eucariotas los precursores de ARNm son moléculas muy largas, que son recortadas por una serie de etapas al final de las cuales se obtiene un ARNm maduro. Una de estas etapas es la maduración del ARN por corte y empalme, en las que se eliminan los intrones del ARNm inmaduro. Frecuentemente en una célula puede madurar un precursor de diferentes formas, de modo que se pueden obtener polipéptidos finales diferentes a partir de un mismo gen, según un proceso que se denomina maduración alternativa del ARN. Aunque se conocen muchos ejemplos de corte y empalme alternativo, sólo unos pocos muestran que están regulados. El descubrimiento de que habitualmente los genes eucariotas contienen intrones y de que sus secuencias codificantes se pueden unir de varias formas, ha planteado nuevas cuestiones sobre la definición de lo que es un gen. Un gen ha sido definido como una región del genoma que se segrega durante la meiosis como una sola unidad y que da lugar a un rasgo definible en términos fenotípicos, tal como ojos rojos o blancos en Drosophila, semillas lisas o rugosas en los guisantes. Sin embargo ahora está claro, que muchas secuencias de ADN de las células de los eucariotas superiores, producen dos o más proteínas distintas mediante la maduración alternativa del ARN. Una alternativa más razonable, es la de modificar la definición original de gen y considerar como gen a cualquier secuencia de ADN que es transcrita como una única unidad y que codifica un conjunto de cadenas polipeptídicas relacionadas (isoformas proteicas). Unos de los casos extremos de incremento del número de proteínas por corte y empalme alternativo, está dado por el gen Dscam en Drosophila. Este gen guía el crecimiento axonal, asegurando que las neuronas (sólo hay 25.000) se conecten adecuadamente. En el pre-ARNm de Dscam los exones 4, 6, 9 y 17 presentan una colección de exones posibles. Estos exones se cortan y empalman de manera casi exclusiva, de modo que sólo hay un exón representado de los muchos posibles. Hay 12 alternativas para el exón 4, 48 para el exón 6, 33 para el 9 y 2 para el 17. Si se utilizan todas las combinaciones posibles, el gen puede producir 38.016 proteínas diferentes. Una proporción substancial de los genes de los eucariotas superiores, produce múltiples proteínas de este modo. Cuando existen diferentes posibilidades de maduración en varias posiciones del transcrito, un único gen, puede producir docenas de proteínas diferentes. Sin embargo, las alternativas en el proceso de maduración son frecuentemente mucho más limitadas y sólo se pueden obtener algunos tipos de proteínas a partir de cada unidad de transcripción. En muchos casos la maduración alternativa del ARN no es constitutiva sino que está regulada. En los casos más simples la maduración alternativa permite pasar de sintetizar proteínas no funcionales a proteínas funcionales. La maduración del ARN se puede regular tanto negativamente, mediante una molécula reguladora que evita que la maquinaria de maduración acceda a una secuencia de maduración determinada en el ARN, o positivamente, mediante una proteína reguladora que dirige la maquinaria de maduración hacia una secuencia de procesamiento, que de otra forma quedaría oculta. La regulación de la maduración del ARN, puede generar versiones diferentes de la proteína en diferentes tipos celulares. El transporte del material genético a través de la envoltura nuclear requiere también de un control, la exportación de ARN a través de los poros nucleares, es un proceso activo que requiere en muchos casos, que los ARN tengan una caperuza especial en el extremo 5’ y una cadena poli A en el extremo 3’. Tener los extremos adecuados, no es suficiente para el transporte: cada molécula de ARNm permanece confinada en el núcleo, hasta que todos los componentes del spliceosoma se han separado de él. Así pues, cualquier mecanismo que evite que se termine el proceso de maduración del ARN puede, en principio, bloquear la salida de estos ARN del núcleo. La poliadenilación inicial de una molécula de ARN, tiene lugar en el núcleo aparentemente de forma automática, para casi todos los precursores de ARNm eucariotas. (con excepción del ARNm de las histonas). Una vez en el citoplasma, las colas de poli A de 200 nucleótidos de longitud de muchos transcritos, son recortadas paulatinamente durante algunos días. No se ha observado colas de poli A, más cortas de 30 nucleótidos, lo que sugiere que ésta sería la longitud mínima necesaria para la estabilidad del ARNm. Se ha estimado que sólo una veinteava parte aproximadamente de la masa total del ARN, abandona el núcleo celular. Por lo tanto, parece que una fracción substancial de los transcritos primarios, pueden ser completamente degradados en el núcleo, sin llegar a generar ninguna molécula de ARN que alcance el citoplasma. Los ARN descartados, pueden ser aquellos, a partir de cuya secuencia no se pueda fabricar ninguna molécula de ARNm; por otro lado, algunos ARN pueden representar moléculas potenciales de ARNm, funcionales solamente en algunos tipos celulares, no llegando en los otros a alcanzar el citoplasma. La mayoría de los ARN de una célula bacteriana son muy inestables: tienen un período de vida media de aproximadamente 3 minutos. Debido a que los ARNm bacterianos se sintetizan y degradan con rapidez, las bacterias pueden adaptarse rápidamente a los cambios ambientales. Los ARNm de las células eucariotas son más estables. Algunos, como los que codifican la β-globina, tienen un período de vida media de más de 10 horas. Sin embargo, otros tienen un período de vida media de menos de 30 minutos. Muchos ARNm son inestables, debido a que contienen secuencias específicas que estimulan su degradación. La estabilidad de los ARNm puede ser controlada por ARN pequeños endógenos. Otra manera de controlar la estabilidad del ARNm es mediante el control del nivel de traducción, la traducción del mensajero controla su estabilidad. La estabilidad de un ARNm puede cambiar en respuesta a señales extracelulares. Así por ejemplo, las hormonas esteroides afectan a una célula, no sólo incrementando la transcripción de determinados genes sino también, incrementando la estabilidad de varios de sus ARNm. El control de la estabilidad en células eucariotas se comprende mejor para el caso de los ARNm que codifican histonas. Estos ARNm tienen una vida media de aproximadamente 1 hora durante la fase S del ciclo celular, pero se degradan en cuestiones de minutos cuando se detienen la síntesis de ADN. Si se inhibe la síntesis de ADN con una droga durante la fase S, los ARNm de las histonas se vuelven inestables inmediatamente, quizás porque la acumulación de histonas libres en ausencia de ADN que unir, aumenta la velocidad de su degradación. El control traduccional se establece por: • Péptido Señal • Adición de cola poli A • Edición del ARNm • Secuencia Shine-Dalgarno en bacterias • Barrido impreciso en eucariontes • Factores implicados en la reducción de la velocidad traduccional (factores de crecimiento, virus, choque térmico, entradafase M del CC. • Control Negativo • Autorregulación • Recodificación traduccional Cuando una nueva molécula de ARNm eucariota, pasa a través de un poro nuclear y alcanza el citoplasma, se encuentra con ribosomas que lo traducen en una cadena polipeptídica. Si la cadena de ARNm codifica una proteína que está destinada a la secreción o a expresarse en la superficie celular, será dirigida hacia el RE por una secuencia señal situada en el extremo amino de la proteína. En los demás casos la proteína es sintetizada en ribosomas libres en el citoplasma, donde las señales presentes en la propia secuencia del polipéptido la pueden dirigir hacia otros compartimientos del interior de la célula. Además existen otros casos, en los que el ARNm son dirigidos hacia posiciones intracelulares específicas, por señales existentes en la propia secuencia del ARNm y antes de que sean traducidas. Estas señales se localizan en la región 3’ no traducida (UTR) de la molécula de ARNm (la región entre el codón de paro de la traducción y el punto de inicio de la cadena poli A). Un ejemplo notable de ello, se produce en el huevo de Drosophila en el que el ARNm que codifica la proteína génica bicoide, se une al citoesqueleto cortical del extremo anterior del huevo en desarrollo. Cuando se dispara la traducción de este transcrito por la fecundación, se genera un gradiente de la proteína bicoide, que tendrá un papel fundamental en el control del desarrollo de la parte anterior del huevo. Otro mecanismo sorprendente, es el proceso denominado edición del ADN, que altera enormemente los transcritos de ARN. En este proceso, descubierto en transcritos que codifican proteínas en las mitocondrias de los tripanosomas, se insertan uno o más U (o se eliminan aunque con menor frecuencia) en regiones seleccionadas del transcrito, provocando grandes modificaciones, tanto en la pauta de lectura original, como en la secuencia, con la que cambia el sentido del mensaje. En el caso de algunos genes, la edición es tan extensa, que más de la mitad de la secuencia son nucleótidos U que se han insertado durante el proceso de edición. La información que especifica exactamente como se ha de editar el transcrito inicial de ARN, está contenida en las moléculas de ARN de 40 a 80 nucleótidos de longitud, que se transcriben por separado, denominados ARN guías, que tienen un extremo 5’, complementario en secuencia a un extremo de la región del transcrito que se ha de editar. Posee además, secuencias encargadas de determinar los lugares en donde no hay U y por último, tiene una cola de poli U. La cola de poli U se va acortando, a medida que se va produciendo la edición del ARN. La edición se inicia en el extremo 3’ y progresa hacia el 5’. También se ha encontrado edición extensa de secuencias de ARN, en las mitocondrias de muchas plantas. Existen evidencias de que la edición, está regulada de forma que se produzcan diferentes ARNm en diferentes condiciones, de modo que la edición del ARN debería entenderse, como una forma primitiva de cambiar la expresión de los genes. Los tripanosomas son eucariontes unicelulares muy antiguos, que se separaron muy pronto de la línea evolutiva que conduce a las plantas, a los animales y a las levaduras. La edición del ARN, en una versión mucho más reducida, también se produce en los mamíferos. El primer caso descrito, corresponde al gen de la apolipoproteína B en el que el proceso de edición produce dos tipos de transcrito. Oocitos y huevos en maduración, constituyen un ejemplo notable de control de la expresión génica mediante adición de poli A al ARNm específicos. En estas células gigantes parecen estar inactivas muchas de las vías de degradación de ARNm, de forma que las células puedan fabricar grandes cantidades de ARNm como preparación para la fertilización. Muchos de los ARNm se almacenan con colas poliA de sólo 10 a 30 residuos A en sus extremos 3’, y en esta forma no se traducen. En ciertos momentos del desarrollo, cuando son necesarios los productos codificados por estos mensajeros, se les añade poli A al extremo 3’, lo que estimula la iniciación de la traducción. En cuanto a los controles que actúan sobre la traducción, se destacan las estrategias diferentes, que utilizan procariontes y eucariontes al inicio de la traducción. En bacterias, una secuencia de seis nucleótidos, la secuencia de Shine – Dalgarno situada corrientes arriba del codón de iniciación AUG, se aparea con el ARN 16S de la subunidad ribosómica pequeña, en el ribosoma. Esta interacción es muy importante para la eficiencia de la iniciación y aporta a la célula bacteriana un mecanismo sencillo para regular la síntesis de proteínas. Los ARNm de los eucariotas no contienen secuencias Shine – Dalgarno. En su lugar la selección de un codón AUG como inicio de la traducción, viene determinada fundamentalmente por la proximidad al extremo caperuza 5’ de la molécula de ARNm, que es el lugar por el que la subunidad ribosómica pequeña se une al ARNm e inicia la búsqueda de un codón de inicio AUG. Los nucleótidos que rodean inmediatamente el lugar de inicio de la traducción, también influyen en la eficiencia con que será reconocido el codón AUG durante el proceso de búsqueda. Si ese lugar de reconocimiento, es suficientemente débil, las subunidades ribosómicas buscadoras, ignorarán el primer codón AUG y podrán escoger el segundo codón AUG en su lugar. Este fenómeno denominado barrido impreciso, es una estrategia empleada frecuentemente para producir dos o más proteínas a partir de un ARNm Las células eucariotas reducen su velocidad de síntesis de proteínas, en respuesta a una gran variedad de situaciones, que incluyen la carencia de factores de crecimiento, la infección por virus, el choque térmico y la entrada en la fase M del ciclo celular. Se cree que la mayor parte de esta regulación, es responsabilidad del factor de iniciación eIF-2, el cual es fosforilado por proteínas quinasas específicas, lo que reduce la velocidad de síntesis de proteínas. Algunas moléculas de ARNm ven bloqueada su traducción por proteínas represoras de la traducción, que se unen al extremo 5’ del ARNm cerca del extremo, donde debería iniciarse la traducción. Este tipo de mecanismo, se denomina control traduccional negativo. Los controles traduccionales descriptos hasta aquí afecta la velocidad de síntesis. Normalmente la traducción una vez que se ha iniciado, automáticamente llega al final. Uno de los mejores ejemplos de regulación mediante la traducción es la síntesis de la α y β tubulina. Si a la célula se la trata con colchicina, los microtúbulos se desensamblan y se incrementa la concentración de las subunidades de α y β tubulina. En estas condiciones la síntesis de α y β tubulina decae drásticamente. Este tipo de regulación traduccional se denomina autorregulación. En este caso la regulación se produce después de que el proceso de traducción haya empezado. Los primeros cuatro aa (MREI) del producto génico de la tubulina (β tubulina) constituyen un elemento de reconocimiento al que se unen los factores de regulación. La concentración de α y β tubulina podría tener función reguladora. Esta interacción proteína-proteína activa la acción de una RNasa que podría ser un componente ribosómico o una proteína citoplasmática no específica. La acción de esta RNasa degrada el ARNm de la tubulina durante la traducción, parando la biosíntesis. La traducción debe producirse al menos hasta el codón 41 puesto que los primeros 30 a 40 aa traducidos están en el túnel dentro de la subunidad mayor del ribosoma y sólo la traducción de este nº de aa hace que la secuencia de reconocimiento MREI sea accesible a la unión. Se ha propuesto este modelo de regulación para otros genes como los de las histonas, algunos factores de transcripción etc. Sin embargo hay ARNm que contienen señales de reconocimiento que interrumpen el proceso normal de traducción. Este proceso recibe el nombre de recodificacióntraduccional y es responsable de la modificación de las proteínas que finalmente produce. La forma de recodificación observada con mayor frecuencia, es el cambio de pauta de lectura traduccional. Este tipo de recodificación es muy frecuente en retrovirus, permitiéndoles sintetizar más de una proteína a partir de un mismo ARNm. Todos los mecanismos de control postranscripcional descriptos, dependen de una determinada molécula de ARN sea reconocida específicamente para un tratamiento especial, como la maduración, edición o degradación. El descubrimiento de que hay de moléculas de ARN que desempeñan una importante función en el control de la expresión génica ha generado un nuevo campo de investigación. Hay moléculas cortas de ARN de aproximadamente 21 nucleótidos que causan represión de la traducción de los ARNm y su degradación. Asimismo se ha demostrado que ARNs especiales actúan en el núcleo alterando la estructura de la cromatina y produciendo un silenciamiento génico. El silenciamiento del ARN se conoce como interferencia del ARN (ARNi) en animales y silenciamiento génico postranscripcional en plantas (PTGS). Este proceso comienza con un ARN de doble cadena (de 70 nucleótidos de longitud) que es procesado por una proteína denominada Dicer que posee actividad ARNasa de doble cadena. Cada proteína Dicer tienen dos dominios catalíticos (uno es inactivo) y funciona como un dímero y corta al ARN a intervalos de unos 21 nucleótidos. El producto es un ARN corto llamado ARN de interferencia corto (ARNsi). Si la cadena de ARNsi se desespiraliza en sus cadenas sencillas con sentido y sin sentido, la cadena antisentido se combina con un complejo proteico denominado RISC (complejo de silenciamiento inducido por ARN) que reconoce se une y corta a los ARNm que contengan secuencias complementarias a la cadena antisentido del ARNsi. RISC corta el ARNm cerca de la zona media de la región emparejada con el ARNsi y los fragmentos de ARN se degradan. El fenómeno ARNi desempeña una función importante en la defensa celular contra la invasión de virus y en el silenciamiento de los transposones. Un segundo tipo de silenciamiento del ARN es mediado por cortas moléculas de ARN denominadas micro ARN (miARN). Los miARN proceden de una región de aproximadamente 70 a 130 nucleótidos que forma una horquilla imperfecta que es cortada por Dicer. En las células animales este producto un ARN de aproximadamente 14 -19 nucleótidos se empareja con las regiones 3’ no traducidas (UTR) de las moléculas maduras de ARNm bloqueando la traducción. En plantas los ARNmi pueden detener la traducción e iniciar la degradación del ARNm. Más recientemente se ha descubierto que los ARN cortos pueden domiciliarce en regiones específicas del genoma para modificar la cromatina. Los ARNsi y ARNmi también pueden emparejarse con el ADN y estarían implicados en diferentes formas de modificación del genoma que regulan la expresión génica. Entre las que se incluye la metilación de la citosina del ADN dirigida por ARN (RdDM). Se ha demostrado que las moléculas cortas de ARN regulan la expresión génica mediante dos mecanismos citoplasmáticos (degradación y detención o la inhibición de la traducción del ARNm) y en el núcleo mediante la metilación de citocinas del ADN lo que conduce en todos los casos al silenciamiento génico.
Compartir