Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO PROGRAMA DE MAESTRÍA Y DOCTORADO EN CIENCIAS BIOQUíMICAS INSTITUTO DE BIOTECNOLOGíA ANÁLISIS DE UNA LIBRERÍA BINARIA DE MUTANTES DE NPR T E S I S QUE PARA OPTAR POR EL GRADO DE: MAESTRO EN CIENCIAS P R E S E N T A L.C.G. VITO ADRIÁN CANTÚ ALESSIO ROBLES DIRECTOR DE TESIS: Dr. FRANCISCO XAVIER SOBERON MAINERO Instituto de Biotecnología, UNAM INTEGRANTES DE COMITÉ TUTOR: Dr. RUBEN PAUL GAYTAN COLIN Instituto de Biotecnología, UNAM Dr. GILLERMO GOSSET LAGARDA Instituto de Biotecnología, UNAM CUERNAVACA, MORELOS JUNIO 2013 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. Integrantes de jurado de examen Presidente Dr. Lorenzo Segovia Forcella Instituto de Biotecnología, UNAM Secretario Dr. Mrcela Ayala Aceves Instituto de Biotecnología, UNAM Vocal Dr. Nina Pastor Colón Facultad de ciencias, UAEM Vocal Dr. Gabriel Del Rio Guerra Instituto de fisiología celular, UNAM Vocal Dr. Enrique Merino Perez Instituto de Biotecnología, UNAM Este trabajo esta dedicado a: Mis jefes (Padres) Yina Mi Hermano AGRADECIMIENTOS Este trabajo fue realizado en el laboratorio del Dr. Xavier Soberon Mainero ubicado en el Instituto de Biotecnología, campus Morelos de la Universidad Nacional Autónoma de México con recursos aportados por el Consejo Nacional de Ciencia y Tecnología (CONACyT). Mi sincero agradecimiento al Dr. Xavier Soberon por asesorarme a lo largo de estos años y darme el espacio y la libertad de elegir mi camino. Agradezco también Flores, Fily y Joel por formarme en las obscuras y misteriosas artes de la biología molecular. A Gloria Saab, por mantener al consorcio SOS (¡vaya nombre!) unido en las buenas y en las malas. A los Doctores Paul Gaytan, Guillermo Gosset, Nina Pastor, Marcela Ayala, Enrique Merino, Gabriel Del Río y Lorenzo Segovia por su dedicación al leer y criticar mi trabajo. Sus opiniones y observaciones enriquecieron mucho este trabajo (y evitaron una serie de penosas faltas ortográficas) A todos mis compañeros de laboratorio, especialmente a Tatiana por ser una muy decente compañera de mesa. A mis compañeros de generación de la maestría. A Yina por escucharme y sacarme a pasear cuando la mi frustración aumentaba. A Patrick, Leo, Ana y Ronan por su amistad. A los miembros de la unidad de docencia: Rudiño, Jalil, Toño y Gloria. Índice de contenido RESUMEN.................................................................................................................................................1 INTRODUCCIÓN.....................................................................................................................................3 Represión catabólica del carbono..........................................................................................................3 El sistema PTS.......................................................................................................................................4 Enzima 1...........................................................................................................................................5 HPr....................................................................................................................................................6 Complejos EII...................................................................................................................................6 Organización del PTS.......................................................................................................................7 Regulación del metabolismo del carbono...........................................................................................10 Regulación de la transcripción por Crp/cAMP ..............................................................................11 Regulación de cyaA y transcripción de crp....................................................................................12 El sistema PTS nitrógeno....................................................................................................................13 Conexión entre el metabolismo del carbono y el metabolismo del nitrógeno....................................15 ANTECEDENTES...................................................................................................................................17 HIPÓTESIS..............................................................................................................................................23 OBJETIVOS............................................................................................................................................23 DISEÑO EXPERIMENTAL....................................................................................................................23 Construcción de librería binaria..........................................................................................................25 Construcción de la librería..............................................................................................................25 Oligonucleótidos mutagénicos........................................................................................................26 Plásmido PZE12-TrpF-Luxp..........................................................................................................27 Probar construcción........................................................................................................................28 Transformación de la librería..............................................................................................................29 Selecciones y plásmidos......................................................................................................................30 Aclimatar cultivos...............................................................................................................................30 Secuenciación Sanger..........................................................................................................................31 Resumen de secuencias.......................................................................................................................32 DISEÑO MODELADO COMPUTACIONAL........................................................................................33 RESULTADOS........................................................................................................................................35 Comparación entre PJET y la hipótesis nula.......................................................................................35 Efecto del tamaño de muestra en la inferencia estadística..................................................................36 Comparación entre PJET y LB ...........................................................................................................37 Comparación entre LB y MTL............................................................................................................38 MODELO.................................................................................................................................................39 CONCLUSIONES...................................................................................................................................41PERSPECTIVAS......................................................................................................................................41 Metodología secuenciación masiva.....................................................................................................42 MÉTODOS..............................................................................................................................................45 Cepas...................................................................................................................................................45 Medios.................................................................................................................................................45 LB...................................................................................................................................................45 M9...................................................................................................................................................45 Sales m9(5X)..................................................................................................................................46 Medio mínimo M9..........................................................................................................................46 i SOC................................................................................................................................................46 GYT................................................................................................................................................47 Otros....................................................................................................................................................47 Oligonucleótidos split resin.................................................................................................................47 Armado de la librería...........................................................................................................................48 Plásmido PZE12-TrpF-LoxP...............................................................................................................49 Purificar plásmido PZE12...................................................................................................................51 Digerir.................................................................................................................................................53 Ligar....................................................................................................................................................53 Verificar librería..................................................................................................................................54 Transformar.........................................................................................................................................54 Oligonucleótidos secuenciación masiva..............................................................................................55 Platear cajas en medio sólido..............................................................................................................56 Seleccionar y extraer plásmido de 96 cepas........................................................................................56 Secuenciar...........................................................................................................................................56 PCR de cultivo.....................................................................................................................................56 Estadística............................................................................................................................................57 Secuencias...........................................................................................................................................57 BIBLIOGRAFÍA.....................................................................................................................................58 Índice de tablas Tabla 1: Constantes de equilibrio del PTSglc............................................................................................9 Tabla 2: Resumen de secuencias..............................................................................................................32 Tabla 3: Comparación entre secuencias en pJET y la hipótesis nula.......................................................35 Tabla 4: Comparación entre PJET y LB..................................................................................................38 Tabla 5: Comparación entre LB y MTL...................................................................................................39 Tabla 6: Modelo del aporte de cada mutación a la actividad HPr............................................................40 Tabla 7: Funciones binarias......................................................................................................................43 Tabla 8: Oligonucleótidos para armar la librería......................................................................................48 Tabla 9: Oligonucleótidos forward con tag..............................................................................................55 Tabla 10: Oligonucleótidos reverse con tag.............................................................................................56 Índice figuras Figura 1: Organización de distintos sistemas PTS en E. coli (105)..........................................................5 Figura 2: Organización del operón rpoN en distintos organismos...........................................................14 Figura 3: Alineamiento múltiple entre HPr, CPr y NPr...........................................................................17 Figura 4: Perfiles de crecimiento.............................................................................................................18 Figura 5: Interfaz HPr:EIIMtl..................................................................................................................18 Figura 6: Reconstrucción de interacciones proteína-proteína por docking molecular.............................20 Figura 7: Comparación en la actividad de las permeasas de glucosa y manosa......................................21 Figura 8: Diagrama de flujo del diseño experimental..............................................................................24 Figura 9: Distribución de los ocho oligonucleótidos que usaron para ensamblar la librería binaria.......25 Figura 10: Gel del plásmido TrpF-LuxP..................................................................................................27 ii Figura 11: El plásmido pJET....................................................................................................................28 Figura 12: Variantes del plásmido pJET..................................................................................................29 Figura 13: Secuencias de variantes crecidas en MM/manitol..................................................................30 Figura 14: Secuencias de variantes crecidas en LB.................................................................................31 Figura 15: Diseño modelado computacional............................................................................................33 Figura 16: Efecto del tamaño de muestra en la inferencia estadística.....................................................36 Figura 17: Regiones variables de la librería binaria.................................................................................43 Figura 18: Producto de PCR de los oligonucleótidos con etiquetas........................................................44 Figura 19: Digestión de PZE12-TrpF-LuxP.............................................................................................51 Figura 20: Purificaciónde las bandas B y M...........................................................................................51 iii RESUMEN NPr y HPr son proteínas parálogas que participan en los sistemas de transferencia de fosfato PTS y PTSNtr respectivamente. El sistema PTS cataliza simultáneamente la entrada a la célula y la transformación a fosfoéster de un amplio número de carbohidratos mientras que el sistema PTSNtr esta implicado en la regulación del metabolismo del nitrógeno. A pesar de la similitud entre los componentes de ambos sistemas se ha observado muy poca reacción cruzada entre ellos. En el articulo adjunto se describe cómo el cambiar catorce aminoácidos de la superficie de NPr por los correspondientes en HPr le proveé a esta NPr quimérica (llamada CPr) la habilidad de interaccionar y transferir fosfatos a diversas permeasas de carbohidratos (EIIAs) ; actividad normalmente llevada a cabo por HPr. Adicionalmente se produjeron otras dos variantes: CPr6 con las primeras seis mutaciones y CPr8 con las ultimas ocho. CPr6 fue capaz de fosforilar sólo algunas de las EIIA que fosforila CPr. Cpr8 no mostró actividad. El trabajo presentado en esta tesis pretende elucidar el aporte de cada una de estas catorce mutaciones a la interacción con diversas EIIA caracterizando una librería que contenga todas las variantes con una de estas catorce mutaciones, todas las variantes con dos, todas las variantes con tres etc... Esta librería se sintetizo usando el método de separación de resina que es capaz de introducir variación en un gen a nivel de codón. Es decir, para cada una de estas catorce posiciones existen solo dos posibles codones: mutante (el de HPr) o silvestre (el de NPr). Esta librería, denominada binaria, tiene 214=16384 variantes. La librería binaria se clonó, trasformó y creció en LB (control), MM/Mnt (medio mínimo más manitol), MM/Man (MM más manosa) , MM/Dul(MM más dulcitol), MM/Sbt(MM más sorbitol) y 1 MM/Glc(MM más glucosa). Se secuenciaron variantes de cada medio. Solo se contaron con suficientes secuencias MM/Mtl para realizar un análisis estadístico que propone la mutación L13N como perjudicial a la actividad y la mutación A51K como benéfica. La falta de la mutación A51K podría explicar porque CPr6 no crece en manitol como fuente de carbono. Ya que el reducido tamaño de muestra nos impide formular más conclusiones, se calculó in silico la energía de interacción de cada una de las 16384 variantes con cada una de las tres estructuras conocidas de EIIA (manosa, manitol y glucosa). El análisis de estas energías produce un modelo integral del aporte de cada de estas mutaciones a la actividad en estas tres fuentes de carbono. Este modelo es congruente con los resultados experimentales. Finalmente, se propone y empieza a trabajar en un protocolo que usa oligonucleótidos marcados con secuencias especificas para poder secuenciar miles de variantes crecidas en diferentes condiciones en solo experimento de secuenciación masiva. Con esto se pretende, además de validar el modelo propuesto, observar el cambio en la frecuencia de las variantes de la librería a lo largo del tiempo en las distintas fuentes de carbono. 2 INTRODUCCIÓN Represión catabólica del carbono Dado un entorno extracelular particular, Escherichia coli sólo necesita un subconjunto de las enzimas codificadas en su genoma para crecer, indicando que la expresión génica está regulada de forma diferencial. Si un sustrato está ausente los genes responsables de metabolizarlo generalmente se reprimen para no malgastar energía en producir enzimas innecesarias en ese momento. El aumento en la concentración del sustrato relaja la represión de estos genes. El ejemplo clásico de este modo de regulación es el operón lac de E. coli(1). Hace más de 100 años se observó que el crecimiento en glucosa reducía la actividad de ciertas enzimas en bacterias y levaduras, fenómeno al que se denominó “efecto glucosa”. Uno de los primeros ensayos cuantitativos de este efecto fue realizado en 1937 por Stephenson y Gale, quienes midieron la actividad galactosidasa (utilización de galactosa) en E. coli. Esta actividad se ve reducida siete veces en presencia de glucosa, mientras que el consumo de glucosa no se ve afectado por la presencia de galactosa(2). A principios de la década de 1940s Monod observó que cuando se cultiva Bacilus subtilis en un medio con sacarosa y dextrano la bacteria primero consume la sacarosa, luego deja de crecer por un tiempo (fase lag), para finalmente empezar a consumir dextrano. Al extender sus estudios a más organismos y azúcares(3) se percató que este comportamiento bifásico era un mecanismo general y extendido; cada 3 organismo parece tener su orden particular de consumo de fuentes de carbono, con glucosa comúnmente en primer lugar. En los años siguientes se descubrió que azúcares comunes como glucosa, fructosa o sacarosa, en concentraciones suficientes, reducen la síntesis de enzimas requeridas para el transporte y utilización de fuentes de carbono menos favorables. Este fenómeno se conoce como “represión catabólica del carbono” (RCC)(4). Cuando la fuente primaria de carbono es consumida, la bacteria primero expresa los genes necesarios para consumir la fuente de carbono secundaria antes de poder continuar con el crecimiento. Los mecanismos regulatorios de la RCC han sido estudiados extensamente, encontrándose que el uso preferencial de una fuente de carbono sobre otro implica modulación de la actividad enzimática y/o represión de la transcripción. En E. coli, el sistema de fosfotranferasa fosfoenolpiruvato:carbohidrato (PTS) desempeña un papel central en la represión catabólica del carbono. El sistema PTS El PTS de E. coli fue descrito por Kundig, Ghosh y Roseman como un sistema que utiliza fosfoenolpiruvato (PEP) para fosforilar ciertas hexosas incluyendo N-actilglucosamina, N- acetilmanosamina, glucosa, manosa y manosamina(5). En seguida se reconoció como un mecanismo de transporte que cataliza simultáneamente la entrada a la célula y la transformación a fosfoéster de un amplio número de carbohidratos. La composición básica del PTS es similar en todas las especies estudiadas(6). Consta de dos componentes citoplásmicos generales, enzima 1 (EI) y HPr (Histidine 4 Containing Protein) que son comunes para todos los carbohidratos del PTS y enzima 2 (EII) que es específica para cada carbohidrato. En general, una bacteria puede expresar un gran número de EIIs diferentes, en E. coli por lo menos 15(7). Cada EII consiste de uno o dos dominios hidrofóbicos integrales de membrana (C y D) y dos hidrofílicos (A y B). Estos dominios pueden o no encontrarse en el mismo polipéptido (ver figura 1). En el caso de fructosa, EIIAFru esta fusionada a FPr, otro parálogo de HPr. Enzima 1 EI esta significativamente conservada tanto en bacterias gram positivas como gram negativas(8), está compuesta por 570 residuos (63 Kda) y codificada por el gen ptsI. Se autofosforila en presencia de 5 Figura 1: Organización de distintos sistemas PTS en E. coli (105) Mg2+ en la posición N-3 del anillo de imidazol de la His-189 (9), localizado en el extremo N-terminal de la proteína. El extremo C-terminal contiene el sitio de unión a PEP y es necesario para la dimerización. La proteólisis leve de EI genera un péptido del extremo N-terminal. Los dominios N- terminal (EI-N)(10) y C-terminal (EI-C)(11) han sido clonados y caracterizados; EI-N se fosforila tanto in vitro como in vivo en presencia de EI-C, PEP y Mg2+. La estructura de EI-N ha sido elucidada tanto en cristal(12) como en solución(13). La fosforilación no parece modificar dramáticamente la estructura deldominio. HPr HPr tiene solo 90 residuos (9KDa) y es codificada por el gen ptsH. Ha sido purificada de varios organismos(6). La similitud es más pronunciada alrededor del sitio activo(14). HPr se fosforila en la posición N-1 del anillo imidazol de la His-15. Se conoce la estructura tridimensional de HPr de E. coli, B. subtilis y unas pocas especies más(15) (16). En el caso de E. coli también existen co-cristales de HPr con EIIAman (17) , EIIAglc (18) o EIIAmnt (19) así como con el dominio N-terminal de EI(20). En todos estos casos el esqueleto de HPr es idéntico, cuatro láminas beta antiparalelas cubiertas por un lado con 3 hélices alfa, lo que indica que HPr no requiere grandes cambios de conformación para lograr la interacción con EIIA o EI. Estudios con un gran número de mutantes de HPr sugieren que los residuos importantes para la interacción, tanto con EI como con todas las EIIA, se encuentran en las hélices 1 y 2 y sus asas cercanas (21). (ver figura 6) Complejos EII 6 Los complejos EII tienen la una estructura modular(22) consistente hasta de 4 proteínas diferentes(6). Los dominios EIIA y EIIB se definen como aquellos que reciben el fosfato de HPr~P y EIIA~P respectivamente. Mientras que en EIIA el residuo fosforilable es siempre una histidina, en EIIB puede ser tanto una histidina (familia de manosa) como una cisteína (las demás familias)(23). El grupo fosfato de EIIB~P es transferido al carbohidrato tras la translocación (internado a la célula) por EIIC (y EIID en algunos casos)(ver figura 1). Los complejos EII se clasifican en 4 superfamilias(24) según sus distintos orígenes evolutivos: 1. La superfamilia glucosa-fructosa-lactosa compuesta por la familia de glucosa (EIIAGlc/EIICBGlc de E. coli o EIICBAGlc de B. subtilis), la familia fructosa-mannitol (EIICBAMtl de E. coli), y la familia de lactosa(EIIALac/EIICBLac de L. casei). 2. La superfamilia ascorbato-galactitol, compuesta por la familia ascorbato (SgaA/SgaB/SgaT de E. coli) y la familia galactitol (EIIAGat/EIIBGat/EIICGat de E. coli ). 3. La familia de manosa (EIIABMan/EIICMan/EIIDMan de E. coli o EIIALev/EIIBLev/EIICLev/EIIDLev de B. subtilis). 4. La familia de dihidroxiacetona (EIIA-HPr-EIDha [DhaM] en E. coli). Esta clasificación basada en secuencia está respaldada por análisis de cristalografía y RMN que muestran claramente que EIIA y EIIB pertenecientes a diferentes familias son estructuralmente distintos. La información estructural sobre los dominios integrales de membrana, EIIC y EIID, es limitada. Organización del PTS 7 La transferencia de fosfato entre los componentes del PTS ocurre por una “asociación en línea” (25). Esta transferencia se facilita por la formación de complejos heterodiméricos, y dada la cinética del proceso, éstos deberían ser efímeros. Se ha descrito la estructura de varios complejos del PTS incluyendo EI/HPr (20), Hpr/EIIGlc (26) (27), Hpr/EIIMtl (28), Hpr/EIIMan (17), EIIAGlc/EIIBGlc (29) y EIIAChb~P/EIIBChb (29). La formación de los complejos heterodiméricos afecta las propiedades de control de flujo de los componentes de PTS (30). Dado que tanto EI como HPr en E. coli están unidos a fragmentos de membrana(31), se ha propuesto que el PTS se asocia en un metabolón(32) (estructura multiprotéica formada por enzimas secuenciales de una misma vía metabólica) que mejoraría la función PTS. Sin embargo existen argumentos que ponen en duda esta afirmación ; por ejemplo, no es claro cómo se lleva a cabo la transferencia de fosfatos en un complejo completamente ensamblado. Además, no debería haber mejora funcional de un complejo EI-HPr-EII contra los componentes en solución, ya que la difusión no limita el flujo de glucosa(33). La formación de complejos se observa con EI marcada con la proteína verde fluorescente (GFP por sus siglas en inglés), tanto en células crecidas en carbohidratos PTS como no-PTS, cuando llegan a fase estacionaria y altas densidades(34). En razón de que al agregar más carbohidratos los complejos desaparecen, parece que los azúcares propician su disociación. Varias proteínas de PTS forman dímeros funcionales. La primera en ser descrita fue EI(35) y se cree que la transición monómero/dímero puede regular el flujo de entrada ya que PEP sólo fosforila a la forma dimérica y la asociación/disociación es muy lenta comparada con el flujo de carbohidratos(36). EI~P tiene una constante de dimerización 10 veces mayor que EI. Siendo esta promovida por Mg2+ y 8 PEP e inhibida por piruvato (37). Algunas EII tansmembranales como EIICBAMtl (38) y EIICBGlc (39) dimerizan. Análisis proteómicos han encontrado oligómeros de EIINag y EIITre (40), apoyando la visión generalizada que las permeasas del PTS funcionan como dímero u oligómeros. En general se acepta que HPr y EIIA no forman oligómeros sin embargo existe evidencia que sugiere lo contrario en el caso de EIIALac, EIIGlc y EIIABMan (41). También EIIANtr, componente del sistema PTSNtr y homólogo a EIIAFru, cristaliza como dímero (42) pero parece ser monómero en solución (43). Se conocen las constantes de equilibro del PTS de E. coli (ver tabla 1). El Keq en este caso expresa la razón entre producto y sustrato. Es decir, en el equilibrio, existen 80 moléculas de HPr~P por cada molécula de EI~P. Esto significa que existe una proporción no despreciable de EI~P en el equilibrio. Tradicionalmente se considera que una reacción es irreversible si su Keq es mayor a 105. Reacción Keq referencia EI~P ↔ HPr~P 80 (36) HPr~P ↔ EIIAGlc~P 1~1.5 (44) EIIAGlc~P ↔ EIICBGlc~P 12 (36) EIICBGlc~P ↔ Glc-6~P 3.2 x 106 (36) Tabla 1: Constantes de equilibrio del PTSglc Sólo la última reacción del PTSGlc es irreversible (Ver tabla 1 ). Se cree que las constantes de otros PTS son similares. La reversibilidad de las reacciones del PTS tiene implicaciones reguladoras discutidas más adelante. 9 Regulación del metabolismo del carbono Cuando E. coli se enfrenta a un cambio en las fuentes de carbono disponibles puede adaptar su metabolismo mediante la expresión de operones específicos, generalmente inducidos por sustrato (45). Datos de transcriptómica muestran que cuando las células crecidas en fuentes ricas de carbono son posteriormente expuestas a fuentes de carbono que sólo permiten un crecimiento lento, el número de genes inducidos incrementa progresivamente (46). Células que crecen bajo limitación de carbono expresan y utilizan un gran número de transportadores, mientras que aquellas que crecen en glucosa sólo expresan unos pocos(47). Esta respuesta transcripcional está mediada por un número pequeño de reguladores(48): Crp, Mlc, FruR, CsrA y σ54. La actividad de algunos de estos reguladores está directamente afectada por el PTS. La importancia del PTS en la regulación del carbono se volvió evidente cuando se encontró que mutantes con deleciones en HPr y/o EI no sólo eran incapaces de crecer en azúcares PTS sino en una gran gama de azúcares no PTS(6). Buscando mutaciones que restauraran el crecimiento en azúcares no PTS recurrentemente se encontró la mayoría un gen que se denominó crr (carbohydrate represion resistant)(49) que luego se demostró codifica para EIIAGlc. La triple mutante HPr, EI y EIIAGlc crece bien en azúcares no PTS, pero no crece en azúcares PTS. Esto muestra que EIIAGlc no sólo está implicada en el transporte de glucosa, sino también en la regulación del transporte y metabolismo de un gran número de fuentes de carbono no PTS. EIIAGlc ~P es requerida para la activación de la adenilato ciclasa. Mutantes en este gen muestran una actividad marginal correspondiente a 5% de la enzima parental(50). EIIAGlc sin fosforilar puede unirse e inhibir múltiples proteínas no PTS incluyendo lapermeasa de lactosa (LacY) y melibiosa (MclB), el 10 componente hidrolizador de ATP del sistema de transporte de maltosa malK y la glicerol cinasa. Al evitar la entrada de estos metabolitos se detiene la inducción de los genes involucrados en su transporte. A este proceso se le denominó “exclusión de inductor” (inducer exclusion). Estos mecanismos permiten a la célula usar fuentes de carbono alternativas sólo cuando EIIAGlc se encuentra mayoritariamente fosforilada (cuando no hay azúcares PTS). Regulación de la transcripción por Crp/cAMP Crp es un regulador global que controla la expresión de diversos genes y operones (51). Crp se activa al unirse a cAMP sintetizado por adenilato ciclasa (cyaA). Diferentes genes y operones requieren distintas concentraciones de Crp/cAMP para activarse ya que este complejo puede tomar diferentes estados conformacionales activos y la afinidad por cada sitio en el ADN es diferente (52). La concentración de Crp/cAMP está regulada por el PTS ; la adición de glucosa a células crecidas en lactosa baja la concentración de cAMP (53). Experimentos con células toluenizadas (54) (este tratamiento vuelve las membranas permeables a carbohidratos) muestran que la actividad de adenilato ciclasa se inhibe por glucosa (55). Otros carbohidratos PTS también inhiben la síntesis de cAMP (56) . Tanto las mutantes ptsHI y crr tienen baja actividad adenilato ciclasa (50). Basado en estos estudios se propuso un modelo en el cual EIIAGlc~P activa a adenilato ciclasa. Creciendo en una fuente rica de carbono, el flujo de fosfato hacia el carbohidrato externo genera una menor proporción EIIAGlc fosforilada inhibiendo la adenilato ciclasa. Sin embargo, en una fuente pobre de carbono, como lactato o succinato, toda la EIIAGlc se encuentra fosforilada, promoviendo la síntesis de cAMP. Este modelo no puede explicar por qué el crecimiento en algunas azúcares no PTS como glucosa-6~P o gluconato genera niveles similares de cAMP a los generados por glucosa (57). Más aún, el efecto inhibitorio de 11 glucosa-6~P sólo ocurre en células intactas y no en toluenizadas (55). Regulación de cyaA y transcripción de crp. Nuestro entendimiento de la regulación mediada por Crp/cAMP proviene del estudio de mutantes cyaA, crp, ptsH, ptsI y/o crr (58). El efecto de diversas fuentes de carbono en el crecimiento, expresión génica, concentración de cAMP y crp ha sido monitoreado en estas mutantes. Agregar cAMP exógeno sirve para distinguir entre los efectos causados por cambios en la concentración de cAMP y aquellos causado por la actividad de Crp. La inactivación de cyaA evita que E. coli crezca en muchos azúcares PTS, aunque la sobre expresión parece ser perjudicial (59). La inactivación de crp aumenta la concentración de cAMP en sesenta veces pero es dependiente de crr ; la doble mutante cyaA crr sólo presenta un aumento de cuatro veces (60). Esto se debe a que la expresión de cyaA está regulada negativamente por Crp/cAMP en E. Coli (61) y la de crp está regulada tanto negativamente (62) como positivamente (63) por Crp/cAMP, dando altos niveles de expresión a concentraciones muy bajas o muy altas del inductor. La expresión de crr es independiente de Crp/cAMP (64) pero la expresión de ptsG (EIICBGlc) esta casi completamente inhibida en mutanres en cyaA o crp (65). No es claro como EIIAGlc~P ejerce su efecto regulatorio sobre cyaA. Se ha demostrado que tanto EIIAGlc~P como EIIAGlc se unen de manera similar a la adenilato ciclasa(66) pero sólo la forma forsforilada permite la unión de un factor extra aún no identificado. El extremo N-terminal de la adenilato ciclasa es la parte catalítica mientras el C-terminal es necesario para la regulación mediada por EIIAGlc~P(66), ya que mutantes en crp generan un aumento de cincuenta veces en la concentración 12 de cAMP que se ve casi normalizado en mutantes sin los 48 aminoácidos C-ternimales de cyaA (67) . Mutantes en crr tienen de 5 a 20 % de la actividad adenilato ciclasa, que se recupera a niveles casi normales al expresar crr en un plásmido(68). Si EIIAGlc fuese el único factor que estimula la adenilato ciclasa la mutante en crr y la cyaA truncada deberían exhibir el mismo fenotipo, pero el efecto positivo de la concentración de cAMP al expresar crr en un plásmido (5x) es mucho menor al negativo causado por la deleción del domino C-terminal de CyaA (50x). El sistema PTS nitrógeno Existe un sistema homólogo a PTS denominado PTSNtr (PTS nitrógeno) compuesto por EINtr (PtsP), homólogo a EI ; NPr (PtsO), homólogo a HPr y EIIANtr (PtsN) homólogo a EIIFru (41). Ninguna de estas proteínas es capaz de complementar la ausencia de su parálogo (41). La función de este sistema aún no está bien entendida, pero se cree que regula el metabolismo del nitrógeno(69). También se ha propuesto un rol en la regulación de los niveles de K+(70). Tanto NPr como EIINtr se encuentran codificados en el mismo operón que el factor σ54, el operón rpoN. (Figura 2) En E. coli (69) y K. pneumoniae (71) la expresión del operón rpoN es constitutiva pero en B. japonicum (72) , P. putida (73) y R. etli (74) está auto-regulada negativamente por EINtr. Estos genes codifican para σ54 (rpoN),la proteína Y asociada a ribosoma (yhnH), EIIANtr (ptsN), una proteína de unión a ATP (yhbJ) y NPr (npr). (41) 13 EINtr, NPr y EIIANtr forman una cadena de transferencia de fosfato in vitro (69). PTSNtr fosforila glucosa 1000 veces más lento que el PTS, sugiriendo que su función principal no es el transporte de carbohidratos (75). EINtr contiene un domino GAF que regula a algunos activadores dependientes del factor transcipcional σ54 (sigma54) lo que sugiere un papel regulatorio(76). Mutantes carentes de PtsN crecen mal en fuentes de orgánicas de nitrógeno cuando el carbono es limitante, pero crecen bien en glucosa (69). En E. coli aún no ha sido aislada una mutante en PtsP, pero su pérdida en otros organismos previene la expresión de genes importantes(77). HPr no parece estar involucrado en regulación (69). De estas observaciones no es obvio un modelo sobre cómo PTSNtr regula la expresión genética. Aunque está generalmente aceptado que la función del PTSNtr requiere de la cadena de transferencia de fosfato EINtr~P → Npr~P → EIIANtr~P para realizar su función, existe una gran diversidad en las proteínas del PTSNtr entre bacterias (ver figura 2)(de hecho R. etli parece no tener NPr pero sí copias funcionales de EINtr y EIIANtr (74)). Esto sugiere que existe reacción cruzada entre las proteínas del PTSNtr y del PTS(78). La estructura del complejo NPr:EIIANtr en solución(43) muestra una interfaz muy 14 Figura 2: Organización del operón rpoN en distintos organismos parecida a la de HPr:EIIA. HPr y NPr tienen una identidad de alrededor de 30% a lo largo de toda la proteína, lo que supone un plegamiento similar. También la estructura parcial de NPr (79) es idéntica a HPr. Aunque hay evidencia de reacción cruzada entre estos dos sistemas(78) nunca se ha observado transferencia de fosfatos de NPr a algún EII de PTS. Conexión entre el metabolismo del carbono y el metabolismo del nitrógeno. La regulación parece estar ligada tanto a las proteínas del PTSNtr como a las de PTS. Las enzimas clave para la utilización del nitrógeno se encuentran en el operón glnALG que codifica a la glutamato sintetasa (glnA) y el sistema de dos componentes NtrB (glnL) – NtrC (glnG). En condiciones limitantes de nitrógeno, NtrC~P bloquea la transcripción a partir del promotor principal σ54-dependiente glnAp1 (80). Aunque el promotor alterno σ70-dependiente glnAp2 es estimulado por Crp/cAMP(que esta a su vez regulada por el PTS), la expresión de glnA es mucho mayor en células crecidas en glucosa que en fructosa oglicerol ya que, según se tiene entendido, Crp/cAMP también reprime al promotor glnAp1 y este efecto es más fuerte que el activador (80). La observación de que al aplicar cAMP a células crecidas en glucosa la actividad de glnA se reduce siete veces (81) apoya este modelo. Mutantes en ptsN, crecidas en limitación de nitrógeno, tienen una reducción en la actividad del promotor glnAp2; en este caso aumentar cAMP no tiene efecto alguno (69). Estas mismas mutantes no pueden crecer en leucina o serina como fuente de nitrógeno y tienen crecimiento reducido en isoleucina (82). Suministrar ptsN en plásmido recupera el fenotipo, pero cuando el plásmido contiene ptsN 15 His73Ala (no es fosforilable) crece aún mejor que la proteína silvestre. También se ha propuesto un papel de EIIANtr en la regulación de la síntesis de algunos aminoácidos (82). Por otro lado, células crecidas en limitación de nitrógeno acumulan α-cetoglutarato(83), inhibidor alosterico no competitivo de EI(84) (se cree que el PTSNtr inhibe a la α-cetoglutarato dehidrogenasa (85)) . Esta interacción ocasiona que, cuando el nitrógeno es limitante para el crecimiento, la actividad del PTS ,y por lo tanto el consumo de carbohidratos, se ve reducida considerablemente. 16 ANTECEDENTES Los antecedentes experimentales relevantes, descritos en el artículo adjunto(86), corresponden a los grupos de investigación del Dr. Xavier Soberón y el Dr.Milton Saier. En este trabajo, que se realizó en gran medida durante mi maestría, se sustituyeron catorce residuos de la proteína NPr (K12P, L13N, A17T, M21A, F24V, E25K, Q28K, V49L, I50F, A51K, L53Q, M54T, D56G y A58T) en su superficie de interacción NPr-EIINtr por los correspondientes en HPr en esas posiciones (ver figura 3). Esta nueva proteína, denominada CPr14, fue capaz de complementar la actividad de HPr sobre un fondo genético BW25113(87):ΔptsH y ΔfruF (codificantes de HPr y FPr respectivamente), usando diversos azúcares PTS como fuente de carbono (figura 4)(glucosa, manitol, manosa, dulcitol y sorbitol). Los catorce residuos se eligieron examinando interfaz del complejo Hpr:EIImnt (ver figura 5). La figura 3 muestra, en el alineamiento superior los residuos que fueron mutados en NPr para generar CPr. El alineamiento inferior muestra la similitud entre secuencias: en verde los aminoácido conservados en las tres proteínas, en azul los conservado en dos y en rojo los solo presentes en una. 17 Figura 3: Alineamiento múltiple entre HPr, CPr y NPr Figura 4.-(Arriba) Perfil de crecimiento de múltiples cepas en diversas fuentes de carbono. Es claro que las cepas NPr y Cpr8 carecen casi por completo de actividad PTS. Cpr14 y HPr presentan perfiles de consumo similares a la cepa parental excepto por el consumo de fructosa (debido a la deleción del gen fruF). CPr6 sin embargo es capaz sólo de transportar algunos carbohidratos; existe información parcialmente responsable del trasporte de manitol y glucito que se encuentra en las otras 8 mutaciones. Figura 5.-(izquierda)Estructura del complejo HPr EIImnt (PDB 1J6T)(19) que fue usada como modelo para seleccionar las 14 mutaciones. HPr es la proteína verde, EIImnt la magenta. En rojo se muestran los 14 aminoácidos a ser sustituidos en NPr y en amarillo la histidina fosforilable. 18 Figura 4: Perfiles de crecimiento Figura 5: Interfaz HPr:EIIMtl Se construyeron diversos modelos de docking proteína-proteína para elucidar la naturaleza de este fenómeno. La figura 6 muestra los modelos obtenidos por HEX y MODELLER de los complejos de CPr y HPr con EIIA de manosa, manitol y glucosa. El número de modelos ser refiere a cuantas conformaciones superaron el umbral de energía para ser reportado o, en caso de no existir ninguno, la mejor conformación evaluada. La energía de unión mostrada corresponde a la función objetivo de HEX. Esta es teóricamente igual a ΔG en Kcal/Mol, pero los supuestos usados en el modelo de interacción hace que muchas veces este no se el caso. El RMSD (Root-mean-square deviation) es una medida promedio de la distancia de átomos sobrepuestos y, en este caso particular, de la distancia de los carbonos alfa del modelo tras el doking y el cristal (en el caso de HPr) o el modelo antes del docking (en los demás). El uso de MODELLER(88) y HEX(89) y específicamente la energía calculada y el RMSD han demostrado ser discriminantes para interacción y transferencia de fosfato a EII de NPr, HPr y CPr. Ya que un modelo rígido fue capaz de reconocer variantes funcionales, se sugiere que la transferencia de fosfato entre HPr (o CPr o NPr) depende más bien de la fuerza de interacción entre las caras de las proteínas que de algún cambio de conformación. 19 Figura 6: Reconstrucción de interacciones proteína-proteína por docking molecular Usando un sitio de restricción aseI, se construyeron las variantes CPr6 , con las primeras seis mutaciones, y Cpr8 , con las últimas ocho. Cpr8 fue incapaz de crecer en fuentes de carbono PTS. CPr6 presentó un crecimiento normal en glucosa, manosa y dulcitol pero nulo en sorbitol y manitol. (figura 4) 20 Los perfiles de crecimiento sugieren que Cpr14 transporta mejor manosa que HPr. Para comprobar esto se midió y comparo el transporte de 2-Desoxiglucosa (carbohidrato no metabolizable transportado específicamente por la permeasa de manosa) y glucosa marcadas radioactivamente (ver figura 7). Este experimento muestra claramente que HPr es mejor que CPr para fosforilar el transportador de glucosa. Sin embargo, en el caso del transportador de manosa CPr forsforila mejor que HPr. NPr, como era de esperarse, no fosforila a ninguno de estos transportadores. Existen muchas presiones de selección que acotan las mutaciones posibles sobre la cara de interacción HPr : interaccionar con suficiente afinidad con cada una de las EIIA del sistema PTS, interaccionar con EI y no interaccionar de más con EINtr o EIINtr. Entre tantas funciones que tiene HPr, es difícil imaginar que esté optimizada para alguna en particular (claramente no es óptima para el transporte de manosa). Modificar la cara de interacción de NPr nos podría permitir controlar el flujo de fosfato de PEP al carbohidrato de nuestra elección, permitiéndonos desarrollar cepas con interés biotecnológico. Claramente, mutar 14 residuos basados en un cristal es un experimento burdo de ingeniería genética; no sabemos cuales de estas mutaciones son realmente necesarias para el fenotipo o incluso si algunas son 21 Figura 7: Comparación en la actividad de las permeasas de glucosa y manosa deletéreas para el sistema PTS. Un estudio metódico y exhaustivo de estos catorce cambios es necesario. 22 HIPÓTESIS Existe un subconjunto propio de los 14 residuos que debe ser clave en las interacciones proteína- proteína realizadas por HPr, de tal forma que le permitan interaccionar con las diversas EII de manera diferencial. Dicho conjunto es discernible mediante la utilización de una biblioteca binaria de mutantes de la proteína homóloga Npr. OBJETIVOS 1) Generar una librería binaria de las 14 mutaciones en NPr. 2) Caracterizar variantes de NPr según su patrón diferencial de consumo de cinco azúcares PTS: glucosa, manosa, manitol, sorbitol, dulcitol. 3) Modelar, mediante herramientas bioinformáticas, la estructura y posibles interacciones con EII de las mutantes NPr. 4) Proponer un modelo sobre la especificidad de la interacción con EII que confieren estos 14 aminoácidos. DISEÑO EXPERIMENTAL En este estudio se utilizó la cepa BW25113 de E. coli y una variante doble mutante (Δ ptsH, ΔfruF) de BW25113(87) (llamada 2Δ). La librería de 16384 variantes fue clonada en el plásmido pZE12(90) . 23 Se usó el método de separación de resina (“resin-splitting”) (91) parageneral la librería binaria ya que es capaz de generar solo la variación que nos importa explorar. Otras técnicas como mutación aleatoria o barajado de genes generan variación “inútil”. Se uso el plásmido PZE12 y la cepa 2Δ para que los resultados fueran directamente comparables con los del articulo adjunto. Ya que 2Δ carece de un sistema PTS activo, su crecimiento en LB es reducido. Esto causa que esta cepa produzca muy poco plásmido. Por esta razón se uso la cepa MC1061 (92) tanto para producir suficiente plásmido para las ligaciones así como para amplificar la librería binaria. 24 Figura 8: Diagrama de flujo del diseño experimental Construcción de librería binaria Construcción de la librería La librería binaria se ensambló con una variación del método usado para armar CPr (ver figura 9). Ocho oligonucleótidos que cubren el gen NPr (tres de ellos mutagénicos) se juntaron por pares por medio de reacciones de PCR (denominados P1, P2, P3 y P4). Solo P1 y P4 requieren NPr como templado. Los productos de PCR fueron purificados usando un gel nativo de acrilamida al 15%. Tras otra ronda de PCR, P1 y P2 generan H1, así como P3 y P4 generan H2. Se purificó de nuevo. Una última reacción de PCR de H1 con H2, amplificada con los oligonucleótidos “forward” y “reverse” generó el fragmento completo correspondiente a la librería armada. Figura 9: Distribución de los ocho oligonucleótidos que usaron para ensamblar la librería binaria. 25 Oligonucleótidos mutagénicos Tres oligonucleótidos mutagénicos (F2, R3 y R3) se ensamblaron por el método de separación de resina(91) : cada uno de los catorce codones por explorar se sustituyó con un tercio del codón correspondiente a HPr y dos tercios del correspondiente a NPr. Así, tomando en cuenta la composición esperada en cada codón, F2 está compuesto por 23 = 8 variantes, R3 por 24 = 16 variantes y R5 por 27 = 128 variantes. Cuando se combinan con otros oligonucleótidos estándar para armar la librería binaria, se generan un total de 16384 (8*16*128) variantes. Los oligonucleótidos mutagénicos ensamblados por separación de resina se sintetizan de manera ordinaria, en fase sólida, adicionando nucleótido por nucleótido hasta llegar a la región variable. Entonces la columna se abre y una porción se transfiere a una segunda columna, mientras que el resto se mantiene en la primer columna. Para el caso particular de los oligonucleótidos ensamblados en este trabajo, un tercio de la resina se transfirió a la segunda columna, donde se ensambló el codón mutante nucleótido por nucleótido, mientras que en la primer columna se ensambló el codón silvestre de igual manera. Concluida la síntesis de ambos codones de manera independiente, las resinas se mezclaron en la primer columna y nuevamente se transfirió un tercio a la segunda columna para continuar con la síntesis del segundo codón mutante, mientras que en la primer columna se sintetizó el segundo codón silvestre. Este proceso de partición de resina, síntesis y mezclado se repitió para cada posición a explorar y las resinas se juntaron en una sola columna cada vez que los codones por sintetizar fueran los inmutables, es decir, aquellos que siempre deberían permanecer silvestres. Esta técnica es muy versátil, porque en base a la proporción de resina separada se puede manipular el contenido de mutaciones en las variantes(93). No hay razón para limitarse a solo dos codones ni a 26 regiones variantes del la misma longitud. Transferir un porcentaje pequeño de la resina generará variantes con pocos reemplazos, mientras que transferir un porcentaje alto generará variantes con alta proporción de mutaciones. Plásmido PZE12-TrpF-Luxp Con la finalidad de poder diferenciar rápidamente por PCR de colonia aquellas clonas que contenían un inserto de la librería de aquellas que conservaban el fragmento silvestre, se clonó en el plásmido PZE12 la fusión proteica TrpF-LuxP usando los mismos sitios de restricción (EcoRI y HindIII). El tamaño de este inserto (900 bp) es claramente distinguible del tamaño de la librería y de NPr (400bp). Figura 10: Gel del plásmido TrpF-LuxP Se probaron varias condiciones para la ligación (ver métodos), donde la mejor produjo 126 variantes por 10μl de células transformadas (de un total de 1000μl). Esta ligación debería alrededor de 63000 27 variantes (126 * 100 del micro-litro de la transformación*5 de la mezcla de ligación restante). Con esta cantidad de variantes (sin corregir para las posibles mutantes y las que no tengan el inserto) cada una de las 16384 variantes tiene 98% de probabilidad de estar representada. Sin embargo, con estos números sólo hay una posibilidad muy baja (1.8 x10-100) de observar al menos una vez cada una de las variantes. Finalmente, usando estas concentraciones, se generaron cinco nuevas ligaciones que, tras transformarse, dieron lugar a una diversidad combinada de 250,000 clonas individuales lo que da 99.6% de posibilidad de observar todas las variantes por lo menos una vez. Estas trasformaciones fueron crecidas en LB y se extrajo plásmido super-enrollado. El DNA de las cinco librerías se mezcló en proporciones definidas para normalizar (ver métodos). Probar construcción Para explorar la diversidad de la librería sin expresar las variantes se uso el plásmido pJET 1.2 blunt(ver figura 11). En este vector el sitio de clonación interrumpe el gen de una enzima de restricción letal (eco47IR) de tal forma que el plásmido ligado sobre sí mismo no es viable. Con este método se obtuvieron alrededor de 1000 colonias al platear 20 μl. De estas se secuenciaron quince (figura 12). Se muestran en naranja/azul los catorce residuos; en naranja los correspondientes a NPr (silvestre) y en azul los correspondientes a HPr (mutantes). En magenta se muestras las mutaciones no deliberadas que fueron probablemente introducidas por PCR durante el armado del gen. 28 Figura 11: El plásmido pJET Las secuencias de estas variantes muestran tres puntos importantes. Primero, todas las 14 mutaciones están presentes por lo menos en una de las variantes, lo que indica que los oligonucleótidos están bien sintetizados y el banco puede tener la diversidad suficiente. Segundo, la frecuencia de las mutaciones introducidas deliberadamente observada (35%) es muy parecida a la esperada (33%). Tercero la frecuencia de mutaciones no deliberadas es baja. Transformación de la librería. Una vez probada la construcción, se clonó en el plásmido PZE12 producido a partir de la digestión de PZE12-TrpF-Luxp. ya que la selección en manitol distingue mejor las células con un PTS activo, esta librería fue transformada en células 2Δ y crecida en MM + AMP + manitol (1 g/l) . Se seleccionaron 10 colonias para extraer plásmido y se secuenciaron 7 de ellas(ver figura 13). De estos datos solo se puede proponer a la mutación A58T como importante para la actividad (ver pruebas estadísticas) 29 Figura 12: Variantes del plásmido pJET Selecciones y plásmidos En teoría las variantes obtenidas con el plásmido PJET no están sujetas a ninguna selección, ya que éste no es un vector de expresión y las células fueron crecidas en la cepa MC1061 que tiene un PTS intacto. Esto nos permite estudiar si hay desviación con respecto al diseño de la librería (1/3 de mutantes en las posiciones relevantes. También nos da una base contra la cual comparar las otras condiciones. Las variantes obtenidas de LB están sujetas a una selección leve; aunque un PTS funcional no es estrictamente necesario para el crecimiento, puede ayudar. Además, el plásmido PZE12 es un vector de expresión y algunas de las proteínas de la librería podrían ser tóxicas para la célula. Por tóxica se entiende que se pliega mal y se agrega. Las variantes obtenidas de MM/manitol estás sujetas a una selecciónfuerte. Un sistema PTS funcional es necesario para el crecimiento. Podrían crecer cepas que expresen variantes de la librería ligeramente tóxicas pero funcionales. Aclimatar cultivos 30 Figura 13: Secuencias de variantes crecidas en MM/manitol Con el fin de evitar el lavado mecánico del medio, que en este caso ha mostrado reducir considerablemente el número de células viables, y de iniciar el programa genético que permitirá a las bacterias crecer en distintas fuentes de carbono, las células fueron sometidas a varios pases por cultivos líquidos. Primero se tomó 2 µl de la transformación para crecer en LB/AMP y verificar que el número de Unidades Formadoras de Colonia (UFC) fuera suficiente. En paralelo, la transformación se usó para inocular 50 ml de LB/AMP líquido y se incubó a 30°C toda la noche. Tomando 1mL de este cultivo, se inocularon cinco matraces con 50 ml de medio mínimo, más uno de los carbohidratos (manosa, manitol, dulcitol, sorbitol o glucosa) como fuente de carbono. Tras crecer toda la noche, se usó 1 ml de cada uno de estos cultivos para inocular un matraz con el mismo medio y se creció una vez más. Secuenciación Sanger Finalmente se plateó 100μL de estos cultivos en cajas con medio sólido con la fuente de carbono correspondiente. Se picaron 96 colonias, 14 de cada carbohidrato y 26 de LB para crecer en 5ml de LB. Se extrajo plásmido de estas 96 cepas usando un kit comercial de ROCHE. Los plásmidos se mandaron secuenciar a la unidad de secuenciación del IBT. Los resultados para LB se muestran a continuación. 31 Figura 14: Secuencias de variantes crecidas en LB Estos datos corroboran que la librería clonada en el plásmido PZE12 está bien construida y están representadas las catorce mutaciones. Para el caso de las 70 secuencias en selección, todas, con la excepción de dos, fueron la misma variante ; aquella con las diez mutaciones esperadas K12P, L13N, A17T, M21A, F24V, Q28K, V49L, M54T, D56G Y A58T así con la mutación no esperada E33V(en verde en la figura 14). Existen dos posibilidades para explicar este comportamiento. La primera es que la adecuación proporcionada por esta combinación de mutaciones es enorme, tanto que la variante es capaz de desplazar fácilmente a las demás variantes en todas las selecciones probadas. La otra posibilidad es que sea un fenómeno causado por el efecto fundador al hacer tantos pases por medio fresco. Cualquiera sea el caso, se ha encontrado una nueva mutación que parece ayudar a que NPr adquiera la actividad de HPr. Resumen de secuencias 32 Tabla 2: Resumen de secuencias N= 15 18 7 mutación/experimento PJET LB MTL K12P 5 11 1 L13N 8 9 0 A17T 5 5 1 M21A 8 7 3 F24V 6 9 3 E25K 4 8 1 Q28K 3 9 4 V49L 11 11 4 I50F 4 7 5 A51K 1 3 4 L53Q 1 2 1 M54T 5 7 1 D56G 8 11 5 A58T 6 10 5 total 75 109 38 35.71% 43.25% 38.78%%mut Esta tabla resume los resultados de las secuencias de diversas variantes en los medios de cultivo probados. Cada fila muestra una de las 14 mutaciones y el número de ocurrencias. Se secuenciaron 15 variantes de PJET, 18 de LB y 7 de manitol. DISEÑO MODELADO COMPUTACIONAL La figura 15 muestra los pasos seguidos para obtener un modelo de la aportación de cada una de las catorce mutaciones a la actividad. Ya que la interacción Hpr:EII parece ser fundamentalmente electrostática la energía de interacción calculada por un método de docking rígido debería ser 33 Figura 15: Diseño modelado computacional proporcional a la ΔG real. Esto nos significa que la relación entre las energías de los modelos se conserva ; si el primero interacciona mejor que el segundo con EII Hex puede reconocer esto (aunque tal vez no reconozca del todo la magnitud de la diferencia). Se usó Hex para calcular la energía de interacción de los modelos de cada una de las 16384 estructuras contra EIIMtl. Para calcular la aportación de la mutación K12P se separaron estas 16384 energías en dos poblaciones: la primera con las 8192 energías correspondientes a los modelos que tienen las mutación, y la segunda con las 8192 energías de los modelos que no la tiene. Esta partición no da dos poblaciones pareadas, cada energía en la primera corresponde a una en la segunda (la del modelos con secuencia idéntica excepto por la mutación K12P). Se realizo una prueba T de Student(94) sobre estos datos para obtener que el aporte de la mutación K12P a la interacción con EIIAMtl es de 3.58 (desviaciones estándar sobre la media). Se repitió este proceso para cada Mutación y para cada EIIA con estructura conocida (manitol, manosa y glucosa) para proponer un modelo (ver tabla 6 en resultados). 34 RESULTADOS Comparación entre PJET y la hipótesis nula. Los oligonucleótidos mutagénicos se construyeron de tal forma que cada codón tiene aproximadamente un 33% de probabilidad de estar mutado. Usando esta información como hipótesis nula, suponiendo que las secuencias en PJET no están sujetas a ninguna selección, con una distribución binomial se puede inferir si la síntesis de los oligonucleótidos y/o el armado de la librería introdujeron sesgo a la proporción de mutantes. En este caso la mutación V49L (en verde) está sobre representada (p<0.02) y las mutaciones A51K y L53Q están subrepresentadas. 35 Tabla 3: Comparación entre secuencias en pJET y la hipótesis nula N= 15 mutación PJET binomial K12P 5 0.6184 L13N 8 0.9692 A17T 5 0.6184 M21A 8 0.9692 F24V 6 0.7970 E25K 4 0.4041 Q28K 3 0.2092 V49L 11 0.9997 I50F 4 0.4041 A51K 1 0.0194 L53Q 1 0.0194 M54T 5 0.6184 D56G 8 0.9692 A58T 6 0.7970 Efecto del tamaño de muestra en la inferencia estadística Las gráficas de la figura 16 describe el tamaño mínimo de muestra para obtener α=5% y β=20%. según la desviación observada respecto al modelo (33% de mutantes en todos los sitos). α es la probabilidad de que nuestra prueba concluya erróneamente que la proporción de mutantes en un posición está sesgada cuando en realidad es efecto del muestreo (falso positivo). β es la probabilidad de que la prueba concluya que no existe sesgo en una posición cuando en realidad sí lo hay (falso negativo). 36 Effect size g To ta l s am pl e siz e Exact - Proportion: Difference from constant (binomial test, one sample case) Tail(s) = Two, Constant proportion = 0.33, α err prob = 0.05, Power (1-β err prob) = 0.8 0 50 100 150 200 250 -0.3 -0.25 -0.2 -0.15 -0.1 2 2 2 15 15 20 20 24 24 28 28 32 36 40 48 55 59 70 77 95 109 134 161 205 Figura 16: Efecto del tamaño de muestra en la inferencia estadística Effect size g To ta l s am pl e siz e Exact - Proportion: Difference from constant (binomial test, one sample case) Tail(s) = Two, Constant proportion = 0.33, α err prob = 0.05, Power (1-β err prob) = 0.8 0 50 100 150 200 250 300 350 0.1 0.15 0.2 0.25 0.3 0.35 374 287 231 187 154 132 111 95 87 74 66 61 58 48 47 43 38 37 31 31 26 26 26 23 21 19 19 19 18 1616 Como se espera que el que exista sesgo sea un evento más bien raro, en general se acepta que β sea mayor que α. La primera gráfica explora tamaños de efecto g entre -0.32 y -0.8 (de 1% a 25% de frecuencia de sustitución observada). Así mismo la segunda gráfica explora tamaños de efecto g entre 0.07 y 0.37 (de 40% a 70% de frecuencia de sustitución observada). Con el actual tamaño de muestra N=15 en PJET solo sesgos muy evidentes como V49L (11/15 observado contra 5/15 esperado) pueden alcanzar este nivel de certeza. La única forma de poder tener más certeza sobre nuestras predicciones, así como poder usar criterios más estrictos, es aumentar considerablemente el tamaño de muestra (N=200 sería un buen comienzo). Comparación entre PJET y LB Al comparar la frecuencia de ocurrencia de cada mutación entre las variantes con la librería clonada en el plásmido pJET y aquellasdonde se clona en el plásmido PZE12, ambas crecidas crecidas en LB se busca elucidar su efecto en la toxicidad. Una mutación poco frecuente en PZE12 como a L53Q, se explica por el hecho de que también es poco frecuente en pJET, indicando que existe un sesgo en la librería. Una mutación con mayor proporción en PZE12 podría indicar actividad PTS, mientras que una con menor indicaría que es desventajosa para el (crecimiento probablemente es tóxica). 37 La segunda columna muestra el P-valor obtenido a partir de una distribución binomial para cada mutación. Esta prueba infiere sobre que tan probable es que las diferencias en las proporciones de substitución observadas entre las dos condiciones se deban al azar. Se marcan con verde las mutaciones que ayudaron significativamente al crecimiento en LB (p<0.05). Al corregir para el tamaño pequeño de muestra con una prueba de Fisher(95) se pierde la significancia estadística (tercera columna). De este estudio se concluye que el efecto de estas mutaciones en el crecimiento de la cepa 2Δ en LB es pequeño. Un mayor número de muestras sin duda es necesario para aseverar esto con certeza. Comparación entre LB y MTL Comparar la frecuencia de ocurrencia de cada mutación entre las variantes con la librería clonada en el plásmido PZE12 aisladas de medio LB y aquellas aisladas en MTL nos dará una inferencia sobre la aportación, positiva o negativa, de esa mutación al crecimiento celular, y por ende a la actividad del sistema PTS. 38 Tabla 4: Comparación entre PJET y LB mutación K12P 0,9961 0,1663 L13N 0,4791 1,0000 A17T 0,4122 1,0000 M21A 0,1606 0,4939 F24V 0,8653 0,7285 E25K 0,9708 0,4688 Q28K 0,9991 0,1451 V49L 0,1802 0,7120 I50F 0,9205 0,7120 A51K 0,9716 0,6074 L53Q 0,8857 1,0000 M54T 0,7767 1,0000 D56G 0,8147 0,7325 A58T 0,9424 0,4905 binomial p-fisher La segunda columna muestra el P-valor obtenido a partir de una distribución binomial para cada mutación. Esta prueba infiere sobre que tan probable es que las diferencias en las proporciones de sustitución observadas entre las dos condiciones (LB y manitol) se deba al azar. Se marcan con verde las mutaciones que ayudaron significativamente al crecimiento en manitol y con rojo las que perjudicaron (p<0.1). Al corregir para el tamaño pequeño de muestra con una prueba de Fisher (tercera columna) solo se conserva significancia estadística en dos posiciones. En particular la mutación A51K también fue descrita por el método de docking molecular como importante para la actividad PTS en MM/MTL. MODELO 39 Tabla 5: Comparación entre LB y MTL mutación binomial P-fisher K12P 0.0161 0.0730 L13N 0.0078 0.0267 A17T 0.3784 0.6372 M21A 0.7314 1.0000 F24V 0.5000 1.0000 E25K 0.1078 0.3548 Q28K 0.7734 1.0000 V49L 0.5557 1.0000 I50F 0.9839 0.2016 A51K 0.9980 0.0664 L53Q 0.8221 1.0000 M54T 0.1736 0.3623 D56G 0.8264 1.0000 A58T 0.8922 0.6592 Tras realizar los pasos descritos en el diseño del modelado computacional se propuso un valor para la aportación de cada uno de los 14 aminoácidos mutados a la interacción de HPr con las tres EIIA de las que existe estructura cristalina. El valor se obtiene con una prueba t de Student(94) (se evaluó también con una prueba t de Welch(96) para varianzas diferentes y el resultado fue idéntico). Se tomó +- 3 como valor de corte (p=0.003) para definir significancia estadística. Los valores mayores a 3 (en verde) indican que en esa posición es ventajoso el codón mutante (el de HPr), los menores a -3 (en rojo) indican que el codón silvestre (el de NPr) es ventajoso para la interacción. Este modelo es congruente con los resultados experimentales y confirma que la mutación A51K es relevante para la actividad. También el modelo propone que la cepa CPr6 no tiene actividad en manitol ya que le falta la mutación A51K y/o le sobra la M54T. Finalmente, estos perfiles de aportación energética sugieren que la interacción HPr:EIIMtl parece tener una orientación ligeramente distinta a HPr:EIIGlc o HPr:EIIMan . 40 Tabla 6: Modelo del aporte de cada mutación a la actividad HPr MUT\prueba T glucosa manosa K12P 3.58 -9.86 -6.27 L13N -0.21 0.44 0.84 A17T -2.83 3.34 -0.83 M21A 0.75 -2.27 0.05 F24V 5.36 -6.17 0.76 E25K 1.72 26.59 23.3 Q28K -1.4 13.71 12.43 V49L 0.21 0.78 -0.44 I50F -0.7 5.43 -1.49 A51K 6.22 12.26 8.8 L53Q 1.02 1.5 1.22 M54T -9.46 -1.79 -0.99 D56G 2.97 -2.71 4.92 A58T 0.58 2.9 1.67 Manitol CONCLUSIONES Construimos una librería binara de un gen completo usando oligonucleótidos sintetizados con la técnica de separación de resinas. Dicha librería presento una distribución de mutaciones cercana a la esperada y nos permitió, por lo menos en el caso de la interacción con EIIMtl, elucidar la importancia de algunos aminoácidos a la actividad HPr. Incluso con un tamaño de muestra pequeño fue posible identificar la mutación A51K como importante para la actividad PTS y la mutación L13N como detrimental . Los resultados de docking molecular son congruentes con los obtenidos experimentalmente, en particular la mutación A51K también fue identificada como importante para la actividad PTS en manosa, manitol y glucosa. Esto es congruente con el articulo adjunto ya que esta sustitución también está presente en la cepa CPr6 que crece bien en manosa y glucosa (pero no en manitol). Ninguna de las 14 mutaciones es estrictamente necesaria para la actividad PTS en ninguno de los medios probados. Existen múltiples subconjuntos de estas catorce mutaciones que tienen actividad y algunas mutaciones parece sen más importantes en algunas selecciones que otras (E25K parce aportar mucho a la actividad en manosa y glucosa, pero poco en manitol). PERSPECTIVAS Ya que el tamaño de muestra afecta la confianza en la pruebas estadísticas, es indispensable incrementarlo. Sin embargo, el número de secuencias necesarias para inferir la contribución a la actividad PTS de algunas de las sustituciones es tan elevado que no es práctico obtenerlas por 41 secuenciación de Sanger. Un método usando secuenciación masiva como el propuesto en este trabajo resolvería este problema al obtener millones de secuencias en cada medio de selección. Estos experimentos se están realizando actualmente. La construcción de la mutante sencilla A51K o de cualquiera de las variantes propuestas por el docking nos dará un mejor entendimiento de la interacción HPr-EIIA. El comprender plenamente la comunicación entre los sistemas PTS y PTSNtr así como entender las interacciones entre HPr y sus parálogos con las diversas EIIA nos permitirá regular el flujo de carbono y en especial respecto al orden y velocidad de consumo de los azúcares PTS. Metodología secuenciación masiva La librería binaria solo tiene dos regiones variantes (ver figura 17. las mutaciones están marcadas en naranja). Usando los oligonucleótidos marcados en azul para amplificar con PCR se genera un oligonucleótido de 218 bp que podría ser secuenciado por ilumina pair-end 2x75 (regiones en naranja) o por ion torrent (el producto completo). En nuestro caso se amplificaría por PCR la sección central del gen de un plásmido proveniente de selección en una fuente de carbono particular. El primer Forward contiene una etiqueta que permitirá saber de qué selección viene esta molécula en particular. El oligonucleótido reverse tiene una etiqueta que codifica para el tiempo en que se tomó la muestra. El producto de PCR de 218bp purificado se mezclará con los provenientes de otras selecciones y tiempos y serán secuenciados en una sola reacción. 42 Figura 17: Regiones variables de la librería binaria Con el fin de poder contener fácilmente los errores de secuenciación se diseñaron estas etiquetas con información redundante. Cada etiqueta es de 7 pares de bases, las primeras tres identifican ya seael tiempo o la selección. Ninguna mutación sencilla puede transformar una en otra y darnos un falso positivo. Las siguientes cuatro se obtienen a partir de operaciones binarias con las tres primeras bases. De esta forma si una base está mutada hay forma de recuperar la información. Las funciones binarias son: Tabla 7: Funciones binarias 43 Función {+} ( X {+} Y = Z ) Función {sii} ( X {sii} Y = Z ) X Y Z X Y Z A A A A A C C C C A T G T T G T G G C A C C A A C A C C T T T G G G G T T A G T A T C T C G T A T C G C G A G A T G A G C G C T T C T A G A G C Con estas funciones las 7 bases de la etiqueta se definieron 1,2,3, 1 {+} 2 , 2 {+} 3, 3 {sii} 1 y 1{ssi}2. Para evaluar el cambio en la abundancia relativa de las variantes se planea extraer muestras del primer cultivo en cada medio de selección a diferentes densidades ópticas (0.2 ; 0.5 ; 1.0 y 1.0 + 3h). A esta muestra se le realizará PCR de cultivo con los oligonucleótidos correspondientes para el medio de selección y el tiempo. También se obtendrá un PCR del medio en LB (tiempo 0, sin selección) con la intención de normalizar y poder capturar los cambios en la población de secuencias. Pruebas de PCR de cultivo usando en diferentes combinaciones de cultivo, oligonucleótido forward y oligonucleótido reverse. De izquierda a derecha las muestras son: marcador,1,2,3,4 y 5 muestra cultivo oligonucle ótido forward oligonucle ótido reverse 1 CPr8 LB 0 2 CPr8 LB 12 3 CPr8 Glc 0 4 CPr8 Glc 12 5 CPr6 LB 0 Se puede observar que todas las bandas son congruentes con el tamaño esperado de 218pb Se planea purificar estos 25 PCR ( 6 medios x 4 tiempos +tiempo 0), normalizarlos y secuenciarlos en una sola reacción del chip 316 de ion torrent. 44 Figura 18: Producto de PCR de los oligonucleótidos con etiquetas MÉTODOS Cepas Se usaron las cepas descritas en el artículo (MC1061 (92) y 2delta(86) ). Medios LB El medio LB se preparó según describe Bertani (97) . En caso de necesitar antibiótico se le agregó una solución stock de ampicilina para llegar a una concentración final de 200μg/ml. En caso de ser sólido se le agregó agar para llegar a una concentración de 1.5%. A 900ml de H2O agregar: 20g Tryptona 5g Extracto de levadura 2ml 5M NaCl 2.5ml 1M KCl 10ml 1M MgCl2 10ml 1M MgSO4 20ml 1M glucosa Aforar a 1L con H2O ,esterilizar en la autoclave. M9 El medio minino M9 se preparó según describe Adams (98). En caso de necesitar antibiótico se le agregó una solución stock de ampicilina para llegar a una concentración final de 200μg/ml. En caso de ser sólido se le agregó agar para llegar a una concentración de 1.5%. A menos que se indique de otra forma, se usó una concentración final de 1g/l para todas las fuentes de carbono. 45 Sales m9(5X) A 800ml agregar: 64g Na2HPO4-7H2O 15g KH2PO4 2.5g NaCl 5.0g NH4Cl Agitar hasta disolver. Aforar a 1000ml con H2O. Esterilizar en la autoclave. Medio mínimo M9 A 700ml de H2O (estéril) agregar: 200ml sales M9 2ml 1M MgSO4 (estéril) Aforar a 1000ml con H2O. Esterilizar en la autoclave. SOC El medio SOC se preparó según describe Hanahan (99) . A 900ml de H2O se agregan: 20g tryptona 5g extracto de levadura 2ml 5M NaCl. 2.5ml 1M KCl. 10ml 1M MgCl2 46 10ml 1M MgSO4 20ml 1M glucosa Aforar a 1000ml con H2O. Esterilizar en la autoclave. GYT El medio GYT se preparó según descrito por Tung(100) . A 70 ml de H2O se agregan: 0.25g tryptona 0.125g extracto de levadura 10ml glicerol 100% Aforar a 100ml con H2O. Esterilizar por filtro de 0.22μm. Otros BufferF 600 mM tris-HCl, 150 mM NH4PO3 , 20 mM MgCl2, pH 9 dNTP's 2.5mM ATP, 2.5mM CTP, 2.5mM TTP, 2.5mM GTP. Oligonucleótidos split resin Para armar la librería se usaron los siguientes oligonucleótidos: 47 Oligonucleótido secuencia forward CGA GAA TTG TGA GCG GAT AAC R1 CTT GAC GGT CAT GGT ACC TTT C F2* G ACC GTC AAG CAA ACT GTT GAA ATC ACA AAC [AAG/CCG] [CTG/AAC] GGC ATG CAT [GCC/ACC] CGG CCT GCA R3* TAA GAG CAC TTC AGC GTC AAA ACC [CTG/CTT] CAT TAA [TTC/TTT] [AAA/TAC] CAG CTT [CAT/GGC] TGC AGG CCG F4 AGT GCT CTT ACG TAA TGA CGA AGG CAC CGA GGC TGA AGC CAA C R5* AAT CTG CCG TCC TTT [GGC/AGT] AGA [ATC/GCC] CAA [CAT/AGT] [CAG/CTG] CAG [CGC/TTT] [AAT/AAA] [AAC/CAG] GCT GTT GGC TTC A F6 ACG GCA GAT TGA AGT TGA AGC GAC CGG TCC ACA GGA AGA GGA AGC ACT GGC CGC CGT T reverse GAC AAA CAA CAG ATA AAA CGA AAG G Tabla 8: Oligonucleótidos para armar la librería Los oligonucleótidos marcados con * son aquellos sintetizados por el método de separación de resina. Armado de la librería La librería se armó a partir de las mitades del gen (H1 y H2) proporcionadas por Filiberto Sánchez en un PCR con los siguientes ingredientes: H1 10μl H2 10μl oligonucleótido forward (10pm/μl) 4μl oligonucleótido reverse (10pm/μl) 4μl dNTP's 10μl bufferF 10μl taq(2U/μl) 5μl H2O 47μl Se usó una maquina “GeneAmp PCR System 9700” con el programa: 95°C x 5min ,(95°C x 1min , 48 60°C x 1min, 72°C x 1min) *30, 72°C x 5 min. Análisis del producto de PCR por gel de agarosa. El tamaño del fragmento observado concuerda con el esperado para la librería binaria de NPr (400bp) Plásmido PZE12-TrpF-LoxP El plásmido PZE12-NPr se digirió mezclando: 50μl plásmido 5μl bufffer 2(new ingland biolab) 1μl HindIII 1μl EcoRI Se dejó reposar a 37°C toda la noche. Se corrió la muestra en gel de agarosa al 2%, se tiñó con bromuro de etidio y se cortó la banda correspondiente al plásmido lineal sin inserto (+/- 3000bp). Esta banda se purificó con columna de fibra de vidrio (ROCHE) siguiendo las instrucciones del fabricante. La secuencia TrpF-LoxP(101) (GAATTCATATGCATCATCATCATCATCACGGGGAG AATAAGGTATGTGGCCTGACGCGTGGGCAAGATGCTAAAGCAGCTTATGACGCGGGCGCGA TTTACGGTGGGTTGATTTTTGTTGCGACATCACCGCGTTGCGTCAACGTTGAACAGGCGCA GGAAGTGATGGCTGCGGCACCGTTGCAGTATGTTGGCGTGTTCCGCAATCACGATATTGCCG ATGTGGTGGACAAAGCTAAGGTGTTATCGCTGGCGGCAGTGCAACTGCATGGTAATGAAGA ACAGCTGTATATCGATACGCTGCGTGAAGCTCTGCCAGCAGGAGGGTCGACCATAACTTCGT 49 ATAATGTATACTATACGAAGTTATCCTCGAGCGGTGGCCATGTTGCCATCTGGAAAGCATTAA GCGTCGGTGAAACCCTGCCCGCCCGCGAGTTTCAGCACGTTGATAAATATGTTTTAGACAA CGGCCAGGGTGGAAGCGGGCAACGTTTTGACTGGTCACTATTAAATGGTCAATCGCTTGGC AACGTTCTGCTGGCGGGGGGCTTAGGCGCAGATAACTGCGTGGAAGCGGCACAAACCGGC TGCGCCGGACTTGATTTTAATTCTGCTGTAGAGTCGCAACCGGGCATCAAAGACGCACGTC TTTTGGCCTCGGTTTTCCAGACGCTGCGCGCATATTAATGAGCTAGCGGCAAACCAATCCAA GCTT) fue donada por Humberto Flores en forma ya digerida. La ligación se realizó en la siguiente mezcla: PZE12 5μl TrpF-Loxp 2μl bufferF 2μl H2O 10μl ligasa T4 1μl Se reposó a 18°C durante 12 horas. La mezcla de ligación se trató con butanol para remover sales de acuerdo al protocolo siguiente: 1.-Agregar 700 μl de butanol a la mezcla. 2.-Centrifugar a 13000 rpm durante 10 minutos. 3.-Remover el sobrenadante con una micropipeta con cuidado de no desechar la pastilla. 4.-Secar la mezcla a 60°C al vacío y centrifugar hasta quedar completamente seco. 5.-Resuspender en 10 μl de H2O. 50 Purificar plásmido PZE12 El plásmido PZE12-TrpF-LuxP se transformó en células MC1061 y se crecieron en cajas LB/AMP. Se inoculó una colonia en LB líquido y se creció en condiciones ordinarias, para finalmente extraer plásmido con una columna comercial (Roche). PZE12-TrpF-LuxP tras digestión con las enzimas HindIII y EcoRI (). Nótese que tras liberar el inserto existen dos bandas del gen digerido Figura 19: Digestión de PZE12-TrpF-LuxP El plásmido PZE12-TrpF-luxP se digirió en las mismas condiciones de PZE12-NPr. Esta digestión no es completa y da dos bandas (figura 19). Para poder elucidar el origen de estas bandas, ambas se purificaron a la grande se le denominó M y a la chica B (figura 20). M fue cuantificada en 30ng/μl y B en 15ng/μl. Se hicieron ligaciones en diversas concentraciones. Las mezclas de ligación fueron transformadas en la cepa MC1061 y se usaron dos controles adicionales C- que fueron células electroporadas sin DNA y C--
Compartir