Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Análisis de la regulación transcripcional del gen FOXP2 desde un enfoque evolutivo Tesis presentada para optar al título de Doctor de la Universidad de Buenos Aires en el área Ciencias Biológicas Lic. Alfredo Leandro Caporale Directora de Tesis: Dra. Lucía Franchini Consejero de Estudios: Dr. Marcelo Rubinstein Instituto de Investigaciones en Ingeniería Genética y Biología Molecular “Dr. Héctor N. Torres” INGEBI-CONICET Buenos Aires, Marzo 2020 RESUMEN Análisis de la regulación transcripcional del gen FOXP2 desde un enfoque evolutivo. Determinar los vínculos existentes entre cambios a nivel genético y la evolución del cerebro humano es uno de los mayores desafíos a los que se enfrenta la era post-genómica. Nuestra hipótesis es que la adquisición de nuevos patrones de expresión de genes relacionados con el desarrollo y la función cerebral en el linaje humano, habría sido crítica para la evolución neuroanatómica de nuestro cerebro y sus capacidades cognitivas diferenciales. Estos nuevos territorios de expresión estarían codificados en parte por cambios en la secuencia de regiones regulatorias de genes que se expresan en cerebro. En nuestro laboratorio, la utilización combinada de herramientas bioinformáticas propias y el análisis de resultados generados por otros laboratorios nos ha permitido identificar las zonas del genoma humano que acumulan mayor número de regiones no-codificantes que muestran signos de evolución acelerada (Human Accelerated Regions: HARs) en comparación con otras especies de mamíferos y vertebrados. En este trabajo nos propusimos analizar el agrupamiento y la distribución de HARs para un locus en particular: el gen FOXP2. Para ello decidimos considerar la estructura tridimensional que adopta la cromatina en esta región, es decir el Dominio Topológicamente Asociado en el que se localiza este gen (TAD-FOXP2), en particular en la placa cortical humana de 16 semanas de gestación, tejido embrionario donde se expresa este gen y ocurre un pico de neurogénesis y migración neuronal. Determinamos que el TAD-FOXP2 se encuentra dentro de las regiones más aceleradas de todo el genoma, lo que podría significar una regulación transcripcional diferencial para este gen en humanos. El gen FOXP2 ha sido ampliamente estudiado en evolución humana, debido a que ciertas mutaciones en la región codificante de este gen impactan directamente en el desarrollo de la capacidad del habla. Por otra parte, se ha encontrado que en humanos este factor de transcripción presenta dos sustituciones no sinónimas en su secuencia codificante, a pesar de ser uno de los genes más conservados entre vertebrados, tanto en secuencia como en territorios de expresión. Sorprendentemente, estas sustituciones ya estaban presentes en los genomas de Neandertales y Denisovanos, miembros del género Homo ya extintos. Sumado a esto, se ha reportado que FoxP2 juega un papel importante en el aprendizaje vocal no innato en varias especies (pinzones, canarios, murciélagos, ballenas, entre otras). No obstante, su rol específico en la ejecución de estas vocalizaciones no está claro, ya que este factor de transcripción regula múltiples genes importantes para el desarrollo cerebral, y además también se expresa en otras especies que no presentan aprendizaje vocal y en otros tejidos no relacionados con la capacidad del habla. Resulta clave comprender la fina regulación a la que está sujeta este gen y su potencial rol como factor de transcripción en territorios de expresión novedosos. 2 Decidimos entonces estudiar en detalle las regiones aceleradas en humanos que se agrupan en el TAD-FOXP2, con el fin de caracterizar potenciales regiones regulatorias de este gen que evolucionaron de manera humano específica. Analizamos in vivo la actividad transcripcional de los 12 HARs contenidos dentro del TAD-FOXP2 utilizando peces cebra y ratones transgénicos. Mediante el uso de genes reporteros e inmunohistoquímica, pudimos determinar que 5 de los 12 HARs presentes en esta región presentan actividad de enhancer transcripcional. Además, 2 de ellos (HACNS750 y HACNS169) mostraron ganancias de expresión a lo largo del sistema nervioso al comparar las regiones ortólogas humanas (derivadas) versus chimpancés (ancestrales), en tejidos donde se expresa FOXP2. Para estas regiones diferenciales, encontramos evidencia adicional que soporta su actividad enhancer a partir de distintos análisis in silico. Nuestros resultados indican que secuencias reguladoras en el locus FOXP2 fueron seleccionadas por un proceso evolutivo específico del linaje Homo, lo que sugiere que la maquinaria transcripcional que controla este gen también podría haber evolucionado de manera diferencial a lo largo de nuestra historia evolutiva, contribuyendo de esta manera con el desarrollo de nuestro cerebro y en particular con nuestra excepcional capacidad del habla. Palabras clave: FOXP2, evolución del cerebro, peces cebra, ratones, regulación transcripcional, HARs. 3 ABSTRACT FOXP2 gene transcriptional regulatory analysis from an evolutionary perspective. Elucidating the link between changes at the genetic level and the evolution of the human brain is one of the greatest challenges facing the post-genomic era. Our hypothesis is that the acquisition of novel expression patterns of genes in the human lineage related to brain function and development would have been critical for the neuroanatomical evolution of our brain and its unique cognitive abilities. These new expression areas would be encoded by changes in the sequence of regulatory regions of genes that are expressed in the brain. In our laboratory, the combined use of our own bioinformatics tools and the analysis of results generated by other laboratories has allowed us to identify the regions of the human genome that accumulate the greatest number of non-coding regions showing signs of accelerated evolution (Human Accelerated Regions: HARs) compared to other species of mammals and vertebrates. In this work, we aimed to analyze the clustering and distribution of HARs for a particular locus in the genome: the FOXP2 gene. To accomplish this we decided to consider the three-dimensional arrangement that chromatin adopts in this region, that is the Topologically Associated Domain in which this gene is located (TAD-FOXP2), in particular for human cortical plate of 16 weeks of gestation. In this embryonic tissue FOXP2 is expressed and a peak of neurogenesis and neuronal migration occurs. We determined that TAD-FOXP2 is one of the most accelerated regions in the whole genome, that could mean differential transcriptional regulation for this gene in humans. FOXP2 gene has been extensively studied in human evolution, specially because certain mutations in the coding region of this gene directly impact the development of speech in humans. Additionally, it has also been found that in humans this transcription factor has two non-synonymous substitutions in its coding sequence, despite being one of the most conserved genes amongvertebrates, both in sequence and in areas of expression. Surprisingly, these substitutions were already present in the genomes of Neanderthals and Denisovans, members of the Homo genus already extinct. In addition, it has been reported that FoxP2 plays an important role in non-innate vocal learning in several vertebrate species (zebrafinches, canaries, bats, whales, among others). However, its specific role in the execution of these vocalizations is not clear, since this transcription factor regulates multiple genes important for general brain development, and it is also expressed in the brain of non-vocal learners species and in other non-related language organs. Therefore, it is essential to understand the fine upstream regulation at which this gene is subject and its potential role as a transcription factor in novel expression territories. 4 We decided to study in detail the accelerated regions in humans located in the TAD-FOXP2, in order to test its regulatory activity. These regions underwent human-specific evolution and it could have had an impact on FOXP2 expression. We analyzed in vivo the transcriptional activity of the 12 HARs contained within the TAD-FOXP2 using transgenic zebrafish and mice. Through the use of reporter enhancer assays and immunohistochemistry techniques, we were able to determine that 5 of the 12 HARs present in this region have transcriptional enhancer activity. In addition, 2 of them (HACNS750 and HACNS169) show extended expression patterns throughout the nervous system when comparing orthologous regions in humans (derived) versus chimpanzee (ancestral), in tissues where FOXP2 is expressed. For these differentially expressing regions, we found additional evidence from different in silico analyzes that supports their enhancer activity. Our results indicate that regulatory sequences in the FOXP2 locus were selected by an specific evolutionary process of the Homo lineage, suggesting that the transcriptional machinery that controls this gene could also have evolved differently throughout our evolutionary history, contributing in this way with the development of our brain, in particular with our exceptional ability to speak. Keywords: FOXP2, brain evolution, zebrafish, mice, transcriptional regulation, HARs. 5 AGRADECIMIENTOS A mis viejos, Sandra y Fredy. Siempre amando, bancando y apoyando ubicuamente. Esta Tesis está dedicada a ustedes. A Fio, Diego, Jo y toda mi Familia de Villa Mercedes y Mar del Plata. (Hasta cuando vas a seguir estudiando!?) Soy un afortunado de tener una familia tan genial y unida a pesar de las distancias. ALEJANDRA GRACIAS AMOR, A mi Familia de Cabashito. Por escucharme, sostenerme y alegrarme la vida. A Juan y Teresa, quienes me adoptaron como un nieto más en aquellos difíciles primeros días en CABA. A la Universidad Nacional de San Luis y A la Universidad de Buenos Aires, por mi Educación y formación académica. Pública, gratuita y de excelencia. A Dra. Lucía Franchini por tu perseverancia, y por brindarme un espacio dentro de tu laboratorio. Por facilitarme las herramientas académicas y económicas para investigar. A mis queridxs Evoludólogos, por motivar mi apetito por la Evolución y las cremonas. Fran, Matias, ARC, Lari, Cata, Anita, Álvaro. Nuestros seminarios blue, charlas y trabajo en equipo, en 15 m3 del lab 222, quedarán como mis mejores recuerdos del toctorado. Al INGEBI, mi lugar de trabajo, el patio de mi casa. Mención particular al laboratorio del Dr. Marcelo Rubinstein y todxs sus becarixs pasados y presentes. Por la cordialidad que los caracteriza! Al laboratorio 222 y toda la (mucha!) gente que transitó por allí con la que compartí almuerzos, mates cafés y tés, charlas y salidas a lo largo de estos 5 años y medio. A Cata por su trabajo durante su tesis de Licenciatura y sus críticas siempre revulsivas. A todxs lxs técnicos de peces y ratones, sin su dedicación este trabajo no hubiera salido. A Martita Treimun por la generación de ratones transgénicos y su calidez en todo momento. A Paula Beati por su aporte bioinformático imprescindible en momentos clave de mi doctorado. 6 A Sonja Vernes, María Castelló, Georg Strietder, Lluís Montoliu, Toby Gibson, Víctor Corcés y mi amigo Gonzalo Parra; científicos y científicas geniales que pude conocer durante mi doctorado. Gracias por transmitir su pasión por la Ciencia y motivarme a progresar. A lxs juradxs de esta Tesis: Dres. Guillermo Lanuza, Adalí Pecci, Alejandro Colman-Lerner. Porque a pesar de la Pandemia COVID-19 nunca pusieron trabas para llevar a cabo la Defensa en tiempo y forma (25 de Marzo 2020). Por la buena predisposición y sus valiosos aportes para la elaboración de este ejemplar final. Agrego a esta lista al Dr. Diego Gelman quien formó parte de mi Comité de Seguimiento de Tesis Doctoral y siempre estuvo presente y pendiente de mis avances. A lxs Biólogxs Moleculares aporteñadxs et al. Por los asados en CABA, birras y fulbitos. A los Compadres Cuyanos Cogollos, los mismos de siempre. Al Nono David. Compromiso Actitud Intensidad. 7 “Tardaban en adaptarse. Los inventos eran accidentales y frecuentemente no se aprovechaban. Si algo nuevo les sucedía, podían agregarlo a su acumulación de información, pero el cambio sólo se conseguía a costa de un gran esfuerzo. Cuando se les imponía a la fuerza, se mostraban reacios a seguir el nuevo rumbo. Se les hacía demasiado cuesta arriba alterarlo de nuevo. Una raza sin espacio para aprender, sin espacio para desarrollarse, no estaba ya equipada para subsistir en un medio intrínsecamente cambiante, y ellos habían rebasado ya el punto crítico en que podrían haberse desarrollado de distinta manera. Eso quedaba para una forma nueva, un nuevo experimento de la naturaleza.” El clan del Oso Cavernario - Jean M. Auel “Todo lenguaje es un alfabeto de símbolos cuyo ejercicio presupone un pasado que los interlocutores comparten; ¿cómo transmitir a los otros el infinito Aleph, que mi temerosa memoria apenas abarca?” El Aleph - Jorge Luis Borges 8 9 Abreviaturas Significado HARs Regiones Aceleradas en Humanos (Human Accelerated Regions) TADs Dominio Topológicamente Asociado enhancer región activadora de la transcripción TSS Sitio de Inicio de la Transcripción (Transcription Start Site) Hi-C Captura de la Conformación de la Cromatina en todo el genoma CP Placa cortical embrionaria (Cortical Plate) GZ Zona germinal embrionaria (Germinal Zone) ANC accelerated non-coding conserved sequences HACNS human accelerated conserved non-coding sequences 2xHAR HARs de segunda generación HTBE human terminal branch elements ISH hibridación in situ cromo cromogénica fluo fluorescente WMISH hibridación in situ de pez entero (whole mount in situ hybridization) IHQ ensayo de inmunohistoquímica RefSeq Secuencia de Referencia (genes) SNP Polimorfismo de nucleótido único (1nt) indel inserción o deleción de regiones pequeñas (2-10000nt) core acelerado núcleo conservado dentro de los HARs donde a su vez ocurre la aceleración región clonada región analizada en este trabajo para cada HAR, que contiene al core TFBS Sitio de unión a factores de transcripción FT Factor de transcripción ADN Ácido desoxiribonucleico ARNm Ácido ribonucleico mensajero 10 cfernandez Texto insertadoFHD Dominio Forkhead de unión al DNA FOXP2/ FOXP2 Forkhead box protein P2 : Gen / Proteína de humano Foxp2/ Foxp2 Forkhead box protein P2 : Gen / Proteína de ratón y otros vertebrados foxP2/ foxP2 Forkhead box protein P2 : Gen / Proteína de pez cebra EGFP Proteína fluorescente verde (enhanced-green fluorescent protein) lacZ Gen que codifica para la enzima reportera 𝛽-galactosidasa MDFIC Gen MyoD Family Inhibitor Domain Containing TFEC Gen Transcription Factor EC LINC ARN intergénico largo, no codificante Hs Homo sapiens Pt Pan troglodytes Mm Mus musculus Dr Danio rerio hpf horas post fecundación en peces cebra E13.5 estadío embrionario 13.5 días post fecundación en ratones CS23 Carnegie stage 23 del desarrollo humano fetal Mb, kb megabases, kilobases (en pares de bases, pb) Ma Millones de años La nomenclatura de FOXP2 para las distintas especies utilizadas se realizó según el Comité de Nomenclatura de Genes de la Familia Forkhead (Kaestner, Knochel, and Martinez 2000) y las Convenciones aprobadas por ZFIN para la nomenclatura en pez cebra (https://wiki.zfin.org/display/general/ZFIN+Zebrafish+Nomenclature+Conventions). Genes y mARN se escriben en itálica, proteínas no. 11 https://paperpile.com/c/DEItd4/3ilI1 https://wiki.zfin.org/display/general/ZFIN+Zebrafish+Nomenclature+Conventions ÍNDICE RESUMEN 2 ABSTRACT 4 AGRADECIMIENTOS 6 ABREVIATURAS 10 INTRODUCCIÓN Evolución humana en mosaico (Homininos) 15 Lenguaje Humano desde un enfoque evolutivo 20 Cerebro y Genoma 22 Humanos y Chimpancés: validando a King & Wilson 23 Desarrollo y Evolución (Evo-Devo) 26 Regulación transcripcional 26 Dominios Topológicamente Asociados (TADs) 29 Regiones aceleradas en humanos (HARs) 29 Gen FOXP2 y Lenguaje 33 Patrón de expresión conservado 35 Evolución molecular de FOXP2 37 Pleiotropía en FoxP2 40 Regulación transcripcional del gen FOXP2 41 HIPÓTESIS 44 OBJETIVOS 44 12 RESULTADOS OBJETIVO 1 El TAD-FOXP2 es una de las regiones más aceleradas del genoma 45 El TAD-FOXP2 presenta 12 HARs distribuidos en 2 clusters 49 OBJETIVO 2 Análisis comparativo de HARs mediante la generación de peces cebra transgénicos 51 Expresión de foxP2 en pez cebra 56 Los HARs diferenciales dirigen la expresión hacia células foxP2 + 60 Caracterización del patrón de expresión de HACNS750 60 Caracterización del patrón de expresión de HACNS169 64 Análisis de expresión de HARs diferenciales en ratones transgénicos 68 Expresión de FoxP2 en embriones de ratón 68 Ratones transgénicos HACNS750-lacZ 69 Ratones transgénicos HACNS169-EGFP 71 OBJETIVO 3 Análisis in silico de las regiones HAR en el TAD-FOXP2 73 Análisis de sustituciones humano específicas y polimorfismos 75 Ganancias y pérdidas de sitios de pegado para factores de transcripción (TFBS) 77 Marcas epigenéticas asociadas a enhancers 80 Interacción con los distintos promotores de FOXP2 82 La secuencia ROI no mostró diferencias de expresión en peces cebra transgénicos 84 13 DISCUSIÓN Principales Resultados 88 Aportes adicionales del análisis in silico 93 Regulación de FOXP2, un fenómeno complejo 95 ROI tiene potencial para regular diferencialmente a FOXP2 99 Perspectivas 100 CONCLUSIONES 102 MATERIALES Y MÉTODOS Análisis bioinformáticos 104 Construcción de transgenes reporteros 107 Mantenimiento de los peces 110 Microinyección de embriones de peces cebra 110 Generación de líneas transgénicas de peces cebra 111 Análisis del patrón de expresión de la proteína reportera EGFP 112 Genotipificación de los peces 112 Hibridaciones in situ en peces cebra 113 Hibridación in situ superpuesta con Inmunohistoquímica (ISH/IHQ fluo) en cortes de embriones de peces cebra 114 Doble inmunohistoquímica sobre embriones reporteros en peces cebra 115 Inmunohistoquímica sobre cortes histológicos de embriones de ratón 116 Ratones y bioterio 116 Producción y análisis embriones HACNS750-lacZ 117 Producción y análisis embriones HACNS169-EGFP 117 Procesamiento de las imágenes 118 MATERIAL SUPLEMENTARIO 119 REFERENCIAS 125 14 INTRODUCCIÓN Evolución humana en mosaico (Homininos) Homo sapiens es una de las aproximadamente 200 especies vivientes de primates que colectivamente constituyen el orden Primates (“A Composite Estimate of Primate Phylogeny” 1995; Begun and Gurche 2006). Este grupo se originó hace aproximadamente 65 millones de años (Tavaré et al. 2002). Los Primates se clasifican en dos grandes subórdenes: Strepsirrhini y Haplorrhini. Los estrepsirrinos se conocen comúnmente como prosimios e incluyen a los lemures, lorinos y gálagos. Por otro lado, los haplorrinos consisten en los tarseros y los antropoideos. Los antropoideos comprenden a los platirrinos (o monos del nuevo mundo, como el mono araña y el mono tití) y los catarrinos. Dentro de este último grupo se agrupan los cercopitécidos (o monos del viejo mundo como los macacos, los colobos y los babuinos) y los grandes simios u hominidos (gibones, orangutanes, gorilas, chimpancés y humanos). Tanto los primates actuales como los fósiles constituyen un conjunto diverso de especies. La mayoría de las especies de primates retuvieron más características ancestrales dentro de la clase de los mamíferos (o plesiomorfías); mientras que Homo sapiens muestra especializaciones morfológicas y de comportamiento completamente novedosas dentro de los mamíferos (apomorfías humanas) (Tanaka 2007; Foley and Lewin 2013; Fleagle 2013). Históricamente, se han estudiado las características de los primates para tratar de entender el surgimiento y desarrollo de estas apomorfías humanas, pasando desde una perspectiva arqueológica (Gowlett, Gamble, and Dunbar 2012) hasta molecular (Pääbo 2014). Muchas características a veces consideradas específicas de los humanos, como la capacidad de caminar erguidos (bipedalismo), gran inteligencia y sociabilidad, que alcanzan su máxima complejidad con la ejecución de nuestro lenguaje; más que representar una discontinuidad con el resto de los primates, son una extensión de las características de estos como grupo (Beard 1991; D’agosto 1991; Whiten 2018). Para poder dilucidar los cambios genéticos responsables de los rasgos humanos, es esencial comprender la historia evolutiva de nuestro linaje. La evolución humana nos permite contextualizar las bases genéticas que subyacen nuestras características distintivas (Fig. I). El registro fósil, junto con estudios genéticos, indican que el linaje que condujo a la aparición de Homo sapiens y el de los chimpancés (Pan troglodytes), nuestro pariente Primate vivo más cercano en la evolución, compartieron su último antepasado común hace ~5-7 millones de años (Ma), en África (Chen and Li 2001; Brunet et al. 2002; Foley and Lewin 2013). 15 https://paperpile.com/c/DEItd4/rJJUZ+zKIho https://paperpile.com/c/DEItd4/rJJUZ+zKIho https://paperpile.com/c/DEItd4/3KwVw https://paperpile.com/c/DEItd4/5iz3I+i7IYm+un2Lg https://paperpile.com/c/DEItd4/t8dn https://paperpile.com/c/DEItd4/Fy4e https://paperpile.com/c/DEItd4/a0Ko+wpZm+ek3Q https://paperpile.com/c/DEItd4/3eqdK+UzwS1+i7IYm 16 FIGURA I: Escala temporal y Filogenia de Hominidae. La divergencia entre los géneros Homo-Pan habría sucedido hace 5-7Ma (millones de años). A partir de ese momento surgen distintos Homininos. Las relaciones filogenéticas entre Homininos es incierta y se encuentra bajo revisión y actualización periódicamente (sombreado gris). Las barras rojas representan el lapso en el que habrían existido según datación a partir de fósiles y estudios moleculares. En la parte superior izquierda se resaltan gráficamente los aquí considerados Humanos arcaicos (Neandertales, Denisovanos y el propio Homo sapiens). Este árbol es provisorio e ilustrativo, no refleja la intrincada complejidad que caracteriza la evolución del linaje Homo. Modificado de (Carroll 2003;., doi:10.1038/scientificamerican0914–40). Si bien Homo sapiens es el único representante vivo en la actualidad del linaje Homininos, la información del registro fósil actualmente disponible sugiere dos patrones importantes en la historia evolutiva del linaje humano. Por un lado, si bien H. sapiens es la única especie viva representante de nuestro linaje, desde la divergencia con el chimpancé existió una gran diversidad de formas morfológicas, muchas de las cuales coexistieron durante largos periodos de tiempo, desde convivencias tempranas entre Homo erectus, Paranthropus y Australopithecus, hace unos 2 Ma (Herries et al. 2020) hasta las especies más recientes del género o Humanos arcaicos: Homo sapiens, Homo neanderthalensis y Denisovanos, hace solo 200 mil años (Slon et al. 2018; Rogers, Harris, and Achenbach 2020). Estas diversas formas fueron interpretadas históricamente como múltiples especies, pero debido a la similitud entre los fósiles encontrados y el solapamiento geográfico que presentan, este tópico se discute activamente en la actualidad, dando lugar al debate “Lumpers versus Splitters” (Dvorsky 2020). Por otro lado, la evolución de los rasgos propios de H. sapiens a partir de la separación con el linaje de los chimpancés no fue un proceso gradual, lineal y aditivo, sino sumamente complejo (Carroll 2003; Tattersall 2010). Algunos rasgos, como el bipedalismo, surgieron muy tempranamente (Richmond et al. 2020) mientras que otros, como el aumento del tamaño cerebral, no evolucionaron hasta hace relativamente poco tiempo (Grün et al. 2020). Las relaciones de parentesco, orden cronológico, la magnitud y ritmo de la evolución de los caracteres en este linaje se encuentran constantemente sujetos a revisión, a medida que ocurren nuevos hallazgos fósiles (Tattersall 2010; Willoughby 2007; Welker et al. 2020). Sin embargo, podemos afirmar que la evolución humana está marcada por una evolución en mosaico de las características que nos distinguen, las cuales surgieron en distintos momentos de nuestra historia evolutiva. 17 https://paperpile.com/c/DEItd4/mb3q+m0VE/?locator=,doi%3A10.1038%2Fscientificamerican0914-40 https://paperpile.com/c/DEItd4/mb3q+m0VE/?locator=,doi%3A10.1038%2Fscientificamerican0914-40 https://paperpile.com/c/DEItd4/OO1u https://paperpile.com/c/DEItd4/OO1u https://paperpile.com/c/DEItd4/Mgka8+GdOI https://paperpile.com/c/DEItd4/Mgka8+GdOI https://paperpile.com/c/DEItd4/PyNA https://paperpile.com/c/DEItd4/mb3q+vYAwU https://paperpile.com/c/DEItd4/2U7q https://paperpile.com/c/DEItd4/5UIM https://paperpile.com/c/DEItd4/vYAwU+RdHIV+fboD Haciendo una descripción más detallada de estas especies, los homininos más antiguos que se conocen en la actualidad son Sahelanthropus tchadensis de Chad, fechado entre 6-7 Ma atrás (Brunet et al. 2005) y Orrorin tugenensis de Kenia (Pickford and Senut 2001). Su tamaño cerebral, ~360 cc, se encuentra dentro del rango que se observa en los chimpancés, y el cráneo porta una cresta supraorbital de gran tamaño, similar a la de los gorilas (Brunet et al. 2005). Aproximadamente 4 Ma atrás habrían aparecido los primeros miembros del género Australopithecus, homininos bípedos, cuyo cráneo tiene un tamaño que oscila entre 390 y 515 cc, similar a los chimpancés y gorilas (Falk et al. 2000; Falk 2019). Esto sugiere que tendrían habilidades cognitivas similares a la de los simios actuales (McHenry and Tobias 1992). Australopithecus fue un género muy exitoso que persistió durante casi 3 millones de años (Bobe et al. 2020). Hace 2,5 millones de años, habría surgido nuestro propio género, Homo, con su distintiva forma corporal, crecimiento más lento y encefalización: cerebros más grandes de lo esperado para el tamaño corporal (Murphy 1980). Los primeros fósiles fueron hallados en el este de África y datan de 2,3 millones de años (Kimbel, Johanson, and Rak 1997). Estos especímenes tempranos son similares en tamaño cerebral y corporal al Australopithecus. El miembro más antiguo del género Homo, Homo habilis (2,3-1,4 Ma atrás) fue hallado en África oriental y está asociado con huesos de animales descuartizados y herramientas de piedra sencillas (Blumenschine 2003; Facchini 2003). Su posible descendiente, Homo erectus, se distribuyó por toda África y Eurasia y persistió desde 1,9 Ma atrás a solo 100.000 años atrás, y tal vez incluso menos tiempo (Antón 2003). La expansión global de Homo erectus sugiere que esta especie era ecológicamente muy flexible, y que tendría capacidades cognitivas para adaptarse y prosperar en entornos muy diferentes (Antón 2020). Aquí se comienza a ver un gran aumento en el tamaño del cerebro, de hasta 1.250cc para especímenes asiáticos posteriores. Alrededor de 700 mil años atrás, y tal vez antes (Grün et al. 2020), H. erectus en África habría dado lugar a Homo heidelbergensis, una especie muy similar a la nuestra en términos de proporciones corporales, adaptaciones dentales y capacidad cognitiva (Rightmire 2009). H. heidelbergensis, a menudo referido como el antecesor de Homo sapiens, era un cazador activo que producía herramientas sofisticadas y habría aprendido a controlar el fuego (Roebroeks and Villa 2011). 18 https://paperpile.com/c/DEItd4/0qBR4 https://paperpile.com/c/DEItd4/73Fyu https://paperpile.com/c/DEItd4/0qBR4 https://paperpile.com/c/DEItd4/UOUtz+ezkQ https://paperpile.com/c/DEItd4/rlETZ https://paperpile.com/c/DEItd4/rlETZ https://paperpile.com/c/DEItd4/XBOW https://paperpile.com/c/DEItd4/jZipa https://paperpile.com/c/DEItd4/yq0MA https://paperpile.com/c/DEItd4/Xcqe6+iZuf https://paperpile.com/c/DEItd4/Mlrsm https://paperpile.com/c/DEItd4/KGbc https://paperpile.com/c/DEItd4/5UIM https://paperpile.com/c/DEItd4/0VPgi https://paperpile.com/c/DEItd4/9cC9V Los Neandertales (Homo neanderthalensis) vivieron en una franja temporal que va aproximadamente desde 300 a 30 mil años atrás; en una franja territorial que abarca toda Europa hasta Asia occidental. Fueron homininos robustos y musculosos, con narices grandes y cerebros incluso más grandes que los nuestros. Se han encontrado registros arqueológicos fuertemente asociados con esta especie, sugiriendo que podían manipular el fuego (P. Williams 2010), y que poseían un arte elaborado y hasta comportamientos simbólicos (Hoffmann et al. 2018; Seghers 2018) Se sugiere que surgieron a partir de las poblaciones de H. heidelbergensis en Europa hace al menos 250 mil años atrás (Hublin2009; Rightmire 2009) Los estudios de ADN antiguo extraído de los fósiles de Neandertal sugieren que nuestro linaje podría haberse cruzado regularmente con ellos (Green et al. 2010; M. Meyer et al. 2012). Los Denisovanos surgieron a partir de un antepasado común con los Neandertales hace 200 mil años atrás (Krause et al. 2010). Su distribución alcanzó un amplio territorio que va desde Siberia hasta el sudeste asiático y se extinguieron hace menos de 40 mil años (Sawyer et al. 2015). La especie se conoce solo por unos pocos dientes y nudillos en la cueva de Denisova, Rusia (Reich et al. 2010). Esto no es suficiente evidencia física para reconstruir la anatomía de los Denisovanos (aparte de que tenían dientes y huesos grandes), pero sí ha permitido reconstruir un genoma casi completo (M. Meyer et al. 2012; Gokhman et al. 2020). La evidencia de fósiles y ADN sugiere que nuestra especie, Homo sapiens, evolucionó en África hace 200.000 años (J. H. Relethford 2008; Rightmire 2009; D. E. Lieberman 2007), probablemente a partir de H. heidelbergensis. La sofisticación conductual de Homo sapiens, reflejada en el gran tamaño cerebral (1.400 cc) y la evidencia arqueológica de un conjunto de herramientas más sofisticado y técnicas de caza inteligentes, permitió que nuestra especie prosperara y se expandiera. Hace 100 mil años, se desplazó hacia Eurasia, y eventualmente se expandió por todo el globo hacia Australia y América (John H. Relethford 2005; DeGiorgio, Jakobsson, and Rosenberg 2009). Siguiendo la historia evolutiva de nuestro linaje se encontrará un conjunto de acontecimientos singulares y de novedades exclusivas que hacen a nuestra especie. Son todas aquellas características que hacen de las especies linajes evolutivos independientes. En este sentido, los humanos no son más especiales que ningún otro grupo de organismos. En nuestro laboratorio intentamos comprender las bases genéticas que subyacen a estas características desde una perspectiva molecular, en particular desde un enfoque regulatorio. 19 https://paperpile.com/c/DEItd4/qc6Y https://paperpile.com/c/DEItd4/AzPf+zBvG https://paperpile.com/c/DEItd4/FolYH+0VPgi https://paperpile.com/c/DEItd4/FolYH+0VPgi https://paperpile.com/c/DEItd4/29JGR+mlgDa https://paperpile.com/c/DEItd4/29JGR+mlgDa https://paperpile.com/c/DEItd4/P7ITj https://paperpile.com/c/DEItd4/Z1i4R https://paperpile.com/c/DEItd4/7NAab https://paperpile.com/c/DEItd4/mlgDa+wznGK https://paperpile.com/c/DEItd4/mlgDa+wznGK https://paperpile.com/c/DEItd4/kbaaY+0VPgi+DyIcE https://paperpile.com/c/DEItd4/EU8HE+epv6m https://paperpile.com/c/DEItd4/EU8HE+epv6m Lenguaje Humano desde un enfoque evolutivo Una de las características más distintivas de Homo sapiens es su forma simbólica de procesar la información. Este estilo cognitivo único probablemente se haya visto potenciado y explotado únicamente gracias a la adquisición del lenguaje y el habla (Tattersall and Schwartz 2008). Al no encontrarse correlato en otras especies, algunas posturas dan cuenta de que el lenguaje habría surgido de novo en Homo sapiens. Estas posturas son la base del psicoanálisis, disciplina donde se plantea al lenguaje como el origen mismo del hombre. Para el estudio del lenguaje humano y su origen, debemos considerarlo como un aspecto más de nuestra biología, una de las características que nos distinguen como especie (Devanna, Dediu, and Vernes 2018). Es innegable el rol de la cultura y del aprendizaje como motores del habla durante la infancia y el resto de nuestra vida, pero no hay que perder de vista que el lenguaje es un rasgo más de nuestra ontogenia. Es clave para el abordaje reduccionista/molecular que consideraremos en este trabajo considerar al lenguaje humano como una característica biológica más de nuestra especie. En este sentido, la publicación del libro de Lenneberg, origen de la Biolingüística como rama de la Biología en 1967 fue clave para cambiar el paradigma de lenguaje como una característica extraordinaria (Lenneberg 1967) . Años más tarde Noam Chomsky propone el término “Facultad del Lenguaje” donde reduce al lenguaje a una condición innata que poseemos todos los humanos, se enfoca en procesos internos del lenguaje y no en diferencias gramaticales o de idioma (Hauser, Chomsky, and Tecumseh Fitch, n.d.). Chomsky postula que la gran novedad es la operación Merge, nuestro cerebro ya tenía todos los componentes necesarios para hablar, solo hacía falta unirlos entre sí (Pinker and Jackendoff 2005). A partir de allí surgieron diversas posturas para explicar el origen y la ejecución del lenguaje (Corballis 2017). El lenguaje humano se basa en la capacidad de los seres humanos para comunicarse por medio de signos lingüísticos (usualmente secuencias sonoras (habla), pero también gestos y señas, así como signos gráficos). Presenta características que no tienen correlato en la evolución: unas 6000 variantes independientes (idiomas), la intencionalidad de lo que se expresa, pensamiento interno, la dualidad que representa generar frases y oraciones infinitas a partir de estructuras finitas, la semántica y la gramática, entre otras (Ghazanfar 2008; Hagoort 2019; Vilain et al. 2011). Sin embargo la característica de aprendizaje o vocal learning se ha encontrado en otras especies tanto de mamíferos y principalmente aves (Scharff and Petri 2011; Pika et al. 2018). Los aspectos neurológicos que implican aprender por mímica y repetición hasta que esos circuitos se consoliden en nuestro cerebro han sido estudiado principalmente a través del canto de pájaros (Bolhuis, Okanoya, and Scharff 2010) y ultravocalizaciones en murciélagos (Vernes 2017). Estos estudios permiten extrapolaciones en la adquisición del lenguaje en infantes y niños (Prather, Okanoya, and Bolhuis 2017), así como también el desarrollo de nuevas hipótesis evolutivas (Jarvis 2019). 20 https://paperpile.com/c/DEItd4/oiroY https://paperpile.com/c/DEItd4/oiroY https://paperpile.com/c/DEItd4/zvM3c https://paperpile.com/c/DEItd4/8eOCk https://paperpile.com/c/DEItd4/rmhI5 https://paperpile.com/c/DEItd4/21AQz https://paperpile.com/c/DEItd4/21AQz https://paperpile.com/c/DEItd4/HE3RO https://paperpile.com/c/DEItd4/NGpIC+3oIJ+qooj https://paperpile.com/c/DEItd4/NGpIC+3oIJ+qooj https://paperpile.com/c/DEItd4/hRtnu+Dc3n1 https://paperpile.com/c/DEItd4/hRtnu+Dc3n1 https://paperpile.com/c/DEItd4/mQOGI https://paperpile.com/c/DEItd4/Ewtdu https://paperpile.com/c/DEItd4/ogs0e https://paperpile.com/c/DEItd4/ZzJmz A continuación se plantearán las principales posturas para analizar nuestros resultados en un marco biolingüístico y evolutivo. Existen al menos 2 posturas en conflicto que intentan explicar el origen del lenguaje, las cuales se reseñan brevemente a continuación. En nuestro trabajo se intentará realizar aportes desde la genética y la biología molecular. - Postura saltacionista, discontinuidad, novedad: (Chomsky 1959) Defendida por Chomsky, Bolhuis. Chomsky fué pionero en postular que lo que define al lenguaje humano es nuestra capacidad de “merge”, “enlazar” conceptos abstractos, sonidos e ideas y poder articularlas y relacionarlas (Hauser et al. 2014).Esta capacidad sería exclusiva de los humanos y tendría un componente innato. Todos los humanos tendríamos la capacidad innata de hablar (Facultad del Lenguaje) la cual habría surgido de forma repentina hace unos 100 mil años (Bolhuis et al. 2014). Todos los proto-lenguajes que podrían haber existido previamente no son considerados por esta postura. - Postura gradualista, continuidad: (C.-W. Kim and Lieberman 1968) Principal defensor: Philip Lieberman. Considera al lenguaje como el punto final de sucesos graduales que ocurrieron de forma adaptativa. El lenguaje no habría surgido de repente sino que es el resultado de sutiles modificaciones que sufrieron nuestros antepasados en el cerebro, el tracto vocal, a partir de modificaciones genéticas y que fue modelado por la cultura. Estas características son concomitantes y se habrían seleccionado y fijado de forma adaptativa (P. Lieberman 2019). Destaca a la Sintaxis como clave en humanos y posiblemente las últimas modificaciones habrían sido en ese sentido. Imbricación de ganglios basales habría sido clave en la regulación del tracto vocal (ya controlaban movimientos, ahora controlan tracto vocal y aprendizaje) Habría surgido hace al menos 500 mil años. Principal novedad impulsora: descenso de la laringe en humanos (P. Lieberman 2012). En cualquiera de los escenarios planteados, los cambios que permitieron la ejecución del lenguaje se deberían ver reflejados en el genoma (Raghanti et al. 2016). Además estos cambios pueden manifestarse temprano durante el desarrollo, donde cambios a pequeña escala pueden tener un gran impacto en estadíos posteriores. Por otra parte, no hay que dejar de lado el papel de la Cultura, la cual podría haber tenido un rol fundamental en los encuentros entre diferentes homininos (Harvey 2017; Condemi et al. 2013). Desde un punto de vista neuroanatómico, además de las estructuras corticales clásicas involucradas en el lenguaje (Áreas de Broca y Wernicke, corteza motora), en esta Tesis quisiera resaltar el rol de estructuras subcorticales, las cuales funcionan como estación de relevo intermediarias entre estas estructuras corticales superiores y las vías eferentes que posibilitan la ejecución y procesamiento del lenguaje. Estas áreas comprenden los ganglios basales (estriado), tálamo y cerebelo, las cumplen esta función integradora independientemente de la modalidad de ejecución (Hisaoka et al. 2010; Kast et al. 2019). 21 https://paperpile.com/c/DEItd4/t2ZwF https://paperpile.com/c/DEItd4/hiA3V https://paperpile.com/c/DEItd4/JMkWK https://paperpile.com/c/DEItd4/JMkWK https://paperpile.com/c/DEItd4/7SwRV https://paperpile.com/c/DEItd4/owDmP https://paperpile.com/c/DEItd4/GN3oB https://paperpile.com/c/DEItd4/GN3oB https://paperpile.com/c/DEItd4/rqUXX https://paperpile.com/c/DEItd4/2n0sg+DDaHc https://paperpile.com/c/DEItd4/9UU5+kwXY2 Cerebro y Genoma El sistema nervioso, y en particular el cerebro y sus capacidades cognitivas, se encuentran entre los atributos más distintivos y fascinantes de nuestra especie, destacando nuevamente al lenguaje como máxima expresión de ello. La manera en la que el sistema nervioso evolucionó en el linaje humano, y cómo éste se diferencia del de nuestros parientes primates más cercanos, aún no se conoce detalladamente. Históricamente, muchos de los estudios que han intentado esclarecer qué aspectos del sistema nervioso central explican mejor las adquisiciones propias de nuestro linaje, se han avocado a correlacionar el tamaño y parámetros métricos del cerebro humano con el nivel de inteligencia. Así surgieron disciplinas como la frenología, hoy en total decadencia. Sin embargo estos estudios comparativos son útiles para tener una idea general de las proporciones y principales características de nuestro cerebro. El sistema nervioso central de Homo sapiens es aproximadamente 3 veces más grande que el de chimpancés (Blinkov and Glezer 1968; Stephan, Frahm, and Baron 1981) y el tamaño cerebral absoluto suele ser un buen predictor de las habilidades cognitivas dentro de los primates (Reader and Laland 2002; Deaner et al. 2007). Sin embargo, esto no resulta así para todas las comparaciones, ya que muchas especies de grandes mamíferos (como algunos cetáceos y el elefante) tienen cerebros de mayor tamaño que el humano (Roth and Dicke 2017). Por otra parte también se sabe que el sistema nervioso humano contiene la mayor cantidad de neuronas de todos los primates, rondando las 86 billones (Azevedo et al. 2009; Suzana Herculano-Houzel et al. 2015), y que el 20.9% de estas neuronas son corticales lo cual representa un 10% más que cualquier otro mamífero (S. Herculano-Houzel 2012). A pesar de estas notables diferencias neuroanatómicas, no se conoce aún el impacto que podrían tener en el desarrollo de nuestras capacidades cognitivas. Es por eso que algunos autores plantean que la adquisición de estas cualidades probablemente se encuentre ligada a factores más complejos que el aumento de tamaño del cerebro y número de neuronas. Se hipotetiza que los procesos subyacentes a la adquisición de estos atributos estarían relacionados más que nada con la organización y conectividad del cerebro (Schenker et al. 2010), un aumento en la diversidad de tipos de células neuronales (por ej. von Economo neurons, (Banovac et al. 2019)), cambios a nivel molecular y la aparición de patrones de conectividad neuronal más expandidos e intrincados (Lucía F. Franchini and Pollard 2017; Sousa, Meyer, et al. 2017). Existen diversos estudios que sostienen estas hipótesis, ya que por ejemplo se lograron identificar cambios en la morfología y abundancia tanto de neuronas excitatorias e inhibitorias como de células de la glía únicamente en humanos (Suzana Herculano-Houzel 2014) y también diferencias en las conexiones y localización regional de distintos tipos neuronales en el neocortex de humanos y primates (Masliah 2017; Defelipe 2011; Sherwood, Subiaul, and Zawidzki 2008; Elston and Elston 2011; X. Han et al. 2013; Bartheld et al. 2016; Raghanti et al. 2016). 22 https://paperpile.com/c/DEItd4/DtTqO+EJnUM https://paperpile.com/c/DEItd4/QYJXW+pPGdV https://paperpile.com/c/DEItd4/ZTzJR https://paperpile.com/c/DEItd4/ZTzJR https://paperpile.com/c/DEItd4/gwVJH+2VARe https://paperpile.com/c/DEItd4/gwVJH+2VARe https://paperpile.com/c/DEItd4/A9yX6 https://paperpile.com/c/DEItd4/A9yX6 https://paperpile.com/c/DEItd4/KVsJ https://paperpile.com/c/DEItd4/KVsJ https://paperpile.com/c/DEItd4/0Sks https://paperpile.com/c/DEItd4/qpXKg+b2gHM https://paperpile.com/c/DEItd4/qpXKg+b2gHM https://paperpile.com/c/DEItd4/mYLV https://paperpile.com/c/DEItd4/MGpRw+T61XL+r5eGL+EfQPx+j8jsh+ejhO7+rqUXX https://paperpile.com/c/DEItd4/MGpRw+T61XL+r5eGL+EfQPx+j8jsh+ejhO7+rqUXX https://paperpile.com/c/DEItd4/MGpRw+T61XL+r5eGL+EfQPx+j8jsh+ejhO7+rqUXX El advenimiento de la genómica junto con el desarrollo de nuevas tecnologías en los campos de la biología molecular y de la bioinformática han aportado nuevas formas de estudiar la evolución humana. Nuestro conocimiento acerca de los genes que sufrieron selección positiva o bien modificaciones en sus niveles de expresión a lo largo de la evolución denuestro linaje está creciendo rápidamente. Sin embargo, el mayor desafío reside en poder vincular estos cambios ocurridos a nivel genómico con el surgimiento de características neuroanatómicas novedosas y asociarlas a su vez a capacidades cognitivas concretas (Preuss 2012; Lucía F. Franchini and Pollard 2015a). En la búsqueda del significado biológico de estos cambios evolutivos, la genómica y genética molecular representan herramientas valiosas en este campo, ya que permiten llevar a cabo análisis comparados entre Homo sapiens y otros primates, e incluso homininos ya extintos, a través de estudios funcionales e in silico. El estudio de la evolución humana desde la genética molecular se aboca a encontrar los cambios a nivel genómico y genético que potencialmente pudieron haber contribuido con la adquisición de las características particulares de nuestra especie. La tarea comprende el desarrollo de herramientas bioinformáticas para la descripción de los patrones de cambio evolutivo a nivel genómico, la identificación de las regiones candidatas, la predicción de cómo esos cambios pudieron impactar a nivel molecular con la estructura y actividad de una determinada región de ADN y los ensayos funcionales necesarios para sostener o no las hipótesis generadas. Finalmente, uno de los objetivos últimos del campo es poder correlacionar los cambios genéticos con cambios fenotípicos, mejorando así la capacidad de comprender los procesos evolutivos subyacentes y cómo esos cambios impactan en la biología actual de nuestra especie (O’Bleness et al. 2012; Pääbo 2014; Preuss 2012). Humanos y Chimpancés: validando a King & Wilson Los humanos y los chimpancés compartieron su último antepasado en común hace ~5-7 millones de años (Chen and Li 2001; Brunet et al. 2002; Foley and Lewin 2013). Desde ese momento se sucedieron notables diferencias fenotípicas entre estas especies, no hace falta un análisis muy exhaustivo para notarlas. Sin embargo se ha constatado que estas diferencias anatómicas y comportamentales no se reflejan en el genoma, más aún, las principales diferencias se dan sobre regiones no codificantes. La versión final del genoma humano (International Human Genome Sequencing Consortium 2004) y la culminación del proyecto de secuenciación del genoma del chimpancé (Chimpanzee Sequencing and Analysis Consortium 2005) proporciona un catálogo comparativo genómico que puede ser utilizado para identificar genes, elementos regulatorios y otras regiones funcionalmente relevantes que subyacen a las características fenotípicas que diferencian a estas dos especies. 23 https://paperpile.com/c/DEItd4/PHfYd+kce0L https://paperpile.com/c/DEItd4/bchYN+Fy4e+PHfYd https://paperpile.com/c/DEItd4/3eqdK+UzwS1+i7IYm https://paperpile.com/c/DEItd4/FSw02 https://paperpile.com/c/DEItd4/FSw02 https://paperpile.com/c/DEItd4/30wNB En un primer análisis, se estimó que la divergencia nucleotídica entre estas especies era de un ~1,23%, del cual ~1% correspondía a las diferencias fijadas por cada especie y el ~0,23% a polimorfismos. Al tomar en cuenta los eventos de inserción-deleción (indels) que abarcan 40-45 Mb en cada especie (es decir, ~90 Mb de diferencia entre los dos) la divergencia total entre estos genomas aumenta a un ~4% (Britten 2002; Varki 2005). A pesar de que existe un gran número de bases humanas que difieren de las correspondientes bases en chimpancés, es probable que una proporción sustancial de estas diferencias no tengan una consecuencia funcional en la evolución del hombre, es decir, sean neutras (Pollard et al. 2006). Históricamente, los estudios comparativos a nivel molecular entre el chimpancé y el humano se han centrado en los genes, los cuales codifican proteínas. Las proteínas ortólogas son extremadamente similares, con casi 1/3 siendo idénticas, mientras que las restantes difieren sólo por 2 aminoácidos en promedio (Chimpanzee Sequencing and Analysis Consortium 2005). Sin embargo, estos cambios aminoacídicos no son suficientes para explicar las diferencias fenotípicas entre nosotros y nuestros parientes primates vivos más cercanos. Al encontrar una alta identidad de secuencia entre proteínas hemoglobinas, King y Wilson propusieron en 1975 que las principales diferencias entre estas dos especies se encontrarían en las regiones regulatorias de ADN no codificante (King and Wilson 1975). Consistentemente con esta hipótesis, planteada ya hace varias décadas, actualmente se cree fehacientemente que la mayor parte de los cambios adaptativos entre estas dos especies han ocurrido principalmente en ADN no codificante, en especial aquellos que dan lugar a cambios en el cerebro (Babbitt et al. 2017; Varki 2005; Patterson et al. 2006). El desafío en la era post-genómica es determinar cuáles de las millones de sustituciones humano-específicas en las regiones no codificantes son responsables de los aspectos únicos de nuestra biología. Caracterizar los vínculos existentes entre la información genómica, la estructura y la función en el sistema nervioso, entender cómo las modificaciones en cada uno de estos componentes repercute en el otro y comparar estas relaciones entre humanos y chimpancés es extremadamente complejo. Esta tarea resulta particularmente difícil por diversas razones. En primer lugar, el genoma no codificante es vasto, lo cual requiere de métodos que logren identificar y priorizar las mutaciones relevantes. La teoría neutral de la evolución molecular, sumado a la redundancia de las redes biológicas, sugiere que muchos de los cambios en el genoma humano tuvieron poco efecto en nuestra biología. En segundo lugar, sabemos mucho menos acerca de cómo la secuencia determina la función en los elementos reguladores, en comparación con los genes que codifican para proteínas o ARN. Es complicado predecir las consecuencias moleculares, celulares y organizacionales de las mutaciones regulatorias específicas del ser humano. En tercer lugar, la mayoría de los rasgos humanos son sumamente complejos, siendo determinados por varios genes y condiciones, están codificados por una combinación de mutaciones en diferentes loci genómicos. Finalmente, 24 https://paperpile.com/c/DEItd4/MHLMP+fyOKk https://paperpile.com/c/DEItd4/trZsc https://paperpile.com/c/DEItd4/30wNB https://paperpile.com/c/DEItd4/30wNB https://paperpile.com/c/DEItd4/4oUys https://paperpile.com/c/DEItd4/bwXUq+fyOKk+oaAf la relación causal entre los genotipos y fenotipos humanos es difícil de probar debido a las limitaciones en la experimentación y manipulación genética de los seres humanos y de los demás primates no humanos. Dado que la regulación genética de hecho ha divergido significativamente entre humanos y organismos modelo clásicos como ratones, peces cebra o moscas, resulta intrincado probar hipótesis sobre los efectos funcionales de las mutaciones regulatorias e interpretar las consecuencias de los cambios genéticos que ocurrieron en humanos (Lucía F. Franchini and Pollard 2015a, [b] 2015). La genómica comparada sólo identifica las regiones evolutivamente relevantes del genoma humano, pero no nos dice nadasobre los tipos de células y los momentos o estadíos del desarrollo en las que una secuencia específica funciona, lo que dificulta el poder vincular estas diferencias genéticas con rasgos particulares. Se necesitan datos adicionales para desarrollar y probar hipótesis sobre los fenotipos moleculares afectados por mutaciones humanas específicas. En este sentido, gracias al abaratamiento y disponibilidad pública de experimentos de genómica funcional, que analizan desde la expresión génica, marcas epigenéticas, eventos de unión proteína-ADN hasta interacciones tridimensionales de regiones regulatorias con promotores en muchos tipos de células y especies, se ha avanzado enormemente en el anotado de elementos en el genoma, además de los estadíos específicos donde estos elementos estarían actuando. El consorcio de referencia donde se recopila información relevante para secuencias regulatorias es ENCODE (https://www.encodeproject.org) (Fig. II) FIGURA II: Resumen de la información de expresión génica integrada en el consorcio ENCODE (versión 4), a partir de distintos experimentos de detección de actividad regulatoria o expresión génica para todo el genoma. De este consorcio surgen potenciales candidatos a elementos regulatorios en cis anotados en el genoma (cCREs). 25 https://paperpile.com/c/DEItd4/kce0L+am4vy https://www.encodeproject.org/ Desarrollo y Evolución (Evo-Devo) El desarrollo de un individuo es un proceso altamente restringido y estrictamente regulado, orquestado a través de complejas redes regulatorias de genes (E. H. Davidson 2006). Existe una notable conservación de algunos procesos clave del desarrollo entre organismos evolutivamente tan distantes como cnidarios, insectos y mamíferos. Las vías moleculares que controlan el desarrollo a través de los distintos linajes animales son las mismas. Por ejemplo, se ha visto que los humanos, los gusanos planos y los cnidarios usan los mismos elementos básicos de las cascadas de señalización paracrina, como las vías Wnt y TGFβ (Finnerty 2004). Por otra parte, los factores de transcripción que regulan el desarrollo también están altamente conservados, lo que se conoce como homología profunda (deep homology) (Scharff and Petri 2011). Estos factores tienden a regular los mismos procesos generales en diversas especies, por ejemplo la regulación del patrón del eje corporal por los genes Hox (Lemons 2006) y los órganos sensibles a la luz por Pax6 (Gehring 2011). La amplia mayoría de los caracteres adquiridos en nuestro linaje son complejos y su origen evolutivo se encuentra relacionado a cambios morfológicos y fisiológicos intrincados que ocurren durante el desarrollo embrionario. Estos cambios que ocurren temprano en el desarrollo son consecuencia directa de alteraciones en la expresión espacio-temporal de genes involucrados en el desarrollo (Fábregas-Tejeda and Vergara-Silva 2018; Carroll 2005). Aquellos pequeños cambios de secuencia ocurridos en regiones regulatorias podrían resultar en una alteración de la maquinaria molecular del desarrollo, dando lugar por ejemplo a la evolución de rasgos morfológicos humano específicos (Carroll 2003; Trinkaus and Shipman 2005). En otras palabras ocurriría un fenómeno de efecto mariposa a lo largo del desarrollo determinado por pequeños cambios en regiones regulatorias. El enfoque de los estudios genético-evolutivos debe estar dirigido a entender a los cambios a nivel regulatorio como las principales fuentes de variabilidad y diversidad morfológica (Souza et al. 2013; Lucia F. Franchini et al. 2012; Carroll 2008). Regulación transcripcional Del total de nuestro genoma, sólo el 1.5% está compuesto por secuencias codificantes, el 45% está compuesto por ADN repetitivo, y aproximadamente el 50% restante está compuesto por ADN no codificante (I. H. G. S. Consortium and International Human Genome Sequencing Consortium 2001; Venter 2003). En la actualidad se sabe que esta parte del genoma posee actividad bioquímica específica, albergando una inmensa cantidad de elementos regulatorios responsables de generar los diferentes patrones de expresión génica. Por lo tanto es aquí donde reside gran parte de la complejidad evolutiva, gracias a la redundancia y multiplicidad de elementos regulatorios que pueden actuar sobre uno o varios genes (Hardison 2000; Woolfe et al. 2004; Luco 2013). 26 https://paperpile.com/c/DEItd4/wgJQF https://paperpile.com/c/DEItd4/xfxGr https://paperpile.com/c/DEItd4/hRtnu https://paperpile.com/c/DEItd4/tB2sA https://paperpile.com/c/DEItd4/Cm1g1 https://paperpile.com/c/DEItd4/bJCh6+V75aG https://paperpile.com/c/DEItd4/bJCh6+V75aG https://paperpile.com/c/DEItd4/mb3q+AEquR https://paperpile.com/c/DEItd4/mb3q+AEquR https://paperpile.com/c/DEItd4/8kn89+Lrxnn+mPt2Z https://paperpile.com/c/DEItd4/8kn89+Lrxnn+mPt2Z https://paperpile.com/c/DEItd4/5kZcl+vyG3P https://paperpile.com/c/DEItd4/5kZcl+vyG3P https://paperpile.com/c/DEItd4/DgNsb+jultR+o84Ye La regulación transcripcional es el mecanismo por el cual los genes son regulados a nivel del ARNm. Dicha regulación es clave para determinar el momento y el lugar de expresión de los genes, que es la información primaria que contiene el genoma. La maquinaria reguladora que controla cómo, cuándo y dónde se expresa un gen se compone de regiones funcionales no codificantes presentes en el ADN, tales como promotores, enhancers y silenciadores; que junto a factores de transcripción en trans permiten regular de manera específica la expresión de genes (Fig. III) (Furlong and Levine 2018; Haberle and Stark 2018). Los promotores en general son lo sitios mejor caracterizados, definen la orientación y el sitio de inicio de la transcripción o TSS. En general abarcan unas 100-1000 pb alrededor del TSS. La ARN polimerasa II es la encargada de transcribir los ARNm que darán lugar a proteínas. Los enhancers o activadores transcripcionales son elementos genómicos que independientemente de su orientación con respecto al promotor son capaces de activar la transcripción génica. Más allá de esta orientación se dice que los enhancers actúan en cis respecto del promotor al que están regulando. Los enhancers están conformados típicamente por secuencias de ADN que presentan sitios de unión a factores de transcripción (TFBS). Los factores de transcripción al unirse a los enhancers cambian su conformación y son capaces de activar la transcripción en trans mediante el contacto directo o indirecto con la maquinaria transcripcional ubicada en el promotor (Serna et al. 2005). Los enhancers tienen la capacidad de actuar a distancia, siendo esta por demás variable. (Visel, Rubin, and Pennacchio 2009; Noonan and McCallion 2010; Pennacchio et al. 2013). Los silencers o represores unen proteínas y complejos modificadores de la cromatina que inhiben la expresión de un gen. Si bien a nivel de secuencia no presentan diferencias con los activadores, estos elementos son más difíciles de caracterizar (Ogbourne and Antalis 1998). Los insulators o aisladores proveen un nivel de regulación adicional, previniendo el avance de regiones de heterocromatinasobre regiones de cromatina activa, o restringiendo el alcance de un enhancer exclusivamente a su promotor (Noonan and McCallion 2010). Funcionan como barreras moleculares que delimitan dominios transcripcionales en el genoma. Por otra parte, cabe destacar que el genoma humano codifica para 1700 –1900 factores de transcripción distintos (Vaquerizas et al. 2009), los cuales actúan en trans sobre estas regiones génicas y son parte esencial de la regulación transcripcional. Estas proteínas usualmente contienen dos dominios distintos, uno responsable de reconocer secuencias o motivos determinados sobre el ADN (dominio de unión al ADN) y otro encargado de mediar la actividad regulatoria mediante interacciones con otras proteínas (dominio de transactivación). 27 https://paperpile.com/c/DEItd4/vCKt8+ywpV https://paperpile.com/c/DEItd4/vCKt8+ywpV https://paperpile.com/c/DEItd4/KiHiM https://paperpile.com/c/DEItd4/rNlg2+LYQ4D+f1oD9 https://paperpile.com/c/DEItd4/rNlg2+LYQ4D+f1oD9 https://paperpile.com/c/DEItd4/jDas6 https://paperpile.com/c/DEItd4/jDas6 https://paperpile.com/c/DEItd4/LYQ4D https://paperpile.com/c/DEItd4/JonFI Figura III: Tipos de elementos regulatorios conocidos. Los promotores son el sitio donde se unen los elementos de la maquinaria basal de la transcripción. Los activadores o enhancers y los represores o silencers median efectos positivos y negativos sobre la transcripción de sus genes blanco por medio de la interacción con los promotores. Los elementos aisladores (insulators) median el alcance de los demás elementos bloqueando físicamente la activación de la transcripción y evitan contactos espurios en el genoma. Todos estos elementos se encuentran distribuidos a lo largo de todo el genoma, el cual se compacta dentro del núcleo de cada célula en forma de cromatina, la cual a su vez se organiza en TADs o dominios topológicamente asociados espacialmente definidos. Los elementos regulatorios actúan sobre los genes en el contexto definido por estos TADs, los cuales pueden presentar tamaños muy variados. Modificado de (Noonan and McCallion 2010; Matharu and Ahituv 2015). En nuestro laboratorio contamos con las herramientas necesarias para estudiar la actividad de regiones candidatas a ser enhancers. Para evaluar la capacidad de un elemento de actuar como enhancer, el ensayo estándar consiste en utilizar genes reporteros. Se clona el elemento a estudiar en un plásmido, que va a contener un promotor mínimo regulando la expresión de un gen reportero. Se considera que el elemento tiene la capacidad de actuar como enhancer sí el mismo es capaz de dirigir la expresión de la proteína codificada por el gen reportero de manera tejido específica (Bessa et al. 2009; Visel et al. 2007). Por otra parte, los sitios con mayor accesibilidad a la degradación por DNAsa se asocian a sitios funcionales bajo el supuesto de que se encuentran accesibles a ser ocupados por factores en trans. Este principio también es utilizado a la hora de identificar regiones activas en el genoma, las cuales pueden incluir a cualquiera de estos elementos. Marcas epigenéticas sobre las histonas le dan especificidad adicional a estos elementos. 28 https://paperpile.com/c/DEItd4/LYQ4D+eCGu https://paperpile.com/c/DEItd4/LYQ4D+eCGu https://paperpile.com/c/DEItd4/VtNmP+JstWD Dominios Topológicamente Asociados (TADs) La evolución de la regulación genética se considera uno de los principales impulsores de la asombrosa diversidad morfológica en el reino animal. Como describimos anteriormente, la regulación génica depende en gran medida de elementos reguladores precisos, piezas discretas de ADN que interactúan entre sí regular la expresión génica (Field and Adelman 2020). En los últimos años, los experimentos de Captura de Conformación Cromatínica (3C, (Dekker 2002) y las tecnología derivadas de ella como Hi-C (Lieberman-Aiden et al. 2009) y 5C (Dostie et al. 2006) han permitido detectar con una resolución sin precedentes (hasta 1 Kb de resolución (Rao et al. 2014) la conformación espacial que adopta la cromatina dentro del núcleo. Los TADs (Dominios Topológicamente Asociados, (Dixon et al. 2012)) surgen de la disposición tridimensional que adopta el ADN en una célula y están delimitados por dominios CTCF que actúan de barrera física entre estos compartimentos (Acemel, Maeso, and Gómez-Skarmeta 2017). Se encuentra en continua discusión y revisión el rol de estos dominios en la regulación transcripcional (Ay and Noble 2015; “3D Genome Organization: Setting the Stage and Introducing Its Players” 2020; X. Wang, Cairns, and Yan 2019; Casa et al. 2020; Hsieh et al. 2020). Las interacciones entre los elementos dentro de un TAD son más frecuentes que las interacciones entre elementos inter-TAD (O. Symmons et al. 2014), de allí su importancia a la hora de limitar compartimentos transcripcionales (o dominios asociados). Por lo tanto la función de los TADs es la de acortar distancias espaciales entre los elementos contenidos dentro de ellos (Orsolya Symmons et al. 2016) y evitar interacciones no deseadas entre distintos dominios o compartimentos. Regiones aceleradas en humanos (HARs) El estudio de regiones no codificantes es sumamente complejo ya que no es posible utilizar los algoritmos más frecuentes para la detección de evolución adaptativa (sustituciones sinónimas versus no sinónimas). Los cambios de un solo nucleótido en el ADN no codificante pueden llegar a tener consecuencias funcionales muy drásticas, pero actualmente estas consecuencias son difíciles de predecir ya que frecuentemente muchas de las pequeñas mutaciones que ocurren en estas regiones son toleradas, y porque no se conoce en detalle cómo se codifica la información en los elementos regulatorios del genoma (Rubinstein and de Souza 2013; Lucía F. Franchini and Pollard 2015b). Una estrategia válida y muy utilizada por algoritmos de búsqueda de regiones regulatorias es la de buscar regiones conservadas a lo largo de la evolución, ya que conservación por lo general implica función. Existe una presión de selección sobre esa región por lo cual se mantiene. Pero también es válido preguntarse: ¿Qué sucede si una región conservada de repente cambia? 29 https://paperpile.com/c/DEItd4/wFbo https://paperpile.com/c/DEItd4/wFbo https://paperpile.com/c/DEItd4/oEweb https://paperpile.com/c/DEItd4/gJaIl https://paperpile.com/c/DEItd4/uO0L6 https://paperpile.com/c/DEItd4/uvFL6 https://paperpile.com/c/DEItd4/VnlJD https://paperpile.com/c/DEItd4/vW91O https://paperpile.com/c/DEItd4/vW91O https://paperpile.com/c/DEItd4/fZyl+FnnD+Pir1+Ai3a+Wl3T https://paperpile.com/c/DEItd4/fZyl+FnnD+Pir1+Ai3a+Wl3T https://paperpile.com/c/DEItd4/fZyl+FnnD+Pir1+Ai3a+Wl3T https://paperpile.com/c/DEItd4/tzqCo https://paperpile.com/c/DEItd4/fGwKP https://paperpile.com/c/DEItd4/BckGV+am4vy Una característica que posibilita la detección de regiones no codificantes es la conservación filogenética. Esto se basa en la hipótesis de que aquellas regiones que cumplen algún tipo de función en el genoma están sujetas a una presión de selección, y tendrán una tasa de evolución molecularmás baja, comparada con la tasa neutral de sustitución nucleotídica. Frecuentemente estas regiones conservadas dan lugar a enhancers asociados a genes involucrados en el desarrollo, lo cual es consistente con la presencia de una fuerte presión de selección que preserve estos mecanismos (S. Fisher 2006). Una de las hipótesis actuales sostiene que es más factible que aquellas secuencias conservadas a lo largo de la evolución alberguen algún tipo de actividad funcional que aquellas conservadas a menores distancias evolutivas (Boffelli, Nobrega, and Rubin 2004). Más allá de poder detectar este tipo de regiones en el genoma humano, la riqueza de la genómica comparada está en poder identificar aquellos elementos que hayan sufrido cambios únicamente en un linaje, ya que esto podría estar asociado con ganancias o pérdidas de función regulatoria. Un enfoque novedoso para analizarlo es reconociendo eventos de evolución acelerada. Esto se logra recurriendo a la detección de modificaciones significativas en la tasa de evolución molecular de regiones no codificantes del genoma, que a su vez hayan estado conservadas en muchos linajes (Hubisz and Pollard 2014; Kostka, Holloway, and Pollard 2018). En este sentido, los elementos acelerados en humanos (HARs; Human Accelerated Regions) son secuencias de ADN cortas y conservadas evolutivamente que han adquirido significativamente más sustituciones nucleotídicas de lo esperado en el linaje humano desde la divergencia con los chimpancés (Capra et al. 2013; Levchenko et al. 2018; Lucía F. Franchini and Pollard 2015a). Varios grupos han realizado estudios genómicos a gran escala con el objetivo de identificar HARs en el genoma humano (Pollard et al. 2006; Lindblad-Toh et al. 2011; Bird et al. 2007; Shyam Prabhakar et al. 2006; Bush and Lahn 2008). Cada uno de estos grupos, de forma independiente, aplicó su propio set de algoritmos produciendo como resultado distintos datasets de elementos acelerados. En líneas generales, la metodología empleada consiste en identificar regiones genómicas conservadas, alineando un grupo de especies de mamíferos y/o vertebrados, y aplicando algún método estadístico para cuantificar el nivel de conservación. Luego se aplica otro método estadístico (Tajima’s D, Likelihood Ratio Test, etc) para detectar un subconjunto de estos elementos que hayan sufrido cambios en su tasa de sustitución nucleotídica en el linaje humano (tasa de evolución molecular acelerada). Por último, estas regiones son curadas (manualmente o recurriendo a filtros específicos) eliminando aquellas que presentaran errores en los alineamientos y/o que estuvieran presentes en regiones anotadas como pseudogenes (entre otros filtros aplicados en cada trabajo). Estos estudios proveen un conjunto de posibles elementos regulatorios que, dado su patrón de evolución, son buenos candidatos a ser responsables de cambios en la regulación génica llevando eventualmente a la aparición de fenotipos humano-específicos. 30 https://paperpile.com/c/DEItd4/lSccr https://paperpile.com/c/DEItd4/XQd4d https://paperpile.com/c/DEItd4/0gO32+SM5qw https://paperpile.com/c/DEItd4/0gO32+SM5qw https://paperpile.com/c/DEItd4/Logkz+CteZw+kce0L https://paperpile.com/c/DEItd4/Logkz+CteZw+kce0L https://paperpile.com/c/DEItd4/trZsc+21Dgd+tGESx+d4qY3+mXjCm https://paperpile.com/c/DEItd4/trZsc+21Dgd+tGESx+d4qY3+mXjCm https://paperpile.com/c/DEItd4/trZsc+21Dgd+tGESx+d4qY3+mXjCm En nuestro laboratorio, previamente se utilizaron cuatro bases de datos de HARs (Pollard et al. 2006; Shyam Prabhakar et al. 2006; Bush and Lahn 2008; Lindblad-Toh et al. 2011) para generar una nueva base de datos no redundante con 1629 elementos acelerados en humanos (HAEs, Human Accelerated Elements, (Kamm, Pisciottano, et al. 2013). A partir de esta base de datos no redundante, se realizó un análisis de distribución de estas regiones en el genoma humano tanto por unidad transcripcional (RefSeq) como por intervalos genómicos no superpuestos de 1 Mb. Este análisis reveló que la gran mayoría de los genes e intervalos genómicos de 1 Mb carecen de HAEs (Fig. IV). (Kamm, Pisciottano, et al. 2013) De los 19,897 genes humanos anotados en RefSeq solo 433 (2,5%) albergan al menos un HAE, y de las unidades transcripcionales que efectivamente contienen HAEs, 416 (96%) contienen solo 1, 2 o 3 elementos. De manera similar, después de fraccionar el genoma humano en intervalos de 1 Mb (~3,000), se encontró que solo 14 (0,5%) tienen 6 o más HAEs. Por lo tanto, los genes que albergan un gran número de HAEs son muy infrecuentes. Dentro de los 7 genes humanos contienen más HAEs en su locus, se encuentra el factor de transcripción neuronal PAS domain-containing protein 3 (NPAS3) con una cantidad excepcional de 14 HAEs, y los genes RBFOX1 y CNTNAP2 con 8 y 6 HAEs, respectivamente. Estos elementos están siendo estudiados intensamente en el laboratorio (Kamm, López-Leal, et al. 2013) (Tesis Dr. Alejandro Cinalli, Tesis Lic. Lara Berasain). El análisis del locus de NPAS3, reveló que 11 de los 14 HAEs poseen actividad de enhancer transcripcional utilizando peces cebra transgénicos. Además, se demostró que el elemento humano HAR202 perdió su capacidad de actuar como enhancer transcripcional del desarrollo del sistema nervioso en comparación con la secuencia ortóloga de chimpancé (Kamm, Pisciottano, et al. 2013). Por otra parte, utilizando ratones transgénicos, también se demostró que el elemento humano 2xHAR142 ganó actividad de enhancer en el telencéfalo en comparación con la secuencia ortóloga en chimpancé y ratón (Kamm, Pisciottano, et al. 2013; Kamm, López-Leal, et al. 2013). En nuestro laboratorio en particular nos interesan aquellas regiones del genoma que contienen un gran número de HARs ya que alguna de estas regiones podría haber sufrido un impacto funcional debido a este proceso evolutivo de aceleración. Además se ha visto que los HARs no se disponen al azar en el genoma sino que más bien se agrupan en regiones cercanas a genes con funciones regulatorias durante los primeros estadíos del desarrollo (Capra et al. 2013; Erwin et al. 2014). En esta Tesis, basándonos en los trabajos previamente realizados en nuestro laboratorio, decidimos investigar si una nueva base de datos de HARs compilada aquí presenta elementos circundantes al locus FOXP2, incluyendo además el concepto de TAD al análisis no considerado anteriormente, para una caracterización espacial más precisa. Nuestro objetivo es evaluar si alguna de ellas puede estar regulando a este gen de forma novedosa en humanos. El gen FOXP2 ha sido ampliamente estudiado en evolución humana como se describe a continuación, lo que justifica fuertemente su análisis regulatorio. 31 https://paperpile.com/c/DEItd4/trZsc+d4qY3+mXjCm+21Dgd https://paperpile.com/c/DEItd4/trZsc+d4qY3+mXjCm+21Dgd https://paperpile.com/c/DEItd4/HHIVB https://paperpile.com/c/DEItd4/HHIVB https://paperpile.com/c/DEItd4/cl3nv https://paperpile.com/c/DEItd4/HHIVB https://paperpile.com/c/DEItd4/HHIVB+cl3nv https://paperpile.com/c/DEItd4/HHIVB+cl3nv https://paperpile.com/c/DEItd4/Logkz+1PgbO Figura
Compartir