Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Contenido • ¿Qué es el genoma humano? • Proyecto del genoma humano • Método de secuenciación • Mapa del genoma humano • Expresión del genoma humano • Métodos para el estudio del genoma humano • Aplicaciones del estudio del genoma humano en medicina • Farmacogenómica • Perspectivas de la medicina genómica • Diversidad genética e historia de las poblaciones humanas • Estudios del genoma humano en México Conceptos clave 1 El genoma humano se codifica en la cadena de DNA en 6 × 109 pares de bases. 2 La secuencia del Genoma Humano permite la identificación de genes relevantes en diferentes enfermedades. 3 Los polimorfismos de un nucleótido (SNPs) y las zonas repetitivas o minisatélites, permiten el mapeo de cambios genómicos de importancia médica. 4 La determinación del transcriptoma y del proteoma así como la determinación de las señales epigenéticas permite evaluar el comportamiento genómico de la célula. 5 La farmacogenómica es un producto aplicativo del estudio genómico en la biomedicina. 6 La terapia génica se contempla como el futuro próximo de la aplicación de la genómica. 1271 https://booksmedicos.org ¿Qué es el genoma humano? El genoma humano se define como la cantidad total de genes contenidos en el DNA que presenta un individuo, su posición en cada uno de los 46 cromosomas y en las mitocondrias, además de todo el DNA “chatarra” que en apariencia no tiene ninguna función. Este genoma es el responsable de la constitución, desarrollo y funcionamiento normal de los organismos vivientes. Esta definición se aplica a todos los organismos vivientes. Como resultado del análisis de la secuencia del genoma humano, la información obtenida más relevante es el catálogo completo de los genes que contiene un individuo. Aunque este paso es importante, sólo es el primero, ya que falta conocer el transcriptoma, o conjunto de todos los transcritos, y el proteoma, o conjunto de todas las proteínas que son el producto de expresión de los genes. Además, falta determinar la manera en que se regula este proceso, trabajo que será largo y complejo. El mapa del genoma humano determinado de forma molecular se completó en el año 2000 y en el 2003 se hizo pública la “secuencia final”, término técnico que indica que la secuencia de genes es muy precisa (con un posible error cada 10 000 letras) y altamente contigua (con espacios remanentes que corresponden a regiones cuya secuencia no puede ser resuelta con las técnicas moleculares actuales). La secuencia final cubre alrededor de 99% de las regiones que contienen al genoma humano, que ha sido secuenciado con alta eficiencia en 99.99%. Según los datos que se tienen hasta ahora (GENCODE versión 26, octubre 2016), el número de genes que codifican proteínas es de 19 817; los genes totales 58 219; aunque existen 13 546 con más de un marco de traducción del mensaje; los RNAs no codificadores largos más los cortos son unos 23 355 y 14 636 seudogenes. En el cuadro 33–1 se muestran algunos de los genes más característicos de cada uno de los cro- mosomas humanos y algunas enfermedades asociadas con éstos. Tomando como referencia la cifra anterior y considerando que el tamaño de la región codificadora y del transcrito primario de los genes humanos es de entre 1 400 y 30 000 pares de bases, respectivamente, se ha calculado que cuando mucho 40% del genoma se transcribe y sólo 8.7% corresponde a secuencias que codifican proteínas. Cuadro 33–1. Algunos de los genes más característicos de cada uno de los cromosomas humanos y ciertas enfermedades asociadas a los cromosomas Cromosoma Genes localizados en el cromosoma Enfermedades asociadas al cromosoma 1 COL11A1: colágeno tipo IV F5: factor de coagulación V GLC1A: gen para glaucoma HPC1: gen para cáncer de próstata PARK7: enfermedad de Parkinson Enfermedad de Alzheimer, cáncer de mama, glaucoma, cáncer de próstata, enfermedad de Parkinson 2 COL3A1: colágeno tipo III, Esclerosis amiotrófica lateral, esclerosis lateral primaria juvenil 1272 https://booksmedicos.org COL4A3: colágeno tipo IV COL5A2: colágeno tipo V TPO: peroxidasa de tiroides 3 PDCD10: muerte celular programada ZNF9: proteína en dedos de zinc Alcaptonuria, distrofia miotónica, porfiria, autismo, ceguera nocturna, susceptibilidad a VIH, diabetes, cataratas, intolerancia a sacarosa 4 FGFRL1: receptor para factor de crecimiento de fibroblastos CF1: factor de complemento I Acondroplasia, cáncer de vejiga, hemofilia C, enfermedad de Huntington, enfermedad de Parkinson 5 FGFR4: receptor para factor de crecimiento de fibroblastos HEXB: hexosaminidasa B Dependencia a la nicotina, enfermedad de Parkinson, atrofia muscular espinal, síndrome de cri du chat 6 COL11A2: colágeno tipo XI MYO6: miosina VI PKHD1: enfermedad hepática y riñón poliquístico Enfermedad de orina de miel de maple, enfermedad de Parkinson, Porfiria 7 COL1A2: colágeno tipo I ELN: elastina HSPB1: proteína de choque térmico TFR2: receptor de transferrina Citrulinemia, fibrosis quística, osteogénesis imperfecta 8 NEFL: polipéptido de neurofilamentos 68 kDa TG: tiroglobulina Hipotiroidismo congénito, deficiencia familiar de lipasa de lipoproteína 9 ALS4: esclerosis lateral amiotrófica ASS: argininosuccinato sintetasa Esclerosis amiotrófica lateral, citrulinemia, galactosemia, púrpura trombocitopénica 10 CDH23: cadherina FGFR2: receptor de factor de crecimiento de fibroblastos Porfiria eritropoyética congénita 11 HBB: cadena beta de la hemoglobina TH: hidroxilasa de tirosina β talasemia, cáncer de vejiga, anemia falciforme 12 COL2A1: colágeno tipo II MYO1A: miosina 1A Hipocondrogénesis, enfermedad de Parkinson, tirosinemia, hipocon- drogénesis 13 BRCA2: cáncer de mama RB1: retinoblastoma 1 Cáncer de mama y vejiga, retinoblastoma 14 COCH: factor C de coagulación Hipotiroidismo congénito, enfermedad de Alzheimer 15 HEXA: hexosaminidasa A EYCL3: color de ojos 3, cafés (el color de ojos es un rasgo poligénico). Síndrome de Angelman, cáncer de mama 16 COQ7: biosíntesis de ubiquitina TAT: tirosina aminotransferasa Fiebre mediterránea familiar, tirosinemia 17 COL1A1: colágeno, tipo I MYO15A: miosina XVA Cáncer de vejiga y de mama, galactosemia, osteogénesis imperfecta 18 FECH: ferroquelatasa Protoporfiria eritropoyética, porfiria 19 APOE: apolipoproteína E STK11: serina cinasa/treonina Enfermedad de Alzheimer, hipotiroidismo congénito, hemocromatosis, enfermedad de la orina de jarabe de maple 1273 https://booksmedicos.org 20 tTG: transglutaminasa tisular Enfermedad celíaca, encefalopatía espongiforme transmisible 21 SOD1: superóxido dismutasa 1 TMPRSS3: proteasa transmembranal, serina 3 Enfermedad de Alzheimer, esclerosis lateral amiotrófica, síndrome de Down, homocistinuria 22 NEFH: polipéptido pesado de neurofilamento. Esclerosis lateral amiotrófica, cáncer de mama, autismo X PGK: fosfoguanosina cinasa G6PD: glucosa-6-fosfato deshidrogenasa HPRT: hipoxantina fosforribosil transferasa Síndrome de Klinefelter, síndrome de Turner, síndrome de triple X Y AZF1: factor de azoospermia 1 SRY: región determinante del sexo TDF: factor determinante del testículo Síndrome de Turner (asociado a la falta de cromosoma Y) El descubrimiento de la reacción en cadena de la polimerasa (PCR) cambió el panorama de cómo se mapeaban los genes y se inició la era de la biología molecular genómica. Los múltiples descubrimientos de las características moleculares del DNA y los avances tecnológicos para manipularlo, produjeron un cambio radical en el conocimiento del genoma de diversos organismos y, por supuesto, en el del humano. La capacidad para sintetizar y analizar moléculas de DNA recombinante, propició el inicio de la era de la genética molecular, que en un periodo de tres decenios cambió en su totalidad el panorama y en 2003 permitió completar el mapa del genoma humano. 1274 https://booksmedicos.org Proyecto del genoma humano El proyecto del Genoma Humano se refiere a la serie de estudios a través de los cuales se logró determinar la secuenciade bases de una célula humana diploide, que contiene al- rededor de 6 × 109 bases nitrogenadas, para tratar de identificar todos los genes presentes en dicha secuencia y así explicar su función en la salud y en la enfermedad. En 1988 se estableció la Organización del Genoma Humano (HUGO, por sus siglas en inglés) con la participación de diferentes países: EUA, Reino Unido, Francia, Alemania, China y Japón, entre otros. El proyecto comenzó de manera oficial en 1990 con la expectativa de terminarse en 15 años; sin embargo, gracias a la cooperación internacional, a los avances en los métodos de secuenciación y de manera importante a la tecnología computacional, en el año 2000 se publicó una secuencia preliminar del genoma (92%). En el año 2004, los investigadores de HUGO anunciaron que una nueva estimación del número probable de genes en el genoma humano oscilaba entre 20 y 25 mil en total, contra el número inicial del proyecto de alrededor de 40 a 100 mil genes. El Proyecto del Genoma Humano planteó una serie de objetivos, entre los que se incluía el desarrollo de nuevas tecnologías y herramientas para la secuenciación, así como la creación de bases de datos y programas de computación para el análisis de secuencias. Otro objetivo fue el estudio de las implicaciones éticas, legales y sociales que tendría la generación de este conocimiento. 1275 https://booksmedicos.org Método de secuenciación El método clásico de Sanger, conocido también como método didesoxi, requiere de una cadena monofilar de DNA que sirve como molde o primer que facilita el inicio del proceso de replicación de DNA, así como de DNA polimerasa para agregar los nucleótidos de acuerdo con la secuencia del molde, nucleótidos normales marcados con fluorescencia o radiactividad y nucleótidos modificados (didesoxinucleótidos) que terminen el proceso de elongación del DNA. La muestra que se va a secuenciar se divide en cuatro lotes para desarrollar reacciones paralelas, y a cada uno se le agrega una mezcla de los cuatro nucleótidos normales, la DNA-polimerasa, y uno de los 4 nucle- ótidos modificados. Como éstos carecen de un grupo hidroxilo en posición 3’, al ser incorporados en la cadena, impiden la adición de más nucleótidos y el crecimiento de la cadena se detiene (figura 33-1). Debido a que los nucleótidos normales entran en competencia con los didesoxinucleótidos, el resultado final es una mezcla de cadenas de DNA con diferentes longitudes que son separadas por electroforesis en gel, y reveladas por medio de una autorradiografía o luz UV. Cada una de las cuatro reacciones realizadas se corre en un carril diferente y al final se puede observar un conjunto de cadenas que difieren entre sí sólo por un nucleótido de longitud, indicando de forma indirecta la base que se encuentra en la posición terminal de cada cadena (figura 33–2). La modificación de la técnica, empleando colorantes fluorecentes (dye-terminator sequencing), permite la secuenciación en una sola reacción y su determinación en electroforesis capilar con detección de cada base de manera continua. Esta modificación permitió la construcción de robots capaces de secuenciar una mega base por semana. Hoy en día se emplean diferentes sistemas para secuenciación masiva que han reducido el tiempo y costo de la obtención de la información, uno de los sistemas más prometedores emplea una combinación de diversas tecnologías por la compañía Pacific Bioscience (PacBio) que utiliza nanoporos en los cuales se sintetiza la cadena complementaria con una DNA polimerasa, liberando fluorocromos específicos para cada base incorporada, la luz se detecta por microscopia confocal y permite la secuenciación continua de cadenas de 5 a 8 kpb de longitud en promedio, facilitando el ensamble de las secuencias de manera simple y reduciendo el tiempo y los costos a cerca de mil dólares por genoma por hora (cuadro 33-2 y 33-3). 1276 https://booksmedicos.org Figura 33–1. Bases bioquímicas del método de secuenciación de Sanger. 1277 https://booksmedicos.org Figura 33–2. Secuenciación por el método didesoxi. 1) Incubación del DNA de secuencia desconocida con desoxinucleótidos y didesoxinucleótidos. 2) Productos obtenidos de la reacción de la polimerasa. 3) Visualización de los productos por electroforesis y deducción de la secuencia de la cadena complementaria a la que se buscaba. En el carril correspondiente a la didesoxicitidina se observa una banda más intensa que el resto, esto se debe a que aquí se obtienen dos heptanucleótidos: uno con didesoxiCTP y otro con CTP normal. Cuadro 33–2. Principales hitos en la secuenciación del DNA 1953 Descubrimiento de la estructura tridimensional del DNA 1954 Determinación del primer mapa físico del genoma humano: nuevas técnicas de tinción permitieron determinar que una célula humana contiene 46 cromosomas de 24 tipos diferentes 1278 https://booksmedicos.org 1977 Maxam y Gilbert publican el método para determinar la se- cuencia del DNA por modificación y degradación química. Sanger publica el método didesoxi para secuenciar, que aún es la base de la secuenciación 1981 Se publica la secuencia completa del DNA mitocondrial humano 1984 Secuencia completa del genoma del virus de Epstein-Barr (170 kbp) 1985 Desarrollo de la técnica de PCR, para replicar pequeñas cantidades de DNA 1986 Se anuncia el primer aparato que permite la secuenciación automática de pequeños fragmentos de DNA 1988 Los Institutos Nacionales de Salud de EUA (NIH) crean el Centro Nacional para el estudio del Genoma Humano Se estableció la Organización del Genoma Humano (HUGO) para coordinar los esfuerzos internacionales y el intercambio de recursos para la secuenciación total del genoma humano 1990 Los institutos Nacionales de Salud de EUA comienzan proyectos de secuenciacióna a gran escala con Mycoplasma caprolicum, Escherichia coli, Caenorhabditis elegans y Sacharomyces cerevisiae Se lanza de manera oficial el Proyecto del Genoma Humano con un presupuesto de 3 mil millones de dólares para EUA 1991 Se establece la Genome Database (GDB) para almacenar los datos de la secuenciación del Genoma Humano 1995 Se publica la secuencia del primer organismo de vida libre: Haemophilus influenzae (1.8 Mb) 1996 El Consorcio Internacional libera la secuencia del genoma de S. cerevisiae (12.1 Mb) 1997 Se publica la secuencia completa de E. coli (5 Mb) 1998 Se completa la secuencia de C. elegans (97 Mb) 1999 El Consorcio Internacional publica la primera secuencia completa del cromosoma 22 humano 2000 Celera Genomics anuncia la secuencia de D. melanogaster (180 kbp), obtenida con el método de escopetazo de genoma completo Se anuncian los borradores de la secuencia del Genoma Humano obtenidos por el Consorcio Internacional y Celera Genomics El Consorcio Internacional completa la primera secuencia de una planta: Arabidopsis thaliana (125 Mb) 2001 El Consorcio Internacional publica el borrador de la Secuencia del Genoma Humano en Nature, mientras que Celera lo hace en Science 2002 Se da por concluida la secuenciación del genoma humano 2006 Se publica finalmente la secuencia del último cromosoma Cuadro 33-3. Ejemplos de genomas secuenciados ARQUEOBACTERIAS Organismo Tipo Relevancia Tamaño del genoma (kpb) Núm. de genes Año Archaeoglobus fulgidus Termófilo acuático anaerobio Biotecnológica 2 178 2 436 1997 Halobacterium sp. Halófilo acuático aerobio y heterótrofo Biotecnológica 2 571 2630 2000 1279 https://booksmedicos.org Haloarcula marismortui Halófilo acuático aerobio Biotecnológica 3419 3407 2004 Methanococcus maripaludis Metanógeno hidrogenotrófico anaeróbico Biotecnológica y producción de energía 1661 1722 2004 Pyrococcus furiosus Hipertermófilo, metaboliza polisacáridos y péptidos Biotecnológica y diversidad metabólica 1908 2 065 1999 BACTERIAS Bacillus anthracis Bacilo Gram +, formador de endosporas Causa carbunco o ántrax 5 228 5 508 2003 Bacillus subtilis Bacilo Gram +, causante de descomposición de alimentosOrganismo modelo 4 214 4 106 1997 Bradyrhizobium japonicum Bacteria nitrificante formadora de nódulos en leguminosas Bacteria con uno de los genomas más grandes 9 105 8 317 2002 Carsonella ruddii Proteobacteria Bacteria con un genoma muy pequeño 159 182 2006 Chlamydia trachomatis Cocoide Gram -, parásito intra- celular Causa tracoma, principal causa de ceguera 1 044 894 1998 Clostridium tetani Bacilo anaerobio Gram +, fromador de endosporas Causa tétanos en humanos 2 799 2 373 2003 Deinococcus radiodurans Coco Gram -, células en tétradas Organismo más resistente a la radiación 3 280 3 187 1999 Escherichia coli K12 Enterobacteria Gram - Organismo modelo 4 639 4 280 1997 Helicobacter pylori Espirobacilo Gram -, entero- bacteria patógena Causa gastritis y úlceras pépticas en humanos 1 667 1 566 1997 Mycobacterium leprae Bacilos curvos, formadores de filamentos, patógeno Causa lepra en humanos 3 268 2 720 2001 Mycobacterium tuberculosis Bacteria patógena Causa tuberculosis en humanos 4 411 3 924 1998 Mycoplasma genitalium Bacteria patógena Bacteria con un genoma muy pequeño 580 476 1995 Pseudomonas aeruginosa Bacilo Gram -, patógeno oportunista Organismo modelo 6 300 5 570 2000 Salmonella typhimurium Bacilo Gram -, enterobacteria patógena Causa fiebre tifoidea en humanos 4 857 4 452 2001 Staphylococcus aureus Coco Gram +, patógeno en humanos Causante de múltiples infecciones en humanos 2 809 2 673 2004 Treponema pallidum Espiroqueta Gram -, patógeno en humanos Causa sífilis en humanos 1 138 1 041 1998 Vibrio cholerae Vibrión Gram - Causa cólera en humanos 4 033 3 885 2000 Anopheles gambiae Mosquito Vector de la malaria 278 844 13 683 2002 Arabidopsis thaliana Mostaza silvestre Planta modelo 125 000 25 498 2000 1280 https://booksmedicos.org Aspergillus niger Hongo de vida libre Biotecnólogica, fermentación 33 900 14 165 2007 Bombyx mori Gusano de seda doméstico Producción de seda 530 000 18 150 2004 Caenorhabditis elegans Gusano nemátodo Animal modelo 95 330 20 018 1998 Canis familiaris Perro doméstico Animal modelo 2 400 000 19 300 2005 Dictyostelium discoideum Hongo mixomiceto mucilaginoso Organismo modelo 34 042 12 500 2005 Drosophila melanogaster Mosca de la fruta Animal modelo 180 000 13 676 2000 Entamoeba histolytica Protozoario parásito intestinal Causa la disentería amibiana en humanos 23 751 9 938 2005 Homo sapiens Ser humano 2 850 000 22 287 2006 Monodelphis domestica Zarigüeya de cola corta Primer genoma marsupial secuenciado 3 475 000 18 648 2007 Mus musculus Ratón común Mamífero modelo 2 716 965 24 174 2002 Neurospora crassa Hongo filamentoso de vida libre Eucarionte modelo 38 639 10 082 2003 Ornithorhyncus anatinus Ornitorrinco, mamífero ovíparo Mamífero primitivo con características compartidas con aves y reptiles 1 840 000 18527 2008 Oryza sativa Arroz Planta cultivada y organismo modelo 420 000 >40 000 2002 Pan troglodytes Chimpancé Primate más cercano al humano 3 100 000 >22 000 2005 Paramecium tetraurelia Protozoario ciliado Organismo modelo 100 000 39 642 2004 Plasmodium falciparum Protozoario parásito Causa la malaria en humanos 22 900 5 268 2002 Rattus norvegicus Rata parda Mamífero modelo 2 750 000 21 166 2004 Saccharomyces cerevisiae Levadura del pan Eucarionte modelo 12 088 5 885 1996 Schizosaccharomyces pombe Levadura, el menor número de genes en un eucarionte Eucarionte modelo 14 000 4 824 2002 Strongylocentrotus purpuratus Erizo de mar Eucarionte modelo 814 000 23 300 2006 Tetraodon nigroviridis Pez globo Vertebrado con el genoma más pequeño 385 000 27 918 2004 Trichomonas vaginalis Protozoario parásito Causa la tricomoniasis en humanos 176 441 60 160 2007 Trypanosoma brucei Protozoario parásito Causa la enfermedad del sueño en humanos 26 075 9 068 2005 1281 https://booksmedicos.org Mapa del genoma humano El genoma humano es complejo y a lo largo de años de estudio se han logrado descubrir algunas características específicas en la secuencia del DNA que son particulares en cada individuo, por lo que pueden ser útiles para la identificación de una persona, un grupo de parientes o de poblaciones con características similares. Haplotipos Un haplotipo es la constitución genética de un cromosoma. Se puede referir a un solo locus o a un genoma completo. En el caso de organismos diploides como los humanos, el haplotipo comprende un miembro del par de alelos para cada locus, uno en cada cromosoma homólogo. Otro significado de haplotipo se refiere a un grupo de polimorfismos de un solo nucleótido (SNP, por sus siglas en inglés) en una sola cromátida que están asociados de cerca. Se cree que estas asociaciones y la identificación de unos pocos alelos de un conjunto de haplotipos pueden identificarse de manera precis a e inequívoca de todos los otros sitios polimórficos de esa región. Esta información es esencial en la investigación de enfermedades genéticas que no son comunes. Los haplotipos en el genoma humano se han producido por los mecanismos moleculares de la reproducción sexual y la historia evolutiva de la especie. Con excepción de las células sexuales, los cromosomas en las células humanas se encuentran por pares, que se denominan homólogos, uno proveniente del padre y otro de la madre. Estos cromosomas no pasan de generación en generación como copias idénticas, ya que durante la gametogénesis intercambian material genético a través de la recombinación. De esta manera, los cromosomas que portará el hijo, producto de la fecundación contendrán una nueva mezcla de genes. A través de muchas generaciones, los segmentos de cromosomas ancestrales en una población que ha tenido cruzas entre sí, se han mezclado a través de repetidos eventos de recombinación. Algunos segmentos de los cromosomas ancestrales ocurren como regiones de secuencias de DNA que son compartidas por muchos individuos. Estos segmentos son regiones de cromosomas que por su cercanía no han sido separadas por las múltiples recombinaciones, y a su vez quedan separadas por segmentos de DNA donde sí han ocurrido recombinaciones. Polimorfismos de un solo nucleótido (SNP) El término SNP se refiere a polimorfismos de un solo nucleótido, (SNP; por sus siglas en inglés, single nucleotide polymorphism). Son secuencias variables de DNA que ocurren cuando un solo nucleótido en la secuencia del genoma es alterado. Por ejemplo, un SNP puede cambiar la secuencia del DNA AAGGCTAA a ATGGCTAA. Para que una variación sea considerada como SNP, debe ocurrir al menos en 1% de la población. En algunas ocasiones, pueden alcanzar hasta 90% de toda la variación genética de los 1283 https://booksmedicos.org humanos, ya que ocurre de cada 100 a 300 bases a lo largo de los 3 mil millones que constituyen el genoma humano. Dos de cada tres SNP implican el cambio de citosina (C) por timina (T). Pueden presentarse tanto en regiones del genoma que codifican genes, como en aquellas que no lo hacen. Así, algunos SNP no tienen efecto en las funciones celulares, pero otros pueden predisponer a las personas a presentar enfermedades, o influir en la respuesta a algunos medicamentos. Aunque más de 99% de la secuencia del DNA es la misma en la población humana, sus variaciones pueden tener mayor impacto en la manera en que los individuos responden a las enfermedades, a las agresiones del ambiente, como exposición a bacterias, virus, toxinas, agentes químicos, medicamentos y a otro tipo de terapias como radiaciones. Esto hace que los SNP sean muy importantes para la investigación biomédica y para el desarrollo de fármacos o diagnósticos médicos. Los SNP son de manera evolutiva estables por lo que no cambian mucho de generación en generación, lo que los hace fáciles de seguir en estudios poblacionales. Debido a esto, el análisis de SNP ayuda a identificar múltiples genes asociados con enfermedades complejas como el cáncer, diabetes, enfermedades vasculares y algunas formas de enfermedades mentales. Los SNP por sí mismos nocausan enfermedades, pero pueden ayudar a determinar la posibilidad de que alguien desarrolle una enfermedad particular. Por ejemplo, el gen de la apolipoproteína E se ha asociado con la enfermedad de Alzheimer, y es un buen ejemplo de cómo los SNP afectan el desarrollo del padecimiento. Este gen contiene dos SNP que resultan en tres posibles alelos para este gen (ApoE): E2, E3 y E4; cada uno difiere en una sola base y la proteína resultante de cada gen difiere en un solo aminoácido. Cada individuo hereda una copia materna y una paterna del gen ApoE. Las investigaciones han mostrado que un individuo que hereda al menos un alelo E4, tiene más probabilidad de padecer la enfermedad de Alzheimer. En apariencia, el cambio de un aminoácido en la proteína E4 altera su estructura y función de manera suficiente para desarrollar la enfermedad. Por otra parte, los individuos que heredan el alelo E2 tienen menor probabilidad de padecerla. Los SNP no son indicadores absolutos del desarrollo de la enfermedad. Un individuo que hereda dos alelos E4 puede no presentar la enfermedad de Alzheimer, mientras que otro que hereda los alelos E2 sí, ya que ApoE es sólo uno de los posibles genes asociados con esta enfermedad. La mayoría de los trastornos crónicos más comunes, como enfermedades del corazón, diabetes o cáncer, son patologías que pueden ser causadas por variaciones en diversos genes. Minisatélites Un minisatélite es una sección de DNA que consiste en una serie corta de 10 a 100 pares de bases, que se encuentran en más de 1000 sitios en el genoma humano. Consisten en regiones con un número variable de repeticiones de nucleótidos en tándem (VNTR, por sus siglas en inglés). Cada segmento polimórfico posee una secuencia básica en común con otras VNTR, así como secuencias que le son específicas. La variabilidad de los 1284 https://booksmedicos.org VNTR se refleja en el hecho de que las secuencias reconocidas por las enzimas de restricción varían en el genoma, por la presencia de mutaciones heredadas o adquiridas. Esto genera o elimina sitios de restricción originando fragmentos de DNA de diferente tamaño o número. A las variaciones en los sitios de restricción se les conocen como fragmentos de restricción de longitud polimórfica (RFLP). La huella genética del DNA consiste en la tipificación de un individuo y se basa en la presencia de minisatélites en el genoma. Las regiones de minisatélites que se utilizan con estos métodos son los VNTR que se encuentran entre los sitios de restricción. Éstos se cortan con enzimas de restricción que dejan intactos los minisatélites, se separan por electroforesis e hibridan con una sonda de una secuencia repetida compartida por diferentes polimorfismos. De este modo se obtiene un patrón electroforético que es único para cada individuo y sirve a manera de huella digital. Es poco probable que dos humanos no emparentados tengan el mismo número de minisatélites en un locus dado; sólo los gemelos idénticos muestran un patrón indistinguible. Por sus características, este método se utiliza en pruebas de paternidad y genética forense. 1285 https://booksmedicos.org Expresión del genoma humano La expresión del material genético y su regulación forman parte de lo que se conoce como transcriptoma, proteoma y epigenoma. Transcriptoma Un gen está constituido por una secuencia de bases que determina como producto final la estructura de una proteína (figura 33–3). Cada gen presenta secuencias llamadas exones, que portan regiones codificadoras que alternan con regiones no codificadoras llamadas intrones. Para que el código que se encuentra contenido en el DNA se traduzca en una proteína, se requiere pasar por varios procesos; el primero es la transcripción, donde a partir del DNA se sintetiza el mRNA; el segundo es la traducción que utiliza los aminoácidos codificados en el mRNA para producir una proteína. El concepto aceptado hace varios años, que dice que un gen produce una proteína, ya no es válido; hoy en día se sabe que un solo gen puede producir numerosos mRNA, por medio de un proceso conocido como remoción alternativa de intrones (alternative splicing). A través de este mecanismo algunos genes originan sólo un tipo de mRNA, pero otros tienen la capacidad de producir centenas, como la familia de las neurexinas, en donde dos genes pueden ge- nerar miles de mRNA distintos entre sí. La remoción alternativa de intrones genera gran variabilidad de mRNA, que en conjunto, constituyen el transcriptoma. En consecuencia, el transcriptoma de una célula posee alto potencial de especificar una amplia diversidad de proteínas que determinan, en parte, su función y su diferenciación. 1286 https://booksmedicos.org Figura 33–3. Se representa al gen con exones, a partir del cual se sintetizan varios mRNA por remoción alternativa de intrones, y por el proceso de traducción se producen diversas proteínas. Proteoma Se conoce como proteoma al complemento proteínico total producido por el genoma de un organismo o de una célula. Su complejidad es grande si se considera que en la especie humana hay más de 20 000 genes, y que cada transcrito de mRNA puede sufrir un procesamiento alternativo y, a su vez, cada proteína puede tener modificaciones postraduccionales. Es posible, por tanto, que el proteoma de cada individuo tenga una complejidad de dos a tres órdenes de magnitud superior a la del genoma. De hecho, se estima que el proteoma completo de la especie humana podría estar constituido por más de 100 mil cadenas polipeptídicas. El conocimiento del proteoma constituye uno de los desafíos más importantes de la era posgenómica. El análisis de la variabilidad de las proteínas está cobrando cada vez mayor interés, debido a que está asociada tanto al funcionamiento normal del organismo como a muchas de sus patologías. En resumen, la proteómica comprende el análisis de este conjunto de proteínas, desde una perspectiva funcional, que incluye localización, modificaciones e interacciones con otras moléculas, en células de tejidos sanos o con alguna patología. Epigenoma 1287 https://booksmedicos.org La epigenética se refiere a las modificaciones heredables que se presentan en la expresión de un gen, pero que no involucran cambios en la secuencia del DNA. Estas modificaciones se presentan tanto en el DNA, por ejemplo, la metilación de esta molécula que ocurre en el carbón 5 de la citosina en las regiones ricas en secuencias repetidas de dinucleótidos CpG, como en proteínas de la cromatina, como el caso de las histonas que sufren modificaciones postraduccionales como la fosforilación y la acetilación (figura 33–4). Ambos eventos influyen en el empaquetamiento del DNA, y en consecuencia en la accesibilidad que tiene la maquinaria transcripcional de un determinado gen, para que éste pueda expresarse. 1288 https://booksmedicos.org Figura 33–4. A) Se representa a la RNA polimerasa llevando a cabo el proceso de transcripción. B) El promotor se encuentra metilado y la polimerasa pierde accesibilidad, por lo cual no ocurre el proceso de transcripción. La metilación inhibe la expresión génica. El epigenoma consiste en la totalidad de cambios epigenéticos que distinguen a un tipo celular específico. Se ha demostrado que los factores ambientales inducen cambios epigenéticos que permiten que cada individuo se adapte a las diferentes etapas de su vida y que a largo plazo, puedan tener efectos en la expresión génica cambiando la susceptibilidad a presentar enfermedades. Debido a que los transcritos y las proteínas son determinantes del proceso de enfermedad, la importancia del conocimiento del transcriptoma, del proteoma y del epigenoma, es de manera potencial más relevante que la del genoma en sí mismo. A continuación, se describen algunas de los métodos más relevantes que han sido utilizados en el estudio de los genes, su composición, regulación, función y las interacciones de sus productos. 1289 https://booksmedicos.org Métodos parael estudio del genoma humano Secuenciación del DNA La secuenciación del DNA es un método que detecta mutaciones relacionadas con enfermedades y polimorfismos. Provee resultados directos con alta sensibilidad, aunque el tiempo invertido y el costo para realizarla la hacen poco práctica para analizar genomas completos, por lo que sólo se aplica al estudio de genes específicos. La eficiencia que tiene este método ha permitido estudiar la secuencia de nucleótidos de las cinasas en diversos tipos de cáncer, las cuales con frecuencia se activan por mutación en las células de los pacientes con esta enfermedad. El conocimiento de estas mutaciones ha llevado a plantear nuevos métodos terapéuticos, basados en el diseño de moléculas inhibitorias que se unen a las cinasas en sitios específicos y las inactivan. Análisis de perfiles de expresión La variedad de transcritos sintetizados por una célula constituye su perfil de expresión, el cual es útil para describir un tejido que presenta una determinada enfermedad, para así encontrar nuevas moléculas blanco y diseñar tratamientos específicos. La expresión génica de una célula se modifica por la adquisición de mutaciones en su secuencia de DNA, por la manera en que responde a los retos y estímulos del medio en que se encuentra, y por los cambios epigenéticos que sufre. Para analizar el perfil de expresión a alta escala se cuenta con diversos métodos, entre los cuales destacan el análisis en serie de la expresión génica y los microarreglos de oligonucleótidos. Análisis en serie de la expresión génica Este método determina la expresión del total de transcritos de una muestra celular, es decir, analiza su transcriptoma. Se extrae el mRNA total de una muestra y se sintetiza el cDNA. A partir de la región 3’ del cDNA se extraen secuencias cortas que funcionan a manera de marcadores o etiquetas (tags) y que cuentan con la información suficiente para identificar un transcrito. Se obtienen más marcadores y se unen o concatenan entre sí, se clonan y se secuencian (alrededor de 1 000 marcadores por gel de secuenciación). A continuación, se identifican y cuantifican los transcritos que se expresan en la muestra estudiada. La abundancia de un fragmento en la secuencia refleja la abundancia del mRNA en el tejido analizado. Aunque este método es laborioso y por tanto aplicable a pocas muestras, permite realizar un análisis a profundidad. De hecho, una de sus mayores ventajas es que detecta y cuantifica los transcritos, aunque éstos aún sean desconocidos o no se hayan asociado con la enfermedad. A través del análisis serial de la expresión génica se detectó que la PRL-3 tirosina fosfatasa está involucrada con el cáncer de colon metastático. Esta observación había pasado inadvertida, debido a que este gen no estaba incluido en los microarreglos para análisis de expresión disponibles de forma comercial. 1290 https://booksmedicos.org Microarreglos Los microarreglos (microarrays) para análisis de expresión, incluyen miles de oligonucleótidos de DNA o cDNA que se colocan en puntos a lo largo de una lámina de cristal; también se pueden obtener a través de la síntesis de oligonucleótidos in situ. A estos últimos se les conoce como chips génicos. Este método permite el análisis de expresión de miles de genes de forma simultánea y se basa en la hibridación del cDNA, sintetizado a partir del mRNA obtenido de una muestra problema, con los oligonucleótidos del microarreglo. Para detectar los niveles de expresión de una muestra existen dos posibilidades: a) en los microarreglos con puntos el cDNA se marca con un fluorocromo, b) en los chips, el cDNA se convierte en cRNA, se marca con biotina y se detecta con avidina conjugada con un fluorocromo. La intensidad de hibridación y fluorescencia es proporcional a la cantidad de cDNA o cRNA presente, que a su vez refleja la abundancia del mRNA de la muestra analizada. Si se desea comparar la expresión génica diferencial entre dos muestras, por ejemplo, células cancerosas y su contraparte normal, se utilizan dos fluorocromos diferentes. Se cohibridan el cDNA de la muestra problema (en color rojo) y el de la muestra de referencia (en color verde). Se evalúa la proporción que existe entre la intensidad de ambos fluorocromos; si existe expresión similar en ambas muestras para un determinado gen ésta se detectará en color amarillo; ante la presencia de mayor expresión en la muestra problema la fluorescencia será color rojo; en contraste, si se presenta decremento en la expresión de un gen, la fluorescencia será color verde. De esta manera se puede obtener una medida relativa de la expresión de las muestras. Este método ha tenido una gran diversidad de aplicaciones que se comentarán más adelante a partir de algunos ejemplos específicos. Otra aplicación del método de microarreglos de DNA es la genotipificación, en donde se analizan matrices de SNP para identificar variaciones en individuos o en poblaciones. Estos polimorfismos pueden estar asociados al desarrollo de enfermedades o a la respuesta a medicamentos y el análisis por microarreglos constituye una estrategia de rastreo rápido de estos cambios. Esta variante del método también es útil para identificar mutaciones, pérdida de heterocigosidad, amplificaciones génicas y deleciones de regiones de DNA en el genoma de individuos afectados. Análisis de metilación del promotor de un gen Las modificaciones epigenéticas de tipo metilación que presenta un alelo en las regiones ricas en dinucleótidos CpG, se pueden distinguir por alteraciones en su secuencia de DNA después de que dicha molécula ha sido tratada con bisulfito. El bisulfito convierte sólo las citosinas no metiladas en uracilos. A continuación, se lleva a cabo una reacción de PCR utilizando cebadores específicos para las secuencias correspondientes, tanto en el caso de que éstas estuvieran metiladas, como no metiladas. Los productos se separan por electroforesis y se discrimina la presencia o ausencia de metilación por diferencias en 1291 https://booksmedicos.org el corrimiento electroforético. Los resultados se validan por secuenciación de los productos. Métodos recientes, empleando síntesis de DNA que liberan fluorocromos en el tercer fosfato han permitido la secuencia directa de varias formas de modoficación epigenética sin necesidad de modificaciones previas en las bases en cuestión, lo cual permite una amplia definición del estado de modificación epigenético del genoma total. 1292 https://booksmedicos.org Aplicaciones del estudio del genoma humano en medicina Las enfermedades genéticas constituyen un espectro que comprende desde las que son mendelianas y que se consideran “simples”, por tener una alta probabilidad de expresión, hasta las “complejas”, que son multifactoriales y en las que cada gen que participa desempeña un papel con capacidad reducida. La genética humana estudia genes aislados, enfermedades monogénicas; en contraste, la medicina genómica estudia al genoma entero, profundizando en el aspecto funcional, por lo que abunda en las interacciones químicas y en los procesos celulares que controlan la expresión de los genes. La medicina genómica identifica y analiza los genes susceptibles a desarrollar enfermedades comunes. Las probabilidades de presentar o no una enfermedad, se basan en las diferencias que existen en las secuencias génicas entre los individuos y en la presencia de factores ambientales que influyen para que dichos genes se manifiesten o no. El conocimiento de los genes asociados con una enfermedad confiere la posibilidad de desarrollar medicina preventiva, nuevos métodos de diagnóstico y de evaluación de la enfermedad a lo largo de sus diversas etapas, así como nuevos agentes y estrategias terapéuticas más efectivas y menos nocivas para el paciente. A continuación, se comentan algunos ejemplos de las aplicaciones del análisis del genoma en diversas enfermedades. 1293 https://booksmedicos.org Farmacogenómica Hace mucho tiempo losmédicos intuyeron diferencias entre los individuos en la respuesta al tratamiento con diversos fármacos. Por ejemplo, en la segunda Guerra Mundial se utilizó primaquina como agente profiláctico contra la malaria, y se observó que los soldados afroamericanos desarrollaron anemia hemolítica por efecto del tratamiento. A continuación, se determinó que la razón por la cual desarrollaron la enfermedad se debió a que existe variabilidad entre razas en la actividad de la glucosa-6- fosfato deshidrogenasa, que participa en el metabolismo del fármaco. Las diferencias del metabolismo de fármacos que existen entre individuos y razas son estudiadas por la farmacogenética. Hoy en día, la toxicidad, la sensibilidad y la resistencia a fármacos son fenómenos reconocidos; la disciplina que estudia sus causas genéticas a través del análisis de los sistemas de absorción, transporte, distribución, metabolismo y excreción es la farmacogenómica. Con base en esto, la farmacogenómica permite asesorar en la selección del fármaco y en la dosis adecuada para cada paciente, partiendo del conocimiento de las variantes alélicas presentes en cada individuo, asociadas con los diversos efectos biológicos del fármaco, como se verá en los siguientes ejemplos. Receptores de fármacos Existen polimorfismos asociados con genes que codifican receptores; por ejemplo, el caso del receptor de opioides mu en la posición 118. La variante proteínica que se obtiene es tres veces más potente en su interacción con la β-endorfina que con respecto al alelo silvestre. Esta variante se presenta en pacientes con mayor susceptibilidad y respuesta a este fármaco, así como en individuos con predisposición a presentar adicciones a drogas. Transportadores de fármacos Las proteínas transportadoras se encuentran involucradas en la absorción, distribución y excreción de diversas toxinas y medicamentos. Un ejemplo es la proteína de resistencia a múltiples fármacos que está codificada por el gen MDR1, que se encarga del transporte de diversas sustancias a través de la membrana, entre las que se encuentran los fármacos utilizados en el tratamiento del cáncer. Se han identificado algunos polimorfismos asociados con la disminución en su expresión que modifican la sensibilidad a diversos agentes quimioterapéuticos. Enzimas que participan en el metabolismo de fármacos El citocromo P450 es un complejo constituido por un grupo de enzimas que participan en el metabolismo de fármacos y de la mayoría de los medicamentos usados en medicina que se distribuye en diversos tejidos, aunque predomina en el hepático y es inducibles por factores ambientales. Dentro del complejo, la actividad de las enzimas CYP 1A2, 1294 https://booksmedicos.org 2C9, 2C19, 2D6, 2E1 y 3A4 está determinada por el grado de expresión de sus respectivos genes. Un ejemplo es el polimorfismo del gen CYP2D6 en el metabolismo de la codeína para transformarla en morfina. Alrededor de 10% de los pacientes que utilizan la codeína como terapia analgésica presentan polimorfismos del gen que impiden el funcionamiento del CYP2D6 por lo que los niveles esperados de morfina se encuentran en bajas cantidades o no se detectan, por lo que estos pacientes no muestran el efecto analgésico esperado. En contraste, hay polimorfismos en CYP2D6 que confieren un metabolismo rápido de la codeína, produciendo niveles anormales altos de morfina con los consecuentes efectos secundarios que produce este analgésico. Cuando se presentan mutaciones homocigotas en el CYP2C19, los pacientes muestran alta sensibilidad a los sustratos de esta enzima, como son el diazepam, el omeprazol y el propanolol, entre otros, por lo que se requiere identificar el polimorfismo de estos pacientes con la finalidad de administrar la dosis adecuada, alcanzar los niveles terapéuticos en sangre y evitar la toxicidad. La enzima CYP2A6 participa en la inactivación de la nicotina a cotinina. En la población fumadora se presentan con baja incidencia dos alelos variantes de dicho gen que son inactivos, CYP2A6*2 y CYP2A6*3. Los consumidores de tabaco que tienen metabolismo deficiente, y aun los que son heterocigotos para las formas inactivas del gen, necesitan disminuir el consumo de cigarros. Se ha tratado de reproducir el efecto del gen inactivo utilizando tranilcipromina y metoxalen que bloquean a la CYP2A6; lo que ha disminuido el consumo de cigarros. Otra enzima importante es la tiopurin-S-metiltransferasa que metaboliza agentes como la mercaptopurina y la azatiopurina, que son utilizados como inmunosupresores y en el tratamiento de neoplasias. Su función consiste en inactivar dichos agentes de preferencia en tejido hematopoyético. Cuando hay deficiencia de esta enzima se acumulan en exceso nucleótidos de tioguanina activos que causan toxicidad en las células sanguíneas. Por otro lado, el empleo de los SNPs como marcadores ha permitido abordar diversos problemas en el diagnóstico de las enfermedades, como se muestra a continuación: a) La clasificación y el diagnóstico de las leucemias requiere de una labor intensa de laboratorios con diferentes especialidades, como es la caracterización del inmunofenotipo, el análisis citogenético y los estudios moleculares. Los ensayos con microarreglos han detectado perfiles de expresión que distinguen los subtipos celulares B o T de los linfoblastos leucémicos, como un patrón asociado con las principales alteraciones citogenéticas y moleculares con valor en el pronóstico de estos pacientes. Como resultado, el estudio de microarreglos ha permitido estratificar a los pacientes en seis grupos basados sólo en el perfil de expresión de sus blastos leucémicos: pacientes con leucemia de células T, con hiperdiploidía mayor a los 50 cromosomas, con alguna de las fusiones génicas características de esta enfermedad que son la E2A-PBX1, BCR-ABL, TEL-AML1 o con alteraciones del gen MLL, permitiendo establecer tratamientos adecuados. b) La ubicación de cada paciente en un grupo con un pronóstico definido, se asocia con 1295 https://booksmedicos.org la respuesta al tratamiento. En diferentes estudios se ha logrado detectar la asociación de diversos genes, evitando el riesgo de presentar eventos adversos como recaídas o resistencia al tratamiento con quimioterapia. c) El desarrollo de neoplasias secundarias como secuela del tratamiento antileucémico. Los análisis de microarreglos han sugerido la posibilidad de detectar, incluso desde el momento del diagnóstico, a aquellos pacientes con predisposición a presentar un segundo cáncer a mediano o largo plazo; aunque este hallazgo puede ser importante, se requiere llevar a cabo estudios prospectivos para confirmarlo. d) La identificación de nuevas moléculas asociadas con la enfermedad sirven como marcadores para seguir la evolución de la misma, o bien, pueden funcionar como blancos terapéuticos en el diseño de agentes específicos de tratamiento antileucémico. En un estudio realizado en niños con leucemia linfoblástica aguda de células T, se analizaron los perfiles de expresión de pacientes con alteraciones en genes conocidos que se sobre-expresan en esta enfermedad (HOX11, TAL1, LYL1, LMO1 LMO2) como efecto de la presencia de alteraciones citogenéticas y moleculares. El análisis de microarreglos determinó la presencia de un nuevo perfil de expresión específico, que ayudó a identificar al gen HOX11L2 que no se había relacionado antes con este tipo de leucemia. Este gen también incrementa su expresión y hoy en día se considera un marcador de la enfermedad útil en el seguimiento con valor en el pronóstico. Con el mismo método, se detectó que la expresión del gen de la CASP8AP2 (proteína 2 asociada a la caspasa 8), que codifica un mediador clave de apoptosis, se asocia con la presencia de enfermedad residual en niños con leucemia linfoblástica aguda. Este término se refiere a la persistencia de un número pequeño de células aún después de recibir tratamiento, por lo que el hecho de presentar enfermedad residual implica riesgode presentar recaída y tiene un impacto significativo en el pronóstico de la enfermedad. e) En cuanto a la detección de nuevos blancos terapéuticos, se ha determinado que dentro del grupo de los pacientes con leucemia que muestran alteraciones en el gen MLL, existe un subgrupo que muestra incremento en la expresión del gen FLT3. Al analizar las causas de esta alteración, se determinó que FLT3 presenta mutaciones activadoras y se consideró que puede utilizarse como blanco específico para desarrollar un nuevo tratamiento. Para ensayar esta posibilidad, se estudiaron ratones con leucemia causada por inoculación con una línea celular humana con el gen MLL alterado. Se diseñó una molécula inhibidora de FLT3 llamada PKC412, la cual mostró una disminución significativa de la enfermedad en los ratones tratados con este nuevo agente. La PKC412, puede considerarse como una posibilidad de tratamiento específico para los pacientes con alteraciones en MLL y sobreexpresión de FLT3. En la leucemia promielocítica aguda también se han buscado nuevas moléculas para el diseño de tratamientos más específicos; los blastos leucémicos de estos pacientes presentan la fusión de los genes PMLRARA (que corresponden al gen de la leucemia promielocítica y al receptor de ácido retinoico α, respectivamente) y, en consecuencia, codifican una proteína quimérica con nuevas propiedades respecto 1296 https://booksmedicos.org a las moléculas originales. Estos pacientes son tratados con ácido holo-trans-retinoico (ATRA) para inducir diferenciación celular. Los estudios de microarreglos mostraron que el gen UBE1L, que codifica la enzima activadora de ubiquitina semejante a E1, se induce por ATRA en una línea celular de una paciente con el tipo de leucemia en cuestión. Estudios posteriores demostraron que ATRA activa de forma directa al pro- motor de UBE1L y su sobreexpresión dispara la degradación de la PML-RARA, por lo tanto induce con gran especificidad la apoptosis de las células leucémicas portadoras de la fusión génica. UBE1L se ha propuesto como un blanco farmacológico capaz de abatir el efecto oncogénico de la proteína quimérica. El análisis del epigenoma también se ha aplicado al estudio de las leucemias. En estas enfermedades es frecuente que los estudios se refieran a la activación de protooncogenes, pero ha sido poco común que se describa la pérdida, mutación o silenciamiento de genes supresores de tumor. Sin embargo, en investigaciones recientes que analizan el silenciamiento de genes por metilación de sus promotores, se ha revelado que este mecanismo ocurre con frecuencia en la leucemia linfoblástica aguda de células T y que también afecta a los genes supresores de tumor. En un grupo de pacientes con esta enfermedad se estudiaron 24 genes, y se determinó que están metilados en un alto porcentaje y que, en consecuencia, no se expresan. Los genes WIF-1 y sFRP5, supresores de la vía de señalización WNT/β-catenina que se encarga de promover la proliferación celular, son los que se encuentran silenciados con mayor frecuencia, en 53 y 40% de los casos de manera respectiva. La presencia de un fenotipo con mayor número de genes metilados, y por lo tanto silenciados, se asoció con la evolución de la enfermedad. Se determinó que existe una correlación positiva entre el incremento del número de genes metilados y la presencia de recaídas y muertes causadas por la leucemia. 1297 https://booksmedicos.org Perspectivas de la medicina genómica Los avances alcanzados en el campo de la genética y la genómica han abierto la necesidad de que los médicos incorporen a la práctica clínica estos conocimientos. La medicina genómica y sus avances han provisto de nuevas perspectivas con respecto a la medicina clásica. La genética, a diferencia de otras áreas, involucra familias y no sólo individuos; los individuos, que con frecuencia se encuentran sanos, hoy en día muestran gran preocupación ante la posibilidad de desarrollar o transmitir una enfermedad a sus descendientes. La mayoría de las enfermedades se diagnostican hasta después de haber presentado los síntomas y sólo hasta ese momento es cuando el paciente decide consultar a un médico. Para algunas enfermedades, llegar a este punto permitirá que el tratamiento ayude a disminuir algunos síntomas y detener su progreso, pero no resultará en su curación. Las nuevas herramientas de la genómica: a) ayudarán a profundizar en el conocimiento de la historia natural de las enfermedades; b) permitirán identificar a los individuos con riesgo de presentarlas; c) podrán modificar los hábitos de los individuos con predisposición, aún en fase presintomática, antes de que inicie el desarrollo de la enfermedad (dejar de fumar, cambiar su dieta, hacer ejercicio), o bien para iniciar un tratamiento presintomático (como la administración de estatinas en individuos que pueden presentar enfermedades cardiovasculares); d) se detectarán marcadores asociados con el desarrollo de una enfermedad (en colonoscopias de individuos con riesgo genético de desarrollar cáncer colorrectal) y, e) permitirán conocer nuevas moléculas y vías que ayuden a llevar a cabo el diagnóstico, la evaluación de la enfermedad y el diseño de tratamientos específicos para obtener mejores resultados con menos secuelas adversas para el paciente. Terapia génica Este nuevo enfoque terapéutico consiste en la inserción de genes en células o tejidos de un animal, para tratar alguna enfermedad, ya sea adquirida o hereditaria, en la que se reemplaza un gen mutante por uno funcional. Con este procedimiento, una célula que carece de un gen o que posee una copia defectuosa puede repararse para adquirir de nuevo su función normal. El procedimiento implica manipular células enfermas y repararlas con la adición del gen faltante, o la sustitución o inactivación del gen defectuoso. En esta terapia, las células defectuosas son extraídas del cuerpo y devueltas a él después de repararse, o por medio de un agente terapéutico se induce la reparación de las células in vivo. Las células que se van a modificar podrían ser las de la línea germinal o las células somáticas. En el caso de las células de la línea germinal, se modificaría un gameto, un cigoto o un embrión temprano, por lo que la modificación sería transmitida de modo permanente a las generaciones sucesivas, de modo que esta estrategia ha sido cuestionada desde el punto de vista ético. Las células somáticas en cambio pueden modificarse en varias formas: a) 1298 https://booksmedicos.org reemplazando un gen alterado por un gen sano de forma directa en el genoma; b) administrando una copia funcional de un gen que se encuentra defectuoso en la célula; c) inhibiendo la expresión del gen causante de alguna enfermedad para controlar o detener algunos padecimientos, en especial cancerosos o autoinmunes. Inserción de genes Las primeras dos opciones mencionadas para la modificación genética de las células somáticas se logran por retrovirus, mediante un vector que facilite la entrada de material genético en una célula enferma. Puede realizarse por medio de un virus modificado que contiene el gen que se desea insertar, que es capaz de introducirlo a la célula y expresarlo, ya sea integrándolo al genoma, si se emplea un retrovirus, o permanecer como un episoma y expresarse sin integrarse, si se emplea un adenovirus (figura 33–5). 1299 https://booksmedicos.org Figura 33–5. Inserción de genes con vectores virales. Aunque los retrovirus pueden resultar muy eficientes, un inconveniente es el hecho de que su integración ocurre en un sitio que no es predecible; así, pueden ocasionar mutaciones que induzcan el silenciamiento de genes propios de la célula o una transformación maligna y convertirla en una célula cancerosa. 1300 https://booksmedicos.org Los adenovirus, aunque no presentan estos inconvenientes, poseen una gran inmunogenicidad, la cual genera respuestas inmunes indeseables. Además, al no integrarse en el genoma, la expresión delgen insertado es de corta duración por lo que debe repetirse el tratamiento para mantener el efecto deseado. Otros virus que aún se encuentran en fases iniciales de experimentación, incluyen a los herpesvirus, lentivirus (como el VIH) y virus adenoasociados o VAA. Otro vector para la inserción de genes terapéuticos son los liposomas, vesículas sintéticas constituidas por una bicapa de fosfolípidos, en donde se empaca el DNA que se va a insertar, que tiene la capacidad de fusionarse de manera directa con la membrana plasmática y depositar en su interior la información genética. La eficiencia de estos vectores sigue siendo baja y además el DNA introducido no se integra en el genoma de la célula, por lo que la expresión génica es temporal (figura 33–6). Figura 33–6. Transferencia de genes por medio de vectores no virales. Un método alternativo conocido como biobalística, emplea pequeñas esferas de metal 1301 https://booksmedicos.org recubiertas con el DNA de interés que, por medio de una pistola neumática especial, permite la entrada del material genético. Aunque se ha empleado con éxito, en especial en la transformación de células vegetales, el DNA introducido no se puede integrar al genoma del huésped y es inactivado o hidrolizado con rapidez. La endocitosis mediada por receptores es otra alternativa para la transferencia de genes, que acopla al DNA a una molécula que actúa como ligando natural. Esta molécula conjugada se interioriza porque es reconocida por un receptor de membrana que induce la endocitosis y la entrada a la célula. Aunque el método tiene una eficiencia de transferencia relativa alta, la vesícula endocitada por lo general se conduce a un lisosoma para su degradación, por lo que una vez dentro de la célula es probable que el DNA se inactive. Para evitar esto, se está trabajando en diseñar un mecanismo de escape que permita llevar al DNA hacia el núcleo, aunque tampoco en este caso se lograría la integración al genoma de la célula. Inhibición de la expresión génica Esta estrategia se emplea cuando algún gen de la célula actúa de manera perjudicial y la posible solución es su eliminación o inactivación. Esto puede ocurrir en enfermedades de herencia mendeliana simple, oncogenes activados en células cancerosas o en algunas enfermedades autoinmunitarias. La terapia génica, en estos casos, pretende destruir de forma directa al gen afectado o detener su expresión, durante o después de la transcripción, o inhibir la síntesis de la proteína codificada por el gen afectado. En cualquiera de los casos, se requiere que el agente terapéutico penetre a la célula para ejercer su efecto, lo que en ocasiones puede resultar complicado o inducir su inactivación (figura 33–7). 1302 https://booksmedicos.org Figura 33–7. Terapia génica por inhibición de la expresión de los genes. Una estrategia común empleada para lograr la inhibición de la traducción del mRNA en proteína, es el empleo de oligonucleótidos antisentido, que son pequeñas cadenas de ácido nucleico con una secuencia complementaria a una parte del mRNA. La formación de una doble cadena de ácido nucleico impide el proceso de traducción y favorece la degradación del mRNA. Desde el descubrimiento de que ciertas cadenas de RNA poseen una actividad catalítica 1303 https://booksmedicos.org (ribozimas), se empezó a buscar una posible aplicación con fines terapéuticos. Las ribozimas pueden degradar de manera selectiva a algunos mRNA, cortándolos en secuencias específicas. Las ribozimas que se pretende utilizar para estos fines son las conocidas como de cabeza de martillo, que tiene la capacidad natural de hacer cortes sobre cadenas de RNA, y que se modifican introduciéndoles secuencias que sean complementarias al mRNA que se quiere destruir. La técnica que hoy en día está recibiendo mayor atención para el desarrollo de una terapia génica eficaz, aprovecha un fenómeno natural que era desconocido hasta hace poco tiempo: el silenciamiento de genes por RNA pequeños de interferencia (RNAi). Se trata de pequeñas cadenas de RNA (21 a 23 nucleótidos) que, en condiciones normales, se producen a partir de RNA de doble cadena un poco mayores. Estas moléculas son, en la actualidad, un método muy eficiente para inducir fenotipos con pérdida de función en estudios de laboratorio con diferentes organismos. Ejemplos de terapia génica El primer ensayo de terapia génica en seres humanos se realizó en septiembre de 1990 con una niña de cuatro años que padecía una rara enfermedad genética, inmunodeficiencia grave combinada, por la que carecía de un sistema inmunitario funcional. Los niños con este padecimiento rara vez sobreviven a la niñez, ya que son muy susceptibles de desarrollar infecciones graves y están condenados a vivir encerrados en un ambiente estéril. En este caso particular, se extrajeron leucocitos de la sangre circulante a los que se les injertó una copia sana del gen defectuoso y se regresaron a la circulación. La paciente mejoró de forma notable y su sistema inmunitario se fortaleció. Sin embrago, el procedimiento no constituyó una cura, ya que las células modificadas no sobrevivieron más que unos cuantos meses y el proceso tuvo que repetirse de nuevo. Algunas enfermedades para las que ya se están desarrollando terapias similares incluyen la hemofilia, distrofia muscular, talasemia y fibrosis quística, entre otras. En dos casos particulares se aplicó esta terapia para curar una enfermedad retiniana hereditaria y un melanoma metastásico con cierto grado de éxito. 1304 https://booksmedicos.org Diversidad genética e historia de las poblaciones humanas Casi desde el inicio del Proyecto del Genoma Humano fue posible identificar variaciones en la secuencia del genoma humano, proveniente de distintos individuos. En el decenio de 1990-99, se reconoció que estas variaciones corresponden a variantes de tipo SNP. Estas variaciones se presentan, en promedio, cada 400 nucleótidos, y pueden existir alrededor de 10 millones de ellos en el DNA de una persona. La mayor parte de los SNP estudiados hasta hoy alternan entre dos nucleótidos posibles, es decir son bialélicos. De este modo, aunque todos los seres humanos comparten 99.9% de la información en los genomas, la diferencia de 0.1% producida por estos polimorfismos es la responsable de la individualidad de cada persona. Para estudiar las particularidades genómicas de las diferentes poblaciones humanas, se creó el Proyecto Internacional de HapMap o mapa de haplotipos, que se encarga de catalogar los bloques de haplotipos en el genoma humano y cuya información será por completo de dominio público. Este proyecto comenzó en octubre de 2002 y la primera fase terminó en octubre de 2005, habiendo analizado cerca de un millón de SNP en tres poblaciones: africana, caucásica y asiática. Se produjo un catálogo de bloques genómicos y se identificaron las variaciones exclusivas de cada grupo estudiado. El proyecto también tiene como objetivo describir la ubicación de las variaciones genéticas en el genoma e identificar su distribución intrapoblacional e interpoblacional. Aunque no establece una conexión entre las variaciones particulares y las enfermedades, puede proporcionar información que permita identificar los factores hereditarios que modifican el riesgo de contraer ciertas enfermedades comunes; esto permitirá, de manera indirecta, el desarrollo de nuevas técnicas de diagnóstico y tratamiento, además de nuevos métodos de prevención. Éste y otros estudios semejantes demuestran, de manera sólida, que la mayor parte de variación genética en los humanos proviene de diferencias dentro de las poblaciones más que entre ellas, por lo que el concepto de raza, como una categoría, no es racional y no puede definirse desde la perspectiva biológica. El estudio de las variaciones del DNA también ha proporcionado un método alternativo, para reconstruir la historia de las poblaciones humanas. Para esto se han empleado distintos tipos de marcadoresgenéticos, aunque los más utilizados son el DNA mitocondrial y algunas secuencias particulares del cromosoma Y. Debido a que estos marcadores no son susceptibles de recombinación genética, es posible seguir la genealogía de una población a través de la línea materna, empleando el DNA mitocondrial, o de la línea paterna, con los marcadores del cromosoma Y. Estos estudios han demostrado el origen reciente de los seres humanos modernos en poblaciones africanas y han propuesto un modelo que sugiere que la especie humana (Homo sapiens) surgió a partir de una pequeña población africana hace unos 100 a 150 mil años, que a continuación emigró para colonizar todo el mundo. El estudio de las secuencias de DNA mitocondrial de los seres humanos modernos permite seguir el linaje 1305 https://booksmedicos.org hasta un sólo individuo, la “Eva mitocondrial”, que se supone existió hace unas 5 000 a 7 000 generaciones en el este de África (figura 33-8). Figura 33–8. Diseminación del Homo sapiens fuera de África. Las fechas (en miles de años antes del presente) indican el arribo a esas zonas. Además de estos estudios de variación en poblaciones de seres humanos modernos, se ha podido recuperar DNA antiguo de muestras de hasta 50 000 años de edad. Esta muestra que correspondía a una de Neanderthal mostró una secuencia de DNA mitocondrial que es diferente de la de los humanos modernos. Esto sugiere que los linajes de ambos homínidos divergieron hace alrededor de 500 000 años y que los hombres de Neanderthal se extinguieron sin contribuir al acervo genético de los seres humanos modernos. 1306 https://booksmedicos.org Estudios del genoma humano en México Más que hablar del genoma del mexicano, se deben mencionar los distintos haplotipos que se encuentran en México, ya que está formado por diversos orígenes étnicos. Entre los más representativos se encuentran dos: los grupos indígenas que se han conservado con poca mezcla genética y la mayoría de los mexicanos producto del mestizaje entre españoles e indígenas, que representan a los grupos mestizos latinoamericanos. En este último, se puede encontrar mayor diversidad genética debido a la mezcla con individuos de otras regiones como los europeos, africanos y asiáticos. Por esto, la mayor parte de los estudios sobre la genética de la población mexicana se realiza en grupos étnicos indígenas y cuando son estudios más generales se consideran sólo individuos nacidos en México al menos en segunda generación (padres y abuelos) nacida en este país. De este modo, se han hecho estudios para caracterizar el genotipo de los mexicanos. Al igual que otros conceptos asociados con la genética, los estudios para conocer y analizar las características genéticas del mexicano, se iniciaron años antes de la aparición de las técnicas de la biología molecular. Por la necesidad de tener un catálogo de haplotipos de la población latinoamericana y en especial de la mexicana, el Instituto Nacional de Medicina Genómica de México inició un estudio con el objetivo de generar esta información y apoyar la investigación médica, al conocer las variaciones genómicas asociadas con enfermedades comunes y la respuesta a fármacos en la población mexicana, además de contribuir al conocimiento histórico y antropológico de los mexicanos. Este proyecto se refiere de manera específica a la estructura genómica de mestizos mexicanos de diversas regiones donde se analizó la muestra. La selección de los estados de la República se basó en su ubicación geográfica, se escogieron: Yucatán, Zacatecas, Sonora, Veracruz y Guerrero. El estudio se hizo en alrededor de 140 individuos sin parentesco entre ellos, mayores de 18 años (50% varones y 50% mujeres) originarios del estado correspondiente al igual que sus padres y abuelos, no inmigrantes recientes de otros países, que participaron de forma voluntaria. El análisis aún no se completa y está basado en polimorfismos con el método de microarreglos de alta densidad. Este sistema utiliza la detección de 500 000 SNP. La estrategia se basa en reducir la complejidad del DNA genómico hasta 10 veces, lo que se logra al digerir 250 ng del genoma de cada muestra con enzimas de restricción. Después se ligan con sitios de reconocimiento para iniciadores por medio de una reacción en cadena de la polimerasa (PCR). A continuación, se amplifican las muestras, lo cual da preferencia a fragmentos de DNA de 250 a 2 000 nucleótidos que se marcan con fluorescencia y se hibridan sobre los microarreglos. La intensidad de la señal fluorescente se analiza para determinar el genotipo de cada muestra para ese polimorfismo particular. La información generada es compleja por lo que se almacena en una base de datos para procesarse en una supercomputadora. Los resultados mostrarán los patrones de variación génica en el genoma de los mestizos mexicanos, a través de las regiones variables en la frecuencia de haplotipos entre poblaciones y grado de asociaciones entre SNP en los diferentes cromosomas. 1307 https://booksmedicos.org Para cumplir con las restricciones éticas de confidencialidad, las muestras de sangre fueron anónimas y codificadas para no identificarse, sólo se asoció con su género, edad y origen geográfico. Además, se colectaron más muestras de las incluidas en el análisis, para que los donadores no supieran si fueron incluidos en el estudio. De esta manera, se protegió la privacidad de los participantes. La contribución del proyecto al desarrollo de la medicina genómica del país proporcionará la generación del mapa de bloques de haplotipos del genoma de los mexi- canos; además, creará una herramienta para usarse en otros proyectos de investigación científica sobre las variaciones genéticas que puedan aumentar el riesgo de padecer enfermedades comunes, y la respuesta de los individuos al uso de algunos fármacos. Previo a este estudio, un grupo de investigadores mexicanos, determinó las variaciones en el DNA mitocondrial (mtDNA) en mestizos del estado de Veracruz para conocer la tendencia genética de sus ancestros. Se estudiaron cuatro haplogrupos (A, B, C y D) del mtDNA que caracterizan a las poblaciones amerindias, cuyos linajes tienen sus raíces en Asia. En México la población mestiza tiene tres raíces; amerindia, europea y africana. A partir de sangre periférica se extrajo el DNA total de 72 individuos no emparentados. Se amplificaron las regiones de interés del mtDNA, mediante PCR, empleando oligonucleótidos específicos y digestión con enzimas de restricción. Los productos se resolvieron en geles de poliacrilamida para su análisis. Se encontraron tres de los cuatro haplogrupos que caracterizan a la población amerindia: haplogrupos A 70%, C 15.2% y D 12.5%, con un total de 98.6%. El restante correspondió al haplotipo L con una frecuencia de 1.4%, que es característico de la población africana. Este estudio demostró que en la costa del Golfo de México, en concreto en el estado de Veracruz, la población mestiza presenta un componente materno amerindio con muy baja frecuencia de africano y ausencia de componente materno europeo. La interpretación de estos resultados fue que la migración de los esclavos no fue homogénea, por lo que se concluye que la mayoría del componente africano se dio en especial por línea paterna. Estudios previos con marcadores genéticos en el DNA nuclear mostraron que el componente africano en México varía en cada región geográfica, ya que un estudio realizado en mestizos del estado de Chihuahua se encontró 4.5% de la muestra estudiada con un componente materno africano. Uno de los primeros trabajos que se hicieron en México para determinar las características de la población, se refiere a la deficiencia de la enzima lactasa. Se demostró que 70% de la población mexicana mayor de seis años tiene deficiencia de la enzima del intestino que se ocupa de metabolizar la lactasa de la leche. Esa enzima está presente en todos los recién nacidos que reciben la leche materna, pero poco a poco, a partir de losdos años, empieza a disminuir su actividad hasta que la mayoría de los individuos sólo conserva 10% de la actividad inicial. La deficiencia de lactasa ocasiona síntomas gastrointestinales indeseables como dolor abdominal, diarrea, flatulencia y sensación de inflamación del estómago, pero una de las preguntas que se plantearon fue: ¿qué porcentaje se debe al mal metabolismo de la lactosa y qué porcentaje a otros trastornos como la parasitosis? 1308 https://booksmedicos.org Uno de los aspectos de investigación consistió en saber si era frecuente o no la deficiencia de lactasa en la población adulta de México, definida para ese propósito como aquella mayor de seis años. Se concluyó que 70% de los mexicanos tiene esa deficiencia debido a factores hereditarios de tipo recesivo, es decir, que ambos padres proporcionan el tipo de gen que hace que la enzima no funcione, y en consecuencia que no se debía a causas ambientales. El 15% de la población tiene síntomas desagradables debido a la deficiencia de lactasa, pero no son graves y se controlan con facilidad. Conocer esa cifra puede incidir en los programas de reforzamiento nutricional que a veces se basan en el consumo de leche, ya que aunque es bajo el porcentaje encontrado, podría haber sectores de la población que no la asimilen de manera adecuada. La solución es sencilla: reducir la ración a la mitad o tomar leche sin lactosa. El estudio consideró a tres sectores de población mexicana: grupos indígenas, distribuidos por todo el país; grupos representativos de las costas occidental y oriental, y habitantes de grandes urbes. De ahí se obtuvieron muestras de sangre para conocer las similitudes y diferencias entre las poblaciones. Con los resultados obtenidos se puso de manifiesto lo que se sabía a partir de otros estudios: no hay poblaciones indígenas puras en el país, todas tienen cierta mezcla con la raza caucásica, en especial la española, o con la africana, sobre todo en las costas. En las grandes ciudades hay alrededor de 50% de ancestros indígenas, alrededor de 40% de caucásicos y 10% de población africana. No hay ningún juicio de calidad en el estudio, sólo se presenta cómo se formó la población mexicana y revela lo que ahora somos, un mosaico etnográfico. Preguntas de reforzamiento 1 ¿Con qué compuesto se logra detener la síntesis de DNA para secuencias con el método de Sanger? a) Nucleótidos carentes de un hidroxilo en 3’ b) Polimerasa II c) ATP d) Nucleótidos tetrafosfatados e) NADPH 2 ¿De que antigüedad son las muestras de DNA del hombre de Neardenthal empleadas para secuencias el genoma mitocondrial? a) 50 000 años. b) 500 000 años. c) 11 000 años. d) 5 000 años. e) 1 000 000 años. 3 ¿Qué tan similar es el genoma entre los humanos actuales? 1309 https://booksmedicos.org a) 99.9% b) 95% c) 90% d) 50% e) 100% 4 Es un problema por resolver que impide emplear los retrovirus en la terapia génica: a) Se insertan aleatoriamente y pueden inactivar genes. b) Poseen genes cancerígenos c) Su genoma es inestable. d) Recombinan con el genoma mitocondrial. e) Pueden inducir enfermedades infectocontagiosas. 5 Citocromo P450 que presenta polimorfismos en el 10% de la población, que impide el efecto de la codeína: a) CYP2D6 b) CYP3A4 c) CYP1A2 d) CYP3A5 e) CYP2E1 Respuestas: 1. a, 2. a, 3. a, 4. a, 5. a. Referencias Becker WM, Kleinsmith LJ, Hardin J: World of the cell. Benjamin Cummings, 6a ed. San Francisco, EUA. 2005. Crow JF: Was there life before 1953? Nature Genetics 2003;33: 449-450. Devlin TM: Bioquímica. Libro de texto con aplicaciones clínicas, Editorial Reverté, 5a ed. Barcelona España. 2004. Ebert BL, Todd RG: Genomic approaches to hematologic malignancies. Blood. 2004; 104:923-932. Green ED, Guyer MS: National Genome Research Institute: Charting a course for genomics medicine from base pairs to bedside. Nature 2011;470:204-213. Griffiths AJF, Miller JH, Suzuki DT, Lewontin RC, Gelbart WM: Genética, Interamericana-McGraw-Hill. 5a ed. Madrid, España, 1995. Hidalgo-Miranda A, S ilva- Zolezzi I, Barrientos E, March S , Del Bosque-Plata L, Pérez-González OA, Balam-Ortíz E, Contreras A, Dávila C, Orozco L, Jiménez-Sánchez G: Proyecto mapa genómico de los mexicanos. Ciencia y Desarrollo 2006; 32:31-53. International Human Genomic Sequencing Consortium: Initial sequencing and analysis of the human genome. Nature 2001;409:860-921. Lodish H, Berk A, Zipursky SL, Matsudaira P, Baltimore D, Darnell J: Biología celular y molecular, Editorial Médica Panamericana. 5a ed. Madrid, España, 2004. Lozano JA, Galindo JD, García Borrón JC, Martínez Liarte: Bioquímica y Biología Molecular, McGraw-Hill Interamericana, 3ª ed. Madrid, España. 2005. Melo RV, Cuamatzi TO: Bioquímica de los procesos metabólicos, México: Editorial Reverté, 2004. Nelson DL, Cox MM: Lehninger Principios de Bioquímica Omega, 4a ed. Barcelona, España. 2006. Passarge E: Genética, texto y atlas, 2a ed. Editorial Médica Panamericana. Buenos Aires, Argentina, 2004. Ruddle FH, Kucherlapati RS: Hybrid cells and human genes. Scientific American 1974; 231:36-44. Strachan T, Read A: Human molecular genetics. Garland Science, 4a ed. New York. 2011. Sweeney BP: Watson and Crick 50 years old from double helix farmacogenomics. Anesthesia 2004 59:150-165. Trejo-Albarrán R, Betancourt M, Casas-Hernández E: Los gametos: Células reproductoras de los mamíferos. El Manual Moderno. México, 2005. 1310 https://booksmedicos.org Botón1:
Compartir