Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Contenido • El genoma es el conjunto de genes y secuencias que regulan su expresión • La actividad de cada gen está finamente regulada • Los genomas también pueden estar constituidos de RNA • Los genomas pueden ser haploides, diploides o poliploides • Los genomas pueden ser circulares o lineales y residir en uno o más cromosomas • La necesidad de un empacamiento eficiente de los genomas • Histonas, nucleosomas, cromatina y cromosomas • La mayoría de los productos genéticos finales son proteínas: “un gen, una enzima” • Constitución molecular de un gen • El tamaño de los genomas no es proporcional al número de genes que contienen • Los genes de los rRNA son copias múltiples con alta actividad transcripcional • Las secuencias repetitivas son fósiles vivientes • Los microsatélites y minisatélites son repeticiones de secuencia sencilla (SSR) • El polimorfismo alélico permite establecer patrones de cosegregación genética • La transferencia y análisis tipo Southern permiten detectar loci polimórficos • Utilidad de los marcadores polimórficos en la medicina legal y forense Conceptos clave 1 ¿Qué es un marcador polimórfico? 2 ¿Cómo se regulan los genes? 3 ¿En qué consiste un genoma con base en RNA? 4 Describe qué es haploidía, diploidía y poliploidía. 5 ¿Cuál es la función de las histonas? 6 ¿Que es y cuál es la función de la cromatina? 7 Describa el funcionamiento de los rRNA. 8 ¿Cuál es la importancia de las secuencias repetitivas del DNA y de los polimorfismos? 9 Describa el papel de las SSR. 963 https://booksmedicos.org En los capítulos anteriores se explicó que los genotipos de los organismos vivos están constituidos desde el punto de vista químico por las secuencias nucleotídicas de los ácidos nucleicos, generalmente DNA, cuya expresión en forma de moléculas de RNA y proteínas determinan de manera importante sus fenotipos. En el presente capítulo se discute el modo en que los genotipos están construidos y organizados desde el punto de vista molecular. El primer análisis directo de los genotipos de los eucariotes fue a través de la observación directa de cromosomas al microscopio para elaborar su cariotipo, es decir, el catálogo y descripción de sus cromosomas, que son las unidades físicas compuestas de DNA y proteínas llamadas cromatina, en las que el material genético se organiza dentro de las células. Durante la metafase de la mitosis, las unidades cromosómicas se condensan y pueden observarse al microscopio de luz usando tinciones con colorantes específicos. El número y la morfología de los cromosomas se organizan en cariotipos, los cuales son característicos de cada especie (figura 28- 1). Gracias a las herramientas de la biología molecular, hoy en día se pueden definir varios cromosomas y aun genomas completos a nivel de su secuencia nucleotídica. Así, con los datos de la secuencia completa y análisis del genoma humano es posible escudriñar con gran detalle la información contenida en los cromosomas y, con ello, tener herramientas para el diagnóstico y estudio de las enfermedades hereditarias. 964 https://booksmedicos.org Figura 28-1. Cariotipo humano masculino e ideograma del cromosoma 4. A. Los cromosomas humanos condensados durante la metafase tienen un aspecto característico identificable por tamaño, forma y patrón de tinción, lo que permite su clasificación en 23 pares homólogos, 22 son cromosomas somáticos o autosomas y un par son los cromosomas sexuales (XY masculino, XX femenino). En esta fase de la mitosis cada cromosoma se 965 https://booksmedicos.org observa como un par de cromátides hermanas, reunidas por el centrómero. Los brazos del cromosoma, p (brazo corto) y q (brazo largo) se extienden a cada lado del centrómero, terminando en extremos cromosómicos o telómeros. B. Cuando son teñidos con colorantes específicos, los cromosomas en metafase revelan con claridad zonas distinguibles por teñirse pobre o ricamente, llamadas bandas. El patrón de bandas G (por haberse obtenido con la tinción de Giemsa) de una cromátide del cromosoma 4 humano se muestra en dos ideogramas con distinto nivel de resolución. Se llama ideograma a la representación esquemática del cromosoma a partir del cual se le pueden hacer mediciones. En un ideograma las bandas son numeradas a partir de la región centromérica. Para designar una banda en particular deben mencionarse: el número del cromosoma, el brazo, la región a que pertenece y su número dentro de la región. Ciertas bandas prominentes son usadas para asignar regiones específicas del cromosoma, en las cuales pueden encontrarse otras bandas. Por ejemplo, el brazo largo (q) del cromosoma 4 tiene tres regiones principales (1, 2 y 3) separadas por las bandas 4q21 y 4q31; dentro de la primera región se encuentran las bandas 4q11, 4q12 y 4q13. Las subdivisiones de una banda son nombradas añadiéndole al nombre de la banda original un nuevo dígito precedido de un punto decimal. El gen (HD) cuya mutación origina la enfermedad de Huntington se localiza en la banda 4p16.3, es decir: cromosoma 4, brazo corto, región 1 (este brazo sólo tiene una región principal), banda 6, sub-banda 3. 966 https://booksmedicos.org El genoma es el conjunto de genes y secuencias que regulan su expresión El genoma es el material genético completo de un organismo, es decir, la secuencia de nucleótidos que contiene el repertorio del genotipo, en donde se codifica la información necesaria para la expresión de su fenotipo. Es importante anticipar que, a pesar del énfasis funcional de esta definición, en los genomas de los eucariotes existen secuencias de nucleótidos en apariencia inservibles, que no obstante contribuyen al tamaño absoluto del genoma. Los genes son segmentos del genoma que en su secuencia de nucleótidos contienen la información necesaria para constituir una unidad funcional, que al ser transcrita forma el producto genético codificado por ese gen en particular (figura 28-2). Implícito en esta definición de gen está el concepto de unidad transcripcional, como la parte del gen que se transcribe en forma de RNA. La transcripción es el paso inicial indispensable para la expresión de cualquier gen, no importa si la naturaleza del producto genético final es un polipéptido o un RNA. Los genes tienen, además de la región que se transcribe, secuencias no transcritas, localizadas por lo general en el flanco 5’ de la unidad transcripcional que regulan su correcta y oportuna expresión. Es importante hacer notar que las secuencias reguladoras no son exclusivas de la transcripción; también hay procesos reguladores postranscripcionales, como la maduración o procesamiento de los transcritos primarios, su eventual traducción (en el caso de los mRNA), localización y vida media, los cuales están mediados por secuencias por lo general incluidas en el RNA transcrito. La importancia de las secuencias reguladoras de la expresión genética se manifiesta en los seudogenes, que son copias no funcionales con las que están de forma estructural y evolutiva relacionados. La falta de actividad de estos genes suele deberse a mutaciones en las secuencias reguladoras de su transcripción, las cuales han disminuido o eliminado del todo la expresión del producto genético final. El origen de los seudogenes, y en general de las familias de genes (funcionales o no), se ha atribuido a procesos de duplicación génica, que pueden ocurrir por recombinación o entrecruzamiento meiótico desigual (figura 28-3). Cuando esto sucede, uno de los cromosomas recombinados se queda con dos copias del gen y el otro sin ninguna de ellas. Los genes duplicados, que al inicio son idénticos entre sí y por ello redundantes para la célula, acumulan mutaciones de sus secuencias nucleotídicas a lo largo del tiempo, las cuales pueden causar: 1) divergencia que les dé identidad y funciones propias, y 2) que una de las copias duplicadas se convierta en un seudogen (figura 28-4). Otro tipo especial de seudogenes se genera por retrotranscripción del mRNA y reinserción genómica. 967 https://booksmedicos.orgFigura 28-2. El genoma como una gran biblioteca. El genoma es el conjunto de genes y los fragmentos de DNA situados entre ellos. En forma análoga al párrafo de un libro, los genes son secciones de la secuencia nucleotídica genómica con suficiente información para codificar un producto genético. Los genes hipotéticos A, B, y C mostrados en la figura están separados por regiones no codificadoras intergenéticas (líneas punteadas), las cuales pueden ser muy cortas como en las bacterias o muy grandes como en los mamíferos. El gen incluye no sólo la región transcrita (rectángulos), sino también las regiones adjuntas (círculos) que contienen los elementos reguladores de la actividad del gen. Nótese que la orientación del extermo 5' está relacionado con el inio y término del gen. Figura 28-3. Duplicación génica. La manera como se generan las familias multigénicas es por duplicación genética, la cual ocurre por un entrecruzamiento inequitativo durante la meiosis. En la figura, cada cromosoma original tiene un gen (rectángulo) en cuya proximidad se localizan secuencias repetitivas tipo Alu. Debido a su gran similitud de secuencia, las regiones Alu pueden recombinarse erróneamente durante la meiosis (mostrado en la figura como un desplazamiento relativo de los cromosomas), generando un cromosoma con dos y otro sin ninguno de los genes. 968 https://booksmedicos.org Figura 28-4. La actividad en el locus de los genes de la subunidad β de la hemoglobina humana está finamente regulada. A) La cadena β puede ser codificada por cinco distintos genes (rectángulos verdes) que constituyen la familia genética de la β-globulina, toda ella alojada en aproximadamente 80 000 pares de bases (pb) del cromosoma 11. Además de los cinco genes activos, existen en la misma región dos seudogenes (rectángulos con diagonales) y algunas secuencias tipo Alu (flechas). B) La actividad de cada gen de la familia de la β-globina varía en forma ordenada, por lo que se dice que está regulada durante la ontogénesis. En las primeras semanas de vida embrionaria, los tejidos hematopoyéticos expresan el gen ε. Después de la semana 8 el gen β es el más activo. Unas semanas antes del nacimiento, el gen γ se empieza a apagar, simultáneamente con el inicio de la expresión del gen β, el cual continúa activo durante toda hemoglobina del adulto. 969 https://booksmedicos.org La actividad de cada gen está finamente regulada No todos los posibles genes inscritos en el genoma se usan o expresan por una célula al mismo tiempo. De hecho, cada estirpe celular en un organismo pluricelular, como el ser humano (H. sapiens) sólo utiliza o expresa unos cuantos genes, los suficientes para producir el fenotipo característico del organismo. Para seleccionar cuáles genes deben estar activos en un momento, lugar y circunstancia ambiental dada, la célula se vale de las regiones o elementos reguladores de la expresión genética. Estas secuencias reguladoras están finamente coordinadas por una red de señales intracelulares y extracelulares que determinan el patrón de expresión genética para cada estirpe celular. La actividad selectiva de los genes de la familia de la alfa 1-globulina durante la ontogénesis es un buen ejemplo de esta coordinación (figura 28-4). Los patrones de expresión genética son autorregulados y sensibles a las influencias extracelulares, de ahí que la modulación de la expresión genética sea una respuesta celular a los retos ambientales. Cuando se examina bajo el microscopio las diferencias estructurales que tiene una neurona y con respecto a un hepatocito, a pesar de que ambas células contengan con exactitud la misma información genómica, se corrobora cuán precisa y selectiva es la regulación genética. 970 https://booksmedicos.org Los genomas también pueden estar constituidos de RNA Por lo general, los genomas están constituidos por DNA. Sin embargo, existen ciertos virus en donde sus genomas están compuestos por RNA. Un paso indispensable en el ciclo vital de estos virus es la transcripción de su genoma en DNA. Esta copia genómica de DNA podrá entonces duplicarse y expresarse de forma genética usando las enzimas de la célula huésped. De esta manera, los virus de RNA pueden proliferar y propagarse. Debido a que este tipo de transcripción de RNA en DNA sigue una dirección opuesta al flujo general de la información dictada por el “dogma central” de la biología molecular (figura 26-2), se le llama transcripción reversa y a los virus de RNA que la emplean se les conoce también como retrovirus. Un gran número de virus que causan enfermedades como el cáncer y el SIDA son retrovirus. 971 https://booksmedicos.org Los genomas pueden ser haploides, diploides o poliploides Las células humanas somáticas son diploides, es decir, cada uno de los cromosomas se encuentra duplicado; éste, no es el caso de otros organismos. En general, los procariotas tienen genotipos contenidos en genomas unitarios o haploides. Aunque un gran número de los organismos eucariotas tiene genomas diploides, existen eucariontes de genoma haploide, como ciertos hongos, entre ellos el que produce la penicilina. También existen eucariotas, como las plantas, cuyos genomas pueden ser poliploides, es decir, que tienen más de dos copias de cada cromosoma. En la diploidía se considera que cada célula contiene dos genomas haploides. De ahí que en cada célula diploide existan dos copias, o alelos, de cada gen. Es importante recordar que estas copias alélicas no tienen que ser idénticas entre sí. Por lo general, la célula diploide utiliza ambas copias. Si una de ellas es inservible, la célula podrá sobrevivir si la otra copia alélica es funcional. Un organismo de genoma haploide, como una bacteria, no podría ser viable si alguno de sus genes indispensables para la vida fuese inactivado por una mutación. En cambio, para causar la misma mortalidad en un organismo de genoma diploide, se requiere inactivar las dos copias alélicas de algún gen vital. La excepción a esta regla es la llamada dominancia negativa, en la cual, a pesar de haber un alelo funcional, la inactivación del otro alelo origina una pérdida total o parcial de la función codificada en ese gen. Por lo general, la dominancia negativa ocurre en genes cuyos productos forman parte de “maquinarias” celulares compuestas de distintos productos genéticos, en los que una “pieza descompuesta” estropea la función del mecanismo completo. Los gametos (las células reproductoras) de los organismos eucarióticos diploides, son haploides. Cuando el óvulo es fecundado por un espermatozoide, la reunión de los complementos haploides de los gametos reconstituye el contenido diploide típico de las células somáticas eucarióticas. 972 https://booksmedicos.org Los genomas pueden ser circulares o lineales y residir en uno o más cromosomas Los genomas haploides de los procariotas, como el de las bacterias, son únicos y circulares, es decir, están compuestos por una sola molécula de DNA cuyos extremos están unidos entre sí, formando un cromosoma anular. Los cromosomas bacterianos no están compartamentalizados en algún organelo celular, ni adoptan la morfología característica de los cromosomas eucarióticos. De forma contraria a los organismos procarióticos, los genomas de los eucariotes están repartidos en diversos cromosomas lineales que residen en el núcleo de la célula. El DNA de los cromosomas eucarióticos es una molécula larga cuyos extremos libres se denominan telómeros. Estos cromosomas adoptan las formas características de los cariotipos debido a la asociación del DNA con las proteínas de la cromatina (véase más adelante). La dotación o equivalente haploide del genoma humano consta de 3.3 Gpb, es decir, 3 300 millones de pares de bases que se distribuyen en 22 autosomas o cromosomas somáticos y un par de cromosomas sexuales X y Y. Por lo tanto, debido a su condición diploide, el cariotipo de células humanas contiene 46 cromosomas, clasificados en 23 pares (figura 28-1). Con la excepción de los cromosomassexuales X y Y, cada uno de los otros 22 pares tienen contenidos genéticos equivalentes, aunque no idénticos, debido a la existencia de variantes alelomórficas (capítulo 25). El cariotipo mostrado en la figura 28-1 corresponde a una célula somática masculina en metafase, por lo que para cada cromosoma se observa un par de cromátidas hermanas unidas por el centrómero. La existencia de dos cromátidas hermanas por cromosoma se debe a que en la metafase la célula es tetraploide, pues su DNA genómico se ha duplicado y, en las siguientes fases de la mitosis, las cromátidas se segregarán a cada una de las células hijas, restituyendo la diploidía propia de las células somáticas. Por último, es importante mencionar que en las células eucarióticas existen organelos subcelulares con genomas propios, los cuales se distinguen con claridad de los genomas nucleares que se han revisado en las secciones anteriores. Por ejemplo, las mitocondrias poseen un genoma circular de cerca de 16 000 pb que codifica alrededor de una docena de genes que se expresan en este organelo y cuyos productos participan en sus funciones. Aunque no se incluye como parte del genoma (término que se acostumbra a reservar para el material genético nuclear), los genes mitocondriales son indispensables para una correcta función celular. Esto queda de manifiesto con el hecho de existen enfermedades ocasionadas por mutaciones de genes mitocondriales. 973 https://booksmedicos.org La necesidad de un empacamiento eficiente de los genomas En comparación con los genomas de los organismos vivientes, el genoma del bacilo E. coli, el organismo procariótico prototipo, consiste 4.64 × 106 pb y el del H. sapiens (haploide) de 3.3 × 109 pb. Si la secuencia de nucleótidos que compone el genoma de E. coli y el ser humano se publicase en forma de letras impresas en libros, ocuparía alrededor de 1 674 y 1 190 477 páginas, respectivamente. Para tener una idea de esas magnitudes, por ejemplo, si cada uno de estos volúmenes hipotéticos tuviese un grosor de 5.4 cm, el genoma de E. coli ocuparía una estantería de 12.5 cm de largo, mientras que el de H. sapiens necesitaría una de 38.8 metros de largo. Una secuencia de 3.3 Gpb de DNA, en conformación B, constituiría una doble hélice alrededor de 1.12 metros de longitud (0.34 nm/pb × 3.3 × 109 pb). Al considerar que las células humanas en promedio tienen un diámetro de 10 a 30 μm, se puede apreciar que la longitud del genoma humano equivale a más de 100 000 veces el diámetro de la célula en que reside. Aun el más pequeño de los cromosomas humanos, el cromosoma 21 tendría una longitud 6 000 veces más grande (4.5 × 107 pb × 0.34 nm/pb = 1.5 cm) de lo que se observa para cualquier cromosoma en metafase (cerca de 2.5 μm). Las células eucarióticas deben tener mecanismos eficientes para acomodar o “empacar” los genomas dentro de sus núcleos. El problema de empacamiento cromosómico no es exclusivo de las células eucarióticas. No obstante, su menor tamaño, el cromosoma de E. coli también tiene una longitud (1.6 mm de circunferencia) que rebasa 800 veces la longitud de la bacteria (2 μm), necesitando también de un sistema eficiente de empacamiento intracelular. Además de la desproporción en longitudes, otro impedimento importante para la compactación intracelular del DNA son las cargas eléctricas negativas de los fosfatos que componen su armazón ribosa fosfato. El cromosoma de E. coli se asocia con poliaminas como la espermidina y la espermina y con proteínas llamadas H-NS, las cuales debido a su carácter básico neutralizan las cargas negativas del DNA. Además de la neutralización de cargas, el DNA cromosómico logra una mayor compactación debido al superenrollamiento mediado por las topoisomerasas del DNA. 974 https://booksmedicos.org Histonas, nucleosomas, cromatina y cromosomas El DNA de los cromosomas eucarióticos también logra un eficiente empacamiento por la asociación con proteínas básicas, en bloques de empacamiento primario, los nucleosomas, los cuales a su vez se agrupan en unidades de cada vez mayor complejidad estructural, hasta llegar a constituir lo que al microscopio se observa como la cromatina y los cromosomas. La cromatina, que resulta de la asociación de las histonas y otras proteínas con el DNA, tiene diversos grados de compactación. El microscopio electrónico revela que en el núcleo celular hay dos clases de cromatina, la eucromatina y la heterocromatina. La primera, que está muy poco condensada, es donde residen los genes con mayor actividad transcripcional. Mientras que la heterocromatina por lo general incluye regiones del DNA con poca o nula actividad transcripcional, lo cual explica el muy alto grado de condensación. Las proteínas estructurales más abundantes que componen la cromatina son las histonas, de las cuales existen cinco tipos denominados H1, H2A, H2B, H3, y H4. Las histonas son proteínas básicas con una secuencia polipeptídica altamente conservada, aun en organismos tan distantes como plantas y animales. Si se hace una digestión parcial del DNA presente en cromatina, usando bajas concentraciones de enzimas del tipo endonucleasa, se obtendrán estructuras casi esféricas de 10 nm de diámetro, los nucleosomas, los cuales constituyen la unidad mínima de empacamiento del DNA (figura 28-5A). Cada nucleosoma es un octámero compuesto de un par de cada una de las histonas H2A, H2B, H3, y H4, las cuales se asocian formando una estructura cilíndrica sobre la cual se enrolla un segmento de DNA de 146 pb, longitud suficiente para dar cerca de dos vueltas al octámero de histonas. La digestión nucleolítica parcial ocurre principalmente sobre las partes del DNA cromosómico accesibles, que no están en estrecho contacto con el octámero de histonas, es decir, sobre los segmentos del DNA que conectan un nucleosoma con otro. Antes de la digestión, cerca de 200 pb de DNA intacto se encuentran enrollados en cada nucleosoma, los cuales están unidos entre sí dando la apariencia de un rosario con una interminable sucesión de cuentas. El DNA dispuesto en este arreglo se empaca en unidades de mayor complejidad estructural, siendo la primera de ellas un enrollamiento en solenoide con seis nucleosomas por cada vuelta de la espiral. Con este nuevo enrollamiento, la cromatina adopta la forma de un filamento de 30 nm de diámetro, en el cual cada nucleosoma es estabilizado por una histona H1, que se une a la superficie del nucleosoma, sobre el área que da hacia el interior del filamento (figura 28-5B y 28-5C). Durante la metafase, estos filamentos de 30 nm se pliegan sobre una matriz de proteínas no histónicas, formando asas que abarcan de 10 a 100 kpb (kilopares de bases, mil pb) de DNA (figura 28-6). La cromatina adosada a este andamiaje puede enrollarse aún más en solenoides cada vez más grandes, hasta el punto de ser visibles al microscopio de luz como cromosomas con formas bien definidas y específicas en una metafase. 975 https://booksmedicos.org Figura 28-5. Los nucleosomas se enrollan formando solenoides. A) Modelo tridimensional de un nucleosoma. El DNA se enrolla alrededor de un octámero de histonas, formando el nucleosoma, una estructura casi esférica de 10 nm de diámetro. B) Los nucleosomas se unen entre sí disponiéndose como las cuentas de un rosario, el cual se enrolla formando un solenoide. Como se aprecia en esta vista a lo largo de su eje longitudinal, el solenoide está constituido por seis nucleosomas por vuelta y tiene un grosor de 30 nm. Las histonas H1 se localizan al centro del solenoide y ayudan a estabilizarlo. C) En esta vista lateral, el solenoide se muestra parcialmente desenrollado por el extremo izquierdo. Figura 28-6. Anatomía de un cromosoma. A) Modelo de la estructura de un cromosoma humano. El solenoide en que se enrollan los nucleosomas se adhiere a un andamiaje proteico, el cual le sirve para un mayor grado de enrollamiento, que puede llegar a ser muy compacto como en los cromosomas en metafase. B) El solenoide sólo se adhiere al andamiaje cromosómicoen ciertos puntos de adhesión. Si se eliminan las histonas de un cromosoma en metafase, manteniendo al DNA adherido al andamiaje proteico (retícula electrodensa situada en la parte inferior de este esquema), se puede observar cómo se adhiere el DNA. Nótese que las hebras de DNA no se presentan con extremos libres, sino como asas que empiezan y terminan en el mismo punto del andamiaje proteico. 976 https://booksmedicos.org Además de las proteínas que componen el nucleosoma y el andamiaje cromosómico, hay otras proteínas asociadas con la cromatina, como la topoisomerasa II (indispensable para desenrollar el DNA durante la duplicación genómica), factores reguladores de la transcripción y otras de alto peso molecular cuya función todavía se desconoce. Aunque su repertorio proteico es de mucho menor abundancia que las histonas, su gama de funciones rebasa el aspecto puramente estructural de estas últimas y sugiere que existen sucesos reguladores de la duplicación del DNA y la expresión genética que ocurren a nivel de la cromatina. Por ejemplo, se han detectado enzimas capaces de introducir grupos acetilo en las histonas, mecanismo mediante el cual se ha postulado se regula el grado de empacamiento de la cromatina, y de ahí el grado de actividad transcripcional de los genes asociados a la región de la cromatina acetilada. Un ejemplo extremo de cómo el nivel de empacamiento de la cromatina juega un papel determinante en la actividad transcripcional de ciertos genes es la inactivación de uno de los dos cromosomas X en las células humanas femeninas. El cromosoma X inactivo se condensa a tal grado que puede observarse como una partícula nuclear (el cuerpo de Barr) durante la interfase. Es importante mencionar a este respecto que la inactivación (y subsecuente compactación) de uno de los cromosomas X se establece en forma aleatoria durante la embriogénesis. Una vez que una célula embrionaria ha inactivado uno de sus cromosomas X, éste se mantiene inactivo en las células hijas a que de lugar en subsecuentes divisiones. Esto causa que las mujeres sean un mosaico genético, en el cual algunas células tendrán activos los genes del cromosoma X heredado por la madre, mientras que otras tendrán activos los del cromosoma X de origen paterno. En conclusión, un cromosoma eucariótico queda definido de forma molecular como una doble hélice de DNA lineal larga de hasta 7.5 cm, con 2 a 3 × 108 pb, en los cromosomas más largos, cuya asociación con proteínas histónicas y de otro tipo le permite compactarse en una estructura de longitud menor que el diámetro celular. Esta estructura tiene propiedades morfológicas (telómero, centrómero y bandas de tinción sui generis, figura 28-1), que han permitido una descripción del cariotipo mucho antes que la descripción molecular a nivel de mapa genético y secuencia de nucleótidos. 977 https://booksmedicos.org La mayoría de los productos genéticos finales son proteínas: “un gen, una enzima” Debido a que en la mayoría de los genes el producto final son proteínas, cuando se describe un gen se piensa de inmediato en una proteína codificada. De hecho, la propuesta clásica, “un gen, una enzima”, enfatiza esta percepción. Esta teoría de Beadle y Tatum, investigadores pioneros de la genética molecular bacteriana, se originó de su descubrimiento de que la inactivación de un gen se reflejaba en la pérdida de un paso de alguna vía metabólica, debido a la inactivación de la enzima codificada en ese gen. En la actualidad se sabe que en términos estrictos la propuesta no es del todo correcta, pues no todos los productos genéticos polipeptídicos son enzimas, además de existir genes cuyo producto genético final es un RNA. No obstante, el mérito de la frase “un gen, una enzima” radica en recordar que la inmensa mayoría de las instrucciones inscritas en el genoma son ejecutadas por “obreros polipeptídicos”, los cuales construyen las células, ya sea aportando sustento estructural o modulación (catalítica o de otro tipo) de sus funciones. Mediante las actividades biológicas de las proteínas, las células regulan sus funciones, incluyendo la selectividad transcripcional, cuyo resultado final es la “elección” de una de las múltiples posibilidades fenotípicas inscritas en el genoma. 978 https://booksmedicos.org Constitución molecular de un gen Como mínimo, un gen consiste en la unidad transcripcional que incluye las regiones reguladoras de la transcripción, localizadas por lo general en la vecindad del extremo 5’ de la región transcripcional (figuras 28-7 y 28-8). Todos los genes de los organismos vivos se ajustan a esta regla; no obstante, los eucariotas y los procariotas presentan diferencias significativas en el diseño de sus genes y sus RNA mensajeros (mRNA). Los genes cuyos productos finales son proteínas, producen transcritos denominados mRNA que eventualmente son traducidos en polipéptidos en los ribosomas. Los mRNA tienen secuencias nucleotídicas reguladoras de la traducción, las cuales permiten la correcta iniciación (en una tripleta 5’AUG3’) y terminación (en una de las tres posibles tripletas de terminación) de la traducción (capítulo 31). Las secuencias comprendidas entre la tripleta de la iniciación y la de terminación delimitan el marco abierto de traducción (MAT), es decir, la porción del mRNA que se traduce por el ribosoma (figura 28-7). A los lados del MAT, se encuentran dos regiones no traducidas (RNT), la RNT 5’ y la RNT 3’. Estas regiones contribuyen a la correcta selección de la tripleta de iniciación (RNT 5’), a la vida media del mRNA y su estabilidad en la célula (RNT 3’). 979 https://booksmedicos.org Figura 28-7. Anatomía del gen β de la hemoglobina humana. Al extremo 5’ de la unidad transcripcional se localizan las secuencias promotores de la transcripción (promotor). La posición relativa del promotor determina el punto en donde se inicia la transcripción. El transcrito primario (1 600 nucleótidos) es la copia en RNA de las secuencias de una región del DNA genómico que incluye a los exones y a los intrones (rectángulos con diagonales). El transcrito primario es modificado por los tres principales tipos de procesamiento postranscripcional, la adición del casquete en el extremo 5’, la adición de la cola de poli-adenilatos en el extremo 3’, y la eliminación de los intrones (splicing), para producir el RNA mensajero activo (mRNA). El mRNA maduro es un poco más largo que la suma de exones, debido a la adición de la cola de poli-A. Linderos importantes en el mRNA maduro son la señal para el inicio (AUG) y para la terminación de la traducción (UAA, o UAG, o UGA), las cuales delimitan las regiones no traducidas (sombreadas en verde) y el marco abierto de traducción (MAT). También conocido como ORF, por sus siglas en inglés (Open Reading Frame), el MAT es la porción del mRNA que es descifrada por el ribosoma durante la traducción para generar la proteína codificada en el gen. En general, las unidades transcripcionales de los eucariotas son monocistrónicas, es decir, producen un mRNA que codifica un solo polipéptido (figura 28-7), mientras que las unidades transcripcionales procarióticas codifican varios productos polipeptídicos, a partir de un solo mRNA (figura 28-8). Por lo general, estas proteínas se relacionan entre sí por pertenecer a una vía metabólica en particular, de modo que cuando se activa la unidad transcripcional, se traducen a partir de ella las enzimas necesarias para llevar a cabo toda 980 https://booksmedicos.org la vía. A este tipo de transcrito con múltiples MAT se le denomina mRNA policistrónico, y al conjunto de genes que están bajo el control de la misma región reguladora de la transcripción se le llama operón (figura 28-8). Figura 28-8. El operón de la lactosa de E. coli produce un mRNA policistrónico. Tres genes componen el operón de la lactosa: el gen lacZ (β-galactosidasa, que rompe a la lactosa en glucosa y galactosa), lacY (permeasa de la lactosa, que permite el transporte de lactosa al interior de la bacteríay lacA (transacetilasa de tiogalactósidos, cuya función se desconoce). La transcripción de este operón está bajo el control de una misma región reguladora. El mRNA transcrito es policistrónico, pues incluye los marcos abiertos de traducción para cada una de las tres proteínas codificadas en el operón. Otra diferencia sustancial es que los mRNA eucarióticos son transcritos al inicio como moléculas precursoras que sufren una serie de modificaciones para convertirse en mensajeros funcionales (figura 28-7 y capítulo 30). Parte fundamental de este procesamiento es la eliminación de fragmentos llamados intrones, los cuales no contribuyen a la función del RNA maduro y son eliminados mediante un proceso de corte y pegado conocido como splicing o empalme. Durante el splicing, además de eliminarse los intrones, se reúnen los exones, los cuales son las partes del transcrito primario que perduran en el RNA maduro. Como se observa en la figura 28-7, es mediante el empalme que la célula elige de forma precisa (a nivel nucleotídico) qué exones integrarán un mRNA maduro. La importancia de esta elección radica en que así se determina la constitución del marco de traducción y, por lo tanto, la secuencia del polipéptido 981 https://booksmedicos.org codificado en el mRNA. De ahí que el splicing sea un punto de regulación para la expresión genética, pues gracias a la selección o exclusión específica de exones, mecanismo llamado splicing alternativo, se pueden generar mRNA alternativos que codifiquen proteínas con diferente secuencia de aminoácidos. Este mecanismo es relevante ya que da versatilidad y amplía el repertorio genómico eucariótico en general, y en particular al humano, pues permite que a partir de un mismo gen se expresen proteínas distintas. El splicing sólo ocurre en los eucariotas, pues los intrones son privativos de éstos. Salvo ciertas excepciones, los genes procarióticos carecen de intrones, es decir, la secuencia codificadora de la unidad transcripcional es una secuencia continua, sin porciones que se eliminen después de la postranscripción por medio del splicing. 982 https://booksmedicos.org El tamaño de los genomas no es proporcional al número de genes que contienen ¿Cuántos genes se necesitan para formar un organismo? ¿Cuál es el tamaño mínimo necesario del genoma de un organismo? Las respuestas a estas preguntas tocan cuestiones biológicas fundamentales como la organización estructural y funcional de los genomas, y cuáles son los genes que distinguen a una especie de otra. De forma intuitiva, se puede pensar que entre más alto se encuentre en la escala filogenética, un organismo requerirá de más genes para establecer su genotipo y, por lo tanto, de genomas más grandes para alojarlos. Los datos del cuadro 28-1 indican que esta suposición es correcta de forma parcial. El número promedio de genes en los procariotas varía entre 1 000 y 4 000. Organismos más complejos, como las levaduras (eucariotas unicelulares) o el nemátodo C. elegans, tienen entre 6 000 y 20 000 genes. Aunque al principio se habían predicho hasta 100 000 genes para los vertebrados, como el ser humano y el ratón, en la actualidad se piensa que el número de genes en este grupo filogenético no rebasa los 30 000, tal como lo reveló la secuencia del genoma humano. El incremento en el número de genes guarda una escasa correlación con el tamaño físico del genoma en que residen. Cuando se habla del tamaño físico de los genomas, el cual se expresa en pares de bases, se habla del llamado complemento o genoma haploide (el denominado valor de C) con el propósito de hacerlos comparables con organismos de diversa ploidía genómica. Por ejemplo, en el caso de los organismos diploides, como el H. sapiens, cuando se dice que el tamaño de su genoma haploide es de 3.3 mil millones de pb, se está hablando sólo de un complemento haploide, es decir, a la mitad del número total de pb que se encontrarían en una célula somática humana. Cuadro 28-1. Números aproximados de genes y tamaño del genoma en diferentes organismos Grupo filogenético Especie Genes Genoma haploide en millones de pb Procariotas Haemophilus influenzae Escherichia coli 1 743 4 435 1.83 4.64 Levaduras Saccharomyces cerevisiae 5 860 12.1 Artrópodos Drosophila melanogaster 20 000 90.0 Nematodos Caenorhabditis elegans 23 000 100.0 Cordados Homo sapiens Mus musculus 29 000 27 000 3 300 3 300 Plantas Arabidopsis thaliana 33 000 120 El cuadro 28-1 muestra que hay una disparidad entre el número de genes y el tamaño del genoma. Ésta es más acentuada en ciertos grupos taxonómicos tales como los anfibios, 983 https://booksmedicos.org los cuales pueden llegar a tener genomas grandes de manera desproporcionada para su número de genes. De hecho, es frecuente encontrar que el tamaño del genoma haploide no tiene una correlación directa ni con el número de las secuencias útiles (genes) que alberga, ni con la posición filogenética de las especies; a esta disparidad se le conoce como paradoja del valor C. Ésta resulta de la distinta densidad de genes por genoma que tienen los organismos biológicos, y sugiere que la cantidad absoluta de DNA de un genoma excede el mínimo necesario para codificar sus genes. Los datos del cuadro 28-1 indican que el repertorio genético de los organismos listados se aloja en genomas de distintos tamaños. Una sencilla división indica que mientras en E. coli se apiña, en promedio, un gen por cada 1 000 pares de bases, en la levadura convive un gen por cada 2 000 pb y en el ser humano se presenta de forma holgada uno por cada 100 000 pb. Una posible explicación de esta discrepancia sería el suponer que los genes de los vertebrados son 50 veces más grandes que en los eucariotas unicelulares, por lo que se requieren 50 veces más pares de bases para su codificación. No obstante, el tamaño promedio de los genes eucarióticos (sin contar intrones) no es muy diferente. El tamaño promedio de la región codificadora es de 1 340 pb en los genes humanos, de 1 311 pb en los del gusano C. elegans y de 1 497 pb en los de la mosca de la fruta D. melanogaster. En vista de que no hay variaciones significativas en el tamaño “útil” (consecuencias codificadoras) y sus genes, otra debe ser la razón que explique la diferencia significativa en el tamaño de sus genomas. Aunque el tamaño promedio de las regiones reguladoras de la transcripción y los intrones en vertebrados es mayor que en los invertebrados, esta diferencia tampoco explica la paradoja del valor de C. La menor densidad genética de los genomas vertebrados, comparada con la de los procariotas o los eucariotas unicelulares se debe a dos razones principales: hay un gran espaciamiento entre gen y gen (distribución holgada de las unidades transcripcionales) y la presencia de secuencias transcripcionalmente inertes y repetitivas en sus genomas. En el genoma bacteriano, el espacio entre un par de genes es muy pequeño y en el genoma humano, los espacios intergenéticos pueden ser varias veces más grandes que el mRNA maduro que codifican (figura 28-4A). La mayor parte del espacio intergenético en vertebrados está ocupado por lo que podrían considerarse “lotes genómicos baldíos”. Gracias a la secuenciación del genoma humano, hoy se sabe que al menos 70% de la secuencia corresponde a estos “lotes baldíos” que no codifican genes ni tienen función conocida y confirman que el “tamaño absoluto” de los genomas eucarióticos rebasa su “tamaño funcional”. 984 https://booksmedicos.org Los genes de los rRNA son copias múltiples con alta actividad transcripcional Nada nuevo ha revelado el análisis del genoma en cuanto a los genes que codifican a los RNA ribosomales (rRNA), pues éstos no han sido secuenciados aún. Esto se debe a que un criterio de exclusión de clones a secuenciar en la fase inicial del proyecto del genoma humano fue el tener repeticiones en tándem, que es la manera en la cual se disponen los genes que codifican estos RNA. Es de esperar que las fases finales de refinamiento y terminación de la secuenciaproporcionen la información detallada sobre las características de estos genes. Los genes humanos que codifican a los rRNA se disponen en copias múltiples idénticas entre sí y que codifican el mismo producto genético final. Las copias de esos genes están dispuestas en tándem, uno tras otro, como carros de ferrocarril, orientados en la misma dirección. Cada copia constituye una unidad transcripcional independiente con su respectivo promotor. Se calcula que hay alrededor de 200 a 300 copias del gen del 5S rRNA. Los otros rRNA humanos, 18S, 5.8S y 28S, están agrupados en un solo gen que produce un transcrito primario, el pre-rRNA, a partir del cual, mediante un procesamiento postranscripcional especializado, se obtienen las formas maduras y funcionales de estos rRNA (capítulo 30). Se calcula que en el ser humano hay entre 150 a 250 copias del gen que codifica al pre-rRNA. La razón de este diseño “multicopia” en los genes de los rRNA es que sus productos genéticos son requeridos en grandes cantidades para satisfacer las necesidades estructurales de las células en proliferación. Por ejemplo, una célula embrionaria, que se duplique cada 24 h, requiere de una producción neta de alrededor de cinco millones de nuevos ribosomas, para la cual es necesaria la actividad transcripcional a saturación de cuando menos 100 copias del gen precursor de los rRNA. Una célula que no tuviese multicopiados estos genes no podría dotarse de los suficientes ribosomas para mantener este ritmo de división celular. Es interesante observar que los genes de las histonas, los cuales son requeridos en cantidades iguales incrementadas en estas células, también estén repetidos siguiendo un diseño multicopia, semejante al de los rRNA. 985 https://booksmedicos.org Las secuencias repetitivas son fósiles vivientes ¿Cuál es la naturaleza de las secuencias que constituyen los componentes de las cinéticas rápida e intermedia observadas en los estudios de reasociación del DNA humano? La explicación aceptada es que estos componentes tienen una complejidad o diversidad de secuencia pobre, pero que están altamente repetidos en el genoma. Con el análisis del genoma humano se confirmaron estas conclusiones e identificaron los distintos tipos de secuencias que constituyen esta gran parte del genoma. Las secuencias repetidas del genoma suelen considerarse como “DNA basura”, inútil o de poco interés. Esta apreciación es inevitable cuando se considera que otras especies, como el pez globo (T. nigroviridis), tienen genomas funcionales con muy pocas secuencias repetidas. Sin embargo, es una apreciación errónea. Las secuencias repetidas han transformado el genoma gracias a su capacidad para movilizarse a diferentes regiones del mismo, incluyendo rearreglos que crean nuevos genes o modifican los preexistentes. También, gracias a las secuencias repetidas, se pueden hacer análisis de la evolución humana, pues son la “evidencia paleontológica”, verdaderos fósiles vivientes en donde han quedado registrados eventos de mutación y selección natural. Basándose en su similitud, es posible reconocer generaciones de repeticiones que surgieron en una misma época. Al observar cómo varían estas secuencias con respecto al progenitor original, se pueden rastrear sus destinos a lo largo de millones de años de evolución, en distintas especies o en diferentes regiones del genoma de una misma especie. Además, como se expone más adelante, proporcionan marcadores genéticos de gran utilidad para el diagnóstico médico. Las secuencias repetidas que se han encontrado en el genoma humano se dividieron en los siguientes grupos: repeticiones intercaladas o dispersas (interspersed repeats), retrotransposones de genes celulares, repeticiones de secuencia sencilla (SSR, por sus siglas en inglés: simple sequence repeats) y duplicaciones segmentarias. 986 https://booksmedicos.org Los microsatélites y minisatélites son repeticiones de secuencia sencilla (SSR) Las repeticiones de secuencia sencilla consisten en repeticiones en tándem (perfectas o de forma mínima imperfectas) de secuencias oligoméricas cortas. Cuando la unidad de repetición del SSR es pequeña, de 1 a 13 bases, se le denomina microsatélite. En cambio, cuando la unidad repetida es más grande, de 14 a 500 bases, se le denomina minisatélite. El nombre histórico de “satélite” proviene de que este DNA se purificó por primera vez como una banda satélite, que se separaba con claridad del grueso del DNA genómico cuando éste era sometido a ultracentrifugación. Las SSR constituyen alrededor de 3% del genoma humano y están distribuidas en todos los cromosomas. Las más frecuentes son los microsatélites dinucleotídicos del tipo (AC)n y (AT)n, en donde n, es decir el número de veces que se repite, puede variar entre 10 y 60. Hay dos clases de minisatélites, los que residen en un locus único y los que están presentes en múltiples loci. Uno de los primeros ejemplos caracterizados de minisatélites multiloci es la llamada sonda de DNA 33.6, compuesta por 54 repeticiones de la secuencia (AGGGCTGGAGG), que se ha observando en decenas de loci en el genoma humano. La gran relevancia de las SSR radica en que el número de veces que se repiten presenta una gran variabilidad en las poblaciones humanas (polimorfismo). Sus cualidades polimórficas y repetitivas los hacen marcadores o puntos de referencia genómica que han sido de extraordinaria utilidad para establecer mapas con los cuales se han ubicado genes enfermos y para el diagnóstico genético en medicina forense (véase más adelante). Por ejemplo, la sonda 33.6 se usa en los tribunales legales de Inglaterra para la identificación genotípica de individuos. 987 https://booksmedicos.org El polimorfismo alélico permite establecer patrones de cosegregación genética Si bien es cierto que hasta ahora se desconoce la utilidad o función de las secuencias repetitivas del genoma humano, éstas han servido, junto con los SNP (por sus siglas en inglés single nucleotide polymorphisms, véase capítulo 31) para establecer marcadores genéticos polimórficos que han sido de importancia fundamental para 1) la identificación genotípica de los individuos (“huella genotípica”); 2) la identificación de los genes involucrados o responsables de ciertas enfermedades genéticas y, 3) el establecimiento de mapas genéticos humanos, como los que usó el consorcio internacional para guiar su proyecto de secuenciación del genoma humano. ¿Por qué un marcador genético debe ser polimórfico para servir a estos propósitos? Un marcador genético que no lo fuese, es decir que no tuviese variabilidad entre los individuos de una especie, es de nula utilidad para establecer árboles genealógicos, pues al ser igual en todos los individuos es imposible saber de qué progenitor ha sido heredado. En cambio, un marcador genético, o para fines prácticos cualquier rasgo fenotípico que sea polimórfico como el color o la forma de los chícharos estudiados por Mendel, lo hace rastreable y útil para hacer análisis genéticos. El estudio genealógico simultáneo de un marcador polimórfico conocido (cuyo “domicilio genómico” se co- nozca) junto con un rasgo fenotípico (como el padecer una enfermedad hereditaria), permite establecer un valor de correlación o cosegregación de ambos parámetros. En términos generales, una alta cosegregación (linkage o enlace del marcador y el rasgo heredable estudiado) indica que tanto el gen como el marcador genético están muy próximos entre sí en el genoma. Como la localización del marcador se conoce, se abre la posibilidad de ubicar el gen responsable del rasgo a que está enlazado. Este tipo de análisis molecular, combinado con una rigurosa genética clásica y otros estudios citogenéticos, ha permitido en el pasado la hazaña de localizar y clonar los genes causales de enfermedades hereditarias, como la corea de Huntington, fibrosis quística y distrofia muscular hereditaria, por sólo mencionar algunas. Ahora, con la secuencia del genoma humano, el número de marcadores polimórficos conocidosy ubicados en el genoma humano se ha incrementado de manera considerable, lo cual facilitará la identificación de los genes cuyas mutaciones sean responsables de enfermedades heredables. 988 https://booksmedicos.org La transferencia y análisis tipo southern permiten detectar loci polimórficos A partir de la información de la sección anterior, es fácil darse cuenta de que conocer las ventajas que otorgan los polimorfismos del genoma son tan importantes como la capacidad del ser humano para detectarlos, pues sólo así se podrán construir los árboles genealógicos necesarios para los estudios de cosegregación. Para fines prácticos, existen dos tipos de polimorfismos: los de secuencia -es decir mutaciones en algún(os) nucleótido(s) de la secuencia, como el caso de los SNP- y los de longitud de algún locus específico del genoma, como es el caso de la variabilidad en el número de veces que se repite un DNA satélite perteneciente a ese locus en particular. Las dos técnicas de laboratorio más usadas para la detección de polimorfismos son el análisis tipo Southern (figura 28-9) y la reacción en cadena de la polimerasa, mejor conocida como PCR por sus siglas en inglés (véase el capítulo 29 para una explicación de la PCR). 989 https://booksmedicos.org Figura 28-9. Polimorfismos genéticos, el RFLP y el VNTR. A) Esquema del locus hipotético T y de sus variantes alélicas T1, T2, T3, T4 y T5 discutidas en el texto. Los tres sitios EcoRI están indicados como E1, E2 y E3; en el alelo T2 el sitio E2 está ausente. Los genes A y B (rectángulos), reconocidos por las sondas A y B se localizan, respectivamente, en los fragmentos de 4 kpb y de 7 kpb obtenidos por la digestión del DNA con EcoRI. Entre E2 y E3 se encuentra un minisatélite (rectángulo café), cuya variación de tamaño causa un polimorfismo (VNTR) detectable con la sonda B. B) Resultado esquemático del análisis tipo Southern (con las sondas A o B) del DNA genómico homocigoto o heterocigoto para el locus T, como se indica en la parte superior del autorradiograma. Los estándares de peso molecular se corrieron en los carriles etiquetados como M (marcador de tamaño molecular) y su tamaño se indica expresado en kpb. Las variaciones de tamaño de las bandas vistas en los homocigotos T1 y T2, son ejemplos de RFLP, mientras que las variaciones vistas en los homocigotos T1, T3, T4 y T5 son ejemplos de VNTR. Nótese que en los DNA heterocigotos, la intensidad de la señal en el 990 https://booksmedicos.org autorradiograma es aproximadamente la mitad de lo que se observa para los DNA homocigotos. En un análisis típico de DNA genómico por medio de la técnica de Southern, desde el inicio, el DNA es digerido, con una endonucleasa de restricción (por ejemplo, la EcoRI), la cual hará que el DNA intacto, inicialmente de alto peso molecular (> 100 kpb), se convierta en un conjunto de fragmentos de muy diversos tamaños, abarcando toda una gama, desde unos cuantos pb hasta miles de ellos. Como el corte con EcoRI es específico de secuencia (figura 26-8), el corte del mismo DNA siempre producirá el mismo conjunto de fragmentos, cada uno de los cuales contendrá loci o regiones, particulares del genoma. Por ejemplo, el gen de una proteína podría residir en un fragmento de 8 kpb, mientras que el de otra podría estar en un fragmento de 3 kpb. Para saber de qué tamaño es el fragmento en donde quedó localizado un gen Z, se efectúa una hibridación con una sonda de DNA correspondiente a ese gen Z, que contenga una marca distinguible, por ejemplo, un isótopo radioactivo. Para que esta hibridación sea informativa, es necesario separar los diferentes componentes o fragmentos del DNA digerido, en función de su tamaño, por medio de electroforesis en geles de agarosa y después transferirlos e inmobilizarlos en una matriz sólida (figura 28-10). Una vez fijos en la matriz, el conjunto de fragmentos se incuba con la sonda radioactiva del gen Z, la cual se reasociará o hibridará con su secuencia complementaria en forma específica. El exceso de sonda se lava, de modo que sólo permanezca la sonda hibridada a una secuencia específica que esté fija en la matriz. La matriz lavada se usa para exponer una placa para rayos X, revelando así la posición y de ahí, el tamaño del fragmento que contiene las secuencias de la sonda Z. En general, se llama análisis o transferencia tipo Southern a los experimentos en los cuales el DNA digerido es separado por tamaño, transferido e hibridizado a una sonda específica (figura 28-10). 991 https://booksmedicos.org Figura 28-10. Análisis de los ácidos nucleicos, las transferencias tipo Southern y Northern. Aún en mezclas muy complejas de ácidos nucleicos, la presencia y el tamaño de alguno en particular se puede determinar por medio de hibridaciones en matrices sólidas. La técnica fue inicialmente descrita para el DNA por un investigador de apellido Southern, de ahí que fuese llamada “Southern blot”. La misma técnica adaptada para RNA, se conoce como “Northern blot”. A) La mezcla de ácidos nucleicos es separada mediante electroforesis en geles de agarosa, en los cuales las muestras migran en el campo eléctrico en forma inversamente proporcional a su tamaño, las más chicas migran rápidamente y las más grandes avanzan poca distancia en el gel. En uno de los carriles del gel se corren moléculas de tamaño conocido que se usan para calcular los tamaños de las muestras; B) Los ácidos nucleicos son transferidos desde el gel hacia una matriz sólida, que generalmente es un papel de nitrocelulosa o una membrana de nylon, y en donde quedan inmovilizados, preservando el patrón de separación obtenido en el gel. Previo a la transferencia, los ácidos nucleicos deben ser desnaturalizados, de manera que las secuencias nucleotídicas queden accesibles a la hibridación siguiente; C) La matriz es separada del gel y se incuba con una sonda (también previamente desnaturalizada) de DNA marcado radiactivamente, la cual contiene las secuencias complementarias al ácido nucleico que se quiere identificar. Durante la incubación, la sonda encuentra e hibrida en forma específica con su complementaria en la matriz; D) El resto de la sonda se lava, de modo que sólo permanezca la sonda hibridada específicamente. La matriz lavada se usa para exponer un filme para rayos X, revelando así la posición y de ahí el tamaño del fragmento que contiene las secuencias de la sonda (autorradiografía). Para ilustrar cómo se usa la técnica de Southern para detectar variantes polimórficas, 992 https://booksmedicos.org imaginar un locus hipotético del genoma definido locus T, para el cual existan dos variantes alélicas, la T1 y T2. Se define alelo T1 como aquel en el cual hay tres sitios de reconocimiento para la endonucleasa de restricción EcoRI separados entre sí por segmentos de DNA de 4 y 7 kpb, y con un minisatélite entre el segundo y el tercer sitio EcoRI (figura 28-11). Se supone también que se tienen las sondas específicas A y B, que reconocen a los genes A y B localizados entre los sitios EcoRI, en los fragmentos de 4 y 7 kpb, respectivamente. El análisis tipo Southern de DNA genómico, cortado con EcoRI que contuviese esta variante alélica T1, revelaría un fragmento de 7 kpb cuando se use la sonda B y de 4 kpb cuando se use la sonda A. Si una variante polimórfica de secuencia del locus T tuviese mutada tan sólo una base que eliminase el segundo sitio EcoRI (como en el alelo T2 de la figura 28-10), ésta se revelaría como un fragmento de 11 kpb, tanto con la sonda A como con la B. Este tipo de polimorfismo que se detecta por la presencia o ausencia del sitio de corte de una enzima de restricción se les conoce como “polimorfismo en la longitud del fragmento de restricción”, o más común y de manera breve como RFLP (por sus siglas en inglés, restriction fragment length polymorphism). 993 https://booksmedicos.org Figura 28-11. Herencia mendeliana de los marcadores polimórficos. Se muestra el árbol genealógico y el patrón esperado en el análisis tipo Southernpara una familia con polimorfismos en el locus hipotético T, discutido en el texto. El DNA señalado con la interrogación corresponde a un supuesto hijo de la familia (figura 28-9 para la explicación de los alelos y otros símbolos). La posición de las bandas alélicas diagnósticas T2 y T4 se señala con 994 https://booksmedicos.org las fechas. Los polimorfismos de longitud también se pueden detectar por análisis tipo Southern. Regresando al ejemplo del locus hipotético T, suponiendo las variantes alélicas T3,T4 y T5 que se distinguieran de la variante T1 por tener repetido un número distinto de veces el minisatélite localizado entre el segundo y el tercer sitios EcoRI. Si éste fuese el caso, el análisis tipo Southern de DNA digerido con EcoRI e identificado con la sonda B, revelaría diversos tamaños para el segundo fragmento EcoRI. Este tipo de polimorfismo que se detecta por la múltiple variabilidad del tamaño de un fragmento de restricción, se le conoce como “polimorfismo en el número de repeticiones en tándem”, o más común y breve como VNTR (por sus siglas en inglés, variable number of tandem repeats). Como su nombre lo indica, este tipo de polimorfismo surge de la gran variabilidad que puede haber en el número de veces que se repiten los elementos constitutivos de los micro y minisatélites. Por ello, los VNTR son por lo general polimorfismos con muchas variantes alélicas; en cambio los RFLP sólo pueden existir en dos formas alélicas, la que tiene el sitio de restricción y la que no lo tiene. Debido a que la variación de los VNTR en una población es mucho mayor que la de los RFLP, los primeros son de mayor utilidad para establecer identidades o huellas genotípicas. 995 https://booksmedicos.org La utilidad de los marcadores polimórficos en la medicina legal y forense La detección de polimorfismos genéticos mediante las técnicas de la biología molecular ha dado una nueva herramienta para el análisis de los genes que se heredan con un patrón mendeliano. Por ejemplo, imaginemos el caso de una pareja en la cual el padre es homocigoto para el alelo T1 y a la madre es homocigota para el alelo T2; si el locus T reside en un autosoma, es de esperarse que todos los descendientes de esta pareja sean heterocigotos T1/T2 y que por tanto exhiban RFLP de forma inequívoca característicos (figura 28-11). Si algún hijo de esta pareja tiene un patrón alélico T2/T4, por ejemplo, sería razonable suponer que el supuesto padre no es el padre biológico de ese hijo, pues quien lo fuese debería ser al menos heterocigoto para el alelo T4. En forma simplificada, ésta es la manera como se realizan las pruebas de paternidad basadas en el análisis de DNA. Como se puede ver con facilidad, estas pruebas son concluyentes para descartar la paternidad de un posible padre; sin embargo, no lo son para asignarla sin lugar a duda. Esto se debe a que el alelo diagnóstico, el alelo T4 del ejemplo anterior, puede estar presente en muchos individuos de la población. El uso de más de un marcador polimórfico, es decir, el análisis de varios loci que sean polimórficos ayuda a disminuir este tipo de incertidumbres, pero jamás a eliminarla en su totalidad. Siguiendo con el ejemplo, si el alelo T4 está presente sólo en 10% de la población, esto eliminaría a 90% de los hombres de esa población como posibles padres biológicos. Si se combinasen los resultados del análisis de 4 alelos, que como T4 tuviesen una frecuencia de 10%, entonces se podría eliminar a 99.99% de la población. Aunque esta cifra es muy cercana a 100%, en términos prácticos aún tiene un alto grado de incertidumbre. Es por ello por lo que para establecer una “huella genotípica” individual inequívoca será necesario identificar, caracterizar y emplear un amplio repertorio de marcadores polimórficos de alta variabilidad. El uso de los minisatélites multiloci, como la sonda 33.6, es muy informativo, pues en un análisis tipo Southern pueden revelar decenas de loci de manera simultánea. No obstante, aun hoy en día, la identificación positiva de individuos por medio de análisis de DNA sigue teniendo tan sólo un valor probabilístico, cuyo grado de certidumbre depende del número y la variabilidad de los marcadores polimórficos utilizados en el análisis. Preguntas de reforzamiento 1 Cuando se presenta la duplicación de un gen y una de las copias es inactivada, pero permanece presente en el genoma se le denomina: a) Diploide. b) Pseudogen. 996 https://booksmedicos.org c) Alelo. d) Retroposon. e) Satélite. 2 El DNA se enrrolla en una estructura constituida por proteínas básicas llamadas histonas. ¿Cuál es el nombre de dicha estructura? a) Topoisomerasa. b) Centromero. c) Cromatida hermana. d) Nucleoide. e) Nucleosoma. 3 ¿Cuántos pares de bases posee una celula somática normal de humano, una vez que se ha pasado por la fase de síntesis para entrar a mitosis y antes de que se efectue la división celular? a) 13.2 x 109 pb (tetraploide) b) 3.3 x 109 pb c) 6.6 x 109 pb d) 4.64 x 106 pb e) 2.24 m 4 Proceso que permite unificar exones de manera postranscripcional, evitando la salida del núcleo de los intrones: a) Condensación. b) Polimorfismo. c) PCR. d) Splicing. e) Linkage. 5 Es el lugar que ocupa físicamente en el cromosoma una serie de genes duplicados dispersos en el genoma y que se les identifica por ser iguales y funcionales, como es el caso de las multicopias de los genes ribosomales: a) Isotopo. b) Locus. c) Loci. d) Unidad de mapa. e) Nucleosoma. Respuestas: 1. b, 2. e, 3. a, 4. d, 5. c Referencias Alberts B, Johnson A, Lewis J, Raff M, Roberts K, Walter P: Molecular biology of the cell. 5a ed. New York, Garland Science, 2008. Baltimore D: Our genome unveiled. Nature 2001:409:814 816. Craig Venter J et al.: The sequence of the human genome. Science 2001 vol.291: 1304-1351. Devlin TM: Bioquímica. Libro de texto con aplicaciones clínicas, 5a. ed., Barcelona. Editorial Reverté, 2004. 997 https://booksmedicos.org Botón1:
Compartir