Vista previa del material en texto
Sin embargo, a pesar del esfuerzo por categorizar diferentes tipos de secuencias cortas aún no existe un consenso en la diversidad de estas secuencias en el genoma y en la variación de funciones o precursores que éstas puedan tener. Este es por ejemplo el caso de los siRNAs (small interference RNAs; AMBROS et al. 2003; XUE et al. 2005), secuencias que también regulan expresión demRNApero que a diferencia de losmiRNA varían en sus precursores. Asimismo, Seringhaus & Gerstein (2008) notan que: Since genetic nomenclature is keyed to discrete genes, short transcribed re- gions located outside of identified genes are troublesome. They sometimes end up listed in sequence of databanks sporting identifiers similar to those of genes, which can be confusing. To further complicate things, experiments on non-gene transcription show that some of this activity occurs in pseu- dogenes, regions of the genome long considered fossils of past genes. In a transcriptional sense, dead genes appear to come to live, with some clues even suggesting that they might help regulate other genes (SERINGHAUS; GERSTEIN, 2008, p. 468). Es evidente que la dificultad de clasificar secuencias de ADN que no constituyen genes aplica también a los transposones, que son regiones del genoma que son capaces de moverse y autoreplicarse. Estas secuencias pueden ser muy abundantes en algunos genomas, pueden replicarse de diferente forma, y producen mutaciones en el genoma y en los genes según las regiones donde se insertan. Wicker et al. (2007) propusieron un sistema de clasificación de transposones basado en los mecanismos de transposición, la similitud de secuencias y las relaciones estructurales entre transposones que incluye en orden jerárquico: clases, subclases, órdenes, superfamilias, familias y subfamilias con la intención de hacerlo comparable a la clasificación de organismos. Según este sistema, existen transposones clase I, los cuales requieren un RNA intermediario para su proceso de transposición, y clase II, los cuales pueden moverse en forma de DNA. Las subclases distinguen transposones cuya copia se reintegra al genoma de aquellos que no se copian y cuya secuencia original es la que se mueve. Los órdenes difieren según los mecanismos de inserción de los transposones. Las superfamilias se diagnostican por una misma estrategia de replicación pero varían según la secuencia a nivel de aminoácidos interna (debido a que muchas veces los transposones codifican para proteínas de transposición) y las secuencias que flanquean al transposón luego de su transposición. Las familias comparten similitud a nivel de secuencia de DNA. Las subfamilias se definen con base en relaciones de ancestría-descendencia entre transposones dentro de un mismo genoma y pueden distinguir entre poblaciones de transposones que se mueven autónomamente y los que no. En realidad la asignación de un transposón a una familia y a una subfamilia es problemática, como lo notan Wicker et al.: The precise definition of a family is problematic because groups of transposa- 182 ble elements with similar features sometimes form a continuum of sequence homology; elements from one end of the spectrum have little DNA sequence identity with those at the other end. . . we define a family as a group of trans- posable elements that have DNA sequence similarity in their coding region (if present) internal domains or their terminal repeat region. For practical reasons, we specify strong sequence similarity as 80% or more in at least 80% of the aligned sequence (WICKER et al., 2007, p. 977). Wicker et al. reconocen que el uso de un porcentaje de similitud para formar grupos de transposones posee el riesgo inminente de confundir similitud con homología: A natural taxonomic classification for transposable elements therefore requi- res their continuing evolutionary and functional analyses. At present even if such analyses can be made within superfamilies, they remain difficult for the upper levels of the classification (classes and subclasses). In other words, the question of a common origin of all classes, subclasses and superfamilies remains open (WICKER et al., 2007, p. 981). 4.5 Difícil de clasificar, difícil de nombrar Aunque las características que distinguen un gen de otro están relativamente bien delimitadas, la nomenclatura de genes es confusa y ambigua, carece de convenciones apropiadas, es informal, descentralizada y en consecuencia variable según el grupo de organismos. Existe controversia en cuanto a la falta de criterios en biología molecular para nombrar y clasificar genes, generada por la producción masiva de secuencias, por la asociación de la nomenclatura de genes con su función y por las diversas escalas biológicas en las que se pueden categorizar las funciones de un solo gen (LYON et al. 2002; DIMMER et al. 2008). Most disciplines know how to handle the naming of newly discovered objects. Not so the molecular biologists, whose profligate and undisciplined labe- ling is hampering communication. . . access to and communication within that discipline will be greatly hindered unless more systematic and com- prehensible systems of nomenclature are developed (Nature 389 (6646), p. 1, comentario editorial). Los avances experimentales han jugado un papel crucial en la nomenclatura y cla- sificación de genes. Inicialmente, los genes que podían ser aislados, identificados y caracterizados funcionalmente eran tan escasos, que los investigadores tuvieron la oportunidad de nombrar los genes para hacer referencia al fenotipo/función del gen (SERINGHAUS; GERSTEIN, 2008; véase también http://tinman.nikunnakki.info/). Así se empezaron a nombrar genes como SUPERMAN (SUP) y KRYPTONITE (KYP), el 183 http://tinman.nikunnakki.info/ Capítulos La clasificación biológica: de especies a genes Conceptos y clasificación de genes Difícil de clasificar, difícil de nombrar