Vista previa del material en texto
primero un locus cuya mutación incrementa el número de estambres en la flor (BOW- MAN et al. 1992) y el segundo un gen que regula a SUPERMAN (JACKSON et al. 2002). Entre otros nombres aparecieron también FARINELLI (FAR), cuyo mutante en flores de Antirrhinum presenta estambres estériles (Davies et al. 1999); VAN GOGH (Vang), cuyo mutante en Drosophila produce pelos a modo de pinceladas discretas (TAYLOR et al. 1998) y SARAH, cuya mutación causa en Drosophila el aborto de huevos (HORNER et al. 2006). Todos estos nombres aunque fáciles de asociar con el fenotipo, no obedecen a un sistema nomenclatural, ni implican jerarquía alguna; son nombres triviales que poco explican la naturaleza de la secuencia o la relación con otros genes y en consecuencia de la homología del gen o de la relación de ancestría en común entre sus ortólogos. Con la capacidad de generar mutantes experimentalmente, se ha incrementado el número de nombres aleatorios y triviales de los mutantes, lo cual ha generado tres problemas fundamentales: (1) debido al efecto de redundancia génica, existen copias o incluso genes diferentes cuyo mutante no se distingue del fenotipo “silvestre”, en estos casos el nombre de un gen no puede ser asignado con base en el fenotipo mutante; (2) en diferentes estadios de desarrollo el mismo gen puede desempeñar funciones diferentes; en consecuencia, dos o más fenotipos pueden estar asociados a un mismo gen y varios nombres podrían ser aplicados a una sola secuencia; (3) diferentes genes que no comparten una relación de ancestría descendencia pue- den estar asociados con el mismo fenotipo y entonces genes diferentes estarían asociados bajo un mismo nombre. Por el contrario se encuentran numerosos sinónimos para un mismo gen. Por ejemplo, el gen APETALA1 (responsable de la identidad de órganos florales) tiene por lo menos seis sinónimos (AGL7, AP1, AP1_ARATH,At1g69120, F4N2.9, IPI00543034), que, a diferencia de los sinónimos taxonómicos, son igualmente válidos; lo anterior genera un caos nomenclatural debido a que no existen parámetros establecidos para su denominación. Por lo tanto sus nombres son triviales, confusos o arbitrarios ya que corresponden a números de accesiones (códigos), clones, o algunas veces asociaciones con otros genes. Esto resulta ser muy común en grandes grupos de factores de transcripción; por ejemplo, el acrónimo AGL (AGAMOUS-like) se usa para todos los genes que comparten ciertos dominios proteicos con el locus AGAMOUS, que había sido clonado previamente, y cuya secuencia y fenotipo son conocidos (el mutante forma flores sin órganos reproductivos; Bowman et al. 1989). En Arabidopsis hay más de 80 genes AGL (AGAMOUS-Like) que se diferencian en secuencia, función y expresión pero en su nomenclatura solo se diferencian por el número adicional al acrónimo AGL (AGL6, AGL12, AGL24 etc.). Existen varias iniciativas que buscan estandarizar la nomenclatura génica; por ejem- plo, la Saccharomyces Genome Database (SDG) exige que el nombre de los genes de 184 http://www.yeastgenome.org/gene_guidelines.shtml levadura con secuencia, expresión y función conocidas lleve tres letras seguidas de un número, y que los alelos dominantes se denoten con letra mayúscula y los rece- sivos con minúscula. Las tres letras deben hacer referencia a un fenotipo, un pro- ducto génico (proteína) o una función. Adicionalmente recomienda que se evite el uso de nombres de genes de otros organismos, a menos que sean los ortólogos en leva- dura. De forma similar existen reglas para nombrar genes en otras cepas de levadura, Candida albicans (www.candidagenome.org/Nomenclature.shtml), Drosophila (http:// flybase.org/static_pages/docs/nomenclature/nomenclature3.html), ratas (http://rgd. mcw.edu/nomen/nomen.shtml) y grupos de genes como citocromos (NELSON, 2006) gly- cosil transferasas (MACKENZIE et al. 1997) y receptores olfativos en mamíferos (GLUS- MAN et al., 2000). Aunque estos proyectos que se vienen desarrollando con el fin de estandarizar un sistema que permita la clasificación de genes que ya han sido aislados y caracterizados, así como la incorporación de nuevas secuencias y nuevos conocimientos asociados, las herramientas de anotación y clasificación de secuencias parecen ser el re- sultado de esfuerzos locales de grupos de investigación particulares, pero una jerarquía estandarizada para todos los genes a través de un paisaje organísmico amplio es todavía incipiente. Las reglas en la nomenclatura de secuencias cortas apenas empiezan a delinearse, pero parecen ser aplicadas con más rigurosidad que la nomenclatura de genes. Los miRNAs son nombrados usando el prefijo “miR” seguido de un número específico (p. ej. miR127). Los números se asignan consecutivamente según sean encontrados experimentalmente. Los números son losmismos paramiRNAs ortólogos en organismos tan diferentes como una planta y un animal (AMBROS et al., 2003; GRIFFITHS-JONES, 2004), lo que contrasta con la nomenclatura de genes. En este caso, los organismos no se interponen en la clasificación o la nomenclatura de miRNAs y es relativamente más fácil identificar miRNAs de distintos taxones. Los criterios para nombrar transposones y grupos de transposones (WICKER et al., 2007) son: nombres de familias pueden incluir letras o letras y números sin guiones, ni subrayados. No deben ser mas largas de seis silabas y deben ser fáciles de pronunciar (al menos en inglés para facilitar su uso en simposios). Nombres de transposones deben incluir un código de tres letras donde la primera haga referencia a la clase, la segunda al orden y la tercera a la superfamilia, seguido del nombre de la familia y un ID dado por la accesión (código) en las bases de datos que corresponde a la secuencia donde el transposón fue encontrado. Así RLC_Angela_AA123456-1 seria (leído de derecha a izquierda) el primer elemento en el gen AA123456 de la familia Angela, superfamilia Copia (C), orden LTR (L), clase I Retrotransposons (R). Las reglas nomenclaturales estandarizadas han sido desarrolladas muy lentamente con respecto a la producción masiva de datos moleculares. Las bases de datos comenza- ron a acumular secuencias correspondientes a regiones del genoma de numerosísimos organismos con la intención de centralizar información de forma organizada, pero 185 www.candidagenome.org/Nomenclature.shtml http://flybase.org/static_pages/docs/nomenclature/nomenclature3.html http://flybase.org/static_pages/docs/nomenclature/nomenclature3.html http://rgd.mcw.edu/nomen/nomen.shtml http://rgd.mcw.edu/nomen/nomen.shtml