Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
BY NC ND Artículo de revisión BY NC ND doi: http://dx.doi.org/10.16925/cf.v4i1.1958 Revisión sobre los marcadores del origen biogeográfico y su aplicación en la investigación forense Daniela María Popa, Lcda. en Criminología1, Eduardo Arroyo-Pardo, Ph.D. en Ciencias Biológicas1, Ana María López-Parra*, Ph.D. en Ciencias Biológicas1 1 Laboratorio de Genética Forense, Dpto. de Toxicología y Legislación Sanitaria, Facultad de Medicina, Universidad Complutense de Madrid, Madrid, España Recibido: 2 de diciembre del 2016 Aprobado: 16 de febrero del 2017 *Autor de correspondencia: Ana María López-Parra. Laboratorio de Genética Forense, Dpto. de Toxicología y Legislación Sanitaria, Facultad de Medicina, Universidad Complutense de Madrid, Madrid, España. Correo electrónico: amlopezparra@ med.ucm.es Cómo citar este artículo: Popa DM, Arroyo-Pardo E, López-Parra AM. Revisión sobre los marcadores del origen biogeográfico y su aplicación en la investigación forense. Colomb Forense. 2016;4(1):15-26. doi: http://dx.doi.org/10.16925/cf.v4i1.1958 Resumen. Propósito: actualmente, los marcadores que determinan el origen bio- geográfico están teniendo mucho auge, especialmente en el ámbito forense. Estos marcadores permiten analizar el adn de un individuo y determinar su origen bio- geográfico. Estos análisis se llevan a cabo con frecuencia a través de snp (Single Nucleotide Polymorphisms), pero más recientemente también a través de InDels. Debido a este auge, la finalidad de la revisión es recopilar información sobre los marcadores que actualmente se están utilizando, su diferente rendimiento y su problemática, así como las posibles soluciones. Periodo que se abarcó, origen y tipos de publicaciones: el periodo abarcado para el análisis es del año 2006 al 2016, con artículos recopilados de PubMed y Web of Science, sin ninguna preferencia en cuanto al origen. Punto de vista: aunque se han empleado para diferentes pobla- ciones y con diferentes marcadores, muestran resultados similares. Los artículos versan desde los tipos de marcadores seleccionados para el análisis, como marca- dores autosómicos o de linaje, hasta comparaciones entre marcadores de la misma categoría, como los snp y los InDels entre los autosómicos. Se han seleccionado así para poder obtener una visión comparativa de los más eficaces para la detección del origen biogeográfico. Conclusiones: se ha comprobado que los más marcado- res eficaces son los aim-snp autosómicos, en cuanto a diferenciación entre grupos poblacionales, y los aim-InDels, de forma suplementaria en los casos de mezcla poblacional. Palabras clave: InDels, origen biogeográfico, snp, str. ISSN: 2145-0684 (impreso)| ISSN: 2145-9649 (en línea) BY NC ND Artículo de revisión BY NC ND doi: http://dx.doi.org/10.16925/cf.v4i1.1958 Review of biogeographical ancestry markers and their application to forensic investigation Abstract. Purpose: The markers that determine biogeographical ancestry are booming, es- pecially in the forensic field. These markers allow to analyze the dna of an individual and determine their biogeographical origin. These analyses are carried out frequently through snp (Single Nucleotide Polymorphisms), but more recently through InDels as well. Be- cause of this boom, the purpose of the review is to gather information about the markers currently being used, their different performance and their problems, as well as possible solutions. Period covered, origin and types of publications: The period covered for the analy- sis is 2006-2016, compiling articles from PubMed and Web of Science, with no preference as to origin. Point of view: Although they have been used for different populations and with different markers, they show similar results. Articles range from the types of markers selected for analysis, such as autosomal or lineage markers, to comparisons among markers in the same category, such as snps and InDels among autosomal ones. They have been thus selected to obtain a comparative view of the most effective for the detection of biogeogra- phical ancestry. Conclusions: The most effective markers are autosomal aim-snp, in terms of differentiation among population groups, and supplementary aim-InDels, in cases of population mixing. Keywords: InDels, biogeographic ancestry, snp, str. Revisão sobre os marcadores de origem biogeográ- fica e a sua aplicação na investigação forense Resumo. Propósito: os marcadores que determinam a origem biogeográfica vivem seu auge na atualidade, especialmente no âmbito forense. Esses marcadores permitem analisar o DNA de um indivíduo e determinar a sua origem biogeográfica. Essas análises são fre- quentemente realizadas através de snp (Single Nucleotide Polymorphisms), porém, recen- temente, também são feitas por meio de InDels. Devido a esse auge, a finalidade da revisão é recopilar informação sobre os marcadores que estão sendo utilizados atualmente, os seus diferentes rendimentos e as suas problemáticas, assim como as possíveis soluções. Período abarcado, origem e tipos de publicações: o período abarcado para a análise é equivalente aos anos de 2006 a 2016, com artigos recopilados do PubMed e do Web of Science, sem nenhuma preferência quanto à origem. Ponto de vista: ainda que tenham sido usados para diferentes populações e com diferentes marcadores, mostram resultados similares. Os ar- tigos versam desde os tipos de marcadores selecionados para a análise, como marcado- res autossômicos ou de linhagem, até comparações entre marcadores da mesma categoria, como os snp e os InDels entre os autossômicos. Foram selecionados dessa forma para que fosse possível obter uma visão comparativa dos mais eficazes para a detecção da origem biogeográfica. Conclusões: foi comprovado que os marcadores mais eficazes são os aim-snp autossômicos, no que tange à diferenciação entre grupos populacionais, e os aim-InDels, de forma complementar, em caso de mistura populacional. Palavras-chave: InDels, origem biogeográfica, snp, str. 17Revisión sobre los marcadores del origen biogeográfico y su aplicación en la investigación forense Introducción Actualmente, la información genética identifica- tiva de un individuo se obtiene mediante marca- dores str (Short Tandem Repeats) o snp (Single Nucleotide Polymorphisms). En el primer caso, una secuencia conservada de 2-6 nucleótidos se rep- ite un número variable de veces en cada cromo- soma; en el segundo caso, se trata de variaciones de una base entre individuos. Recientemente, se han incorporado los llamados polimorfismos InDels (Insertion/Deletions). Se trata de lugares del genoma en los que puede aparecer insertada o no una determinada secuencia. Todos estos polimorf- ismos pueden emplearse para elaborar el perfil genético identificativo de un sujeto, si bien para ello es necesario otra muestra indubitada con la cual comparar. Sin embargo, el adn todavía puede pro- porcionar información adicional sin necesidad de cotejo. Un ejemplo es la inferencia del origen bio- geográfico (BioGeographical Ancestry, bga). Esta información puede ser especialmente útil en pobla- ciones estructuradas, en las que conviven subpo- blaciones de diferente origen étnico y genético. Así, el origen biogeográfico puede contribuir a la investigación en casos de personas desaparecidas, identificación de restos pertenecientes a desapare- cidos, análisis de casos antiguos o determinación de perfiles con adn mezclados, entre otros. El empleo de marcadores predictores del ori- gen biogeográfico de los individuos se fundamenta en el concepto de “ancestralidad” y en la estruc- tura genética de las poblaciones humanas. La ancestralidad puede ser definida como la heren- cia genética que cada individuo porta de sus ante- pasados o ancestros, los cuales –en un pasado más o menos remoto– han ocupado un determinado lugar geográfico a lo largo del tiempo. La ances- tralidad biogeográfica (BioGeographical Ancestry o bga) corresponde a la variación poblacionalencon- trada en un individuo, que puede señalar su origen o procedencia de una región geográfica concreta. Sin embargo, la herencia genética presente en las poblaciones humanas, su estructura genética, se ve afectada sobre todo por los movimientos pobla- cionales, la migración, la mezcla y por fuerzas evo- lutivas como la mutación, la deriva génica, el flujo génico y la selección natural. En teoría, este panorama es más complejo a causa del movimiento de los individuos en la era de la globalización. Pero, en general, las poblaciones humanas no están plenamente entremezcladas, ya que la distancia geográfica y las barreras geofísicas y culturales crean una fuerte restricción para el apa- reamiento al azar y para el libre movimiento de las personas [1]. Prueba de ello han sido los diferentes estudios que se han realizado para estimar la diver- sidad entre las poblaciones, comprobando que se observan mayores diferencias al comparar indivi- duos que al comparar poblaciones. Así, Rosenberg [2] estimó que la diversidad humana de los indi- viduos de una población oscila entre 93,2 y 94,1%, mientras que entre diferentes grupos poblaciona- les se sitúa entre 3,6 y 4,3%. A través del software structure, Rosenberg identificó cinco “clusters” (o grupos) continentales claramente diferencia- dos: Eurasia, África Subsahariana, Asia del Este, América y Oceanía. En publicaciones posteriores, se han diferenciado tres grupos en Eurasia: Europa, Oriente Medio y Asia Central/Sur. Los primeros estudios sobre la ancestralidad se llevaron a cabo analizando la variabilidad del adn mitocondrial (adnmt) y los polimorfismos del cromosoma Y (y-snp y y-str). Ambos se caracteri- zan por heredarse uniparentalmente: el adn mito- condrial por vía materna y el cromosoma Y por vía paterna. Por otro lado, el carácter haplotípico de estos marcadores reduce la potencia de la asigna- ción estadística porque, pese a la alta variabilidad, la información proviene de un único marcador, el cual no se aplica a un solo individuo, sino a su linaje completo. De esta manera, la mejor estrategia para estimar la ancestralidad consiste en, además de la utilización de estos genomas uniparentales, analizar marcadores informativos de ancestrali- dad conocidos como aim (Ancestry Informative Markers). Entre estos, los más utilizados son los aim-snp (Ancestry Informative Markers-snps) [3, 4]. El empleo de nuevas herramientas de genoti- pado, como la secuenciación de nueva generación (Next Generation Sequencing, ngs), posibilita el análisis de miles de marcadores y permite el análi- sis simultáneo de marcadores aim y marcadores de linaje [5]. Cada uno de los sistemas de análisis utiliza poblaciones de referencia y realiza inferencias sobre la comparación de los patrones de variación detec- tados. Un perfil de genotipos aim de ascendencia desconocida es analizado y comparado con la infor- mación de referencia. Por lo tanto, uno de los fac- tores clave en la inferencia forense de ancestralidad Colombia Forense / Volumen 4, Número 1 / abril 2017Artículo de revisión18 son la relevancia, la calidad y el alcance de los datos de las poblaciones de referencia [1]. Entre los objetivos que este trabajo pretende revisar está la valoración de marcadores genéticos como herramienta para distinguir los principales grupos poblacionales en que esta puede subdivi- dirse. Por otro lado, se revisarán los distintos tipos de marcadores genéticos que son más adecuados para predecir el origen biogeográfico. Así mismo, interesa evaluar la utilidad de los marcadores del cromosoma Y, adn mitocondrial, y los marcadores autosómicos en relación con el origen biogeográ- fico. Por último, el trabajo pretende analizar la uti- lización de los marcadores de origen biogeográfico desde un punto de vista ético y legal. Materiales y métodos Todos los artículos manejados en el presente tra- bajo se recopilaron a partir de bases de datos como PubMed y Web of Science; se realizó la búsqueda inicial el 23 de marzo de 2016 y se seleccionaron los artículos dentro del periodo 2006-2016. Los artículos utilizados que tienen fechas anteriores son debidos a su relevancia en el campo de estudio. Los términos empleados en las búsquedas en las bases de datos fueron: ancestry informative mar- kers (aim), aim-snps, phenotype, dna markers, bio- geographic origin, strs, InDels, X chromosome y Y chromosome. Estos términos han sido combinados de manera pertinente, buscando en el resultado los artículos más relacionados con el tema en estudio. Se ha elaborado una tabla (ver tabla 1) con toda la información recogida en los artículos consul- tados respecto a poblaciones analizadas, número de individuos, marcadores analizados, y tipo de marcadores. Marcadores informativos de ancestralidad (aim) La ancestralidad biogeográfica (bga) es el tér- mino propuesto por el Grupo de Trabajo en Raza, Etnicidad y Genética del Instituto Nacional de Investigación en Genoma Humano, en sustitución de los términos “ancestro” o “raza” [6]. El proceso por el cual se asigna un grupo ancestral implica primero identificar y caracteri- zar aquellos marcadores cuyas frecuencias alélicas se encuentran ampliamente diferenciadas entre los grupos de poblaciones, es decir los aim. En este sen- tido, hay que tener presente los diferentes niveles de divergencia que existen entre las poblaciones. Así, existe una fuerte diferenciación de las poblaciones africanas respecto al resto, seguido por las diferen- cias entre las poblaciones eurasiáticas y el resto, y por último, entre las poblaciones del este de Asia con Oceanía y poblaciones americanas, debido a los recientes eventos fundadores en estas regiones [7]. De tal manera, se deben encontrar conjuntos de marcadores que separen estos grupos de pobla- ciones; es decir, con elevados niveles de Fst entre poblaciones [8]. Pero debe ser con igual poder de resolución; por el contrario, se puede infra o sobre- estimar la proporción de uno de los componentes, como ya ha sido observado en el análisis de pobla- ción boliviana por Taboada [9] y Galanter [10]. Posteriormente, lo que se mide en un individuo es el ancestro genómico o nivel de ancestro gené- tico, siendo este el nivel promedio de mezcla cal- culado en el genoma, en relación con los aim [7]. De este modo, el genotipado de aim podría indicar la ancestralidad más probable del donante, y por tanto, ayudar en el curso de la investigación [8]. La bga puede ser estimada a través del análi- sis de marcadores genéticos como str, snp e InDels [11]. Desde los primeros estudios de estimación del bga, se han empleado aim-snp. Los snp son muy frecuentes en los cromosomas, encontrándose un snp cada 300-500 pares de bases. Se han identifi- cado snp con un amplio rango de frecuencias dife- renciales en distintas poblaciones. Su baja tasa de mutación permite que la variabilidad genética entre las poblaciones permanezca sin cambios a lo largo del tiempo. Tienen un limitado número de varian- tes posibles por locus, de forma que si existe una variante representativa de la población, es más pro- bable que la porte un gran porcentaje de los indivi- duos de ese grupo. Además, la posibilidad de poder emplear pequeños amplicones favorece su genoti- pado mediante sistemas múltiplex e incrementa la posibilidad de éxito con muestras degradadas [12]. Por todo ello, el genotipado de snp autosómicos ha sido considerado como la herramienta ideal para la predicción del origen biogeográfico [13]. En los repositorios científicos, se encuen- tran numerosas publicaciones en las que se han empleado aim-snp, de manera que se han cons- truido paneles específicos de estos marcadores. El 34 snp-plex [8] es un ejemplo de un set de snp, con 19Revisión sobre los marcadores del origen biogeográfico y su aplicación en la investigación forense lo que este ha podido diferenciar, con un error infe- rior al 1%, a poblaciones africanas subsaharianas, europeas y asiáticas.Sin embargo, este análisis no puede distinguir otro tipo de poblaciones como la nativa americana o la de Oceanía, por lo cual se han desarrollado otras combinaciones de snp adecua- das para dichas poblaciones [3]. Bulbul et al. [4] llevaron a cabo un estudio com- binado de varios paneles de aim-snp: el 34-plex, el Eurasiaplex y un nuevo panel denominado 33-plex para obtener una mayor resolución genética de las poblaciones del Oriente Medio, del este de Europa y de población mediterránea. El análisis de com- ponentes principales muestra una diferencia- ción creciente entre la población de estudio y la de referencia cuando al 34-plex se le añaden paneles adicionales. La división poblacional de las regio- nes de Asia Central y del sur de Asia aumenta tras añadir el Eurasiaplex. Más aún, el 33-plex aumentó la separación entre población euroasiática y pobla- ción del este asiático. Por lo tanto, la mejor separa- ción de los cinco grupos (África, Europa, Oriente Medio, Asia centro-meridional y Asia del este) es obtenida utilizando los tres paneles de snp juntos, dado que cada uno contribuye a la diferenciación global. El análisis de la estructura genética mostró que la división óptima por grupos fue obtenida en K:5, en el que los grupos poblacionales están casi completamente diferenciados (figura 1) [4]. Figura 1. En la imagen se muestra la división realizada a través de structure en cuatro grupos, siendo el K:5 el que muestra la mayor diferenciacion entre los grupos poblacionales analizados [4]. En relación con los str, se han realizado algu- nos intentos pero siempre en conjunción con los snp [14]. Un conjunto de str que refleje el ori- gen geográfico de un individuo es difícil de defi- nir debido al multialelismo y a la hipervariabilidad. Así, casi todos los alelos frecuentes están presen- tes en casi todas las poblaciones, hecho que reduce su información respecto al origen biogeográfico. Su elevada tasa de mutación promueve la estabili- zación de las frecuencias alélicas entre poblaciones [13]. Además, se han observado grandes diferencias en la estimación del origen biogeográfico según el grupo ancestral [15]. Los aim-InDels pueden proporcionar el mismo potencial que los aim-snp para la detección de la ancestralidad, pero tienen la ventaja de ser más fáciles de genotipar. Los snp son polimorfismos de secuencia, por lo cual para conocer la posición polimórfica se hace necesario secuenciar; mien- tras que los InDels son polimorfismos de longitud, con lo que tan solo se debe conocer su diferencia en el tamaño del fragmento. La simplicidad de este enfoque proporciona un uso fácil y una elevada efi- ciencia en tiempo y coste [14]. Estos marcadores son capaces de distinguir de modo fiable la ancestrali- dad entre las principales poblaciones continentales de África, Europa, este de Asia y América [16]. Por Colombia Forense / Volumen 4, Número 1 / abril 2017Artículo de revisión20 último, proporcionan una capacidad superior para detectar mezclas de adn de individuos distintos, dado que en los electroferogramas producen patro- nes de picos mucho más equilibrados que los snp. Y son más exitosos en el análisis de adn degradado, debido al menor tamaño del producto de pcr [17]. Así, por ejemplo, el panel de 46 aim-InDels, diseñado por el grupo de Chris Philips, tiene la capacidad de diferenciar cuatro grupos poblacio- nales principales (africanos, europeos, asiáticos del este y nativos americanos), que distingue con un alto grado de precisión. Igualmente, ha sido demos- trada su capacidad de distinguir grupos de Oceanía, aunque con menor precisión [17]. Sin embargo, la población de Oriente Medio no es correctamente identificada, siendo descritos como “europeos” con componentes africanos minoritarios [18]. Debido a la limitación que supone el número de marcado- res que es posible analizar en una sola pcr, el 46 aim-InDels, al igual que otros conjuntos de aim, estima el origen geográfico a nivel continental. De nuevo, la combinación de aim-InDels con aim-snp o str disponibles mejora la asignación forense de ancestralidad [19]. Así, por ejemplo, Santos et al. [18] realizaron un estudio en el que combinaron 34 aim-snp con 46 aim-InDels, y obtuvieron una mayor separa- ción entre el grupo africano y el euroasiático, así como entre el grupo europeo y el del este de Asia (figura 2A). En el análisis con el software struc- ture (figura 2B), queda patente que la población de Asia centro-meridional está claramente dife- renciada de la europea cuando se añade el 34 aim- snp. Sin embargo, considerando solo uno de los conjuntos de marcadores, la población del Oriente Medio no puede ser diferenciada de otros grupos [18]. Aunque es evidente el interés de este tipo de marcadores, todavía se dispone de pocas poblacio- nes de referencia genotipadas para los aim-InDels, limitando así su utilidad. Figura 2. En los gráficos, se muestra la diferenciación de los grupos poblacionales analizados con structure (B) y a través del análisis de componentes principales de dos paneles, uno de snp y otro de Indels, por separado y en conjunto (A) [18]. 21Revisión sobre los marcadores del origen biogeográfico y su aplicación en la investigación forense El cromosoma X no se emplea con demasiada frecuencia como herramienta para la determina- ción forense del origen biogeográfico a nivel conti- nental [20]. Tan solo se ha utilizado a nivel nacional [21] o para distinguir dos continentes [20]. Laan et al. [20] llevaron a cabo un análisis del desequilibrio de ligamiento en el cromosoma X con structure y observaron que había dos posibles grupos diferen- ciados. En la mayoría de las poblaciones del estudio, cada individuo presentó un haplotipo único cons- tituido por seis (Xp22) u ocho (Xq13) loci. Hay una clara diferencia entre las distribuciones haplotípi- cas europeas y las asiáticas. En la población euro- pea, excepto los Saami, desde el oeste de Europa hasta los Urales predomina un haplotipo princi- pal (17-40%). En el este de Asia, este haplotipo está presente con bajas frecuencias (≤10%). Por el con- trario, el haplotipo común detectado en Asia oscila entre el 16% en Uriankhai, una población aislada de Mongolia, y el 34% en japoneses, estando prác- ticamente ausente en Europa [20]. Recientemente, se ha publicado un panel con InDels en cromosoma X logrando estimar los principales grupos conti- nentales [22]. Hoy en día, se trabaja intensamente para des- cubrir nuevos aim capaces de distinguir entre gru- pos poblacionales específicos [19] que permitan una estimación a nivel regional [23]. Esta precisión en relación con el origen geográfico se puede mejo- rar mediante el análisis de cientos de marcadores, empleando para ello plataformas de secuenciación de nueva generación. Así, Precision ID Ancestry Pannel (Applied Biosystems™) incluye 165 marca- dores snp autosómicos y se analiza mediante una plataforma Ion pgm™ System, que permite la esti- mación del origen geográfico a nivel local. En este sentido, también es interesante el panel de 128 marcadores diseñado por el euro- forgen [24]. Este panel denominado euroforgen Global aim permite la asignación en poblaciones de los cinco grupos continentales. Posteriormente, se ha desarrollado un sistema SNaPshot a partir del euroforgen Global aim, que incluye 28 snp bialé- licos y tres trialélicos, que se conoce como Global aim Nano set [25]. La inclusión de snp trialélicos facilita la detección de muestras mezcladas. Así, se han obtenido perfiles con 64 picogramos de adn, lo cual demuestra que es adecuado para muestras degradadas, y por lo tanto, el empleo de un sis- tema basado en la minisecuenciación busca su fácil implementación en laboratorios forenses. Por otra parte, ForenSeq™FGx System –empleando la pla- taforma MiSeqFGx™ System de Illumina– analiza, entre otros, 56 ancestry-snps [26]. Sea cual sea el tipo de marcador empleado, se requieren herramientas estadísticas que, en fun-ción de las frecuencias en las poblaciones de refe- rencia, permitan estimar el origen geográfico. Así, se dispone principalmente de dos calculado- ras forenses online que permiten estimar la ances- tralidad individual: snipper (http://mathgene.usc. es/snipper/) [27] y Forensic Resource/Reference on Genetics-Knowledge Base (frog-kb) (http://frog. med.yale.edu) [28]. El website snipper permite que el usuario incorpore nuevas poblaciones de refe- rencia, pero está limitado a un número menor de paneles de marcadores. Por su parte, frog-kb tiene diez paneles con conjuntos de 53-125 poblaciones de referencia [29]. Estos análisis tienen como limitación la mezcla poblacional [1, 5, 30], lo cual supone la existencia de individuos o poblaciones con ancestralidades mez- cladas. En estos casos, se han empleado estrategias diferentes. Así, algunos investigadores han optado por incrementar el número de aim [5], mientras otros han escogido el empleo de diferentes herra- mientas estadísticas, como el análisis bayesiano con el cálculo de LR (likelihood ratio), que establece una ratio entre dos probabilidades bajo dos hipóte- sis mutuamente excluyentes. Marcadores de linajes La información obtenida a partir de marcadores de linaje revela una parte de la historia biológica dis- tinta pero complementaria a la de los marcadores autosómicos. El empleo de aim autosómicos para la inferencia del ancestro biogeográfico y el grado de mezcla a nivel de individuos permiten la eva- luación de una estructura demográfica actual. Sin embargo, debido a que los loci autosómicos apor- tan información de ambos progenitores, sus alelos proporcionan una perspectiva del pasado distinta a la del adn mitocondrial y del cromosoma Y. Estos marcadores de linaje son informativos respecto a las poblaciones y permiten rastrear la filogenia de grupos, así como detectar mezclas [7]. adn mitocondrial La molécula de adn mitocondrial (adnmt) – como sucede con el cromosoma Y– presenta una Colombia Forense / Volumen 4, Número 1 / abril 2017Artículo de revisión22 amplísima variabilidad interpoblacional que per- mite predecir el origen biogeográfico. Al ser el adnmt un marcador relativamente resistente a la degradación post mortem (simplemente por ser más abundante), supone una ventaja muy impor- tante en el campo forense. Sin embargo, debido a la falta de recombinación, presentan una limitación: este marcador no permite asignar un perfil a un individuo sino a un linaje extenso; es decir, tiene un bajo poder de discriminación. De esta forma, no se puede hablar del origen biogeográfico de un individuo sino de un linaje [17]. La información del adn mitocondrial que se analiza no es solo de las regiones hipervariables hvi/hvii, sino también de los snp de regiones codi- ficantes, siendo esto último complementario para aumentar la discriminación en casos en los que los perfiles de las regiones hvi/hvii sean idénti- cos, particularmente las secuencias originadas de la misma población o grupo étnico [31]. A efectos poblacionales, es interesante el con- cepto de “haplogrupo”. Un haplogrupo es un con- junto de haplotipos que comparten una serie de mutaciones y, por lo tanto, tienen un origen común. El haplogrupo H es el más común en la población caucásica, pero la diferenciación genealógica en subgrupos apunta a una subestructura en forma de mosaico, con diferentes subgrupos mostrando diferentes patrones geográficos. Así, por ejemplo, la población de Colombia, según censos oficiales, está formada fundamentalmente por descendien- tes de población caucasoide (86,1%), en su mayo- ría españoles, africanos (10,5%), amerindios (3,4%) y gitanos (0,1%) [32]. La variabilidad poblacional respecto al origen es muy distinta según las regio- nes, en especial en los departamentos de la costa del Pacífico o del mar Caribe frente a los departa- mentos interiores. El análisis del adn mitocondrial refleja el mantenimiento de los linajes amerindios, y los cuatro principales haplogrupos amerindios A, B, C y D se encuentran con frecuencias que varían en un intervalo del 74 al 97% [33, 34]. Una situa- ción similar se observa en la mayoría de países de Suramérica, por lo que a partir de los haplogrupos mitocondriales resulta difícil una asignación pre- cisa [31]. Chaitanya et al. [35] realizaron un estudio sobre la herencia matrilineal en los cinco continen- tes y desarrollaron cinco sistemas de genotipado múltiplex que abarcaban 62 snp mitocondria- les informativos de ancestralidad (mt-snp), que pudieron ser analizados en diferentes tipos de muestras (sangre, saliva, etc.) y en muestras con baja concentración de adn (un picogramo). Este sistema jerárquico de ensayos permite la detec- ción de los principales haplogrupos presentes en África, América, oeste de Eurasia, este de Eurasia, Australia y Oceanía, revelando así el origen geográ- fico del linaje materno. Décadas de investigación en genética pobla- cional sobre la distribución mundial de la varia- ción genética del adnmt han proporcionado un amplio número de mtsnp que permite diferen- ciar poblaciones geográficas cercanas [36]. Esto ha posibilitado el diseño de sistemas múltiplex con los que asignar los haplogrupos y subhaplogrupos más frecuentes en un continente, como por ejemplo el 22-plex a nivel europeo [37], o para asignar eficien- temente individuos a poblaciones con un fuerte componente mestizo, como sería el caso del 42-plex en poblaciones latinoamericanas [38] o el genoti- pado de los linajes fundadores de poblaciones indí- genas americanas mediante el AmericaPlex26 [39]. Cromosoma Y En el cromosoma Y se analizan también marcado- res de linaje mediante str y snp. Son numerosos los estudios genético-poblacionales que han apor- tado frecuencias haplotípicas y de haplogrupos del cromosoma Y. Así, Díaz-Lacava et al. [40] llevaron a cabo un análisis geoestadístico que confirma la existencia de un componente geográfico en la dife- renciación poblacional en Europa, tal como hicie- ron otros estudios anteriores, como por ejemplo el del grupo de Lao [41]. Este enfoque proporciona evidencia detallada de la distribución geográfica y las frecuencias relativas de la mayoría de grupos principales de la población masculina europea, examinada a través de haplotipos y-str [40]. En cuanto a los str, el sistema PowerPlex Y23 (ppy23, Promega Corporation, Madison, Wisconsin), por ejemplo, se ha empleado para separar muestras con ancestralidad africana de otros grupos o “metapoblaciones” continentales. Además, en Europa se evidenció una clara división este-oeste para estos marcadores, a pesar de ser poblaciones con pequeñas distancias genéticas. En algunos casos, se encontraron distancias genéticas relativamente grandes entre migrantes y potencia- les poblaciones de origen, como los afroamericanos y los africanos autóctonos [42]. 23Revisión sobre los marcadores del origen biogeográfico y su aplicación en la investigación forense Respecto a los y-snp, son numerosos los múlti- plex que se han desarrollado para predecir el linaje a través de los haplogrupos más representativos. Se han diseñado múltiplex a nivel mundial, como el 28 y-snp del grupo de Van Oven [43]. También, se han diseñado múltiplex a nivel continental, como el 37-plex a nivel Europeo [44] o el análisis de 24 y-snp para asignar los principales haplogrupos y subhaplogrupos detectados en Suramérica [45]. No obstante, resulta evidente que el análisis de 530 snp mediante el empleo de las nuevas platafor- mas de genotipado permite una asignación mucho más precisa tanto a nivel de haplogrupos como de subhaplogrupos [46]. Discusión Utilidad de los aim En comparación con otros marcadores, resulta evidente que los aim-snp son los marcadores que mejores resultados proporcionan para el análi- sis del origen biogeográfico. Así, en primer lugar, los aim-snp presentan una utilidad técnica. En la mayoría de los casos forenses, la muestra suele ser crítica, es decir,con baja concentración de adn y/o con material genético muy degradado, por lo que se requieren marcadores que tengan un tamaño redu- cido y técnicas de genotipado muy optimizadas, tal como sucede con los aim-snp [3]. En lo referente a la información proporcio- nada para la inferencia del origen biogeográfico, los aim-snp autosómicos están siendo más empleados en las plataformas de genotipado frente a los mar- cadores de linaje. Esto se debe a que los aim-snp presentan mayor poder en la diferenciación de gru- pos de poblaciones [7], en comparación con los str de cromosomas sexuales o el adn mitocondrial [2, 47, 48]. Sin embargo, las recientes investigaciones empleando marcadores InDels permiten proponer que los InDels pueden suplir la información apor- tada por los aim-snp, de manera que su utilización conjunta sería útil para dilucidar con una mayor probabilidad el origen biogeográfico del individuo del que proviene una muestra dubitada [8, 19]. Pese a sus ventajas, todavía subsiste el induda- ble problema técnico de las ancestralidades mez- cladas. A este respecto, Prestes et al. [30] llevaron a cabo un análisis para determinar la ancestralidad individual de muestras con adn mezclados, com- parando marcadores uniparentales y marcado- res autosómicos. Utilizaron seis aim autosómicos, específicamente seleccionados, y determinaron que tenían una capacidad que alcanzaba el 95% para la inferencia del origen biogeográfico. Afirmaron que, aunque los marcadores uniparentales analiza- dos relacionaban los haplogrupos con la ancestra- lidad declarada por los donantes, los marcadores autosómicos eran más precisos en individuos con ancestralidades mezcladas. Por otro lado, el estu- dio afirmaba que un panel más amplio de aim altamente discriminativos, y seleccionados para diferenciar la población de interés, podría propor- cionar una mayor precisión a la hora de predecir los niveles de mezcla [30]. Por otra parte, la fiabilidad de la inferencia forense de ancestralidad depende también de la existencia de bases de datos de poblaciones de refe- rencia exhaustivas [18]. Sin embargo, los snp incor- porados a los paneles de aim varían desde unas pocas docenas a unos pocos cientos, siendo este número restringido por las técnicas de genotipado empleadas. En consecuencia, en escenarios pobla- cionales donde se manejen grupos estrechamente relacionados o en casos de mezcla serán necesa- rios paneles de aim amplios con sus correspon- dientes bases de datos poblacionales [3, 5]. Existe una correlación entre el número de snp en un panel y el error asociado a la estimación de ancestrali- dad. Los análisis llevados a cabo por el grupo de Pardo-Secol [5], con varios conjuntos de aim-snp, muestran que los errores en las estimaciones de ancestralidad son mayores cuando se utilizan alre- dedor de 500 snp elegidos aleatoriamente, a dife- rencia de cuando se utilizan al menos 1.000 snp elegidos aleatoriamente. Un ejemplo de aplicación del análisis de este tipo de marcadores en los casos de investigación policial fue la investigación que se llevó a cabo tras el atentado del 11 de marzo de 2004 en Madrid (España), en la cual se requirió la predicción del origen biogeográfico para ayudar a encaminar la pesquisa hacia los sospechosos del atentado [49]. Por último, a nivel clínico también es de interés el empleo de aim, dado que la respuesta a medicamentos y la prevalencia de enfermedades están condicionadas por la estructura genética de la población de pertenencia y, en defintiiva, por la ancestralidad. Existen estudios epidemiológi- cos en los que se ha demostrado que la asignacion Colombia Forense / Volumen 4, Número 1 / abril 2017Artículo de revisión24 geográfica genética es más precisa que la referida por el propio individuo [50, 51]. Consideraciones éticas y legales La principal controversia en la utilización de estos marcadores es que si al proceder de adn codifi- cante, su empleo puede vulnerar principios del derecho como la libertad, la privacidad y la auto- nomía [3]. Por este motivo, las legislaciones sobre el tema presentan una notable heterogeneidad entre países: la mayoría de ellos permite exclusiva- mente el uso de adn en regiones no codificantes. Sin embargo, estas legislaciones solo se refieren a muestras obtenidas de sospechosos, detenidos o voluntarios, cuyos perfiles van a ser almacenados en bases de datos, y no a las muestras que se obtie- nen de la escena de un crimen. Holanda constituye una excepción al respecto, dado que es el único país que permite el uso de este tipo de marcadores. No obstante, hay países que permiten que se lle- ven a cabo todos los análisis que la ley no prohíba, mientras que otros lo prohíben explícitamente o incluso carecen de regulación al respecto [3]. En el caso de España, la Ley 10/2007, del 8 de octubre, reguladora de la base de datos policial sobre identificadores obtenidos a partir del adn, especifica que se analizan las muestras halladas en el lugar del crimen y las obtenidas de sospechosos, detenidos o imputados, cuando se trata de delitos graves y delitos que afecten derechos fundamenta- les como el de la vida, la integridad y la libertad sexual, entre otros. Se incluye en la base de datos policial solo la información correspondiente a la identidad de la persona y a su sexo. De manera que, legalmente, no está prohibido el análisis del origen biogeográfico, pero tampoco está regulado explíci- tamente [52]. Por lo tanto, una base legal para el análisis del origen biogeográfico debe ir acompañada, además, del marco legal que lo regule exhaustivamente, de unas condiciones previas para el análisis y de unas reglas para el manejo y la interpretación de los datos [53]. Conclusión Para concluir, puede decirse que en Europa los marcadores que mejor diferencian entre los gru- pos étnicos son los autosómicos. Dentro de los autosómicos, los que mejor llevan a cabo esta tarea son los snp. En la poblacional global, los marcadores más eficaces para la determinación del origen biogeo- gráfico son los aim-snp, que son capaces de dis- tinguir los principales grupos poblacionales continentales. Por otro lado, los InDels constitu- yen una poderosa herramienta suplementaria de los aim-snp y resultan eficaces cuando se trata de adn de ancestralidad mezclada. Además, cuando se emplean en cantidad suficiente, son equiparables a los mejores snp. En lo referente al conjunto de marcadores genéticos, los autosómicos son más precisos y efi- caces para determinar el origen biogeográfico que marcadores haploides como el adn mitocondrial o el cromosoma Y. Así mismo, en los casos de mezcla serán los aim seleccionados específicamente para distinguir ancestralidades biogeográficas los que proporcionarán mayor precisión en la asignación de ancestralidad. Referencias [1] Phillips C. Forensic genetic analysis of bio-geogra- phical ancestry. Forensic Sci Int Genet. 2015;18:49- 65. [2] Rosenberg NA, Pritchard JK, Weber JL, Cann HM, Kidd KK, Zhivotovsky LA, et al. Genetic structure of human populations. Science. 2002;298(5602):2381- 5. [3] Lareu Huidobro V. Nuevos polimorfismos de adn: predicción de origen biogeográfico y características físicas. En Casado M, Guillén M. adn forense: pro- blemas éticos y jurídicos. Barcelona: Universidad de Barcelona; 2014. p. 157-68. [4] Bulbul O, Filoglul G, Zorlul T, Altuncull H, Frei- re-Aradas A, Söchtig J, et al. Inference of biogrogra- phical ancestry across central regions of Eurasia. Int J Legal Med. 2016;130(1):73-9. [5] Pardo-Secol J, Martinón-Torres F, Salas A. Evalua- ting the acurracy of aim panels at quantifying geno- me ancestry. bmc Genomics. 2014;15:543. [6] Halder I, Shriver M, Thomas M, Fernandez JR, Fru- dakis T. A panel of ancestry informative markers for estimating individual biogeographical ancestry and admixture from four continents: Utility and applica- tions. Hum Mutat. 2008;29(5):648-58. [7] Frudakis T. Molecular photofitting.Predicting an- cestry and phenotype using dna. Cambridge: Aca- demic Press; 2008. 25Revisión sobre los marcadores del origen biogeográfico y su aplicación en la investigación forense [8] Phillips C, Salas A, Sánchez JJ, Fondevila M, Gó- mez-Tato A, Álvarez-Dios J, et al. Inferring ancestral origin using a single multiplex assay of ancestry-in- formative marker snps. Forensic Sci Int Genet. 2007;1(3-4):273-80. [9] Taboada-Echalar P, Álvarez-Iglesias V, Heinz T, Vi- dal-Bralo L, Gómez-Carballa A, Catelli L, et al. The genetic legacy of the Pre-colonial period in contem- porary Bolivians. PLoS One. 2013;8(3):e58980. [10] Galanter JM, Fernández-López JC, Gignoux CR, Barnholtz-Sloan J, Fernández-Rozadilla C, Via M, et al. Development of a panel of genome-wide ancestry informative markers to study admixture throughout the Americas. PLoS Genet. 2012;8(3):e1002554. [11] Ruiz Orozco Y. fdp: “Forensic dna Phenotyping”. Aplicaciones de marcadores genéticos en la inferen- cia de características visibles externas y origen an- cestral con fines forenses. Santiago de Compostela: Universidad Santiago de Compostela; 2012. [12] Butler JM, Coble MD, Vallone PM. stra vs. snps: thoughts on the future of forensic dna testing. Fo- rensic Sci Med Pathol. 2007;3(3):200-5. [13] Fondevila M, Phillips C, Lareu M. Aplicaciones no convencionales de marcadores bialélicos (snps) en genética forense. Boletín Galego de Medicina Legal e Forense. 2014;(20). [14] Phillips C, Fernández-Formoso L, Gelabert-Besada M, García-Magariños M, Santos C, Fondevila M, et al. Development of a novel forensic str multiplex for ancestry analysis and extended identity testing. Electrophoresis. 2013;34(8):1151-62. [15] Graydon M, Cholette F, Ng LK. Inferring ethnicity using 15 autosomal str loci –Comparisons among populations of similar and distinctly different phys- ical traits. Forensic Sci Int Genet. 2009;3(4):251-4. [16] Pereira R, Phillips C, Pinto N, Santos C, Santos S, Amorim A, et al. Straightforward inference of an- cestry and admixture proportions through ances- try-informative insertion deletion multiplexing. PLoS One. 2012;7(1):e29684. [17] Fondevila M, Phillips C, Santos C, Pereira R, Gus- mao L, Carracedo A, et al. Forensic performance of two insertion-deletion marker assays. Int J Legal Med. 2012;126(5):725-37. [18] Santos C, Phillips C, Oldoni F, Amigo J, Fondevila M, Pereira R, et al. Completion of a worldwide refe- rence panel of samples for an ancestry informative Indel assay. Forensic Sci In. Genet. 2015;17:75-80. [19] Fondevila M, Phillips C, Santos C, Freire-Aradas A, Vallone PM, Butler JM, et al. Revision of the snp- forID 34-plex forensic ancestry test: Assay enhan- cements, standard reference sample genotypes and extended population studies. Forensic Sci Int Genet. 2013;7(1):63-74. [20] Laan M, Wiebe V, Khusnutdinova E, Remm M, Pääbo S. X-chromosome as a marker for popula- tion history: Linkage desequilibrium and haplotype study in Eurasian populations. Eur J Hum Genet. 2005;13(4):452-62. [21] Ibarra A, Restrepo T, Rojas W, Castillo A, Amo- rim A, Martínez B, et al. Evaluating the X chromo- some-specific diversity of colombian population using insertion/deletion polymorphism. PLoS One. 2014;9(1):e87202. [22] Fan GY, Ye Y, Hou YP. Detecting a hierarchical genetic population structure via Multi-InDel mar- kers on the X chromosome. Sci Rep. 2016;6:32178. doi:10.1038/srep32178 [23] Rosenberg NA, Li LM, Ward R, Pritchard JK. Infor- mativeness of genetic markers for inference of an- cestry. Am J Hum Genet. 2003;73(6):1402-22. [24] Eduardoff M, Gross TE, Santos C, De la Puente M, Ballard D, Strobl C, et al. euroforgen-NoE Con- sortium, Parson W, Phillips C. Inter-laboratory evaluation of the euroforgen Global ancestry-in- formative snp panel by massively parallel sequen- cing using the Ion pgmTM. Forensic Sci Int Genet. 2016;23:178-89. [25] De la Puente M, Santos C, Fondevila M, Manzo L, euroforgen-NoE Consortium, Carracedo Á, et al. The Global aims Nano set: A 31-plex SNaPshot assay of ancestry-informative snps. Forensic Sci Int Genet. 2016;22:81-8. [26] Silvia AL, Shugarts N, Smith J. A preliminary assess- ment of the ForenSeqTMFGx System: Next genera- tion sequencing of an str and snp multiplex. Int J Legal Med. 2017;131(1):73-86. [27] The Snipper App version 2.5 [internet]. Disponible en http://mathgene.usc.es/snipper/ [28] Rajeevan H, Soundararajan U, Pakstis AJ, Kidd KK. Introducing the Forensic Research/Reference on Genetics knowledge base, frog-kb. Investig Genet. 2012;3(1):18. [29] Bulbul O, Cherni L, Khodjet-El-Khil H, Rajeevan H, Kidd KK. Evaluating a subset of ancestry informati- ve snps for discriminating among Southwest Asian and circum-Mediterranean populations. Forensic Sci Int Genet. 2016;23:153-8. [30] Prestes PR, Mitchell RJ, Daniel R, Sánchez JJ, Van Oorschot RAH. Predicting biogeographical ances- try in admixed individuals – values and limitations of using uniparental and autosomal markers. Aust J Forensic Sci. 2016;48(1):10-23. [31] Pereira L, Richards M, Goios A, Alonso A, Albarrán C, García O, et al. Evaluating the forensic informa- Colombia Forense / Volumen 4, Número 1 / abril 2017Artículo de revisión26 tiveness of mtdna haplogroup H sub-typing on a Eurasian scale. Forensic Sci Int. 2006;159(1):43-50. [32] Rodríguez-Palau E, Hernández-Romero A, Sala- manca-Rodríguez L, Ruiz-García F, Sardi-Perea E. Colombia. Una nación multicultural. Bogotá: De- partamento Administrativo Nacional de Estadística. [33] Yunis JJ, Yunis EJ. Mitochondrial dna (mtdna) haplogroups in 1526 unrelated individuals from 11 Departments of Colombia. Genet Mol Biol. 2013;36(3):329-35 [34] Xavier C, Builes JJ, Gomes V, Ospino JM, Aquino J, Parson W, et al. Admixture and genetic diversity distribution patterns of non-recombining lineages of Native American ancestry in Colombian popula- tions. PLoS One. 2015;10(3):e0120155. [35] Chaitanya L, Van Oven M, Weiler N, Harteveld J, Wirken L, Sijen T, et al. Developmental validation of mitochondrial dna genotyping assays for adepts matrilineal inference of biogeographic ancestry at a continental level. Forensic Sci Int Genet. 2014;11:39- 51. [36] Brandstätter A, Parsons TJ, Parsons W. Rapid scree- ning of mtdna coding region snps for the identifi- cation of west European Caucasian haplogroups. Int J Legal Med. 2003;117(5):291-98. [37] Kohnemann S, Sibbing U, Pfeiffer H, Hohoff C. A ra- pid mtdna assay of 22 snps in one multiplex reaction increases the power of forensic testing in European Caucasians. Int J Legal Med. 2008;122(6):517-23. [38] Paneto GG, Koehnemann S, Martins JA, Cicarelli RM, Pfeiffer H. A single multiplex pcr and SNaPs- hot minisequencing reaction of 42 snps to classify admixture populations into mitochondrial dna ha- plogroups. Mitochondrion. 2011;11(2):296-302. [39] Coutinho A, Valverde G, Fehren-Schmitz L, Coo- per A, Barreto Romero MI, Espinoza IF, Llamas B, Haak W. AmericaPlex26: a SNaPshot multiplex system for genotyping the main human mitochon- drial founder lineages of the Americas. PLoS One. 2014;9(3):e93292. [40] Díaz-Lacava A, Walier M, Willuweit S, Wienker T, Fimmers R, Baur M, et al. Geostatistical inference of main y-str-haplotype groups in Europe. Forensic Sci Int Genet. 2011;5(2):91-4. [41] Lao O, Lu T, Nothnagel M, Junge O, Freitag-Wolf S, Caliebe A, et al. Correlation between genetic and geographic structure in Europe. Curr Biol. 2008;18(16):1241-8. [42] Purps J, Sigert S, Willuweit S, Nagy M, Alves C, Sa- lazar R, et al. A global analysis of Y-chromosomal haplotype diversity for 23 str loci. Forensic Sci Int Genet. 2014;12:12-23. [43] Van Oven M, Ralf A, Kayser M. An efficient multi- plex genotyping approach for detecting the major worlwide human Y-chromosome haplogroups. Int J Legal Med. 2011;125(6):879-85. [44] Onofri V, Alessandrini F, Turchi C, Pesaresi M, Bus- cemi L, Tagliabracci A. Development of multiplex pcrs for evolutionaryand forensic applications of 37 human Y chromosome snps. Forensic Sci Int. 2006;157(1):23-35. [45] Geppert M, Baeta M, Núñez C, Martínez-Jarreta B, Zweynert S, Cruz OW, et al. Hierarchical y-snp as- say to study the hidden diversity and phylogenetic relationship of native populations in South America. Forensic Sci Int Genet. 2011;5(2):100-4. [46] Ralf A, Van Oven M, Zhong K, Kayser M. Simulta- neous analysis of hundreds of Y-chromosomal snps for high-resolution paternal lineage classification using targeted semiconductor sequencing. Hum Mutat. 2015;36(1):151-9. [47] Phillips C, Fernández-Formoso L, García-Maga- riños M, Porras L, Tyedebrink T, Amigo J, et al. Analysis of global variability in 15 established and 5 new European Standard Set (ess) strs using the ceph human genome diverity panel. Forensic Sci Int Genet. 2011;5(3):155-69. [48] Phillips C, Freire-Aradas A, Kriegel A, Fondevila M, Bulbul O, Santos C, et al. Eurasiaplex: A forensic snp assay for differentiating European and South Asian ancestries. Forensic Sci Int Genet. 2013;7(3):359-66. [49] Phillips C, Prieto L, Fondevila M, Salas A, Gó- mez-Tato A, Álvarez-Dios J, et al. Ancestry analy- sis in the 11-M Madrid bomb attack investigation. PLoS One. 2009;4(8):e6583. [50] Spector SA, Brummel SS, Nievergelt CM, Maihofer AX, Singh KK, Purswani MU, et al. Pediatric hi- vaids Cohort Study (phacs). Genetically determi- ned ancestry is more informative than self-reported race in hiv-infected and -exposed children. Medici- ne (Baltimore). 2016;95(36):e4733. [51] Oliveira JS, Ferreira RS, Santos LM, Marin LJ, Co- rrêa RX, Luizon MR, et al. Self-declared ethnicity and genomic ancestry in prostate cancer patients from Brazil. Genet Mol Res. 2016;15(4). [52] España, Jefatura Oficial. Ley Orgánica 10/2007 del 08 de octubre de 2007, Reguladora de la base de da- tos policial sobre identificadores obtenidos a partir del adn. Boletín Oficial del Estado n.° 242 del 09 de octubre de 2007. [53] Zieger M, Utz S. About dna databasing and inves- tigative genetic analysis of externally visible char- acteristics: A public survey. Forensic Sci Int Genet. 2015;17:163-72.
Compartir