Logo Studenta

INFORME construccion de dendrogramas - sistematica

¡Este material tiene más páginas!

Vista previa del material en texto

Informe N°2 Construcción De Dendrogramas 
Grupo 3 
-Laura Sofia Moreno Perez 
- Nicole Renee Limas Giraud 
-Juan Diego Rivas Camargo 
Sistemática, Facultad de Ciencias, Escuela de Biología, Universidad Pedagógica y 
Tecnológica de Colombia, Tunja, Boyacá 
 
 
1. Introducción 
Una buena representación gráfica de los agrupamientos por caracteres binarios en 
una clasificación jerárquica es un dendrograma. 
Los dendrogramas son ilustraciones en forma de árbol los cuales muestran los 
grupos que se forman cuando se aglomeran entre sí, paso a paso y también en 
cuanto al nivel de similitud que estos presentan. el nivel de similitud se mide de 
forma vertical y el grado de diferencia en el eje horizontal. 
Este se utiliza para ver los conglomerados en cada paso y evaluar los niveles de 
similitud de cada grupo formado en cuanto a los nodos. 
Interpretar un dendrograma es fácil pero su lectura errónea puede llevarnos a 
conclusiones equivocadas tales como pensar que; por ejemplo, los dendrogramas 
correspondientes a agrupaciones jerárquicas no son únicos, puesto que por cada 
agrupación se debe indicar qué árbol o aglomeración va en cada dirección. 
La estructura jerárquica del dendrograma puede no representar realmente las 
distancias entre los objetos encuestados. 
 
 
 
2. Materiales 
 
Computadores (Hp y Dell). 
Celulares (Lg, samsung) 
Software estadísticos : PAST 
Aplicaciones de google: Meet, drive, gmail. 
Otras aplicaciones: mensajería instantánea (whatsapp) 
Cinta métrica. 
Báscula 
Red de banda ancha. 
Información personal de los participantes 
 
Metodología 
Se procede a codificar los distintos caracteres de cada uno de los individuos a analizar. 
Seguido de esto se realiza una tabla donde se evidencian las diferencias entre cada uno 
--
SISTEMATICA GENERAL - BIOLOGIA
de los 9 sujetos. Luego de obtener la tabla con las diferencias se procede a armar el 
árbol/dendrograma donde se prioriza el conjunto con mayores similitudes. 
 
Procedimiento 
 
Figura 1. Flujograma Procedimiento 
 
2.1 Sujetos 
Los sujetos a estudiar fueron seleccionados de acuerdo a la relación parental que 
presentaban con los encuestadores debido a la facilidad de acceso a estos. 
 
Tabla n°1. en esta tabla se encuentran los datos obtenidos de los sujetos en cuestión. 
Tabla n°1. Presentación de los sujetos 
Nombre del sujeto Fotografía 
Sergio 
 
Camilo 
 
Diana 
 
 
 
 
 
Daniel 
 
 
Sara 
 
Victor 
 
Eva 
 
Camile 
 
Claudia 
 
 
2.2 Tiempo 
El informe fue realizado en un periodo de tiempo de 8 - 10 horas durante las cuales se 
agrupó la información recolectada, y en las fechas 22 a 24 de febrero se organizó, digitó y 
analizó esta información. 
 
 
3. Resultados 
 
3.1 tablas 
 
Tabla n°2. Datos obtenidos de las personas encuestadas. 
 
 
 
 
 
Tabla n°3. tabla rangos de codificación de los caracteres y porcentaje de varianza. 
 
 
 
rango
s 
estados 
definido
s 
caracteres usados 
estatur
a 
peso ciudad 
origen 
ocupación hermano
s 
año 
nacimient
o 
0 1.50-
1.60 
(33,3%
) 
50-60 
(35,7%
) 
firavitoba 
/ bogotá 
(22,2%) 
transportado
r / operario 
de máquina 
(22,2%) 
0 -1 
(33,3%) 
1960 -
1970 
23,2% 
1 1.61-
1.70 
(30%) 
 61-70 
(32,1%
) 
Santa 
Rosa 
(11,1%) 
docente / 
estudiante 
(55,5%) 
2 
(11,1%) 
1975 - 
1985 
23,2% 
2 1.71-
1.80 
(30%)) 
71-75 
(14,3%
) 
Belén 
(22,2%) 
jardinera 
(11,1%) 
3 
(33,3%) 
1986 - 
2000 
(32,5%) 
3 1.81-
1.90 
(30%)) 
75-80 
(17,8%
) 
Sogamos
o 
(44,4%) 
artista 
(11,1%) 
4 
(22,2%) 
2001 - 
2010 
(20,9%) 
 
Cabe resaltar que los rangos de los datos no están balanceados. 
 
Tabla n°4. caracteres codificados 
Nombre Estatura Peso Ciudad origen Ocupación Hermanos Año nacimiento 
Sergio 2 2 3 0 0 2 
Camilo 1 0 0 1 1 2 
Diana 1 0 0 2 0 1 
Daniel 2 0 2 1 2 3 
Sara 1 0 1 1 2 3 
Victor 2 2 2 0 2 0 
Eva 0 3 3 1 3 0 
Camile 3 1 3 1 0 3 
Claudia 1 0 3 3 0 0 
 
Tabla n° 5. tabla de diferencias 
 
Nombre Sergio Camilo Diana Daniel Sara Victor Eva Camile Claudia 
Sergio x 5 5 5 6 3 5 4 4 
Camilo x 3 4 3 6 5 5 4 
Diana x 5 4 6 6 5 3 
Daniel x 2 3 5 4 5 
Sara x 5 5 4 4 
Victor x 5 6 5 
Eva x 4 4 
Camile x 4 
Claudia x 
 
Gráfico n°1. Dendrograma 1 
 
 
 
 
 
 
 
 
Gráfico n°2. Dendrograma 2 
 
 
Gráfico nº3. Posible dendrograma 3. 
 
 
 
 
UPGMA 
 
 
 
 
 
Gráfico n°4. posible dendrograma 4. 
 
 
Dendrograma Seleccionado 
 
 
Sacrificios: 
1. Sacrificio diana-claudia 
 
 
2. Sacrificio daniel-victor 
 
 
 
 
 
3. Sacrificio daniel - sergio 
 
4. Sacrificio Sergio-Eva 
 
 
 
5. Sacrificio. Camilo-Victor 
 
 
 
6. Sacrificio Camile - Diana 
 
 
 
7. Sacrificio Claudia - Camilo 
 
 
 
8. Sacrificio Sara -Eva 
 
 
9. Sacrificio Daniel - Claudia 
 
 
10. Sacrificio Eva – Diana 
 
 DISCUSION 
 
Se observa un grupo clave el cual es Daniel y Sara quienes presentan la mayor 
cantidad de similitudes y con solo dos diferencias. Esta pareja se tomó como 
prioridad y en base a esta se empieza a modificar el dendrograma con grupos de 
una similitud menor, comparando cada vez a Sara y Daniel con el resto de sujetos 
y sus distintas similitudes y diferencias. Se eligió el dendrograma número tres, 
teniendo en cuenta las distancias más favorables y el menor número de sacrificios 
posible. En nuestro caso tuvimos que realizar 10 sacrificios para nuestro 
dendrograma, este número relativamente alto se podría explicar debido a la gran 
cantidad de unidades taxonómicas ordenadas que poseemos por lo cual se dificulta 
mucho más la conglomeración y relación entre sí y, más difícil aún era respetar todas 
las distancias por lo cual decidimos centrarnos sólo en aquellos grupos con menor 
número de diferencias. generalmente estos sacrificios empezaban desde un 
número de diferencias, mayores a cinco, podemos indicar que los grupos que se 
formaron estuvieron conglomerados mayormente por similitudes en estatura, año 
de nacimiento, peso, número de hermanos y ocupación. 
Es necesario mencionar también que el porcentaje de variación entre rango y rango 
se encuentra desbalanceado o a propósito de la variabilidad de cada carácter. 
Esto puede indicarnos que aquellas personas contemporáneas entre sí poseen 
mayor número de similitudes. Además, es importante mencionar que el grupo 
conformado por daniel y sara tiene la característica de que estos comparten una 
relación de parentesco, lo cual también podría explicar la cantidad de similitudes 
que poseen entre sí. Eva fué quien presentó menor relación con casi todos los 
integrantes, compartiendo solo 2 con claudia y camile coincidiendo con la ciudad de 
origen, 
Para futuros estudios y creaciones de dendrogramas, se debería considerar una 
cantidad de sujetos menor para que sea más sencillo y sea a su vez más preciso, 
además de trabajar con caracteres que no presenten relaciones que se puedan 
sesgar, esto se puede evitar incluyendo test que no dependan del parentesco entre 
individuos, además de utilizar caracteres filogenéticos que serían los más 
adecuados al no tener tanta correlación entre sujetos y casi que únicos para cada 
sujeto, mejorando así la calidad en los dendrogramas y sus medidas. 
 
1. Bibliografía citada 
 
 
 Departamento de matemáticas. Universidad de Puerto Rico. Minería de datos. 
Recuperado de: https://academic.uprm.edu/eacuna/clus2acu.pdf 
 Soporte de Minitab. Recuperado de: https://support.minitab.com/es-
mx/minitab/18/help-and-how-to/modeling-statistics/multivariate/how-to/cluster-
observations/interpret-the-results/all-statistics-and-graphs/dendrogram/ 
 Revista chapingo, serie ciencias forestales y del ambiente. C. A. Núñez-Colín. 
CONSTRUCCIÓN DE DENDROGRAMAS DE TAXONOMÍA NUMÉRICA 
MEDIANTE EL COEFICIENTE DE DISTANCIA χ2: UNA REVISIÓN. Recuperado 
de: 
https://www.researchgate.net/publication/264862369_CONSTRUCCION_DE_DEN
DROGRAMAS_DE_TAXONOMIA_NUMERICA_MEDIANTE_EL_COEFICIENTE_DE_DISTANCIA_ch2_UNA_REVISION 
https://academic.uprm.edu/eacuna/clus2acu.pdf
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-statistics/multivariate/how-to/cluster-observations/interpret-the-results/all-statistics-and-graphs/dendrogram/
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-statistics/multivariate/how-to/cluster-observations/interpret-the-results/all-statistics-and-graphs/dendrogram/
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-statistics/multivariate/how-to/cluster-observations/interpret-the-results/all-statistics-and-graphs/dendrogram/
https://www.researchgate.net/scientific-contributions/Carlos-Alberto-Nunez-Colin-77210434
https://www.researchgate.net/publication/264862369_CONSTRUCCION_DE_DENDROGRAMAS_DE_TAXONOMIA_NUMERICA_MEDIANTE_EL_COEFICIENTE_DE_DISTANCIA_ch2_UNA_REVISION
https://www.researchgate.net/publication/264862369_CONSTRUCCION_DE_DENDROGRAMAS_DE_TAXONOMIA_NUMERICA_MEDIANTE_EL_COEFICIENTE_DE_DISTANCIA_ch2_UNA_REVISION
https://www.researchgate.net/publication/264862369_CONSTRUCCION_DE_DENDROGRAMAS_DE_TAXONOMIA_NUMERICA_MEDIANTE_EL_COEFICIENTE_DE_DISTANCIA_ch2_UNA_REVISION
Referencias

Continuar navegando

Materiales relacionados

78 pag.
Razonamiento Matemático 2

Colegio Pedro II

User badge image

Héctor Arroyo

522 pag.
100 pag.
Razonamiento Matemático 3

Teodoro Olivares

User badge image

Blanca Espinosa

80 pag.
Pim-Pam-Pum-2-Guia-Docente

SIN SIGLA

User badge image

Sabriina sosa