Resumen analítico y explicativo de algoritmos de clustering

Algoritmos

•

UNAM

0

mariamcl12

30/9/2023

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Algoritmos

28.840 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Algoritmos Computacionales Grupo C 
M. Cruz Apuntes de prueba de regularización Curso de invierno 2022 
Resumen analítico y explicativo de algoritmos de 
clustering 
Los algoritmos de clustering son un tipo de algoritmo de 
aprendizaje automático que se utiliza para agrupar 
objetos en grupos o clústeres. Estos algoritmos se 
utilizan en una amplia gama de aplicaciones, como la 
segmentación de clientes, la detección de anomalías y 
la visualización de datos. 
¿Qué es un algoritmo de clustering? 
Un algoritmo de clustering es un conjunto de reglas o 
funciones que se utilizan para agrupar objetos en 
grupos. Estos algoritmos suelen entrenarse en un 
conjunto de datos de objetos no etiquetados, que son 
objetos que no han sido asignados a un grupo. Una vez 
que el algoritmo se ha entrenado, se puede utilizar para 
agrupar nuevos objetos. 
¿Cómo funciona un algoritmo de clustering? 
Los algoritmos de clustering funcionan de diferentes 
maneras, pero todos ellos comparten un objetivo 
común: agrupar objetos de manera que los objetos 
dentro de un grupo sean similares entre sí y los objetos 
de diferentes grupos sean diferentes entre sí. Algunos 
algoritmos de clustering populares incluyen: 
• Algoritmo k-means: Este algoritmo agrupa 
objetos asignando cada objeto al grupo cuyo 
centroide es el más cercano. 
• Algoritmo de agregación: Este algoritmo agrupa 
objetos fusionando grupos adyacentes que son 
similares entre sí. 
• Algoritmo de densidad: Este algoritmo agrupa 
objetos en función de su densidad local. 
Ejemplo: algoritmo k-means 
El algoritmo k-means es un algoritmo de clustering 
simple pero poderoso. Este algoritmo agrupa objetos 
asignando cada objeto al grupo cuyo centroide es el 
más cercano. 
Para utilizar el algoritmo 
k-means, primero se 
debe seleccionar un 
valor para k. El valor de 
k representa el número 
de grupos que se desea 
crear. 
Una vez que se ha 
seleccionado un valor 
para k, el algoritmo k-
means agrupa objetos 
de la siguiente manera: 
1. Se seleccionan 
aleatoriamente k 
puntos de datos 
como centroides 
iniciales. 
2. Cada objeto se 
asigna al grupo 
cuyo centroide es 
el más cercano. 
3. Los centroides de 
los grupos se 
recalculan como 
el promedio de 
los objetos 
asignados a cada 
grupo. 
4. Los pasos 2 y 3 
se repiten hasta 
que los 
centroides no 
cambien o hasta 
que se alcance 
un número 
máximo de 
iteraciones. 
Ventajas y desventajas 
del algoritmo k-means 
Algoritmos Computacionales Grupo C 
M. Cruz Apuntes de prueba de regularización Curso de invierno 2022 
El algoritmo k-means tiene una serie de ventajas, entre 
ellas: 
• Es un algoritmo simple y fácil de entender. 
• Es un algoritmo robusto que puede funcionar 
bien en una variedad de situaciones. 
• Es un algoritmo no paramétrico, lo que significa 
que no hace suposiciones sobre la distribución 
de los datos. 
Sin embargo, el algoritmo k-means también tiene 
algunas desventajas, entre ellas: 
• Puede ser sensible a la selección del valor de k. 
• Puede producir resultados subóptimos si los 
datos no son linealmente separables. 
Conclusión 
Los algoritmos de clustering son una herramienta 
poderosa que se puede utilizar en una amplia gama de 
aplicaciones. El algoritmo k-means es un algoritmo de 
clustering simple pero poderoso que es una buena 
opción para muchos problemas de clustering. 
Ideas principales para estudiantes de universidad 
• Los algoritmos de clustering son un tipo de 
algoritmo de aprendizaje automático que se 
utiliza para agrupar objetos en grupos. 
• Los algoritmos de clustering funcionan de 
diferentes maneras, pero todos ellos comparten 
un objetivo común: agrupar objetos de manera 
que los objetos dentro de un grupo sean 
similares entre sí y los objetos de diferentes 
grupos sean diferentes entre sí. 
• El algoritmo k-means es un algoritmo de 
clustering simple pero poderoso. Este algoritmo 
agrupa objetos asignando cada objeto al grupo 
cuyo centroide es el más cercano. 
Recomendaciones para estudiantes de universidad 
• Para aprender más sobre algoritmos de 
clustering, se recomienda que los estudiantes de 
universidad 
consulten libros y 
artículos de 
investigación 
sobre el tema. 
• Los estudiantes 
de universidad 
también pueden 
encontrar 
recursos útiles en 
línea, como 
tutoriales y 
cursos. 
• Practicar con 
ejemplos de 
algoritmos de 
clustering es una 
excelente manera 
de aprender 
cómo funcionan 
estos algoritmos. 
Adiciones específicas 
para estudiantes de 
universidad 
• Los estudiantes 
de universidad 
pueden encontrar 
útil aprender 
sobre la distancia 
euclidiana, que 
es un tipo de 
medida de 
distancia que se 
utiliza 
comúnmente en 
algoritmos de 
clustering. 
• Los estudiantes 
de universidad 
también pueden 
Algoritmos Computacionales Grupo C 
M. Cruz Apuntes de prueba de regularización Curso de invierno 2022 
encontrar útil aprender sobre la densidad de 
datos, que es una medida de la concentración de 
datos en un área. 
• Los estudiantes de universidad pueden encontrar 
útil aprender sobre la selección del valor de k, 
que es un parámetro importante en el algoritmo 
k-means.