Logo Studenta

Clustering K- means

¡Estudia con miles de materiales!

Vista previa del material en texto

Nombre del alumno: Antony Arturo García Pérez
Matrícula: 2020690020
Carrera: Licenciatura en Ciencia de Datos
Nombre de la materia: Minería de Datos
Nombre del docente: Dr. José Luis Cendejas Valdez
Clustering K- means
Sabinas, Coahuila							12/04/2022
K- Means Dataset meteorológico Morelia
En el siguiente análisis se utilizo la herramienta de Orange para para cargar los datos del dataset meteorológico de Morelia, que anteriormente se había preprocesado, dejando así solo los datos que nos resultaran relevantes
Podemos observar como es que, al cargar los datos de nuestro dataset, el Software de Orange, nos detecta los valores por su tipo, como numero y como cadenas los correspondientes.
Seguido de esto, creamos un widget nuevo donde agregamos el uso del K-Means, aquí el mismo Software nos identifica cual es el número de clúster preferibles
En nuestro caso notamos que se recomienda el uso de 2, 3 y hasta 8 clúster, por lo que aquí deberíamos intervenir nosotros para elegir el que consideremos más adecuado.
Después de realizar esto, podemos ver como es que el software de Orange nos arroja las mejores correlaciones que ve dentro del clúster, en este caso podemos ver como tenemos de primer lugar con un mayor puntaje la correlación entre el Índice de calor y la alta temperatura, siendo que estos también corresponden a los datos con mayor correlación en nuestro estudio, no es de extrañarnos.
Heat Index con Hi Temp
En este caso podemos como dentro de nuestro análisis vemos que nuestro software señala 2 clústeres uno con aglomerado en la parte baja e izquierda y la otra en la parte alta derecha, por lo que vemos una alta relación y podemos indicar que, si dentro de nuestras variables tenemos un registro de una alta temperatura, es muy probable que nuestro índice de calor también sea alto.
UV Índex con Solar Energy
Dentro de este análisis podemos observar que se encuentran de igual manera dos conglomerados, donde vemos que se registran a manera de que se genera uno en la parte inferior izquierda y otro en la parte superior derecha, con esto podemos indicar que a mayor índice de rayos UV tendremos un mayor registro de energía solar y así con un nivel bajo de rayos UV, tendremos un menor registro de energía solar

Continuar navegando