Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Nombre del alumno: Antony Arturo García Pérez Matrícula: 2020690020 Carrera: Licenciatura en Ciencia de Datos Nombre de la materia: Minería de Datos Nombre del docente: Dr. José Luis Cendejas Valdez Clustering K- means Sabinas, Coahuila 12/04/2022 K- Means Dataset meteorológico Morelia En el siguiente análisis se utilizo la herramienta de Orange para para cargar los datos del dataset meteorológico de Morelia, que anteriormente se había preprocesado, dejando así solo los datos que nos resultaran relevantes Podemos observar como es que, al cargar los datos de nuestro dataset, el Software de Orange, nos detecta los valores por su tipo, como numero y como cadenas los correspondientes. Seguido de esto, creamos un widget nuevo donde agregamos el uso del K-Means, aquí el mismo Software nos identifica cual es el número de clúster preferibles En nuestro caso notamos que se recomienda el uso de 2, 3 y hasta 8 clúster, por lo que aquí deberíamos intervenir nosotros para elegir el que consideremos más adecuado. Después de realizar esto, podemos ver como es que el software de Orange nos arroja las mejores correlaciones que ve dentro del clúster, en este caso podemos ver como tenemos de primer lugar con un mayor puntaje la correlación entre el Índice de calor y la alta temperatura, siendo que estos también corresponden a los datos con mayor correlación en nuestro estudio, no es de extrañarnos. Heat Index con Hi Temp En este caso podemos como dentro de nuestro análisis vemos que nuestro software señala 2 clústeres uno con aglomerado en la parte baja e izquierda y la otra en la parte alta derecha, por lo que vemos una alta relación y podemos indicar que, si dentro de nuestras variables tenemos un registro de una alta temperatura, es muy probable que nuestro índice de calor también sea alto. UV Índex con Solar Energy Dentro de este análisis podemos observar que se encuentran de igual manera dos conglomerados, donde vemos que se registran a manera de que se genera uno en la parte inferior izquierda y otro en la parte superior derecha, con esto podemos indicar que a mayor índice de rayos UV tendremos un mayor registro de energía solar y así con un nivel bajo de rayos UV, tendremos un menor registro de energía solar
Compartir