Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
lOMoARcPSD|3741347 lOMoARcPSD|3741347 Reconocimiento de patrones, 24 de Mayo del 2018. Universidad Tecnológica de Pereira. ISSN 0122-1701 1 Parcial Reconocimiento de Patrones. Autor: Yersain Castaño Arenas. Ingeniería Eléctrica, Universidad Tecnológica de Pereira, Pereira, Colombia Correo-e: yercastano@utp.edu.co Resumen—En el presente informe se presenta el análisis correspondiente a una base de datos la cual fue utilizada para entrenar los diferentes clasificadores empleados en el curso y de acuerdo a esto predecir el la clase de otra base de datos. Abstract — In the present report the corresponding analysis is presented to a database which was used to train the different classifiers used in the course and according to this, to predict the class of another database. I. RELEVANCIA CARACTERÍSTICAS. Las características relevantes son importantes para mejorar la clasificación; con base en esto a continuación se presentan relevancia de las características. Fig 1. Relevancias. En la que se puede observa claramente cuáles de las 37 características de la base de datos son las más relevantes las cuales son normalizadas y representadas por medio de un análisis de componentes principales se selecciona el número de características. A continuación se presenta la matriz de correlación de distancia. Fig 2. Matriz de Correlación. Como se puede observar en la matriz de correlación se presenta los datos que se encuentran poco relacionados son los que se encuentran en azul y los que sí lo están por el contrario tienden a tener un color vinotinto de forma gradual lo que quiere decir que se aproxima a la unidad que indicaría que es linealmente dependiente caso contrario si se acerca a 0. Fig 3. Matriz de Distancia. En esta matriz se puede observar que existe simetría al igual que la matriz anterior pero en este caso no se discute sobre la relación entre características si no que se habla sobre que tan cerca o que tan alejados se encuentran los datos entre s, se Fecha de Recepción: 24 de Mayo del 2018 Fecha de Aceptación: mailto:yercastano@utp.edu.co lOMoARcPSD|3741347 2 Scientia et Technica Año XVIII, No xx, Mesxx de Añoxx. Universidad Tecnológica de Pereira. puede apreciar una diagonal azul que indica que la distancia es nula debido a que se muestra la distancia entre el mismo dato pero con respecto a los demás se aprecia que hay algunos datos que se encuentran alejados y se representan por una línea vino tinto y pero en su mayoría hay datos cercanos y algunos dispersos. II. PCA EN 3D. Fig 4. PCA 3D. En el análisis de componentes principales en 3D se puede observar que ambas clases se encuentran muy mezcladas lo que hace difícil clasificar o entrenar el clasificador usando un clasificador discriminante de tipo lineal, por ello se implementó en el código los tres clasificadores estudiados en el curso para definir cuál era el más conveniente para usar. III. MODELO DE CLASIFICACIÓN. En la selección del modelo de clasificación se tuvieron en cuenta el método de relevancia de características para su posterior selección de empleando PCA y Relieff además también se consideró el menor número de características y el porcentaje de acierto, los cuales fueron criterios a la hora de seleccionar el clasificador como se muestra a continuación. Fig 5. Distancia minim, La distancia mínima hace referencia a la distancia más corta que se presenta para cada clasificador con respecto a lo ideal que sería el 100 % de acierto, aunque no solo esto se tuvo en cuenta también el número de características y la desviación estándar presentada para cada caso de acuerdo a estas restricciones o lineamiento se escogió el clasificador que en este caso fue el cuadrático con selección Relieff( Rel+Cuad).
Compartir