Logo Studenta

examen-9-mayo-2018-preguntas-y-respuestas

¡Estudia con miles de materiales!

Vista previa del material en texto

lOMoARcPSD|3741347 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
lOMoARcPSD|3741347 
 
 
 
Reconocimiento de patrones, 24 de Mayo del 2018. Universidad Tecnológica de Pereira. ISSN 0122-1701 1 
 
Parcial Reconocimiento de Patrones. 
Autor: Yersain Castaño Arenas. 
Ingeniería Eléctrica, Universidad Tecnológica de Pereira, Pereira, Colombia 
Correo-e: yercastano@utp.edu.co 
 
 
Resumen—En el presente informe se presenta el análisis 
correspondiente a una base de datos la cual fue utilizada para 
entrenar los diferentes clasificadores empleados en el curso y de 
acuerdo a esto predecir el la clase de otra base de datos. 
 
 
Abstract — In the present report the corresponding analysis is 
presented to a database which was used to train the different 
classifiers used in the course and according to this, to predict the 
class of another database. 
 
 
I. RELEVANCIA CARACTERÍSTICAS. 
 
Las características relevantes son importantes para mejorar la 
clasificación; con base en esto a continuación se presentan 
relevancia de las características. 
 
 
Fig 1. Relevancias. 
 
En la que se puede observa claramente cuáles de las 37 
características de la base de datos son las más relevantes las 
cuales son normalizadas y representadas por medio de un 
análisis de componentes principales se selecciona el número 
de características. A continuación se presenta la matriz de 
correlación de distancia. 
 
 
 
Fig 2. Matriz de Correlación. 
 
Como se puede observar en la matriz de correlación se 
presenta los datos que se encuentran poco relacionados son los 
que se encuentran en azul y los que sí lo están por el contrario 
tienden a tener un color vinotinto de forma gradual lo que 
quiere decir que se aproxima a la unidad que indicaría que es 
linealmente dependiente caso contrario si se acerca a 0. 
 
 
Fig 3. Matriz de Distancia. 
 
En esta matriz se puede observar que existe simetría al igual 
que la matriz anterior pero en este caso no se discute sobre la 
relación entre características si no que se habla sobre que tan 
cerca o que tan alejados se encuentran los datos entre s, se 
 
 
Fecha de Recepción: 24 de Mayo del 2018 
Fecha de Aceptación: 
mailto:yercastano@utp.edu.co
 
lOMoARcPSD|3741347 
 
 
 
2 
Scientia et Technica Año XVIII, No xx, Mesxx de Añoxx. Universidad Tecnológica de Pereira. 
puede apreciar una diagonal azul que indica que la distancia es 
nula debido a que se muestra la distancia entre el mismo dato 
pero con respecto a los demás se aprecia que hay algunos 
datos que se encuentran alejados y se representan por una 
línea vino tinto y pero en su mayoría hay datos cercanos y 
algunos dispersos. 
 
II. PCA EN 3D. 
 
 
Fig 4. PCA 3D. 
 
En el análisis de componentes principales en 3D se puede 
observar que ambas clases se encuentran muy mezcladas lo 
que hace difícil clasificar o entrenar el clasificador usando un 
clasificador discriminante de tipo lineal, por ello se 
implementó en el código los tres clasificadores estudiados en 
el curso para definir cuál era el más conveniente para usar. 
 
III. MODELO DE CLASIFICACIÓN. 
 
En la selección del modelo de clasificación se tuvieron en 
cuenta el método de relevancia de características para su 
posterior selección de empleando PCA y Relieff además 
también se consideró el menor número de características y el 
porcentaje de acierto, los cuales fueron criterios a la hora de 
seleccionar el clasificador como se muestra a continuación. 
 
 
 
Fig 5. Distancia minim, 
 
La distancia mínima hace referencia a la distancia más corta 
que se presenta para cada clasificador con respecto a lo ideal 
que sería el 100 % de acierto, aunque no solo esto se tuvo en 
cuenta también el número de características y la desviación 
estándar presentada para cada caso de acuerdo a estas 
restricciones o lineamiento se escogió el clasificador que en 
este caso fue el cuadrático con selección Relieff( Rel+Cuad).

Continuar navegando