Logo Studenta

ARTIFICIAL CONEXIONISTA

¡Estudia con miles de materiales!

Vista previa del material en texto

PONCE CRISTIAN MARCELO 
INGENIERÍA EN INFORMÁTICA LU=6454 
PRIMER PARCIAL DE INTELIGENCIA 
ARTIFICIAL CONEXIONISTA - 2016 
7) La técnica para la estimación del error de clasificación que hemos utilizado es la 
técnica Hold Out, y la hemos realizado unas 30 veces. Es decir, lo que hacemos es 
entrenar y predecir en base a 30 modelos, estimamos el error en cada uno de esos 
modelos y hallamos el promedio de dichos errores al que denominamos error medio de 
clasificación. Podemos decir que hemos aplicado un criterio similar al K-fold Cross 
Validation, el cual requiere entrenar y predecir sobre k modelos, para hallar el error de 
clasificación como un promedio de cada uno de los errores obtenidos para cada modelo. 
a) El error medio que obtuve es aceptable (entre 0.2 y 0.3 aproximadamente) para el tipo 
de datos históricos que disponemos y esto se debe principalmente a que cada clase 
presenta una distribución de probabilidad con parámetros diferentes (en este caso difieren 
en la media), por lo que los datos de cada clase se encuentran por lo general dispersos 
uno con respecto al otro y no todos mezclados en un único lugar, dándole una mayor 
precisión al predictor a la hora de encontrar el hiperplano que sea capaz de separar 
dichas clases. 
b) Una de las cosas que se puede hacer para mejorar el rendimiento del clasificador es 
modificar algunos de los parámetros de las distribuciones de probabilidad que tenemos de 
manera que podamos diferenciar más los elementos de cada clase. Otra cosa es ir 
modificando el porcentaje de elementos que tomamos para entrenamiento y para prueba 
e ir viendo para que porcentajes obtenemos el menor error medio de clasificación. Por 
ultimo podemos aumentar el número de corridas hechas hasta llegar a un punto en el cual 
encontremos el error medio de clasificación más bajo. 
8) Para poder identificar porque jugador apostar deberemos ver el árbol de decisión. Si 
tenemos en cuenta que el partido de tenis se jugara sobre una superficie de arcilla, que 
pertenece a un torneo de la serie Grand Slam y que o probablemente Federer no esté al 
100% físicamente o que el partido se haga por la tarde, entonces el algoritmo ID3 sugiere, 
en base a los datos históricos de la tabla que apostemos por Nadal

Otros materiales