Vista previa del material en texto
Empleo de Métodos de aprendizaje automatizado en problemas de ingeniería mecánica Dr. C Darina Lara Coba Universidad Tecnológica de La Habana “José Antonio Echeverría” (CUJAE), Dpto. Mecánica Aplicada email: dlarac@mecanica.cujae.edu.cu RESUMEN Existen problemas de ingeniería donde las variables involucradas en la búsqueda de la solución no tienen relaciones sencillas entre sí, y la modelación clásica no permite representar el problema mediante funciones matemáticas de fácil deducción. En estos casos se pueden emplear métodos de aprendizaje automatizado, trasladando la solución al campo de la inteligencia artificial. El presente trabajo tiene como objetivo realizar una exploración de las posibilidades de aplicación de métodos de aprendizaje automatizado a problemas de ingeniería mecánica. Se realizó una búsqueda bibliográfica sobre dichos métodos y sobre posibles problemas a solucionar, sumada a encuestas y entrevistas con especialistas de la carrera de diversas procedencias. Empleando la herramienta Weka se resolvió un ejemplo. Se obtuvo como resultado un banco de problemas donde pueden aplicarse estos métodos de manera inmediata, y se llegó a la conclusión de que es factible emprender una investigación dirigida a resolverlos por esta vía. PALABRAS CLAVES: Aprendizaje automatizado, inteligencia artificial, modelos computacionales. EMPLOYMENT PERSPECTIVE MACHINE LEARNING METHODS PROBLEMS OF MECHANICAL ENGINEERING ABSTRACT There are engineering problems where the variables involved in the search for the solution does not have simple relations with each other, and classical modeling can represent the problem not by mathematical functions easy deduction. In these cases you can be employed machine learning methods, transferring the solution to the field of artificial intelligence. This paper aims to make an exploration of the possibilities of application of machine learning methods to problems in mechanical engineering. A search for such methods and possible problems to solve, together with surveys and interviews with specialists from diverse career was made. Using the tool Weka an example was resolved. It was obtained as a result a bank of problems where these methods can be applied immediately, and concluded that it is feasible to undertake an investigation to solve this way. KEY WORDS: Machine learning, artificial intelligence, computational models. INTRODUCCIÓN El Aprendizaje Automatizado (AA) es una rama de la Inteligencia Artificial (IA), cuyo objetivo es desarrollar técnicas que permitan crear programas que puedan aprender de forma similar a lo realizado por los humanos, es decir, aprender por sí mismos; capaces de generalizar comportamientos a partir de una información no estructurada suministrada en forma de ejemplos. Es, por lo tanto, un proceso de inducción del conocimiento. En muchas ocasiones el campo de mailto:dlarac@mecanica.cujae.edu.cu actuación del mismo se solapa con el de la estadística, ya que las dos disciplinas se basan en el análisis de datos. Sin embargo, el aprendizaje automatizado se centra más en el estudio de la complejidad computacional de los problemas (1). El aprendizaje a partir de ejemplos en su formulación más simple es el proceso que opera sobre una colección de ejemplos, cada uno de los cuales está descrito mediante un conjunto de rasgos. Este proceso de aprendizaje tiene dos momentos principales: la generación de conocimiento o solución de un nuevo problema, y la validación del resultado (2). Para poder desarrollar estas dos etapas la colección de ejemplos se divide en dos conjuntos: el conjunto de entrenamiento y el conjunto de control. Con el primero se realiza el aprendizaje, mientras que con el segundo se evalúa la calidad de los resultados. La principal cualidad a medir en todo método de aprendizaje es su capacidad de generalización, es decir, la capacidad del método de poder resolver problemas no vistos antes. La capacidad de generalización se mide a partir de los resultados alcanzados con la muestra de control (2). Para el análisis previo de los datos se utilizan varios métodos como la selección de ejemplos (experimentos) y de atributos (variables), y la normalización de los atributos, permitiendo mejorar la calidad del modelo de aprendizaje, sintetizando la descripción de los objetos, de manera tal que la información sea preservada de la forma más compacta y clara posible, favoreciendo la labor de aprendizaje, es decir, distingue los atributos realmente relevantes en la base de casos (3). Los sistemas de Redes Neuronales Artificiales (RNA) del tipo multicapa, constituye un modelo computacional que simula algunas formas del funcionamiento del cerebro humano, sin llegar a desarrollar una réplica del mismo (Burr, 1988). Son excelentes clasificadores, entrenados de forma discriminativa (4), utilizando el aprendizaje con propagación hacia atrás de los errores BP (Back Propagation). Este procedimiento pertenece a la categoría de supervisado, pues requiere conocer las salidas correctas para cada ejemplo de entrada. La RNA (Fig. 1) responde a una topología multicapa dirigida hacia delante con capa de entrada, capas ocultas y capa de salida. Figura 1. Esquema de una red neuronal del tipo MLP Los sistemas K vecino más cercano (K-NN) se basan en la suposición de que los ejemplos cercanos pertenecen a la misma clase. Su fase de aprendizaje es muy simple, pues se limita a almacenar los ejemplos del conjunto de entrenamiento. El clasificador busca los k ejemplos más cercanos al dato que se quiere clasificar y le asigna la clase más frecuente entre ellos. Son rápidos en el entrenamiento pero producen clasificadores no discriminatorios, lo que significa que el proceso de entrenamiento está basado en la maximización de la pertenencia de los datos a una clase, ignorando la información entre clases (5). El K-NN constituye un algoritmo clásico de la forma de solución conocida a un problema similar y ha sido empleado en problemas de clasificación y regresión. El método básicamente consiste en comparar la nueva instancia a clasificar con los casos o ejemplos del dominio del problema, recuperando los k ejemplos más cercanos, lo cual depende del parecido entre los atributos del nuevo ejemplo con los ejemplos de la muestra de aprendizaje o entrenamiento. Como resultado del mismo se devuelve el promedio de los valores asociados al rasgo objetivo de los k ejemplos más cercanos a él. Herramientas computacionales empleadas en la aplicación de los métodos de aprendizaje automatizado Existen varias herramientas o plataformas para la utilización de los métodos de aprendizaje automatizado y con ellos el desarrollo de modelos para la solución de diversos problemas, entre ellas están Orange, Keel, Weka. Orange: su estructura basada en componentes que permiten facilidades para crear nuevos algoritmos utilizando lenguaje C++, incluye una amplia gama de técnicas de preparación de los datos, de aprendizaje y para la validación de resultados (6). Keel: es una herramienta, creada en el año 2004, para almacenar, utilizar y probar algoritmos de aprendizaje evolutivos (Fig. 2). Contiene técnicas de pre-procesamiento aunque no posee gran cantidad de métodos para la Selección de Atributos. Esta herramienta posee código abierto, permitiendo así la incorporación libre de nuevos algoritmos (7). Figura 2. Entorno de trabajo de Keel Weka: constituye un entorno de trabajo (Fig. 3) que integra una amplia colección de algoritmos. Fue desarrollado en lenguaje Java por un equipo de investigadores de la universidad de Waikato (Nueva Zelanda), bajo licencia GNU (General Public License), y se caracteriza por la independencia de su arquitectura, ya que funciona en cualquier plataforma sobre la que existe una máquina virtual Java disponible. Permite aplicar, analizar y evaluar algunas de las técnicas más relevantes del análisisde datos, dentro de las que se enmarcan: el pre-procesamiento de datos, clasificación, regresión, agrupamiento, reglas de asociación y visualización. Es un software libre que está orientado a la extensibilidad, por lo que es posible añadir nuevas funcionalidades. Todo lo anterior justifica que sea una de las herramientas más utilizadas en la minería de datos (8). Figura. 3 Entorno de trabajo de Weka Las técnicas de Inteligencia Artificial se aplican hoy en día a diferentes problemas de Ingeniería, especialmente los Sistemas Basados en el Conocimiento. Donde los más comunes son los Sistemas Basados en Patrones, los Sistemas Basados en Reglas, los Sistemas Basados en Casos y los Sistemas Híbridos. Los Sistemas Basados en Casos parten de problemas resueltos en un dominio de aplicación y mediante un proceso de adaptación, encuentran la solución a un nuevo problema. Tomando en cuenta lo anteriormente planteado el objetivo del trabajo es realizar una exploración de las posibilidades de aplicación de métodos de aprendizaje automatizado a problemas de ingeniería mecánica. Ejemplo empleando métodos de Inteligencia artificial Objetivo. Desarrollar un modelo computacional para la estimación de la densidad del suelo mediante el sensoramiento continuo. Para alcanzar este objetivo se realizaron mediciones de resistencia a la penetración del suelo empleando un sensor, se obtuvieron muestras de suelo y se determinó en laboratorio la densidad del suelo. Con esta información se creó una base de casos la cual se normalizó en la herramienta computacional empleada (Weka) y finalmente se pasó al desarrollo del modelo en dicha herramienta. Se aplicaron los métodos, K NN y MLP. K- Vecinos más Cercanos. Los resultados de la aplicación de este método mostraron (Tabla 1), que existe mayor correlación entre los resultados predichos y observados (r=0,89), el error cuadrático medio es de 0,11 g∙cm-3 y el error medio absoluto es de 6%. Tabla 1. Resultado de la validación cruzada del modelo obtenido por el K vecinos más cercanos Parámetros K NN Coeficiente de correlación 0,89 Error medio absoluto 0,06 Error cuadrático medio (g∙cm-3) 0,11 Error absoluto relativo (%) 32,59 Error cuadrático medio estandarizado (%) 47,15 Número de instancias 75 Redes neuronales del tipo multicapa. Los resultados de los estadígrafos de la validación cruzada de este método mostraron (Tabla 2), que existe correlación alta entre las variables predichas y observadas (r=0,75), con una raíz del error cuadrático medio de 0,16 g∙cm-3 y el error medio absoluto de un 13%. Tabla 2. Estadígrafos de la validación cruzada de la red neuronal Parámetros MLP Coeficiente de correlación 0,75 Error medio absoluto 0,13 Error cuadrático medio (g∙cm-3) 0,16 Error absoluto relativo (%) 68,67 Error cuadrático medio estandarizado (%) 67,39 Número de instancias 75 De los modelos desarrollados, el que mejores resultados mostró fue el obtenido por el método K NN, pues se logra disminuir el error de las predicciones hasta el 6%, además de exhibir el mayor coeficiente de correlación. Para la ejecución del modelo computacional obtenido se hizo necesario desarrollar una aplicación (interfaz) que sea capaz de leer en las matrices correspondientes a cada variable controlada y presentar en forma numérica el resultado, que le permite al usuario ejecutar el modelo obtenido por el método K de los vecinos más cercanos en la plataforma Weka. Figura 4. Interfaz para la ejecución del modelo Problemas que pueden ser resueltos aplicando los métodos de inteligencia artificial Los sistemas Basados en casos pueden ser empleados con éxito en: La localización y clasificación de defecto de piezas según el tamaño del defecto, para el diseño de transmisiones por tornillo sin fin; El desarrollo de modelos que permitan obtener las magnitudes idóneas para las condiciones marítimas de Cuba en el empleo de la energía undimotriz; Determinar anomalías en máquinas rotatorias teniendo en cuenta el régimen de trabajo. Sin embargo ello constituye un campo de las aplicaciones de la Inteligencia Artificial aún inexplorada. Conclusión Es factible realizar investigaciones para resolver estos problemas empleando métodos de aprendizaje automatizado. Referencias Bibliográficas 1. Bello M. Un método de aproximación de funciones basado en el enfoque de los prototipos más cercanos utilizando relaciones de similaridad [en opción al título de Licenciado en Ciencia de la Computación]. Santa Clara: Universidad Central “Marta Abreu” de Las Villas; 2012. 2. Mitchell T. Machine Learning. Portland, OR, USA: McGraw Hill; 1997. 3. Zurada JM, Malinowski A, Usui S. Perturbation method for deleting redundant inputs of perceptron networks. Neurocomputing. 1997;14(2):177-93. 4. Rynkiewicz J. General bound of overfitting for MLP regression models. Neurocomputing. 2012;90:106-10. 5. Araúzo A. Un sistema inteligente para selección de características en clasificación [en opción al grado de doctor en Informática]. España: Universidad de Granada; 2006. 6. Curk T, Demsar J, Xu Q, Leban G, Petrovic U, Bratko I, et al. Microarray data mining with visual programming. Bioinformatics. 2005;21(3):396-8. 7. Alcalá J, Fernández A, Luengo J, Derrac J, García S, Sánchez L, et al. KEEL data-mining software tool: data set repository, integration of algorithms and experimental analysis framework. J of Mult-Valued Logic & Soft Computing. 2011;17:255-87. 8. Witten I, Frank E. Practical machine learning tools and techniques. San Francisco, Estados Unidos de América: Morgan Kaufmann; 2005. 525 p.