Logo Studenta

TrabajoparaCECIMterminado

¡Estudia con miles de materiales!

Vista previa del material en texto

Empleo de Métodos de aprendizaje automatizado en problemas de ingeniería mecánica 
Dr. C Darina Lara Coba 
Universidad Tecnológica de La Habana “José Antonio Echeverría” (CUJAE), Dpto. Mecánica Aplicada 
email: dlarac@mecanica.cujae.edu.cu 
RESUMEN 
Existen problemas de ingeniería donde las variables involucradas en la búsqueda de la solución no tienen relaciones 
sencillas entre sí, y la modelación clásica no permite representar el problema mediante funciones matemáticas de fácil 
deducción. En estos casos se pueden emplear métodos de aprendizaje automatizado, trasladando la solución al campo 
de la inteligencia artificial. El presente trabajo tiene como objetivo realizar una exploración de las posibilidades de 
aplicación de métodos de aprendizaje automatizado a problemas de ingeniería mecánica. Se realizó una búsqueda 
bibliográfica sobre dichos métodos y sobre posibles problemas a solucionar, sumada a encuestas y entrevistas con 
especialistas de la carrera de diversas procedencias. Empleando la herramienta Weka se resolvió un ejemplo. Se 
obtuvo como resultado un banco de problemas donde pueden aplicarse estos métodos de manera inmediata, y se llegó 
a la conclusión de que es factible emprender una investigación dirigida a resolverlos por esta vía. 
PALABRAS CLAVES: Aprendizaje automatizado, inteligencia artificial, modelos computacionales. 
EMPLOYMENT PERSPECTIVE MACHINE LEARNING METHODS PROBLEMS OF MECHANICAL 
ENGINEERING 
ABSTRACT 
There are engineering problems where the variables involved in the search for the solution does not have simple 
relations with each other, and classical modeling can represent the problem not by mathematical functions easy 
deduction. In these cases you can be employed machine learning methods, transferring the solution to the field of 
artificial intelligence. This paper aims to make an exploration of the possibilities of application of machine learning 
methods to problems in mechanical engineering. A search for such methods and possible problems to solve, together 
with surveys and interviews with specialists from diverse career was made. Using the tool Weka an example was 
resolved. It was obtained as a result a bank of problems where these methods can be applied immediately, and 
concluded that it is feasible to undertake an investigation to solve this way. 
KEY WORDS: Machine learning, artificial intelligence, computational models. 
INTRODUCCIÓN 
El Aprendizaje Automatizado (AA) es una rama de la Inteligencia Artificial (IA), cuyo objetivo es desarrollar técnicas 
que permitan crear programas que puedan aprender de forma similar a lo realizado por los humanos, es decir, aprender 
por sí mismos; capaces de generalizar comportamientos a partir de una información no estructurada suministrada en 
forma de ejemplos. Es, por lo tanto, un proceso de inducción del conocimiento. En muchas ocasiones el campo de 
mailto:dlarac@mecanica.cujae.edu.cu
 
actuación del mismo se solapa con el de la estadística, ya que las dos disciplinas se basan en el análisis de datos. Sin 
embargo, el aprendizaje automatizado se centra más en el estudio de la complejidad computacional de los problemas 
(1). 
El aprendizaje a partir de ejemplos en su formulación más simple es el proceso que opera sobre una colección de 
ejemplos, cada uno de los cuales está descrito mediante un conjunto de rasgos. Este proceso de aprendizaje tiene dos 
momentos principales: la generación de conocimiento o solución de un nuevo problema, y la validación del resultado 
(2). 
Para poder desarrollar estas dos etapas la colección de ejemplos se divide en dos conjuntos: el conjunto de 
entrenamiento y el conjunto de control. Con el primero se realiza el aprendizaje, mientras que con el segundo se evalúa 
la calidad de los resultados. La principal cualidad a medir en todo método de aprendizaje es su capacidad de 
generalización, es decir, la capacidad del método de poder resolver problemas no vistos antes. La capacidad de 
generalización se mide a partir de los resultados alcanzados con la muestra de control (2). 
Para el análisis previo de los datos se utilizan varios métodos como la selección de ejemplos (experimentos) y de 
atributos (variables), y la normalización de los atributos, permitiendo mejorar la calidad del modelo de aprendizaje, 
sintetizando la descripción de los objetos, de manera tal que la información sea preservada de la forma más compacta 
y clara posible, favoreciendo la labor de aprendizaje, es decir, distingue los atributos realmente relevantes en la base 
de casos (3). 
Los sistemas de Redes Neuronales Artificiales (RNA) del tipo multicapa, constituye un modelo computacional que 
simula algunas formas del funcionamiento del cerebro humano, sin llegar a desarrollar una réplica del mismo (Burr, 
1988). Son excelentes clasificadores, entrenados de forma discriminativa (4), utilizando el aprendizaje con 
propagación hacia atrás de los errores BP (Back Propagation). Este procedimiento pertenece a la categoría de 
supervisado, pues requiere conocer las salidas correctas para cada ejemplo de entrada. La RNA (Fig. 1) responde a 
una topología multicapa dirigida hacia delante con capa de entrada, capas ocultas y capa de salida. 
 
Figura 1. Esquema de una red neuronal del tipo MLP 
 
Los sistemas K vecino más cercano (K-NN) se basan en la suposición de que los ejemplos cercanos pertenecen a la 
misma clase. Su fase de aprendizaje es muy simple, pues se limita a almacenar los ejemplos del conjunto de 
entrenamiento. El clasificador busca los k ejemplos más cercanos al dato que se quiere clasificar y le asigna la clase 
más frecuente entre ellos. Son rápidos en el entrenamiento pero producen clasificadores no discriminatorios, lo que 
significa que el proceso de entrenamiento está basado en la maximización de la pertenencia de los datos a una clase, 
ignorando la información entre clases (5). 
El K-NN constituye un algoritmo clásico de la forma de solución conocida a un problema similar y ha sido empleado 
en problemas de clasificación y regresión. El método básicamente consiste en comparar la nueva instancia a clasificar 
con los casos o ejemplos del dominio del problema, recuperando los k ejemplos más cercanos, lo cual depende del 
parecido entre los atributos del nuevo ejemplo con los ejemplos de la muestra de aprendizaje o entrenamiento. Como 
resultado del mismo se devuelve el promedio de los valores asociados al rasgo objetivo de los k ejemplos más cercanos 
a él. 
Herramientas computacionales empleadas en la aplicación de los métodos de aprendizaje automatizado 
Existen varias herramientas o plataformas para la utilización de los métodos de aprendizaje automatizado y con ellos 
el desarrollo de modelos para la solución de diversos problemas, entre ellas están Orange, Keel, Weka. 
 Orange: su estructura basada en componentes que permiten facilidades para crear nuevos algoritmos 
utilizando lenguaje C++, incluye una amplia gama de técnicas de preparación de los datos, de aprendizaje y 
para la validación de resultados (6). 
 Keel: es una herramienta, creada en el año 2004, para almacenar, utilizar y probar algoritmos de aprendizaje 
evolutivos (Fig. 2). Contiene técnicas de pre-procesamiento aunque no posee gran cantidad de métodos para 
la Selección de Atributos. Esta herramienta posee código abierto, permitiendo así la incorporación libre de 
nuevos algoritmos (7). 
 
 
Figura 2. Entorno de trabajo de Keel 
 Weka: constituye un entorno de trabajo (Fig. 3) que integra una amplia colección de algoritmos. Fue 
desarrollado en lenguaje Java por un equipo de investigadores de la universidad de Waikato (Nueva Zelanda), 
bajo licencia GNU (General Public License), y se caracteriza por la independencia de su arquitectura, ya que 
funciona en cualquier plataforma sobre la que existe una máquina virtual Java disponible. Permite aplicar, 
analizar y evaluar algunas de las técnicas más relevantes del análisisde datos, dentro de las que se enmarcan: 
el pre-procesamiento de datos, clasificación, regresión, agrupamiento, reglas de asociación y visualización. 
Es un software libre que está orientado a la extensibilidad, por lo que es posible añadir nuevas 
funcionalidades. Todo lo anterior justifica que sea una de las herramientas más utilizadas en la minería de 
datos (8). 
 
 
 
Figura. 3 Entorno de trabajo de Weka 
Las técnicas de Inteligencia Artificial se aplican hoy en día a diferentes problemas de Ingeniería, especialmente los 
Sistemas Basados en el Conocimiento. Donde los más comunes son los Sistemas Basados en Patrones, los Sistemas 
Basados en Reglas, los Sistemas Basados en Casos y los Sistemas Híbridos. 
Los Sistemas Basados en Casos parten de problemas resueltos en un dominio de aplicación y mediante un proceso de 
adaptación, encuentran la solución a un nuevo problema. 
Tomando en cuenta lo anteriormente planteado el objetivo del trabajo es realizar una exploración de las posibilidades 
de aplicación de métodos de aprendizaje automatizado a problemas de ingeniería mecánica. 
Ejemplo empleando métodos de Inteligencia artificial Objetivo. Desarrollar un modelo computacional para la 
estimación de la densidad del suelo mediante el sensoramiento continuo. 
Para alcanzar este objetivo se realizaron mediciones de resistencia a la penetración del suelo empleando un sensor, se 
obtuvieron muestras de suelo y se determinó en laboratorio la densidad del suelo. Con esta información se creó una 
base de casos la cual se normalizó en la herramienta computacional empleada (Weka) y finalmente se pasó al 
desarrollo del modelo en dicha herramienta. Se aplicaron los métodos, K NN y MLP. 
K- Vecinos más Cercanos. Los resultados de la aplicación de este método mostraron (Tabla 1), que existe mayor 
correlación entre los resultados predichos y observados (r=0,89), el error cuadrático medio es de 0,11 g∙cm-3 y el error 
medio absoluto es de 6%. 
Tabla 1. Resultado de la validación cruzada del modelo obtenido por el K vecinos más cercanos 
Parámetros K NN 
Coeficiente de correlación 0,89 
Error medio absoluto 0,06 
Error cuadrático medio (g∙cm-3) 0,11 
Error absoluto relativo (%) 32,59 
Error cuadrático medio estandarizado (%) 47,15 
Número de instancias 75 
 
 
 
Redes neuronales del tipo multicapa. Los resultados de los estadígrafos de la validación cruzada de este método 
mostraron (Tabla 2), que existe correlación alta entre las variables predichas y observadas (r=0,75), con una raíz del 
error cuadrático medio de 0,16 g∙cm-3 y el error medio absoluto de un 13%. 
Tabla 2. Estadígrafos de la validación cruzada de la red neuronal 
Parámetros MLP 
Coeficiente de correlación 0,75 
Error medio absoluto 0,13 
Error cuadrático medio (g∙cm-3) 0,16 
Error absoluto relativo (%) 68,67 
Error cuadrático medio estandarizado (%) 67,39 
Número de instancias 75 
 
De los modelos desarrollados, el que mejores resultados mostró fue el obtenido por el método K NN, pues se logra 
disminuir el error de las predicciones hasta el 6%, además de exhibir el mayor coeficiente de correlación. 
Para la ejecución del modelo computacional obtenido se hizo necesario desarrollar una aplicación (interfaz) que sea 
capaz de leer en las matrices correspondientes a cada variable controlada y presentar en forma numérica el resultado, 
que le permite al usuario ejecutar el modelo obtenido por el método K de los vecinos más cercanos en la plataforma 
Weka. 
 
Figura 4. Interfaz para la ejecución del modelo 
Problemas que pueden ser resueltos aplicando los métodos de inteligencia artificial 
Los sistemas Basados en casos pueden ser empleados con éxito en: 
 La localización y clasificación de defecto de piezas según el tamaño del defecto, para el diseño de 
transmisiones por tornillo sin fin; 
 
 El desarrollo de modelos que permitan obtener las magnitudes idóneas para las condiciones marítimas de 
Cuba en el empleo de la energía undimotriz; 
 Determinar anomalías en máquinas rotatorias teniendo en cuenta el régimen de trabajo. 
Sin embargo ello constituye un campo de las aplicaciones de la Inteligencia Artificial aún inexplorada. 
Conclusión 
Es factible realizar investigaciones para resolver estos problemas empleando métodos de aprendizaje automatizado. 
Referencias Bibliográficas 
1. Bello M. Un método de aproximación de funciones basado en el enfoque de los prototipos más cercanos 
utilizando relaciones de similaridad [en opción al título de Licenciado en Ciencia de la Computación]. Santa 
Clara: Universidad Central “Marta Abreu” de Las Villas; 2012. 
2. Mitchell T. Machine Learning. Portland, OR, USA: McGraw Hill; 1997. 
3. Zurada JM, Malinowski A, Usui S. Perturbation method for deleting redundant inputs of perceptron networks. 
Neurocomputing. 1997;14(2):177-93. 
4. Rynkiewicz J. General bound of overfitting for MLP regression models. Neurocomputing. 2012;90:106-10. 
5. Araúzo A. Un sistema inteligente para selección de características en clasificación [en opción al grado de 
doctor en Informática]. España: Universidad de Granada; 2006. 
6. Curk T, Demsar J, Xu Q, Leban G, Petrovic U, Bratko I, et al. Microarray data mining with visual 
programming. Bioinformatics. 2005;21(3):396-8. 
7. Alcalá J, Fernández A, Luengo J, Derrac J, García S, Sánchez L, et al. KEEL data-mining software tool: data 
set repository, integration of algorithms and experimental analysis framework. J of Mult-Valued Logic & 
Soft Computing. 2011;17:255-87. 
8. Witten I, Frank E. Practical machine learning tools and techniques. San Francisco, Estados Unidos de 
América: Morgan Kaufmann; 2005. 525 p.