Descarga la aplicación para disfrutar aún más
Esta es una vista previa del archivo. Inicie sesión para ver el archivo original
31/12/2017 PROYECTO COFINANCIADO POR: GEMELOS DIGITALES en la transición a la Industria 4.0 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Entregable E5.1 1 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Información del documento Título: Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Title: State of the art and analysis of Big Data techniques for Digital Twins Cod. documento: Entregable E5.1 Proyecto: “DIGITAL TWINS: Gemelos Digitales en la transición a la Industria 4.0” Fecha publicación: 31/12/2017 Palabras clave: Gemelo digital, Big Data, Simulación, Redes de petri ITI - Instituto Tecnológico de Informática Camino de Vera, s/n. Edif. 8G. Acc. B – 4ª planta 46022 Valencia - España / Spain www.iti.es Personas de contacto: Sr. Salvador Santonja, Project Leader R&D Area TLF: +34 963 877 069; Email: ssantonja@iti.es Agradecimientos: Las actividades descritas en este documento se encuadran en el proyecto ““DIGITAL TWINS: Gemelos Digitales en la transición a la Industria 4.0””, que está cofinanciado por el Instituto Valenciano de Competitividad Empresarial (IVACE) y por la Unión Europea a través del Fondo Europeo de Desarrollo Regional (FEDER), dentro del programa de ayudas dirigidas a centros tecnológicos de la Comunidad Valenciana para proyectos de I+D en cooperación con empresas 2017, con nº expediente IMDEEA/2017/103. Nota legal Este documento está bajo una Licencia Creative Commons Atribución-NoComercial- SinDerivar 4.0 Internacional. Se permite libremente copiar, distribuir y comunicar públicamente esta obra siempre y cuando se reconozca la autoría y no se use para fines comerciales. No se puede alterar, transformar o generar una obra derivada a partir de esta obra. Los derechos de autor de todas las marcas, nombres comerciales, marcas registradas, logos e imágenes pertenecen a sus respectivos propietarios. http://www.iti.es/ http://creativecommons.org/licenses/by-nc-nd/4.0/ http://creativecommons.org/licenses/by-nc-nd/4.0/ 2 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Resumen DIGITAL TWINS (Gemelos Digitales en la transición a la Industria 4.0) es un proyecto financiado por el Instituto Valenciano de Competitividad Empresarial (IVACE) y la Unión Europea a través del Fondo Europeo de Desarrollo Regional (FEDER). El objetivo general del proyecto es avanzar en la definición, modelado y construcción de los Gemelos Digitales en el marco de la Industria 4.0, y demostrar la nueva dimensión de herramientas y servicios que se pueden construir sobre ellos para mejorar sus transferibilidad y aplicación en el tejido industrial de la Comunitat Valenciana. El objetivo del entregable se centra en analizar el estado del arte, la técnica, tendencias y tecnologías Big Data aplicadas para la construcción de Gemelos Digitales en el contexto de la Industria 4.0. En concreto, el documento recoge los resultados de las tareas llevadas a cabo para la identificación, selección y experimentación de las técnicas y tecnologías que intervienen en: la Representación Visual de los procesos productivos, la Simulación de procesos industriales y la Optimización de las variables o factores que intervienen en la definición de escenarios de funcionamiento de los Gemelos Digitales en procesos industriales. Abstract DIGITAL TWINS (Digital Twins in the transition to Industry 4.0) is a project funded by the Valencian Institute for Business Competitiveness (IVACE) and the European Union through the European Regional Development Fund (FEDER). The general objective of the project is to advance in the definition, modeling and construction of Digital Twins in the framework of Industry 4.0, and demonstrate the new dimension of tools and services that can be built on them to improve their transferability and application in the Valencian Community industry. The objective of the deliverable focuses on analyzing the state of the art, the technique, trends and Big Data technologies applied to the development of Digital Twins in the context of Industry 4.0. Specifically, the document includes the results of the tasks for the identification, selection and experimentation of the techniques and technologies involved in: Visual Representation of production processes, Simulation of industrial processes and Optimization of variables or factors that intervene in the definition of operating scenarios of Digital Twins in industrial processes. 3 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Contenido Resumen .......................................................................................................................... 2 Abstract ........................................................................................................................... 2 1 Introducción .............................................................................................................. 5 1.1 Objetivos del Paquete de Trabajo 5 ............................................................................. 5 1.2 Objetivo del presente documento ............................................................................... 5 2 Estado del Arte de técnicas Big Data para Gemelos Digitales....................................... 6 2.1 Gemelo Digital ............................................................................................................. 6 2.1.1 Concepto ....................................................................................................... 6 2.1.2 Definición ...................................................................................................... 7 2.1.3 Control de sistemas complejos ..................................................................... 7 2.1.4 Machine Learning Control (Smart control) y Gemelo Digital ....................... 9 2.1.5 Gestión del ciclo de vida del producto (PLM) ............................................. 10 2.1.6 Gemelo Digital como parte de Smart Products .......................................... 12 2.1.7 Gemelo digital en la Industria 4.0 .............................................................. 12 2.1.8 Cadena de suministro cognitiva (Cognitive Supply Chain) ......................... 15 2.2 Sector Industrial al que se dirige............................................................................... 17 2.3 Modelo de referencia ................................................................................................ 18 2.4 Retos tecnológicos ..................................................................................................... 22 3 Análisis de las técnicas Big Data para Gemelos Digitales ............................................ 23 3.1 Construcción de un Gemelo Digital ........................................................................... 24 3.1.1 Problemática .............................................................................................. 26 3.1.2 Técnicas involucradas ................................................................................. 27 3.1.3 Big Data en el Gemelo Digital..................................................................... 29 3.2 Modelado y simulación dinámica de procesos industriales ...................................... 31 3.2.1 Simulación discreta de eventos (DES) ......................................................... 31 3.2.2 Tipos de modelos ........................................................................................ 32 3.2.3 Necesidad de la simulación ........................................................................ 32 3.2.4 Ventajas e inconvenientes de la simulación ............................................... 32 3.2.5 Construcción del modelo. Verificación, validación y credibilidad ............... 33 3.2.6 Estudio de herramientas de simulación ..................................................... 33 4 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 3.2.7 Redes de Petri ............................................................................................. 35 3.3 Optimización de procesos industriales ...................................................................... 36 3.3.1 Deep Learning ............................................................................................. 37 3.3.2 Reinforcement Learning ............................................................................. 41 3.3.3 Deep Reinforcement Learning .................................................................... 44 3.4 Tecnologías para la representación visual de un Gemelo Digital .............................. 49 3.4.1 Librerías de Javascript ................................................................................ 50 3.4.2 Representación de grandes cantidades de datos ....................................... 53 4 Referencias .............................................................................................................. 55 5 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 1 Introducción 1.1 Objetivos del Paquete de Trabajo 5 El objetivo del paquete de trabajo se centra en el estudio de las técnicas y tecnologías Big Data Analytics de representación digital de sistemas físicos para la construcción Gemelos Digitales en el ámbito de la Industria 4.0. Además, se realizará una prueba de concepto de los resultados obtenidos en los estudios con datos de una empresa cooperante en un contexto de producción real. En definitiva, el paquete pretende resolver la problemática asociada a la dificultad técnica que implica manejar, representar e interpretar una gran cantidad de datos generada por planta de fabricación en continuo. Los resultados esperados del paquete se centran en (i) la evaluación del potencial de uso de tecnologías Big Data para la concepción de Gemelos Digitales sobre entornos masivamente sensorizados, (ii) la validación de la necesidad de uso de técnicas Big Data y Machine Learning para la representación avanzada no sólo del estado, sino de las características y comportamiento de los elementos físicos a los que el Gemelo Digital emula del entorno real en la empresa, y (iii) probar y validar una solución en el ámbito de los Gemelo Digitales en un caso de uso en entorno relevante (planta industrial de empresa cooperante). 1.2 Objetivo del presente documento El objetivo del entregable E5.1 se centra en analizar el estado del arte, la técnica, tendencias y tecnologías Big Data aplicadas para la construcción de Gemelos Digitales en el contexto de la Industria 4.0. En concreto, el documento recoge los resultados de las tareas llevadas a cabo para la identificación, selección y experimentación de las técnicas y tecnologías que intervienen en: La construcción del Gemelo digital mediante la simulación multivariante de señales de comportamiento de los elementos físicos que intervienen. La Simulación de procesos industriales mediante la definición de condiciones, transiciones y eventos que permitan al usuario realizar experimentos y analizar el comportamiento de los Gemelos Digitales. La Optimización de las variables o factores que intervienen en la definición de escenarios de funcionamiento de los Gemelos Digitales en procesos industriales, permitiendo así realizar actuaciones sobre el Gemelo Físico. La Representación Visual de los procesos productivos en los que interviene el Gemelo Digital, un conjunto de indicadores de Eficiencia Productiva que permitan evaluar su funcionamiento y configuración y grandes volúmenes de datos que modelen su comportamiento ante unos factores externos definidos por los nuevos escenarios. 6 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 2 Estado del Arte de técnicas Big Data para Gemelos Digitales 2.1 Gemelo Digital 2.1.1 Concepto El concepto de gemelo digital se remonta al año 2002 en la Universidad de Míchigan (EEUU), en el contexto de una presentación realizada a la industria por Michael Grieves sobre la gestión del ciclo de vida de un producto (Product Lifecycle Management, PLM). De hecho, y aunque no se llamó específicamente gemelo digital, la transparencia en cuestión (“Conceptual ideal of PLM”) presenta los tres elementos que de forma general definen un gemelo digital: mundo real, mundo virtual, y el enlace entre ambos, que implica flujo de datos del mundo real al mundo virtual, y de información en el otro sentido. Figura 1. "Conceptual ideal for PLM". Michael Grieves introduce por primera vez el concepto de gemelo digital en 2002 (Universidad de Míchigan) Desde entonces, el concepto gemelo digital se ha aplicado a numerosos y variados ámbitos, y en muchos casos se ha particularizado para englobar no todo el ciclo de vida de un producto, sino fases más específicas, y sobre todo y más concretamente la fase de uso del producto. Pero como se explicará más tarde, en principio el concepto gemelo digital está pensado para englobar todas las fases del ciclo de vida del producto: diseño, fabricación, uso y eliminación y reciclaje, poniendo de relieve que el gemelo digital es dinámico, acompaña a su gemelo físico, se integra en diferentes entornos (que por otra parte le afectan y condicionan en su evolución) y aporta diferentes ventajas y funcionalidades dependiendo de la fase en la que se aplique. 2010 / 2012 An integrated multi-physics, multi-scale, probabilistic simulation of a vehicle or system that uses the best available physical models, sensor updates, fleet history, etc., to mirror the life of its flying twin. The digital twin is ultra-realistic and may consider one or more important and interdependent vehicle systems. 2012 A cradle-to-grave model of an aircraft structure’s ability to meet mission requirements, including submodels of the electronics, the flight controls, the propulsion system, and other subsystems 2012 Ultra-realistic, cradle-to-grave computer model of an aircraft structure that is used to assess the aircraft’s ability to meet mission requirements 2013 Coupled model of the real machine that operates in the cloud platform and simulates the health condition with an integrated knowledge from both data driven analytical algorithms as well as other available physical knowledge 7 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 2013 Ultra-high fidelity physical models of the materials and structures that control the life of a vehicle 2013 Structural model which will include quantitative data of material level characteristics with high sensitivity 2015 Very realistic models of the process current state and its behavior in interaction with the environment in the real world 2015 Product digital counterpart of a physical product 2015 Ultra-realistic multi-physical computational models associated with each unique aircraft and combined with known flight histories 2015 High- fidelity structural model that incorporates fatigue damage and presents a fairly complete digital counterpart of the actual structural system of interest 2016 Virtual substitutes of real world objects consisting of virtual representations and communication capabilities making up smart objects acting as intelligent nodes inside the internet of things and services 2016 Digital representation of a real world object with focus on the object itself 2016 The simulation of the physical object itself to predict future states of the system 2016 Virtual representation of a real product in the context of Cyber-Physical Systems 2016 An integrated multi-physics, multi-scale, probabilistic simulation of an as-built system, enabled by Digital Thread, that uses the best available models, sensor information, and input data to mirror and predict activities/performance over the life of its corresponding physical twin 2016 A unified system model that can coordinate architecture, mechanical, electrical, software, verification, and other discipline specific models across the system lifecycle, federating models in multiple vendor tools and configuration-controlled repositories Tabla 1. Definiciones de gemelo digital en la literatura científica (2012-2016) [1] 2.1.2 Definición En cualquier caso, existen numerosas definiciones de gemelo digital. Los autores en [1] han realizado una búsqueda exhaustiva en la literatura desde 2012 (cuando aparece el concepto de Industria 4.0) hasta 2016, seleccionando todas las publicaciones que contienen el término “digital twin” en el título, en el abstract o en la lista de palabras clave. Las diferentes definiciones de gemelo digital, encontradas por los autores en la literatura, quedan reflejadas en la Tabla 1. Como comentan los autores en [1], la primera definición fue acuñada por la NASA en su “Modeling, Simulation, Information, Technology & Processing Roadmap” en 2010. El objetivo de este gemelo era reproducir de forma lo más fidedigna posible la vida de los vehículos espaciales, incluyendo elementos probabilísticos, datos históricos y datos procedentes de sensores, así como interacciones con el mundo real. En subsiguientes trabajos también se van incluyendo el ciclo de vida completo del producto, los requisitos dependiendo de la misión a la que es destinado, y el uso del gemelo para la prognosis y el diagnóstico. Más adelante, se generaliza desde vehículos espaciales a cualquier tipo de producto, y se sientan las bases para la aplicación del gemelo digital en entornos avanzados de fabricación, incluyendo ya elementos de industria 4.0, big data o cloud. 2.1.3 Control de sistemas complejos La necesidad del gemelo digital surge de la necesidad de modelar de la forma más fidedigna posible la evolución de sistemas cada vez más complejos, y sometidos a diferentes 8 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales condiciones de entorno. En este sentido, se ha pasado de modelos descriptivos (lo que incluye métodos tradicionales de simulación, CAD, etc…) en los que lo importante era modelar la forma de un objeto, a modelos accionables, en los que se también se pretenden simular las fuerzas físicas que actúan sobre el modelo en cada momento, y en los que lo importante es determinar el comportamiento de un sistema a lo largo del tiempo. Figura 2. Evolución de las necesidades de modelado y justificación del gemelo digital En este sentido, el gemelo digital está íntimamente ligado al estudio de sistemas dinámicos complejos, y la necesidad de predecir (y/o atenuar) el comportamiento emergente imprevisto e indeseable (unpredicted and undesirable emergence behaviour) que aparece en dichos sistemas. Esta relación es planteada por Michael Grieves en el capítulo “Digital Twin: Mitigating Unpredictable, Undesirable Emergent Behaviour in Complex Systems” [6], que está incluido en su libro sobre el estudio de dichos sistemas complejos. Un sistema complejo está compuesto por varias partes interconectadas o entrelazadas cuyos vínculos crean información adicional no visible antes por el observador. Como resultado de las interacciones entre elementos, surgen propiedades nuevas que no pueden explicarse a partir de las propiedades de los elementos aislados. Dichas propiedades se denominan propiedades emergentes. Esto implica que el comportamiento de estos sistemas puede plantear problemas completamente imprevistos, que pueden suponer un fallo del sistema, e incluso la completa destrucción del mismo. Tradicionalmente, el control autónomo de sistemas, con o sin realimentación, ha sido el campo que se ha dedicado a desarrollar mecanismos para, dado un sistema observable, y sometido a unas determinadas condiciones externas, diseñar un mecanismo de control automático que, aplicado al sistema, lo mantenga dentro de unos determinados parámetros de comportamiento, englobados en una función de coste. En el caso de que el proceso de control incluya feedback, los paralelismos con el concepto de gemelo digital son obvios, como se puede ver en la figura adjunta, en la que se aprecia que las funcionalidades y objetivos del controlador y del gemelo digital son similares: https://es.wikipedia.org/wiki/Emergencia_(filosof%C3%ADa) 9 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Figura 3. Sistema de control con realimentación, en el que se aprecian similitudes con el concepto de gemelo digital En este caso, se obtienen observaciones del sistema real mediante un conjunto de sensores, y el controlador, mediante una ley de control definida de antemano, y en base a las observaciones que obtiene, y al conocimiento previo de las dinámicas del sistema, calcula la actuación a aplicar sobre el sistema de tal manera que cierta función de coste es minimizada. Aunque existe una gran cantidad de literatura sobre el tema, y la comunidad dedicada al estudio de este tipo de escenarios es numerosa, el problema anterior sólo tiene solución bajo unas condiciones muy determinadas, en concreto cuando el sistema a controlar es lineal, el ruido que le afecta es gaussiano, y la función de coste a minimizar cuadrática (Linear Quadratic Gaussian Control [7]). En el resto de casos, las soluciones obtenidas son sub-óptimas. En cualquier caso, la teoría general de control está centrada, sobre todo, en la estabilidad del sistema, y en asegurarse de que la salida de control no produce una divergencia completa del mismo. 2.1.4 Machine Learning Control (Smart control) y Gemelo Digital Claramente, cuanto más complejo se vuelve el sistema, y las perturbaciones exteriores son más complicadas de modelar, ese tipo de control se vuelve inaplicable en este tipo de escenarios. Control basado en aprendizaje automático (Machine Learning Control) es un sub- campo en el que converge teoría tradicional de control de sistemas, combinada con técnicas de aprendizaje automático, y está especialmente indicado para sistemas complejos no-lineales. En este caso, al esquema mostrado más arriba se añadiría un bucle adicional off-line, que permite al controlador ir aprendiendo de datos obtenidos experimentalmente. 10 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Figura 4. Bucle de control con aprendizaje automático [8] En este caso, las similitudes con el gemelo digital son aún mayores, ya que incorporando el aprendizaje automático en el controlador es posible añadir nuevos factores acerca de la predicción de la evolución y el comportamiento del sistema. Por tanto, es posible aplicar teoría general de control y más concretamente teoría específica de control mediante aprendizaje automático al diseño del gemelo digital. En este sentido, en el libro recientemente publicado “Machine Learning Control – Taming Nonlinear Dynamics and Turbulence” [7], los autores aplican técnicas de aprendizaje automático como “genetic programming” y otros algoritmos evolutivos al diseño de las leyes de control, y proporcionan también algunos detalles para su implementación. 2.1.5 Gestión del ciclo de vida del producto (PLM) Por otra parte, si asumimos que un producto durante su ciclo de vida es un sistema dinámico complejo, el objetivo del gemelo digital es poder diseñar, testear, fabricar y usar una versión virtual de ese producto, de tal forma que podamos asegurarnos de que el diseño es realmente fabricable y determinar qué tipos de fallo podrá tener el sistema una vez esté en uso. El sistema complejo aparece virtualmente al comienzo del ciclo de vida, cobra forma física durante la fase de fabricación, continúa durante la fase operativa, hasta que el producto es retirado y eliminado. El comportamiento emergente puede aparecer en cualquiera de estas fases del ciclo de vida. En la fase de creación, el sistema físico realmente no existe, pero comienza a tomar forma de forma virtual a través de un Prototipo de Gemelo Digital (Digital Twin Prototype, DTP [6]). En este sentido, los actuales avances en tecnología y simulación 3-D hacen que la forma del sistema se pueda modelar de forma avanzada, incluir movimientos e interacciones entre componentes, y descubrir conflictos y posibles problemas de forma rápida y eficaz. La fase de creación es en la que se trata de prevenir el comportamiento emergente del sistema. El diseño tradicional se ha centrado en verificar y validar el comportamiento deseable, y eliminar los problemas y fallos procedentes del comportamiento predecible y no deseable. Sin embargo, el DTP debe permitir identificar y eliminar el comportamiento impredecible y no deseable. Variando los parámetros de simulación sobre todo el rango que pueden tomar, se puede investigar el comportamiento no lineal del sistema, incluyendo combinaciones y discontinuidades que pueden dar lugar a fallos catastróficos. Finalmente, y tal y como se 11 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales muestra en la figura 1, la posibilidad de disponer de múltiples espacios virtuales (VS1, VS2,….) implica que el sistema puede ser sometido a diferentes test destructivos sin un gran coste económico. Esto no implica que el sistema se puede someter a todas las condiciones posibles, pero se debe intentar en la medida de lo posible mitigar o erradicar las fuentes más relevantes de comportamiento emergente no previsto y no deseado. La siguiente fase es la de fabricación, en la que se comienza a construir el sistema físico con, en principio, configuraciones específicas y potencialmente únicas. Estas diferentes configuraciones se reflejan en diferentes Instancias del Gemelo Digital (Digital Twin Instance, DTI) de forma virtual. Por tanto, en esta fase el flujo es el contrario que en la fase de creación. En este caso, se parte de un sistema físico, y los datos de este sistema se envían al espacio virtual, donde se mantienen representaciones virtuales de ese sistema físico, cada una reflejando una configuración diferente. En la fase operativa o de uso, se descubre si las predicciones sobre el comportamiento del sistema fueron correctas. El sistema real puede cambiar tanto en forma, como en comportamiento, y se comprueba si se eliminó o no el comportamiento no deseable. Si se ha hecho un buen trabajo en la fase de diseño, el comportamiento emergente no debería suponer ningún problema crítico. Los sistemas real y virtual mantienen su relación y se comunican en ambos sentidos. A medida que el sistema físico va cambiando, estos cambios se incorporan al sistema virtual, y por otra parte se usa la información aportada por el sistema virtual para predecir el rendimiento, comportamiento y fallos del sistema físico. Finalmente, la fase de retirada del producto se suele ignorar, pero puede ser conveniente mantener la información y el conocimiento generado sobre su comportamiento, y además se debe tener en cuenta toda esa información acerca de componentes, etc … para evaluar su impacto en el entorno y la sostenibilidad. Figura 5. Evolución del gemelo digital durante el ciclo de vida del producto (elaboración propia a partir de la información proporcionada en [6]) 12 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 2.1.6 Gemelo Digital como parte de Smart Products Poco a poco, los productos tradicionales de los que habitualmente disfrutamos están siendo cada vez más inteligentes, gracias al desarrollo de sensores, microprocesadores, inteligencia artificial y comunicaciones. Esta tendencia ha desembocado en los llamados productos inteligentes (Smart Products), los cuales, en general, van equipados con sistemas integrados que permiten la comunicación con otros productos inteligentes mediante su conexión por internet. Dichos productos inteligentes están capacitados para conocer su estado operativo, para monitorear y controlar sus procesos físicos, mantienen una cierta consciencia sobre su entorno, con el que interactúan al enviar mensajes y desencadenar eventos, y se les permite actuar de forma autónoma [11, Chapter 1]. Aunque las funcionalidades inteligentes del producto son aplicables durante todo su ciclo de vida, es durante la fase de uso del mismo (ver PLM en el apartado anterior) cuando estas capacidades se hacen más patentes. En este sentido, el gemelo digital del producto se puede considerar de forma cada vez más destacada como una parte fundamental del producto inteligente [10]. Figura 6. Clases de productos [10] Más concretamente, en [12] se estudia de forma detallada la reconfiguración de productos inteligentes durante su fase de uso, y se propone una plataforma que combina los datos procedentes de los gemelos digitales para dicha reconfiguración. 2.1.7 Gemelo digital en la Industria 4.0 Como se ha comentado en apartados anteriores, el gemelo digita se puede aplicar a múltiples productos y procesos, como por ejemplo el ciclo de vida completo del producto. Sin embargo, elaborar el gemelo digital de un proceso completo de fabricación supone un caso de elevado interés hoy en día. Por un lado, la continua digitalización de la industria, con la masiva sensorización de las plantas (mediante internet de las cosas, IoT) y la aplicación de técnicas de 13 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales sistemas ciber-físicos, y por otro la necesidad de supervisar de una forma intensiva procesos cada vez más complejos de cara a evitar fallos, aumentar la eficiencia, tanto energética como operativa, y maximizar el rendimiento de la planta, hacen de este caso un ejemplo paradigmático de la aplicación de gemelo digital [5]. El análisis de los datos realizado por el gemelo digital puede servir para detectar tendencias erróneas en el rendimiento real del proceso de fabricación, en determinados aspectos y cuando se compara con el rango ideal de funcionamiento (nótese de nuevo la similitud de este planteamiento con el bucle de control con una función de coste o referencia. De hecho, en [5] se identifica el gemelo digital como un bucle entre el mundo digital y el físico). Figura 7. El gemelo digital como bucle entre el mundo físico y el mundo virtual (fuente: Deloitte University Press) De hecho, y Según la Asociación Alemana de Tecnología de la Información, Telecomunicaciones y Nuevos Medios (BITKOM), los gemelos digitales aplicados a la industria manufacturera tendrán un potencial económico de más de 78.000 millones de euros en 2025. En este contexto, y aunque claramente el concepto existe anteriormente, Microsoft introduce el término Gemelo Digital de Proceso, en su libro blanco “The Process Digital Twin: A step towards operational excellence” [9]. En dicho trabajo, en el que se analiza el impacto de la digitalización en la industria manufacturera, se contrapone el Gemelo Digital de Producto, que permite mejorar el ciclo de vida de productos aislados y el rendimiento del equipamiento durante ese ciclo, al Gemelo Digital de Proceso, como el siguiente nivel de la transformación digital, que extiende los beneficios del gemelo digital a lo largo de toda la fábrica y la cadena de suministro. En este sentido, el gemelo digital de proceso trasciende al gemelo digital para abarcar el entorno completo de producción. Dicho gemelo usa realidad aumenta, inteligencia artificial y computación de alto rendimiento para optimizar no solo el equipamiento, sino todo el proceso, incluyendo las múltiples organizaciones a lo largo de la cadena de suministro. 14 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Según este trabajo, la excelencia operacional de la industria 4.0 se puede conseguir mediante la aplicación de este concepto, ya que permite la implementación sus principios básicos (fábricas interconectadas, equipamiento inteligente, y on-line) mediante una triple integración: vertical (procesos en una misma fábrica), horizontal (organizaciones a lo largo de la cadena de suministro) y optimización end-to-end (integración entre diferentes procesos de diferentes organizaciones). Figura 8. Limitaciones del Gemelo Digital de Producto (fuente: Microsoft "The Process Digital Twin: A step toward operational excellence") Figura 9. Gemelo Digital de Producto (fuente: Microsoft "The Process Digital Twin: A step toward operational excellence") 15 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Siemens también extiende el concepto de gemelo digital al proceso de producción y al equipamiento, según se aplique el gemelo digital en una parte u otra de la cadena de suministro: Figura 10. Diferentes tipos de gemelo digital, dependiendo de su posición en la cadena de suministro (fuente: Siemens [17]) 2.1.8 Cadena de suministro cognitiva (Cognitive Supply Chain) Ahmed El Adhl (https://www.linkedin.com/in/ahmedeladl/) sostiene que los esfuerzos actuales para crear gemelos digitales para las máquinas existentes tienen una visión muy limitada a un pequeño conjunto de funcionalidades con el foco principal en la efectividad operacional y el mantenimiento predictivo. Por tanto, él va un paso más allá, y añadiendo la transformación cognitiva a la transformación digital, concibe el gemelo digital cognitivo como una representación digital, aumentada e inteligente de su par físico, incluyendo todos sus sub-sistemas y a lo largo de todo su ciclo de vida y evolución. El gemelo digital cognitivo (CDT) continúa optimizando sus capacidades, mejorando su diseño cognitivo, digital y físico a lo largo del tiempo en función de los datos recopilados y la experiencia adquirida, y no solo en función de los modelos y datos que se les ha id proporcionando o han ido heredando. https://www.linkedin.com/in/ahmedeladl/ 16 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Las características principales del gemelo cognitivo son las siguientes https://www.linkedin.com/pulse/emergence-cognitive-digital-physical-twins-cdpt-21st- ahmed/): sistemas cognitivos distribuidos altamente interconectados y dando lugar, en algunos casos, a sistemas de sistemas grandes y complejos (SoS). existen en el espacio digital y evolucionan con el tiempo a medida que evoluciona su gemelo físico. abarca el espacio físico, el digital y muy pronto el humano. podrá actuar, interactuar y colaborar en los dominios físico y virtual evolucionará de forma continuada para poder tomar decisiones contextuales de forma autónoma, y ejecutar tareas cada vez más complejas, tanto en el mundo digital como en el físico aprenderá a lo largo del tiempo a identificar, crear y proporcionar nuevos servicios, que sus primeras versiones no podrían ofrecer. tendrá las habilidades de autodiagnóstico físico y digital y auto-curación, mediante técnicas como la fabricación aditiva o tecnologías futuras similares para diseñar, fabricar y reemplazar autónomamente algunas partes defectuosas de su propio gemelo físico. crearán una nueva economía masiva alrededor de los servicios inteligentes digitales semiautomáticos o totalmente automatizados, definidos y ofrecidos por los propios CDT en colaboración con los gemelos físicos y posiblemente los humanos asociados. Figura 11. Gemelo Digital Cognitivo (CDT) (fuente: Ahmed El Adhl) https://www.linkedin.com/pulse/emergence-cognitive-digital-physical-twins-cdpt-21st-ahmed/ https://www.linkedin.com/pulse/emergence-cognitive-digital-physical-twins-cdpt-21st-ahmed/ 17 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 2.2 Sector Industrial al que se dirige Soluciones proporcionadas por ANSYS (sacado de la revista digital prnoticias.com): Transporte. Hasta ahora, los ingenieros de una de las más importantes empresas europeas de transporte tardaban cuatro meses en realizar las pruebas a sus trenes de pasajeros, en un túnel de viento climático, para validar el diseño de los sistemas de calefacción, ventilación y aire acondicionado. Hoy, utilizando la simulación computacional de fluidos dinámicos (CFD) de ANSYS, pueden validar el diseño de estos sistemas en su nuevo tren ICE 4 antes de construir el primer vagón, reduciendo el periodo de pruebas y los costes en más de un 50%. Telecomunicaciones. Wifi para las zonas incomunicadas de Brasil. Las vastas zonas rurales de Brasil apenas tienen acceso a internet. Instalar cables de fibra óptica no resulta rentable y la única solución es levantar torres que les proporcionen conexiones inalámbricas; aun así, la conexión wifi sólo llega al 22% de la población rural. La empresa Jet Towers utilizó el software de simulación de ANSYS para diseñar una línea de torres modulares que permite construirlas e instalarlas en solo una semana (una quinta parte del tiempo habitual) y por una fracción de los costes de una torre inalámbrica convencional. Perforación. Alargar la vida de las herramientas y prevenir riesgos. Las costosas máquinas de perforación, fabricadas con materiales resistentes a la corrosión, están sometidas a un permanente desgaste, mucho mayor en los elementos de corte. Los investigadores de la Universidad Técnica de Dortmund utilizaron herramientas de fluidos y análisis estructural de ANSYS para optimizar el proceso de distribución del flujo refrigerante y alargar así la vida del perforador, hasta en un 50%. Y, al mismo tiempo, prevenir el desgaste y posibles daños y riesgos. Industria. Bombas para una óptima limpieza de tuberías. Con la ayuda de la simulación de ingeniería de ANSYS, FMC Technologies ha logrado reducir a la mitad el peso de una bomba de limpieza alternativa para los conductos del alcantarillado, al tiempo que disminuye su impacto medio ambiental y aumenta la presión de salida del agua. Esta reducción de peso supone además abaratar los costes de la bomba, facilitar su mantenimiento y aumentar su eficiencia energética. Plataformas petrolíferas. Garantizando la seguridad del almacenaje. La mayoría de las nuevas plataformas petrolíferas están ubicadas mar adentro, lejos de la costa. Allí, los sistemas de almacenamiento flotantes y los buques de descarga sufren las duras condiciones del océano. En el pasado, la única alternativa para garantizar que los petroleros pudieran soportar las peores condiciones sin sufrir daños eran costosas pruebas físicas. La simulación de ANSYS ha logrado reducir el número de estas pruebas y además obtener datos más detallados y precisos, que no podrían obtenerse de otra manera. Telecomunicaciones. La startup que va a revolucionar la tecnología 5G. La startup PHAZR quiere competir con las grandes compañías en la carrera por la tecnología 5G. Han creado una red inalámbrica 1268 veces más rápida y 1024 veces con más 18 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales capacidad que las actuales conexiones 4G LTE. La empresa ha aprovechado el poder del software de ANSYS no sólo para investigar y analizar la velocidad, la propagación de la frecuencia de radio o los materiales de la antena, sino también en la agilidad del diseño y la flexibilidad de esta tecnología de vanguardia. Y todo, sin necesidad de invertir en costosos prototipos y pruebas físicas. Energía (entrevista a Sham Chotai, Director de Tecnología de GE Power & Water en el portal http://www.fierasdelaingenieria.com). Recientemente, GE ha pilotado un concepto de parque eólico digital que utiliza un sistema de simulación y modelado en tiempo real para predecir los problemas y optimizar la producción de energía diaria. La compañía afirma que podría aumentar la producción de energía de un parque en un 20%. Además, en el sector eólico, el gemelo digital también puede ofrecer una serie de ventajas más allá de la propia eficiencia. Dado que es una fuente de energía muy poco fiable, en el parque eólico digital es necesario hacer previsiones diarias, reaccionar y hacer frente mejor a mercados integrados de alta verticalidad como Norteamérica y Europa, donde existen múltiples fuentes de combustible. El objetivo es gestionar esas energías renovables, señalando al mercado lo que se puede producir y estabilizar la red a través de diferentes fuentes de combustible. El gemelo digital no es sólo para turbinas, sino para todas las restantes partes de una central eléctrica. Por ejemplo, un compresor podría fallar. En el caso de una planta nuclear, puede causar un cierre y costar millones de dólares para traer a la planta de nuevo en línea. Usando el concepto del gemelo digital combinado con el aprendizaje profundo de la máquina, se puede ser capaz de predecir de 30 a 60 días antes que un compresor falle. 2.3 Modelo de referencia Dada la relativa novedad del concepto de gemelo digital, no existe un modelo de referencia extendido y aceptado universalmente como tal, que sirva para el diseño y la implementación de dicho gemelo digital. En su libro blanco [5], Deloitte propone el siguiente modelo conceptual de arquitectura: http://www.fierasdelaingenieria.com/ 19 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Figura 12. Arquitectura de gemelo digital (fuente Deloitte University Press [5]). Dicha arquitectura viene definida por las siguientes seis etapas: creación, comunicación, agregación, análisis, deducción y actuación. Aunque en esta arquitectura quedan reflejadas muchas de las tecnologías intervinientes en un gemelo digital, se observa alguna carencia sobre todo en lo que atañe al modelado y control de sistemas, dado que tan sólo se considera la tecnología CAD a tal efecto. Además, y como datos que se proporcionan al gemelo digital, tan solo se consideran las medidas procedentes de dos fuentes: las del propio sistema a monitorizar, y las del entorno, obviando las dinámicas propias del sistema (aunque sí que es cierto que se comenta que “las señales de los sensores pueden ser aumentadas con información basada en los procesos de los sistemas, como los sistemas de ejecución de fabricación, sistemas de planificación de recursos empresariales, CAD y sistemas de cadenas de suministro”, y se da a entender que también se cogerían datos del ERP de la empresa, etc ….), que deben poder ser transmitidas de alguna manera de forma directa al gemelo digital para la aplicación de técnicas de control inteligente, y no sólo basadas en el aprendizaje desde los datos. Finalmente, el nivel de detalle de algunas técnicas aplicadas no se corresponde con otras, y el orden en el que se ordenan también puede generar cierta confusión. La creación, desarrollo, puesta en marcha y funcionamiento de un gemelo digital, es una tarea multidisciplinar, que, aunque básicamente consiste en la conjunción de tecnología de sistemas y procesos físicos con tecnología de la información y comunicaciones, engloba numerosas 20 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales prácticas, necesarias para simular, caracterizar y digitalizar el sistema físico, comunicarlo de forma continua, segura, eficiente y en tiempo real con su gemelo digital, guiar el aprendizaje del gemelo digital en línea con la evolución del sistema, optimizar dicho aprendizaje en base a unos requisitos de eficacia y rendimiento, y reproducir y visualizar de la forma más fidedigna posible lo que ocurre en el sistema físico y no es observable, o lo que se prevé que puede llegar a ocurrir. Por lo tanto, y teniendo en cuenta todo lo anterior, en este trabajo se ha optado por proponer un modelo de referencia propio, que queda reflejado en la figura 12, en la que se muestran las diferentes tecnologías involucradas, la posición de estas en el proceso global, y como se relacionan unas con otras. En general, se distinguen cuatro grandes bloques: 1. Todo lo relacionado con el sistema físico y los procesos que implica. En esta parte se incluye teoría de sistemas complejos y de sistemas de sistemas, análisis y simulación de sistemas dinámicos, y modelado de procesos. 2. Digitalización y sensorización del sistema físico, y comunicación con el gemelo digital. Este bloque incluiría redes de sensores inalámbricos (WSN), internet de las cosas (IoT y IIoT), y teoría de sistemas ciberfísicos (CPS), así como la aplicación de protocolos rápidos, eficaces y seguros tipo OPC UA, MQTT y similares, y conceptos de “edge computing” y “edge security”. 3. El gemelo digital debe estar preparado para recibir y procesar la gran cantidad de datos recibida del sistema físico, para lo que se aplica técnicas de HPC y BigData. Asimismo, el gemelo digital aplica técnicas de control inteligente basado en las dinámicas del sistema físico, aprendizaje automático basado en las medidas obtenidas mediante los sensores, e inteligencia artificial para aprender del sistema físico, y evolucionar con él, así como para poder predecir comportamientos futuros ante ciertas condiciones. También se aplican técnicas de optimización para encontrar el funcionamiento óptimo bajo ciertos parámetros, y poder modificar el comportamiento del sistema físico por medio de actuadores u otra forma de interacción. 4. Finalmente, existe un bloque que, mediante técnicas avanzadas de visualización, debe permitir visualizar de forma lo más fidedigna posible el comportamiento tanto de la parte del sistema que no es observable, como del sistema en un futuro bajo los parámetros correspondientes. Para ello se utilizan técnicas de visualización 3D, realidad aumentada y visión artificial. 21 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Figura 13. Modelo de referencia en la elaboración de un gemelo digital 22 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 2.4 Retos tecnológicos En principio, y según la búsqueda realizada por los autores en [1], Big Data no es considerado en la literatura un aspecto clave para la definición de gemelo digital. De hecho, tan sólo en [2] se reconoce de forma explícita que un gemelo digital requiere el almacenamiento de una gran cantidad de datos. En [3], los autores afirman que la gestión y el análisis de Big Data es un factor muy importante para la concepción de un gemelo digital. Finalmente, en [4] se propone Big Data como un método de análisis para los problemas de optimización que aparecen en gemelos digitales. Sin embargo, y según el “padre” del gemelo digital Michael Grieves [6], el avance del gemelo digital va íntimamente ligado a los avances en materia de comunicación y computación de datos, debido a la cantidad masiva que de los mismos se requiere para un correcto modelado. De hecho, y tal y como recoge Deloitte en [5], no ha sido hasta hoy que, gracias al avance tecnológico en el procesado, almacenamiento y análisis de datos, el concepto de gemelo digital, que hasta ahora se había prácticamente limitado a grandes corporaciones (NASA, etc …), puede ser utilizado de forma más extendida por las empresas y, por tanto, incorporados a la industria en su continua digitalización. Además, y tal y como se he comentado en secciones anteriores, en ese mismo informe de Deloitte se propone una arquitectura de gemelo digital basada en las siguientes seis fases: 1. Creación. Esta fase implica la obtención de las mediciones de los sensores desplegados en el sistema físico. 2. Comunicación. Se implementa la conectividad en ambos sentidos entre el sistema físico y el gemelo digital. 3. Agregación (y procesado). En esta fase de realiza la ingestión de datos en un repositorio, procesados y preparados para su análisis. 4. Análisis. En esta fase se realiza el análisis de los datos almacenados. 5. Deducción. Se presentan deducciones obtenidas en la fase de análisis mediante la visualización, resaltando las desviaciones más reseñables en el rendimiento y las áreas más importantes en las que realizar seguimiento y ajuste. 6. Actuación. En esta fase se ponen en marcha las deducciones que se pueden concretar en la activación de actuadores, para la corrección o afinación de las correspondientes desviaciones. Claramente, se puede apreciar que las fases anteriores siguen un flujo bastante similar al que sigue la cadena de valor de Big Data. Dicha cadena engloba todos los pasos que tienen lugar en la gestión de los datos, desde su creación en las diferentes fuentes hasta la generación de valor desde los mismos. Sin embargo, varias de estas fases se identifican con las fases del gemelo digital propuesto por Deloitte: Generación de datos (data generation) Adquisición de datos (data acquisition) Procesamiento de datos (data processing) Análisis de datos (data anlysis) Valor de los datos (data value) Aplicación de los datos (data application) 23 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Esto implica que el concepto de gemelo digital va íntimamente unido al concepto de generación de valor en la cadena de Big Data. Esto es, el gemelo digital es un caso claro y concreto de aplicación Big Data, en el cual la generación de los datos y la generación de valor convergen en la misma entidad, el sistema o proceso físico. Figura 14. Equivalencia entre el modelo de Gemelo Digital propuesto en [5] y la cadena de valor de Big Data Por tanto, no es sólo que un gran volumen de datos (volumen) procedente de diferentes fuentes (sensores, entorno, dinámicas del sistema físico, ERP, Bill of materials (BoM), …) (variabilidad) es necesario para alimentar al Gemelo Real en tiempo real (velocidad), de tal forma que este sea el reflejo lo más fidedigno posible de su par físico, sino que la propia arquitectura del gemelo digital está basada en la cadena de valor de Big Data, y por tanto técnicas específicas de Big data pueden ser aplicadas en cada una de las fases del gemelo digital. Revisión de las soluciones existentes 3 Análisis de las técnicas Big Data para Gemelos Digitales Abordar el reto de los Gemelos Digitales en un contexto de Industria 4.0 supone llevar a cabo tareas de identificación, selección y experimentación de las técnicas y tecnologías Big Data que intervienen en (i) la construcción del Gemelo Digital a partir de señales de comportamiento del Gemelo físico (iii) la visualización de las señales y procesos que intervienen en el Gemelo Digital, (ii) simulación de procesos industriales en los que intervienen los Gemelos Digitales y (iii) optimización de las condiciones de funcionamiento de los Gemelos Digitales que permita la actuación sobre el Gemelo Real. 24 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Figura 15. Elementos de estudio en el que interviene Big Data En el contexto de la industria conectada o Industria 4.0, nos encontramos la necesidad de estudiar la aplicación de técnicas y tecnologías Big Data para resolver retos relacionados con el Volumen, Variedad, Velocidad de los datos en los cuatro elementos representados en la figura. En concreto, los requerimientos que nos encontramos en cada uno de ellos son: Gemelo Digital: grandes volúmenes de datos provenientes del Gemelo Real que deben ser capturados, transformados y analizados para producir un simulador de las señales del comportamiento. Simulación del proceso: velocidad a la hora de interpretar la respuesta de cada uno de los Gemelos Digitales que intervienen en el proceso productivo. Es necesario ofrecer una respuesta rápida a la hora de simular grandes periodos de tiempo. Visualización: análisis de estrategias de tratamiento de grandes volúmenes de datos para su representación eficiente. Optimización: utilización de técnicas de procesamiento paralelo para la creación de modelos estadísticos que permitan la optimización a partir del aprendizaje automático con grandes volúmenes de datos. Velocidad a la hora de interpretar nuevos escenarios de funcionamiento y actuación sobre el Gemelo Físico. 3.1 Construcción de un Gemelo Digital La aplicación de IoT (Internet of Things) en el entorno industrial es algo cada vez más común y con gran potencial. En ese entorno los procesos industriales o las diferentes máquinas que forman parte de dichos procesos industriales se sensorizan. Los datos generados por estos sensores son de gran importancia pues con el debido tratamiento van a permitir adquirir conocimiento nuevo, detectar anomalías de funcionamiento, además de permitir la optimización de procesos y máquinas. La extracción de conocimiento de dicha información se realizará mediante la aplicación de modelos estadísticos y algoritmos de Machine Learning. Uno de los intereses que tiene la industria consiste en la anticipación de los efectos que puede tener el cambio de uno o varios factores de funcionamiento o la reorganización de mi proceso 25 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales productivo, tanto a nivel productivo como interno a cada una de las máquinas que forman parte del proceso. Para poder conocer dichos efectos aparece el concepto de Gemelo Digital. Este nuevo concepto implica la digitalización de una máquina en un entorno virtual para poder evolucionarla mediante técnicas de simulación. Cuando se desea modelar un objeto, habitualmente este objeto viene definido a través de varias mediciones y no una única, así para la simulación, debemos de pensar en una modelización multidimensional que respete la estructura interna de correlación entre las variables que lo definen. Si por ejemplo la presión de un fluido sube con la temperatura, y queremos simular dichas señales, no sería realista simular cada una de estas variables de forma independiente pues se observarían simulaciones incongruentes con la realidad, y las conclusiones a las que se podría llegar con nuestro Gemelo Digital se alejarían del objeto real que éste modela. Por lo tanto, la idea consiste en realizar una copia digital y virtual de todos aquellos sensores que definen a mi máquina y simularlos de forma multidimensional, con lo que podríamos observar cómo se comportan dichos sensores una vez integrada dicha máquina en mi proceso productivo. Figura 16. Esquema conceptual de una máquina virtual. La figura muestra el esquema conceptual de una máquina virtual. En dicha máquina se pueden observar cuatro tipos diferentes de variables: X, F, W y Q. La variable n-dimensional X representará los valores obtenidos por los sensores y sus valores representan el funcionamiento interno de la máquina y serán objeto de la detección de anomalías, la variable m-dimensional F será la variable que representa los factores de configuración manipulables por el humano y serán objeto de optimización, la variable p-dimensional W representa mediciones externas que pueden proceder o bien de sensores exteriores o bien de mediciones de otras máquinas en el proceso productivo y finalmente la variable k-dimensional Q serán nuestras variables de calidad algunas de las cuales serán entradas a otras máquinas dentro del proceso productivo. Matemáticamente, 𝑋 = ൭ 𝑥1 ⋮ 𝑥𝑛 ൱ M 𝑄 = ൭ 𝑞1 ⋮ 𝑞𝑘 ൱ 𝐹 = ሺ𝑓1 ⋯ 𝑓𝑚ሻ 𝑊 = ሺ𝑤1 ⋯ 𝑤𝑝ሻ 26 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales F = {𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠 𝑒𝑥𝑡𝑒𝑟𝑛𝑜𝑠 𝑚á𝑞𝑢𝑖𝑛𝑎 𝑓𝑖𝑗𝑎𝑑𝑜𝑠 𝑝𝑜𝑟 ℎ𝑢𝑚𝑎𝑛𝑜} W = {𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑒𝑥𝑡𝑒𝑟𝑛𝑎𝑠} 𝑋𝑔 = {𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑢𝑙𝑡𝑖𝑑𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑎𝑙𝑒𝑠 𝑠𝑖𝑚𝑢𝑙𝑎𝑑𝑜𝑠} X = ℱ(𝑋𝑔 , F, W) Q = ℱሺX, F, Wሻ Finalmente una vez obtenidos los diferentes modelos para cada una de las partes que modelan a nuestro gemelo digital podremos unirlos entre sí para poder modelar el proceso de producción completo y hacerlo funcionar de manera integrada mediante simulación. La simulación del modelo completo se realizará mediante el uso de Redes de Petri. Dichas redes de Petri permiten la transición de la producción a través de una función de tiempo que vendrá será ofrecida por alguna de las k variables Q. Figura 17. Esquema Red de Petri. La figura representa la estimación del tiempo de producción de cada modelo sirve para marcar el ritmo. Los círculos indican colas y estados que habilitan o no la producción, mientras que los rectángulos modelizan los ritmos de producción de piezas. En el interior de cada rectángulo se puede acceder a los diferentes valores de funcionamiento que modelizan dicha máquina (X,F,W,Q) durante la simulación de la producción. La modelización que pretende cubrir este capítulo tiene que ver con la simulación de las variables (X,F,W,Q) de cada máquina y no tanto con la forma en la que se comunican las diferentes máquinas para modelizar un proceso completo, y que se cubrirá en otro capítulo. El objetivo final de esta simulación no es otro que el conocer el comportamiento dinámico de una máquina dada (valores que toma X y Q) en función de unos parámetros de entrada (F) o variables externas (W) y el tiempo de producción. 3.1.1 Problemática Tal se ha visto en el apartado de descripción del problema, el objetivo aquí consiste en la simulación de una máquina, para ello el concepto de máquina se concreta en una serie de mediciones obtenidas con varios sensores (X) que ofrecen medidas del comportamiento interno de dicha máquina, junto a factores (F) de configuración de la máquina que el usuario puede fijar, variables externas (W) procedentes del entorno o de otras máquinas. Todo ello nos ofrece finalmente una predicción de variables calidad (Q). Por lo tanto para poder obtener el modelo digital deberemos de poder establecer relaciones: X = ℱ(𝑋𝑔, F, W) Q = ℱሺX, F, Wሻ Donde tal y como se puede observar deberemos primero de obtener X para lo que además de F necesitaremos Xg. Esta variable n-dimensional Xg la vamos a estimar mediante simulación. Pero aquí hemos de darnos cuenta que dicha simulación no es una simulación unidimensional al uso, C1 M1 Cp Mp… 27 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales pues dicha variable es n-dimensional, y cuando la simulemos deberemos de hacerlo con sentido, respetando la estructura de correlaciones existente entre todas las dimensiones que la conforman. Otro aspecto a tener en cuenta consiste en que la evolución de los sensores de la máquina guardan una clara relación cronológica con el tiempo, de tal forma que los valores que se estén simulando en un momento dado tendrán una autocorrelación directa con determinados valores pasados y no son el producto de una simulación aleatoria sin contexto pasado. Una vez obtenida la variable Xg, y puesto que los factores externos no han formado parte de dicha simulación, se ha de poder introducir a estos F junto a las condiciones externas W, para conseguir valores reales X que se vean influenciados por los valores tomados por los diferentes parámetros F y W en un momento dado. Finalmente, las variables de calidad, Q, serán predichas a partir de los valores X, F y W que resulten significativos a la hora de predecir dichos valores de calidad Q. 3.1.2 Técnicas involucradas El Gemelo Digital que aquí se expone se compone de la aplicación de diversas técnicas hasta completar todas y cada una de las partes que lo implementan. Así, las partes a implementar son: simulación Xg, dotar de sentido temporal a las simulaciones, estimación del efecto de los factores de configuración de la máquina sobre el valor final de los sensores simulados, estimación de las variables de calidad a partir de los valores de sensores simulados y los factores de configuración. Para cada una de las partes se van a aplicar diferentes técnicas estadísticas y de Machine Learning. 3.1.2.1 Simulación de Xg Aquí se va a aplicar una proyección PCA [18,19,20,21,22] que convierte las características originales en nuevas características que garantizan una mejor situación de normalidad y ortogonalidad que las características originales. A partir de esta conversión se hace uso de un simulador gaussiano multidimensional de estas nuevas características, generándose tantos puntos como se puedan y almacenándolos en un almacén de datos Big Data, donde a cada nuevo punto se le dota de un índice calculado mediante una función de hashing que se fundamenta en el cálculo de percentiles de la gaussiana unidimensional teórica que modelaría cada una de las componentes, consiguiendo así una distribución uniforme del número de sacos de cada grupo que identifique la función de hashing. La necesidad de introducir un índice para los puntos guardados está relacionada con la necesidad posterior de realizar búsquedas rápidas por cada uno de los puntos que se deseen simular posteriormente. Para poder garantizar que la simulación realizada es equivalente desde un punto de vista poblacional con la población de datos originales, se aplicará el test estadístico de T2-Hotelling [31]. 3.1.2.2 Dotar de sentido temporal a las simulaciones El resultado de una simulación gaussiana consiste en una serie de puntos generados de forma aleatoria sin ninguna estructura secuencial y temporal, donde el valor de un punto generado en un momento dado no depende del valor de los puntos generados en instantes anteriores. Este modo de funcionamiento, que puede ser muy útil en una gran parte de los problemas no nos es útil aquí directamente pues el tipo de simulación a realizar aquí debe de llevar implícita la estructura secuencial y temporal de una típica serie temporal en un proceso industrial. Esto nos 28 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales lleva a la necesidad de introducir un modelo que de alguna manera prediga el valor del siguiente instante en función de los valores anteriores, guardando así la estructura secuencial y temporal de la serie. Para poder introducir esta secuencia se hará uso de modelos ARIMA [23,24,25,26,27,28,29,30] (Autoregressive Integrated Moving Average) o redes recurrentes LSTM [34,35] sobre las componentes PCA que se ha decidido utilizar en la simulación gaussiana. 3.1.2.3 Estimación del efecto de F y W sobre X. Con la simulación expuesta anteriormente se tendría una simulación multidimensional de los sensores internos de una máquina. Existen ocasiones en los que además de estos sensores se dispone de una serie de factores de configuración o incluso valores de estado externos (F), que se prefijan a unos valores durante la producción o en los diferentes instantes, por ejemplo: tengo o no tengo pieza. La introducción de estos factores de configuración suele tener algún tipo de influencia sobre los valores que finalmente toman los sensores. Para poder simular de manera más realista se ha de corregir la simulación anterior con algún tipo de error proveniente de la influencia que estos sensores tienen sobre los sensores internos. De manera general, los valores finalmente generados (X) serán: X = Xg+E donde E se estimará como función de: E = ℱ(𝑋𝑔, F, W) dicha función F se estimará aplicando técnicas estadísticas y de Machine Learning como: PLS, Ecuaciones estructurales, Regresión Lineal, SVM, Redes Neuronales, etc. Una vez estimada la función ya se está en posición de realizar una simulación más realista que incluya la posible influencia de los factores de entrada. 3.1.2.4 Estimación de las variables de calidad. Otro aspecto a considerar en la simulación de un Gemelo Digital son las variables de salida (Q). Estas variables de salida son variables dependientes de las variables de las variables explicativas X, F y W anteriormente expuestas. Algunas de estas variables de salida serán la entrada a alguna parte del proceso que une las diferentes máquinas en un proceso productivo de nivel de abstracción superior. Para poder ser modeladas se requerirá la estimación de una función: Q = ℱሺX, F, Wሻ Para realizar dicha estimación de la función F se podrá hacer uso de técnicas estadísticas y de Machine Learning similares a las vistas en el punto anterior: PLS, Ecuaciones estructurales, Regresión Lineal, SVM, Redes Neuronales, etc. Finalmente, una vez estimada esta función ya se estará en posición de realizar una simulación de la salida en función de las simulaciones de las entradas, esto permitirá observar el comportamiento simulado de la máquina al completo y su interconexión con otras partes del proceso. 29 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 3.1.3 Big Data en el Gemelo Digital Los procesos de simulación suelen ser más fieles a la realidad conforme mayor sea el número de puntos simulados, pues a mayor número de puntos mejores estimaciones de los parámetros de interés. Por otra parte, cuanto mayor sea el número de puntos simulados, mayor será la necesidad de espacio para su almacenamiento y mayor el tiempo requerido para la búsqueda de dichos puntos simulados, esto plantea dos problemas, relacionados con el volumen de datos y la velocidad de acceso a éstos. En el simulador multidimensional que se plantea se presentan ambos problemas, pues se requiere de un sistema capaz de almacenar un gran volumen de datos y capaz, a su vez, de ofrecer las simulaciones en un tiempo razonable una vez el sistema esté en producción. Además las necesidades de volumen y de tiempos de búsqueda adecuados crecen de manera no lineal conforme mayor sea el número de dimensiones de nuestro simulador multidimensional. 3.1.3.1 Acceso a datos Las técnicas de Big Data [32] en el proceso de simulación van a jugar un papel relevante en la persistencia de los datos simulados mediante el uso del simulado Gaussiano, para lo que se hará uso de almacenes de datos NoSQL distribuidos que nos garantizan escalado transparente y replicación. Además, el proceso de simulación del Gemelo Digital implica una búsqueda del punto más cercano entre todos los puntos generados. Para poder realizar dicha búsqueda en tiempo razonable para la simulación será necesario realizarla con una arquitectura distribuida [33]. Las BBDD distribuidas NoSQL, nos ofrecen la posibilidad de almacenar tantos puntos como necesitemos, pues dichos puntos se distribuyen entre los nodos existentes en un clúster y se trata conceptualmente de BBDD elásticas en el sentido de que sus capacidades crecen de manera transparente al introducir más nodos en dichos clústers. En cuanto a la velocidad de la búsqueda de los puntos gaussianos más cercanos, se plantean dos soluciones que se llevarán a cabo a la vez, una primera solución consiste en hacer uso de un índice de partición a partir de una función de HASHING que distribuya uniformemente los puntos bajo un mismo índice y por otra parte, una segunda solución, intrínseca ésta al propio concepto de BBDD distribuida, que consiste en que, al tratarse de una BBDD distribuida, las búsquedas de los puntos apropiados durante la simulación la realizan todos los nodos de forma paralela. Con éste planteamiento la velocidad de acceso a los puntos la podemos adaptar de manera sencilla a las necesidades temporales del simulador propuesto, buscando el compromiso apropiado entre el volumen de datos deseado, nivel de profundidad de la clave de hash pues un mayor nivel de profundidad de la clave hash produce un menor número de puntos, aglutinados bajo un mismo identificador, sobre los que realizar la búsqueda, y el número de nodos en el clúster, pues la búsqueda de los puntos más cercanos con el identificador ofrecido por la función de hash se realiza de manera paralela por todos los nodos que conforman nuestro clúster. Concretamente la BBDD NoSQL que vamos a utilizar es Cassandra. Cassandra es una base de datos NoSQL columnar distribuida basada en software libre y desarrollada por Facebook, permite una alta escalabilidad a lo largo de distintos data centers 30 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales sobre hardware estándar, proporciona alta disponibilidad sin que ningún nodo actúe como punto de fallo único. La propia arquitectura de Cassandra es la responsable de su capacidad para escalar, ejecutar, y ofrecer ejecución de forma permanente en el tiempo. En lugar de utilizar un modelo esclavo- servidor o una arquitectura fragmentada difícil de mantener, Cassandra tiene un diseño en forma de anillo sin maestro, que es elegante, fácil de instalar y fácil de mantener. En Cassandra, todos los nodos tienen un rol idéntico; no existe el concepto de nodo principal, todos los nodos se comunican entre sí por igual. La arquitectura de Cassandra permite que sea capaz de manejar grandes cantidades de datos, miles de usuarios y miles de operaciones por segundo, concurrentes incluso a través de múltiples data centers. No tiene ningún punto único de fallo y por lo tanto es capaz de ofrecer disponibilidad y acceso continuo. En caso de necesidad para poder ampliar el servicio únicamente hay que añadir nuevos nodos al clúster existente sin tener que parar el servicio. Figura 18. Incremento del tiempo de respuesta con el número de nodos del cluster. Los puntos a destacar son los siguientes: Descentralizada: Cada nodo del clúster posee el mismo rol, no hay punto único de ruptura, la información se distribuye uniformemente a lo largo del clúster. Capacidad de réplica y escalabilidad: Un clúster puede ser replicado en distintos data centers a modo de réplica y cada clúster puede aumentar el número de nodos para aumentar la capacidad del mismo Tolerancia a fallos: La información es replicada en distintos nodos para tolerancia a fallos y la gestión de errores es gestionada de forma transparente. Soporte map/reduce: Dispone de integración con Apache Hadoop así como Apache Pig y Apache Hive. 3.1.3.2 Estimación de algoritmos La obtención de un Gemelo Digital conlleva la estimación de una serie de modelos que representen el comportamiento real del proceso que se desea modelar. En el simulador que se plantea aquí, la estimación de dichos modelos se basa en la obtención de una serie de mediciones obtenidas a partir del funcionamiento real de dicho objeto o proceso. Estas mediciones son la fuente de información necesaria para la estimación de los parámetros de dichos modelos. Dicha estimación será tanto mejor conforme más evidencias se tengan sobre dicho proceso y mayor sea el número de posibles configuraciones que se estudien para dicha estimación. Cuanto mayor sea el número de muestras de aprendizaje y mayor el número de configuraciones estudiadas mayores serán las necesidades de cómputo, y memoria necesarias. La disponibilidad de una arquitectura de cómputo paralela y distribuida que cumpla con las propiedades 31 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales anteriormente mencionadas, además de la posibilidad de disponer de GPUs en los nodos de cómputo, redundará en una mejora de la calidad de los modelos estimados, pues se podrán realizar más cálculos en el mismo tiempo además de disponer de mayor cantidad de memoria disponible. Esta mejora de los modelos redundará finalmente en la obtención de mejores simulaciones en el Gemelo Digital, consiguiendo así mejores aproximaciones a la máquina real, de la cual nuestro gemelo es una copia. En el simulador que planteamos se dan estos problemas, pues se requiere de un sistema capaz, de obtener modelos de simulación realistas, almacenar un gran volumen de datos y de ofrecer simulaciones en un tiempo razonable. El simulador ha de ser escalable conforme a las necesidades del proceso que se esté simulando en cada momento, y ha de tener una probabilidad baja de fallo, por falta de comunicación o caída de la máquina que contiene al gemelo digital. Para esta parte, y puesto que se dispone de un clúster paralelo distribuido, se puede hacer uso de Spark-ML y la programación funcional, que es directamente distribuible y paralelizable, además de TensorFlow, para algunos de los modelos a estimar, que hará uso de las GPUs de manera transparente si se dispone de dicha capacidad. 3.2 Modelado y simulación dinámica de procesos industriales 3.2.1 Simulación discreta de eventos (DES) Los sistemas de simulación discreta de eventos modelan la operación de un sistema como una secuencia de eventos en el tiempo. Cada evento ocurre en un instante de tiempo y marca un cambio en el estado del sistema. Entre eventos que tienen lugar de forma consecutiva no se produce ningún tipo de cambio ni alteración del sistema, ya que se simula que la salida de un evento es la entrada de otro consecutivo. Para aplicar esta técnica es necesario que las variables que definen el sistema no cambien su comportamiento durante el intervalo simulado. Estos sistemas se caracterizan por mantener un estado íntegro del sistema, que puede cambiar por la ocurrencia de un evento. El estado del sistema solo cambia mediante la ejecución de los eventos y por uno o varios procesos dedicados a su ejecución que, a medida que pasa el tiempo de simulación y los eventos terminan, eliminan los eventos pendientes para el valor de tiempo actual. La ejecución de un evento puede desencadenar la generación de nuevos eventos futuros, donde cada uno está marcado por su tiempo y por el orden de generación, que puede no coincidir con el orden de ejecución. Dentro de los sistemas de simulación discreta de eventos se distingue: Tiempo de simulación: valor de tiempo que el simulador puede avanzar a una velocidad superior a la habitual de un reloj común, evolucionando así el estado de un sistema de forma acelerada. Evento: suceso que hace cambiar las variables de estado del sistema. Durante el procesamiento de un evento el tiempo de simulación permanece fijo. Un evento pertenece a una entidad, y normalmente solo cambia atributos de esta, dejando invariante el resto del sistema. Entidad: el sistema a simular se modela sobre la base de entidades o actores que representan, en conjunto, al sistema completo. El estado del sistema se entiende, entonces, como el agregado de los estados que lo conforman. Actividad: secuencia de eventos pertenecientes a una entidad que cierran un ciclo funcional. A diferencia de un evento, que se ejecuta a tiempo de simulación constante, una actividad se desarrolla dentro de un intervalo de tiempo de simulación no puntual. 32 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Simulación en tiempo acelerado: cuando el avance del tiempo de simulación es mayor de un segundo por cada segundo de tiempo real. Simulación en tiempo real: cuando el avance del tiempo de simulación es exactamente de un segundo por cada segundo de tiempo real. 3.2.2 Tipos de modelos La forma más inmediata para estudiar un sistema es experimentar sobre él. Sin embargo, esto puede ser desaconsejable e incluso imposible por varios motivos: 1. Es posible que el sistema no exista y lo que se pretende sea, precisamente, su diseño. 2. Porque sea inviable económicamente experimentar sobre el sistema real. 3. Porque la experimentación sobre el sistema real puede conllevar unos plazos de tiempo muy dilatados. En cualquier caso, es necesario construir un modelo que refleje lo más fielmente posible las características del sistema a analizar y la experimentación que se llevará a cabo sobre éste. Los modelos físicos están formados por una estructura material que tiene unas características, en cuanto al objeto del estudio, similares a las del sistema real. Un modelo matemático, sin embargo, representa el sistema por medio de relaciones lógicas y cuantitativas entre sus variables de estado. Una vez construido se debe analizar cómo utilizarlo para resolver las preguntas planteadas sobre el sistema. Si el modelo matemático es sencillo, se podrá resolver de forma analítica para obtener una solución exacta a las preguntas. Si el modelo es complejo, se deberá recurrir a su simulación, proporcionando valores a determinadas variables de estado y calcular cuál es el valor resultante para el resto de variables, obteniendo así una representación o muestra de las posibles respuestas del modelo (del sistema que representa) ante distintas condiciones de partida. 3.2.3 Necesidad de la simulación La complejidad a la hora de representar un modelo matemático puede tener varias causas: En los sistemas continuos, cuando una o varias variables de estado representen la tasa o velocidad de cambio de otras variables de estado, siendo necesario el uso de ecuaciones diferenciales que indiquen este tipo de relaciones. En los sistemas discretos, con la aparición de fenómenos aleatorios que solo pueden ser representados en términos probabilistas. En este caso, la formulación matemática implica relaciones donde aparecen funciones de distribución o de densidad de probabilidad, dificultando así su resolución analítica. 3.2.4 Ventajas e inconvenientes de la simulación Algunos de los argumentos a favor de la utilización de la simulación son: La mayoría de los sistemas no se pueden describir con precisión suficiente mediante un modelo matemático que se pueda resolver analíticamente. Por ello, con frecuencia la simulación es el único método posible de estudio de estos sistemas. La simulación permite estimar el comportamiento de un sistema existente bajo un conjunto previsto de condiciones. Permite la comparación de diseños o políticas de operación alternativas para especificar cuál es el que cumple de forma más adecuada los objetivos formulados. 33 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales Se puede tener un control sobre las condiciones del experimento que si re realizara sobre el propio sistema. Permite estudiar un sistema cuya evolución se dilata en el tiempo en un periodo reducido de tiempo. Por otra parte, entre los inconvenientes se encuentran: Por regla general, los modelos de simulación consumen una cantidad elevada de recursos técnicos y humanos durante un periodo prolongado de tiempo. La gran cantidad de información que proporcionan, unido a veces a su capacidad de persuasión de algunos paquetes gráficos, hacen que, a menudo, se confíe en exceso en los resultados que proporcionan. SI un modelo de simulación no proporciona una representación válida del sistema real, la información que suministra puede no ser validada o, incluso, puede conducir a la toma de decisiones erróneas. 3.2.5 Construcción del modelo. Verificación, validación y credibilidad Una vez construido y validado el modelo de simulación, se debe seleccionar el lenguaje que se va a utilizar para su programación. He aquí una lista: Lenguajes de propósito general, como FORTRAN, C y C++. Librerías
Compartir