E5_1_Estado del arte y análisis de técnicas Big Data en Gemelos Digitales

•
Cesar Vallejo

Maik
21/3/2024
Esta es una vista previa del archivo. Inicie sesión para ver el archivo original
31/12/2017 
 
 
PROYECTO COFINANCIADO POR: 
 
GEMELOS DIGITALES en la transición a la Industria 4.0 
Estado del arte y análisis de las técnicas Big 
Data en Gemelos Digitales 
Entregable E5.1 
 
 
 
 
1 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
 
Información del documento 
Título: Estado del arte y análisis de las 
técnicas Big Data en Gemelos Digitales 
Title: State of the art and analysis of Big Data 
techniques for Digital Twins 
Cod. documento: Entregable E5.1 
Proyecto: “DIGITAL TWINS: Gemelos Digitales en 
la transición a la Industria 4.0” 
Fecha publicación: 31/12/2017 
 
Palabras clave: Gemelo digital, Big Data, Simulación, 
Redes de petri 
 
 
 
 
 
 
 
 
 
ITI - Instituto Tecnológico de Informática 
Camino de Vera, s/n. Edif. 8G. Acc. B – 4ª planta 
46022 Valencia - España / Spain 
www.iti.es 
 
Personas de 
contacto: 
Sr. Salvador Santonja, Project Leader 
R&D Area 
TLF: +34 963 877 069; Email: ssantonja@iti.es 
 
 
Agradecimientos: Las actividades descritas en este documento se encuadran en el proyecto ““DIGITAL TWINS: Gemelos 
Digitales en la transición a la Industria 4.0””, que está cofinanciado por el Instituto Valenciano de Competitividad 
Empresarial (IVACE) y por la Unión Europea a través del Fondo Europeo de Desarrollo Regional (FEDER), dentro del 
programa de ayudas dirigidas a centros tecnológicos de la Comunidad Valenciana para proyectos de I+D en cooperación 
con empresas 2017, con nº expediente IMDEEA/2017/103. 
Nota legal 
Este documento está bajo una Licencia Creative Commons Atribución-NoComercial-
SinDerivar 4.0 Internacional. Se permite libremente copiar, distribuir y comunicar 
públicamente esta obra siempre y cuando se reconozca la autoría y no se use para fines 
comerciales. No se puede alterar, transformar o generar una obra derivada a partir de esta obra. Los 
derechos de autor de todas las marcas, nombres comerciales, marcas registradas, logos e imágenes 
pertenecen a sus respectivos propietarios. 
http://www.iti.es/
http://creativecommons.org/licenses/by-nc-nd/4.0/
http://creativecommons.org/licenses/by-nc-nd/4.0/
 
 
 
 
2 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
 
Resumen 
DIGITAL TWINS (Gemelos Digitales en la 
transición a la Industria 4.0) es un proyecto 
financiado por el Instituto Valenciano de 
Competitividad Empresarial (IVACE) y la 
Unión Europea a través del Fondo Europeo de 
Desarrollo Regional (FEDER). 
El objetivo general del proyecto es avanzar en 
la definición, modelado y construcción de los 
Gemelos Digitales en el marco de la Industria 
4.0, y demostrar la nueva dimensión de 
herramientas y servicios que se pueden 
construir sobre ellos para mejorar sus 
transferibilidad y aplicación en el tejido 
industrial de la Comunitat Valenciana. 
El objetivo del entregable se centra en 
analizar el estado del arte, la técnica, 
tendencias y tecnologías Big Data aplicadas 
para la construcción de Gemelos Digitales en 
el contexto de la Industria 4.0. En concreto, el 
documento recoge los resultados de las 
tareas llevadas a cabo para la identificación, 
selección y experimentación de las técnicas y 
tecnologías que intervienen en: la 
Representación Visual de los procesos 
productivos, la Simulación de procesos 
industriales y la Optimización de las variables 
o factores que intervienen en la definición de 
escenarios de funcionamiento de los Gemelos 
Digitales en procesos industriales. 
 
 
Abstract 
DIGITAL TWINS (Digital Twins in the transition 
to Industry 4.0) is a project funded by the 
Valencian Institute for Business 
Competitiveness (IVACE) and the European 
Union through the European Regional 
Development Fund (FEDER). 
The general objective of the project is to 
advance in the definition, modeling and 
construction of Digital Twins in the 
framework of Industry 4.0, and demonstrate 
the new dimension of tools and services that 
can be built on them to improve their 
transferability and application in the 
Valencian Community industry. 
The objective of the deliverable focuses on 
analyzing the state of the art, the technique, 
trends and Big Data technologies applied to 
the development of Digital Twins in the 
context of Industry 4.0. Specifically, the 
document includes the results of the tasks for 
the identification, selection and 
experimentation of the techniques and 
technologies involved in: Visual 
Representation of production processes, 
Simulation of industrial processes and 
Optimization of variables or factors that 
intervene in the definition of operating 
scenarios of Digital Twins in industrial 
processes. 
 
 
 
 
 
 
3 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
Contenido 
Resumen .......................................................................................................................... 2 
Abstract ........................................................................................................................... 2 
1 Introducción .............................................................................................................. 5 
1.1 Objetivos del Paquete de Trabajo 5 ............................................................................. 5 
1.2 Objetivo del presente documento ............................................................................... 5 
2 Estado del Arte de técnicas Big Data para Gemelos Digitales....................................... 6 
2.1 Gemelo Digital ............................................................................................................. 6 
2.1.1 Concepto ....................................................................................................... 6 
2.1.2 Definición ...................................................................................................... 7 
2.1.3 Control de sistemas complejos ..................................................................... 7 
2.1.4 Machine Learning Control (Smart control) y Gemelo Digital ....................... 9 
2.1.5 Gestión del ciclo de vida del producto (PLM) ............................................. 10 
2.1.6 Gemelo Digital como parte de Smart Products .......................................... 12 
2.1.7 Gemelo digital en la Industria 4.0 .............................................................. 12 
2.1.8 Cadena de suministro cognitiva (Cognitive Supply Chain) ......................... 15 
2.2 Sector Industrial al que se dirige............................................................................... 17 
2.3 Modelo de referencia ................................................................................................ 18 
2.4 Retos tecnológicos ..................................................................................................... 22 
3 Análisis de las técnicas Big Data para Gemelos Digitales ............................................ 23 
3.1 Construcción de un Gemelo Digital ........................................................................... 24 
3.1.1 Problemática .............................................................................................. 26 
3.1.2 Técnicas involucradas ................................................................................. 27 
3.1.3 Big Data en el Gemelo Digital..................................................................... 29 
3.2 Modelado y simulación dinámica de procesos industriales ...................................... 31 
3.2.1 Simulación discreta de eventos (DES) ......................................................... 31 
3.2.2 Tipos de modelos ........................................................................................ 32 
3.2.3 Necesidad de la simulación ........................................................................ 32 
3.2.4 Ventajas e inconvenientes de la simulación ...............................................
32 
3.2.5 Construcción del modelo. Verificación, validación y credibilidad ............... 33 
3.2.6 Estudio de herramientas de simulación ..................................................... 33 
 
 
 
 
4 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
3.2.7 Redes de Petri ............................................................................................. 35 
3.3 Optimización de procesos industriales ...................................................................... 36 
3.3.1 Deep Learning ............................................................................................. 37 
3.3.2 Reinforcement Learning ............................................................................. 41 
3.3.3 Deep Reinforcement Learning .................................................................... 44 
3.4 Tecnologías para la representación visual de un Gemelo Digital .............................. 49 
3.4.1 Librerías de Javascript ................................................................................ 50 
3.4.2 Representación de grandes cantidades de datos ....................................... 53 
4 Referencias .............................................................................................................. 55 
 
 
 
 
 
 
5 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
1 Introducción 
1.1 Objetivos del Paquete de Trabajo 5 
El objetivo del paquete de trabajo se centra en el estudio de las técnicas y tecnologías Big Data 
Analytics de representación digital de sistemas físicos para la construcción Gemelos Digitales 
en el ámbito de la Industria 4.0. Además, se realizará una prueba de concepto de los 
resultados obtenidos en los estudios con datos de una empresa cooperante en un contexto de 
producción real. En definitiva, el paquete pretende resolver la problemática asociada a la 
dificultad técnica que implica manejar, representar e interpretar una gran cantidad de datos 
generada por planta de fabricación en continuo. 
Los resultados esperados del paquete se centran en (i) la evaluación del potencial de uso de 
tecnologías Big Data para la concepción de Gemelos Digitales sobre entornos masivamente 
sensorizados, (ii) la validación de la necesidad de uso de técnicas Big Data y Machine Learning 
para la representación avanzada no sólo del estado, sino de las características y 
comportamiento de los elementos físicos a los que el Gemelo Digital emula del entorno real en 
la empresa, y (iii) probar y validar una solución en el ámbito de los Gemelo Digitales en un caso 
de uso en entorno relevante (planta industrial de empresa cooperante). 
1.2 Objetivo del presente documento 
El objetivo del entregable E5.1 se centra en analizar el estado del arte, la técnica, tendencias y 
tecnologías Big Data aplicadas para la construcción de Gemelos Digitales en el contexto de la 
Industria 4.0. 
En concreto, el documento recoge los resultados de las tareas llevadas a cabo para la 
identificación, selección y experimentación de las técnicas y tecnologías que intervienen en: 
 La construcción del Gemelo digital mediante la simulación multivariante de señales 
de comportamiento de los elementos físicos que intervienen. 
 La Simulación de procesos industriales mediante la definición de condiciones, 
transiciones y eventos que permitan al usuario realizar experimentos y analizar el 
comportamiento de los Gemelos Digitales. 
 La Optimización de las variables o factores que intervienen en la definición de 
escenarios de funcionamiento de los Gemelos Digitales en procesos industriales, 
permitiendo así realizar actuaciones sobre el Gemelo Físico. 
 La Representación Visual de los procesos productivos en los que interviene el Gemelo 
Digital, un conjunto de indicadores de Eficiencia Productiva que permitan evaluar su 
funcionamiento y configuración y grandes volúmenes de datos que modelen su 
comportamiento ante unos factores externos definidos por los nuevos escenarios. 
 
 
 
 
6 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
2 Estado del Arte de técnicas Big Data para Gemelos Digitales 
2.1 Gemelo Digital 
2.1.1 Concepto 
El concepto de gemelo digital se remonta al año 2002 en la Universidad de Míchigan (EEUU), 
en el contexto de una presentación realizada a la industria por Michael Grieves sobre la 
gestión del ciclo de vida de un producto (Product Lifecycle Management, PLM). De hecho, y 
aunque no se llamó específicamente gemelo digital, la transparencia en cuestión (“Conceptual 
ideal of PLM”) presenta los tres elementos que de forma general definen un gemelo digital: 
mundo real, mundo virtual, y el enlace entre ambos, que implica flujo de datos del mundo real 
al mundo virtual, y de información en el otro sentido. 
 
Figura 1. "Conceptual ideal for PLM". Michael Grieves introduce por primera vez el 
concepto de gemelo digital en 2002 (Universidad de Míchigan) 
 
Desde entonces, el concepto gemelo digital se ha aplicado a numerosos y variados ámbitos, y 
en muchos casos se ha particularizado para englobar no todo el ciclo de vida de un producto, 
sino fases más específicas, y sobre todo y más concretamente la fase de uso del producto. 
Pero como se explicará más tarde, en principio el concepto gemelo digital está pensado para 
englobar todas las fases del ciclo de vida del producto: diseño, fabricación, uso y eliminación y 
reciclaje, poniendo de relieve que el gemelo digital es dinámico, acompaña a su gemelo físico, 
se integra en diferentes entornos (que por otra parte le afectan y condicionan en su evolución) 
y aporta diferentes ventajas y funcionalidades dependiendo de la fase en la que se aplique. 
 
2010 / 
2012 
An integrated multi-physics, multi-scale, probabilistic simulation of a vehicle or system that uses 
the best available physical models, sensor updates, fleet history, etc., to mirror the life of its flying 
twin. The digital twin is ultra-realistic and may consider one or more important and interdependent 
vehicle systems. 
2012 A cradle-to-grave model of an aircraft structure’s ability to meet mission requirements, including 
submodels of the electronics, the flight controls, the propulsion system, and other subsystems 
2012 Ultra-realistic, cradle-to-grave computer model of an aircraft structure that is used to assess the 
aircraft’s ability to meet mission requirements 
2013 Coupled model of the real machine that operates in the cloud platform and simulates the health 
condition with an integrated knowledge from both data driven analytical algorithms as well as 
other available physical knowledge 
 
 
 
 
7 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
2013 Ultra-high fidelity physical models of the materials and structures that control the life of a vehicle 
2013 Structural model which will include quantitative data of material level characteristics with high 
sensitivity 
2015 Very realistic models of the process current state and its behavior in interaction with the 
environment in the real world 
2015 Product digital counterpart of a physical product 
2015 Ultra-realistic multi-physical computational models associated with each unique aircraft and 
combined with known flight histories 
2015 High- fidelity structural model that incorporates fatigue damage and presents a fairly complete 
digital counterpart of the actual structural system of interest 
2016 Virtual substitutes of real world objects consisting of virtual representations and communication 
capabilities making up smart objects acting as intelligent nodes inside the internet of things and 
services 
2016 Digital representation of a real world object with focus on the object itself 
2016 The simulation of the physical object itself to predict future states of the system 
2016 Virtual representation of a real product in the context of Cyber-Physical
Systems 
2016 An integrated multi-physics, multi-scale, probabilistic simulation of an as-built system, enabled by 
Digital Thread, that uses the best available models, sensor information, and input data to mirror 
and predict activities/performance over the life of its corresponding physical twin 
2016 A unified system model that can coordinate architecture, mechanical, electrical, software, 
verification, and other discipline specific models across the system lifecycle, federating models in 
multiple vendor tools and configuration-controlled repositories 
Tabla 1. Definiciones de gemelo digital en la literatura científica (2012-2016) [1] 
2.1.2 Definición 
 En cualquier caso, existen numerosas definiciones de gemelo digital. Los autores en [1] han 
realizado una búsqueda exhaustiva en la literatura desde 2012 (cuando aparece el concepto de 
Industria 4.0) hasta 2016, seleccionando todas las publicaciones que contienen el término 
“digital twin” en el título, en el abstract o en la lista de palabras clave. Las diferentes 
definiciones de gemelo digital, encontradas por los autores en la literatura, quedan reflejadas 
en la Tabla 1. 
Como comentan los autores en [1], la primera definición fue acuñada por la NASA en su 
“Modeling, Simulation, Information, Technology & Processing Roadmap” en 2010. El objetivo 
de este gemelo era reproducir de forma lo más fidedigna posible la vida de los vehículos 
espaciales, incluyendo elementos probabilísticos, datos históricos y datos procedentes de 
sensores, así como interacciones con el mundo real. En subsiguientes trabajos también se van 
incluyendo el ciclo de vida completo del producto, los requisitos dependiendo de la misión a la 
que es destinado, y el uso del gemelo para la prognosis y el diagnóstico. Más adelante, se 
generaliza desde vehículos espaciales a cualquier tipo de producto, y se sientan las bases para 
la aplicación del gemelo digital en entornos avanzados de fabricación, incluyendo ya 
elementos de industria 4.0, big data o cloud. 
2.1.3 Control de sistemas complejos 
La necesidad del gemelo digital surge de la necesidad de modelar de la forma más fidedigna 
posible la evolución de sistemas cada vez más complejos, y sometidos a diferentes 
 
 
 
 
8 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
condiciones de entorno. En este sentido, se ha pasado de modelos descriptivos (lo que incluye 
métodos tradicionales de simulación, CAD, etc…) en los que lo importante era modelar la 
forma de un objeto, a modelos accionables, en los que se también se pretenden simular las 
fuerzas físicas que actúan sobre el modelo en cada momento, y en los que lo importante es 
determinar el comportamiento de un sistema a lo largo del tiempo. 
 
Figura 2. Evolución de las necesidades de modelado y justificación del gemelo digital 
 
En este sentido, el gemelo digital está íntimamente ligado al estudio de sistemas dinámicos 
complejos, y la necesidad de predecir (y/o atenuar) el comportamiento emergente imprevisto 
e indeseable (unpredicted and undesirable emergence behaviour) que aparece en dichos 
sistemas. Esta relación es planteada por Michael Grieves en el capítulo “Digital Twin: 
Mitigating Unpredictable, Undesirable Emergent Behaviour in Complex Systems” [6], que está 
incluido en su libro sobre el estudio de dichos sistemas complejos. Un sistema complejo está 
compuesto por varias partes interconectadas o entrelazadas cuyos vínculos crean información 
adicional no visible antes por el observador. Como resultado de las interacciones entre 
elementos, surgen propiedades nuevas que no pueden explicarse a partir de las propiedades 
de los elementos aislados. Dichas propiedades se denominan propiedades emergentes. Esto 
implica que el comportamiento de estos sistemas puede plantear problemas completamente 
imprevistos, que pueden suponer un fallo del sistema, e incluso la completa destrucción del 
mismo. 
Tradicionalmente, el control autónomo de sistemas, con o sin realimentación, ha sido el 
campo que se ha dedicado a desarrollar mecanismos para, dado un sistema observable, y 
sometido a unas determinadas condiciones externas, diseñar un mecanismo de control 
automático que, aplicado al sistema, lo mantenga dentro de unos determinados parámetros 
de comportamiento, englobados en una función de coste. En el caso de que el proceso de 
control incluya feedback, los paralelismos con el concepto de gemelo digital son obvios, como 
se puede ver en la figura adjunta, en la que se aprecia que las funcionalidades y objetivos del 
controlador y del gemelo digital son similares: 
https://es.wikipedia.org/wiki/Emergencia_(filosof%C3%ADa)
 
 
 
 
9 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
 
Figura 3. Sistema de control con realimentación, en el que se aprecian similitudes con 
el concepto de gemelo digital 
 
En este caso, se obtienen observaciones del sistema real mediante un conjunto de sensores, y 
el controlador, mediante una ley de control definida de antemano, y en base a las 
observaciones que obtiene, y al conocimiento previo de las dinámicas del sistema, calcula la 
actuación a aplicar sobre el sistema de tal manera que cierta función de coste es minimizada. 
Aunque existe una gran cantidad de literatura sobre el tema, y la comunidad dedicada al 
estudio de este tipo de escenarios es numerosa, el problema anterior sólo tiene solución bajo 
unas condiciones muy determinadas, en concreto cuando el sistema a controlar es lineal, el 
ruido que le afecta es gaussiano, y la función de coste a minimizar cuadrática (Linear Quadratic 
Gaussian Control [7]). En el resto de casos, las soluciones obtenidas son sub-óptimas. En 
cualquier caso, la teoría general de control está centrada, sobre todo, en la estabilidad del 
sistema, y en asegurarse de que la salida de control no produce una divergencia completa del 
mismo. 
2.1.4 Machine Learning Control (Smart control) y Gemelo Digital 
Claramente, cuanto más complejo se vuelve el sistema, y las perturbaciones exteriores son 
más complicadas de modelar, ese tipo de control se vuelve inaplicable en este tipo de 
escenarios. Control basado en aprendizaje automático (Machine Learning Control) es un sub-
campo en el que converge teoría tradicional de control de sistemas, combinada con técnicas 
de aprendizaje automático, y está especialmente indicado para sistemas complejos no-lineales. 
En este caso, al esquema mostrado más arriba se añadiría un bucle adicional off-line, que 
permite al controlador ir aprendiendo de datos obtenidos experimentalmente. 
 
 
 
 
10 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
 
Figura 4. Bucle de control con aprendizaje automático [8] 
En este caso, las similitudes con el gemelo digital son aún mayores, ya que incorporando el 
aprendizaje automático en el controlador es posible añadir nuevos factores acerca de la 
predicción de la evolución y el comportamiento del sistema. 
Por tanto, es posible aplicar teoría general de control y más concretamente teoría específica 
de control mediante aprendizaje automático al diseño del gemelo digital. En este sentido, en el 
libro recientemente publicado “Machine Learning Control – Taming Nonlinear Dynamics and 
Turbulence” [7], los autores aplican técnicas de aprendizaje automático como “genetic 
programming” y otros algoritmos evolutivos al diseño de las leyes de control, y proporcionan 
también algunos detalles para su implementación. 
2.1.5 Gestión del ciclo de vida del producto (PLM) 
Por otra parte, si asumimos que un producto durante su ciclo de vida es un sistema dinámico 
complejo, el objetivo del gemelo digital es poder diseñar, testear, fabricar y usar una versión 
virtual de ese producto, de tal forma que podamos asegurarnos de que el diseño es realmente 
fabricable y determinar qué tipos de fallo podrá tener el sistema una vez
esté en uso. El 
sistema complejo aparece virtualmente al comienzo del ciclo de vida, cobra forma física 
durante la fase de fabricación, continúa durante la fase operativa, hasta que el producto es 
retirado y eliminado. El comportamiento emergente puede aparecer en cualquiera de estas 
fases del ciclo de vida. 
En la fase de creación, el sistema físico realmente no existe, pero comienza a tomar forma de 
forma virtual a través de un Prototipo de Gemelo Digital (Digital Twin Prototype, DTP [6]). En 
este sentido, los actuales avances en tecnología y simulación 3-D hacen que la forma del 
sistema se pueda modelar de forma avanzada, incluir movimientos e interacciones entre 
componentes, y descubrir conflictos y posibles problemas de forma rápida y eficaz. La fase de 
creación es en la que se trata de prevenir el comportamiento emergente del sistema. El diseño 
tradicional se ha centrado en verificar y validar el comportamiento deseable, y eliminar los 
problemas y fallos procedentes del comportamiento predecible y no deseable. Sin embargo, el 
DTP debe permitir identificar y eliminar el comportamiento impredecible y no deseable. 
Variando los parámetros de simulación sobre todo el rango que pueden tomar, se puede 
investigar el comportamiento no lineal del sistema, incluyendo combinaciones y 
discontinuidades que pueden dar lugar a fallos catastróficos. Finalmente, y tal y como se 
 
 
 
 
11 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
muestra en la figura 1, la posibilidad de disponer de múltiples espacios virtuales (VS1, VS2,….) 
implica que el sistema puede ser sometido a diferentes test destructivos sin un gran coste 
económico. Esto no implica que el sistema se puede someter a todas las condiciones posibles, 
pero se debe intentar en la medida de lo posible mitigar o erradicar las fuentes más relevantes 
de comportamiento emergente no previsto y no deseado. 
La siguiente fase es la de fabricación, en la que se comienza a construir el sistema físico con, 
en principio, configuraciones específicas y potencialmente únicas. Estas diferentes 
configuraciones se reflejan en diferentes Instancias del Gemelo Digital (Digital Twin Instance, 
DTI) de forma virtual. Por tanto, en esta fase el flujo es el contrario que en la fase de creación. 
En este caso, se parte de un sistema físico, y los datos de este sistema se envían al espacio 
virtual, donde se mantienen representaciones virtuales de ese sistema físico, cada una 
reflejando una configuración diferente. 
En la fase operativa o de uso, se descubre si las predicciones sobre el comportamiento del 
sistema fueron correctas. El sistema real puede cambiar tanto en forma, como en 
comportamiento, y se comprueba si se eliminó o no el comportamiento no deseable. Si se ha 
hecho un buen trabajo en la fase de diseño, el comportamiento emergente no debería 
suponer ningún problema crítico. Los sistemas real y virtual mantienen su relación y se 
comunican en ambos sentidos. A medida que el sistema físico va cambiando, estos cambios se 
incorporan al sistema virtual, y por otra parte se usa la información aportada por el sistema 
virtual para predecir el rendimiento, comportamiento y fallos del sistema físico. 
Finalmente, la fase de retirada del producto se suele ignorar, pero puede ser conveniente 
mantener la información y el conocimiento generado sobre su comportamiento, y además se 
debe tener en cuenta toda esa información acerca de componentes, etc … para evaluar su 
impacto en el entorno y la sostenibilidad. 
 
Figura 5. Evolución del gemelo digital durante el ciclo de vida del producto 
(elaboración propia a partir de la información proporcionada en [6]) 
 
 
 
 
12 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
2.1.6 Gemelo Digital como parte de Smart Products 
Poco a poco, los productos tradicionales de los que habitualmente disfrutamos están siendo 
cada vez más inteligentes, gracias al desarrollo de sensores, microprocesadores, inteligencia 
artificial y comunicaciones. Esta tendencia ha desembocado en los llamados productos 
inteligentes (Smart Products), los cuales, en general, van equipados con sistemas integrados 
que permiten la comunicación con otros productos inteligentes mediante su conexión por 
internet. Dichos productos inteligentes están capacitados para conocer su estado operativo, 
para monitorear y controlar sus procesos físicos, mantienen una cierta consciencia sobre su 
entorno, con el que interactúan al enviar mensajes y desencadenar eventos, y se les permite 
actuar de forma autónoma [11, Chapter 1]. 
Aunque las funcionalidades inteligentes del producto son aplicables durante todo su ciclo de 
vida, es durante la fase de uso del mismo (ver PLM en el apartado anterior) cuando estas 
capacidades se hacen más patentes. En este sentido, el gemelo digital del producto se puede 
considerar de forma cada vez más destacada como una parte fundamental del producto 
inteligente [10]. 
 
Figura 6. Clases de productos [10] 
 
Más concretamente, en [12] se estudia de forma detallada la reconfiguración de productos 
inteligentes durante su fase de uso, y se propone una plataforma que combina los datos 
procedentes de los gemelos digitales para dicha reconfiguración. 
2.1.7 Gemelo digital en la Industria 4.0 
Como se ha comentado en apartados anteriores, el gemelo digita se puede aplicar a múltiples 
productos y procesos, como por ejemplo el ciclo de vida completo del producto. Sin embargo, 
elaborar el gemelo digital de un proceso completo de fabricación supone un caso de elevado 
interés hoy en día. Por un lado, la continua digitalización de la industria, con la masiva 
sensorización de las plantas (mediante internet de las cosas, IoT) y la aplicación de técnicas de 
 
 
 
 
13 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
sistemas ciber-físicos, y por otro la necesidad de supervisar de una forma intensiva procesos 
cada vez más complejos de cara a evitar fallos, aumentar la eficiencia, tanto energética como 
operativa, y maximizar el rendimiento de la planta, hacen de este caso un ejemplo 
paradigmático de la aplicación de gemelo digital [5]. El análisis de los datos realizado por el 
gemelo digital puede servir para detectar tendencias erróneas en el rendimiento real del 
proceso de fabricación, en determinados aspectos y cuando se compara con el rango ideal de 
funcionamiento (nótese de nuevo la similitud de este planteamiento con el bucle de control 
con una función de coste o referencia. De hecho, en [5] se identifica el gemelo digital como un 
bucle entre el mundo digital y el físico). 
 
Figura 7. El gemelo digital como bucle entre el mundo físico y el mundo virtual (fuente: 
Deloitte University Press) 
De hecho, y Según la Asociación Alemana de Tecnología de la Información, 
Telecomunicaciones y Nuevos Medios (BITKOM), los gemelos digitales aplicados a la industria 
manufacturera tendrán un potencial económico de más de 78.000 millones de euros en 2025. 
En este contexto, y aunque claramente el concepto existe anteriormente, Microsoft introduce 
el término Gemelo Digital de Proceso, en su libro blanco “The Process Digital Twin: A step 
towards operational excellence” [9]. En dicho trabajo, en el que se analiza el impacto de la 
digitalización en la industria manufacturera, se contrapone el Gemelo Digital de Producto, que 
permite mejorar el ciclo de vida de productos aislados y el rendimiento del equipamiento 
durante ese ciclo, al Gemelo Digital de Proceso, como el siguiente nivel de la transformación 
digital, que extiende los beneficios del gemelo digital a lo largo de toda la fábrica y la cadena 
de suministro. En este sentido, el gemelo digital de proceso trasciende al gemelo digital para 
abarcar el entorno completo de producción. Dicho gemelo usa realidad aumenta, inteligencia 
artificial y computación
de alto rendimiento para optimizar no solo el equipamiento, sino todo 
el proceso, incluyendo las múltiples organizaciones a lo largo de la cadena de suministro. 
 
 
 
 
14 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
Según este trabajo, la excelencia operacional de la industria 4.0 se puede conseguir mediante 
la aplicación de este concepto, ya que permite la implementación sus principios básicos 
(fábricas interconectadas, equipamiento inteligente, y on-line) mediante una triple integración: 
vertical (procesos en una misma fábrica), horizontal (organizaciones a lo largo de la cadena de 
suministro) y optimización end-to-end (integración entre diferentes procesos de diferentes 
organizaciones). 
 
Figura 8. Limitaciones del Gemelo Digital de Producto (fuente: Microsoft "The Process 
Digital Twin: A step toward operational excellence") 
 
Figura 9. Gemelo Digital de Producto (fuente: Microsoft "The Process Digital Twin: A 
step toward operational excellence") 
 
 
 
 
15 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
Siemens también extiende el concepto de gemelo digital al proceso de producción y al 
equipamiento, según se aplique el gemelo digital en una parte u otra de la cadena de 
suministro: 
 
Figura 10. Diferentes tipos de gemelo digital, dependiendo de su posición en la cadena 
de suministro (fuente: Siemens [17]) 
2.1.8 Cadena de suministro cognitiva (Cognitive Supply Chain) 
Ahmed El Adhl (https://www.linkedin.com/in/ahmedeladl/) sostiene que los esfuerzos 
actuales para crear gemelos digitales para las máquinas existentes tienen una visión muy 
limitada a un pequeño conjunto de funcionalidades con el foco principal en la efectividad 
operacional y el mantenimiento predictivo. 
Por tanto, él va un paso más allá, y añadiendo la transformación cognitiva a la transformación 
digital, concibe el gemelo digital cognitivo como una representación digital, aumentada e 
inteligente de su par físico, incluyendo todos sus sub-sistemas y a lo largo de todo su ciclo de 
vida y evolución. 
El gemelo digital cognitivo (CDT) continúa optimizando sus capacidades, mejorando su diseño 
cognitivo, digital y físico a lo largo del tiempo en función de los datos recopilados y la 
experiencia adquirida, y no solo en función de los modelos y datos que se les ha id 
proporcionando o han ido heredando. 
https://www.linkedin.com/in/ahmedeladl/
 
 
 
 
16 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
Las características principales del gemelo cognitivo son las siguientes 
https://www.linkedin.com/pulse/emergence-cognitive-digital-physical-twins-cdpt-21st-
ahmed/): 
 sistemas cognitivos distribuidos altamente interconectados y dando lugar, en algunos 
casos, a sistemas de sistemas grandes y complejos (SoS). 
 existen en el espacio digital y evolucionan con el tiempo a medida que evoluciona su 
gemelo físico. 
 abarca el espacio físico, el digital y muy pronto el humano. 
 podrá actuar, interactuar y colaborar en los dominios físico y virtual 
 evolucionará de forma continuada para poder tomar decisiones contextuales de forma 
autónoma, y ejecutar tareas cada vez más complejas, tanto en el mundo digital como 
en el físico 
 aprenderá a lo largo del tiempo a identificar, crear y proporcionar nuevos servicios, 
que sus primeras versiones no podrían ofrecer. 
 tendrá las habilidades de autodiagnóstico físico y digital y auto-curación, mediante 
técnicas como la fabricación aditiva o tecnologías futuras similares para diseñar, 
fabricar y reemplazar autónomamente algunas partes defectuosas de su propio 
gemelo físico. 
 crearán una nueva economía masiva alrededor de los servicios inteligentes digitales 
semiautomáticos o totalmente automatizados, definidos y ofrecidos por los propios 
CDT en colaboración con los gemelos físicos y posiblemente los humanos asociados. 
 
 
Figura 11. Gemelo Digital Cognitivo (CDT) (fuente: Ahmed El Adhl) 
 
https://www.linkedin.com/pulse/emergence-cognitive-digital-physical-twins-cdpt-21st-ahmed/
https://www.linkedin.com/pulse/emergence-cognitive-digital-physical-twins-cdpt-21st-ahmed/
 
 
 
 
17 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
2.2 Sector Industrial al que se dirige 
Soluciones proporcionadas por ANSYS (sacado de la revista digital prnoticias.com): 
 Transporte. Hasta ahora, los ingenieros de una de las más importantes empresas 
europeas de transporte tardaban cuatro meses en realizar las pruebas a sus trenes de 
pasajeros, en un túnel de viento climático, para validar el diseño de los sistemas de 
calefacción, ventilación y aire acondicionado. Hoy, utilizando la simulación 
computacional de fluidos dinámicos (CFD) de ANSYS, pueden validar el diseño de estos 
sistemas en su nuevo tren ICE 4 antes de construir el primer vagón, reduciendo el 
periodo de pruebas y los costes en más de un 50%. 
 Telecomunicaciones. Wifi para las zonas incomunicadas de Brasil. Las vastas zonas 
rurales de Brasil apenas tienen acceso a internet. Instalar cables de fibra óptica no 
resulta rentable y la única solución es levantar torres que les proporcionen conexiones 
inalámbricas; aun así, la conexión wifi sólo llega al 22% de la población rural. La 
empresa Jet Towers utilizó el software de simulación de ANSYS para diseñar una línea 
de torres modulares que permite construirlas e instalarlas en solo una semana (una 
quinta parte del tiempo habitual) y por una fracción de los costes de una torre 
inalámbrica convencional. 
 Perforación. Alargar la vida de las herramientas y prevenir riesgos. Las costosas 
máquinas de perforación, fabricadas con materiales resistentes a la corrosión, están 
sometidas a un permanente desgaste, mucho mayor en los elementos de corte. Los 
investigadores de la Universidad Técnica de Dortmund utilizaron herramientas de 
fluidos y análisis estructural de ANSYS para optimizar el proceso de distribución del 
flujo refrigerante y alargar así la vida del perforador, hasta en un 50%. Y, al mismo 
tiempo, prevenir el desgaste y posibles daños y riesgos. 
 Industria. Bombas para una óptima limpieza de tuberías. Con la ayuda de la 
simulación de ingeniería de ANSYS, FMC Technologies ha logrado reducir a la mitad el 
peso de una bomba de limpieza alternativa para los conductos del alcantarillado, al 
tiempo que disminuye su impacto medio ambiental y aumenta la presión de salida del 
agua. Esta reducción de peso supone además abaratar los costes de la bomba, facilitar 
su mantenimiento y aumentar su eficiencia energética. 
 Plataformas petrolíferas. Garantizando la seguridad del almacenaje. La mayoría de 
las nuevas plataformas petrolíferas están ubicadas mar adentro, lejos de la costa. Allí, 
los sistemas de almacenamiento flotantes y los buques de descarga sufren las duras 
condiciones del océano. En el pasado, la única alternativa para garantizar que los 
petroleros pudieran soportar las peores condiciones sin sufrir daños eran costosas 
pruebas físicas. La simulación de ANSYS ha logrado reducir el número de estas pruebas 
y además obtener datos más detallados y precisos, que no podrían obtenerse de otra 
manera. 
 Telecomunicaciones. La startup que va a revolucionar la tecnología 5G. La startup 
PHAZR quiere competir con las grandes compañías en la carrera por la tecnología 5G. 
Han creado una red inalámbrica 1268 veces más rápida y 1024 veces con más 
 
 
 
 
18 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
capacidad que las actuales conexiones 4G LTE. La empresa ha aprovechado el poder 
del software de ANSYS no sólo para investigar y analizar la velocidad, la propagación 
de la frecuencia de radio o los materiales de la antena, sino también en la agilidad del 
diseño y la flexibilidad de esta tecnología de vanguardia. Y todo, sin necesidad de 
invertir
en costosos prototipos y pruebas físicas. 
 Energía (entrevista a Sham Chotai, Director de Tecnología de GE Power & Water en el 
portal http://www.fierasdelaingenieria.com). Recientemente, GE ha pilotado un 
concepto de parque eólico digital que utiliza un sistema de simulación y modelado en 
tiempo real para predecir los problemas y optimizar la producción de energía diaria. La 
compañía afirma que podría aumentar la producción de energía de un parque en un 
20%. 
Además, en el sector eólico, el gemelo digital también puede ofrecer una serie de 
ventajas más allá de la propia eficiencia. Dado que es una fuente de energía muy poco 
fiable, en el parque eólico digital es necesario hacer previsiones diarias, reaccionar y 
hacer frente mejor a mercados integrados de alta verticalidad como Norteamérica y 
Europa, donde existen múltiples fuentes de combustible. 
El objetivo es gestionar esas energías renovables, señalando al mercado lo que se 
puede producir y estabilizar la red a través de diferentes fuentes de combustible. El 
gemelo digital no es sólo para turbinas, sino para todas las restantes partes de una 
central eléctrica. Por ejemplo, un compresor podría fallar. En el caso de una planta 
nuclear, puede causar un cierre y costar millones de dólares para traer a la planta de 
nuevo en línea. Usando el concepto del gemelo digital combinado con el aprendizaje 
profundo de la máquina, se puede ser capaz de predecir de 30 a 60 días antes que un 
compresor falle. 
2.3 Modelo de referencia 
Dada la relativa novedad del concepto de gemelo digital, no existe un modelo de referencia 
extendido y aceptado universalmente como tal, que sirva para el diseño y la implementación 
de dicho gemelo digital. 
En su libro blanco [5], Deloitte propone el siguiente modelo conceptual de arquitectura: 
http://www.fierasdelaingenieria.com/
 
 
 
 
19 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
 
Figura 12. Arquitectura de gemelo digital (fuente Deloitte University Press [5]). 
 
Dicha arquitectura viene definida por las siguientes seis etapas: creación, comunicación, 
agregación, análisis, deducción y actuación. Aunque en esta arquitectura quedan reflejadas 
muchas de las tecnologías intervinientes en un gemelo digital, se observa alguna carencia 
sobre todo en lo que atañe al modelado y control de sistemas, dado que tan sólo se considera 
la tecnología CAD a tal efecto. Además, y como datos que se proporcionan al gemelo digital, 
tan solo se consideran las medidas procedentes de dos fuentes: las del propio sistema a 
monitorizar, y las del entorno, obviando las dinámicas propias del sistema (aunque sí que es 
cierto que se comenta que “las señales de los sensores pueden ser aumentadas con 
información basada en los procesos de los sistemas, como los sistemas de ejecución de 
fabricación, sistemas de planificación de recursos empresariales, CAD y sistemas de cadenas de 
suministro”, y se da a entender que también se cogerían datos del ERP de la empresa, etc ….), 
que deben poder ser transmitidas de alguna manera de forma directa al gemelo digital para la 
aplicación de técnicas de control inteligente, y no sólo basadas en el aprendizaje desde los 
datos. Finalmente, el nivel de detalle de algunas técnicas aplicadas no se corresponde con 
otras, y el orden en el que se ordenan también puede generar cierta confusión. 
La creación, desarrollo, puesta en marcha y funcionamiento de un gemelo digital, es una tarea 
multidisciplinar, que, aunque básicamente consiste en la conjunción de tecnología de sistemas 
y procesos físicos con tecnología de la información y comunicaciones, engloba numerosas 
 
 
 
 
20 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
prácticas, necesarias para simular, caracterizar y digitalizar el sistema físico, comunicarlo de 
forma continua, segura, eficiente y en tiempo real con su gemelo digital, guiar el aprendizaje 
del gemelo digital en línea con la evolución del sistema, optimizar dicho aprendizaje en base a 
unos requisitos de eficacia y rendimiento, y reproducir y visualizar de la forma más fidedigna 
posible lo que ocurre en el sistema físico y no es observable, o lo que se prevé que puede 
llegar a ocurrir. 
Por lo tanto, y teniendo en cuenta todo lo anterior, en este trabajo se ha optado por proponer 
un modelo de referencia propio, que queda reflejado en la figura 12, en la que se muestran las 
diferentes tecnologías involucradas, la posición de estas en el proceso global, y como se 
relacionan unas con otras. En general, se distinguen cuatro grandes bloques: 
1. Todo lo relacionado con el sistema físico y los procesos que implica. En esta parte se 
incluye teoría de sistemas complejos y de sistemas de sistemas, análisis y simulación 
de sistemas dinámicos, y modelado de procesos. 
2. Digitalización y sensorización del sistema físico, y comunicación con el gemelo digital. 
Este bloque incluiría redes de sensores inalámbricos (WSN), internet de las cosas (IoT y 
IIoT), y teoría de sistemas ciberfísicos (CPS), así como la aplicación de protocolos 
rápidos, eficaces y seguros tipo OPC UA, MQTT y similares, y conceptos de “edge 
computing” y “edge security”. 
3. El gemelo digital debe estar preparado para recibir y procesar la gran cantidad de 
datos recibida del sistema físico, para lo que se aplica técnicas de HPC y BigData. 
Asimismo, el gemelo digital aplica técnicas de control inteligente basado en las 
dinámicas del sistema físico, aprendizaje automático basado en las medidas obtenidas 
mediante los sensores, e inteligencia artificial para aprender del sistema físico, y 
evolucionar con él, así como para poder predecir comportamientos futuros ante 
ciertas condiciones. También se aplican técnicas de optimización para encontrar el 
funcionamiento óptimo bajo ciertos parámetros, y poder modificar el comportamiento 
del sistema físico por medio de actuadores u otra forma de interacción. 
4. Finalmente, existe un bloque que, mediante técnicas avanzadas de visualización, 
debe permitir visualizar de forma lo más fidedigna posible el comportamiento tanto de 
la parte del sistema que no es observable, como del sistema en un futuro bajo los 
parámetros correspondientes. Para ello se utilizan técnicas de visualización 3D, 
realidad aumentada y visión artificial. 
 
 
 
 
 
 
21 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
 
Figura 13. Modelo de referencia en la elaboración de un gemelo digital 
 
 
 
 
22 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
2.4 Retos tecnológicos 
En principio, y según la búsqueda realizada por los autores en [1], Big Data no es considerado en 
la literatura un aspecto clave para la definición de gemelo digital. De hecho, tan sólo en [2] se 
reconoce de forma explícita que un gemelo digital requiere el almacenamiento de una gran 
cantidad de datos. En [3], los autores afirman que la gestión y el análisis de Big Data es un factor 
muy importante para la concepción de un gemelo digital. Finalmente, en [4] se propone Big Data 
como un método de análisis para los problemas de optimización que aparecen en gemelos 
digitales. 
Sin embargo, y según el “padre” del gemelo digital Michael Grieves [6], el avance del gemelo 
digital va íntimamente ligado a los avances en materia de comunicación y computación de datos, 
debido a la cantidad masiva que de los mismos se requiere para un correcto modelado. 
De hecho, y tal y como recoge Deloitte en [5], no ha sido hasta hoy que, gracias al avance 
tecnológico en el procesado, almacenamiento y análisis de datos, el concepto de gemelo digital, 
que hasta ahora se había prácticamente limitado a grandes corporaciones (NASA, etc …), puede 
ser utilizado de forma más extendida por las empresas y, por tanto, incorporados a la industria en 
su continua digitalización.
Además, y tal y como se he comentado en secciones anteriores, en ese mismo informe de 
Deloitte se propone una arquitectura de gemelo digital basada en las siguientes seis fases: 
1. Creación. Esta fase implica la obtención de las mediciones de los sensores desplegados en 
el sistema físico. 
2. Comunicación. Se implementa la conectividad en ambos sentidos entre el sistema físico y 
el gemelo digital. 
3. Agregación (y procesado). En esta fase de realiza la ingestión de datos en un repositorio, 
procesados y preparados para su análisis. 
4. Análisis. En esta fase se realiza el análisis de los datos almacenados. 
5. Deducción. Se presentan deducciones obtenidas en la fase de análisis mediante la 
visualización, resaltando las desviaciones más reseñables en el rendimiento y las áreas 
más importantes en las que realizar seguimiento y ajuste. 
6. Actuación. En esta fase se ponen en marcha las deducciones que se pueden concretar en 
la activación de actuadores, para la corrección o afinación de las correspondientes 
desviaciones. 
 
Claramente, se puede apreciar que las fases anteriores siguen un flujo bastante similar al que 
sigue la cadena de valor de Big Data. Dicha cadena engloba todos los pasos que tienen lugar en 
la gestión de los datos, desde su creación en las diferentes fuentes hasta la generación de valor 
desde los mismos. Sin embargo, varias de estas fases se identifican con las fases del gemelo digital 
propuesto por Deloitte: 
 Generación de datos (data generation) 
 Adquisición de datos (data acquisition) 
 Procesamiento de datos (data processing) 
 Análisis de datos (data anlysis) 
 Valor de los datos (data value) 
 Aplicación de los datos (data application) 
 
 
 
 
23 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
Esto implica que el concepto de gemelo digital va íntimamente unido al concepto de generación 
de valor en la cadena de Big Data. Esto es, el gemelo digital es un caso claro y concreto de 
aplicación Big Data, en el cual la generación de los datos y la generación de valor convergen en la 
misma entidad, el sistema o proceso físico. 
 
Figura 14. Equivalencia entre el modelo de Gemelo Digital propuesto en [5] y la cadena de 
valor de Big Data 
 
Por tanto, no es sólo que un gran volumen de datos (volumen) procedente de diferentes fuentes 
(sensores, entorno, dinámicas del sistema físico, ERP, Bill of materials (BoM), …) (variabilidad) es 
necesario para alimentar al Gemelo Real en tiempo real (velocidad), de tal forma que este sea el 
reflejo lo más fidedigno posible de su par físico, sino que la propia arquitectura del gemelo digital 
está basada en la cadena de valor de Big Data, y por tanto técnicas específicas de Big data pueden 
ser aplicadas en cada una de las fases del gemelo digital. Revisión de las soluciones existentes 
3 Análisis de las técnicas Big Data para Gemelos Digitales 
Abordar el reto de los Gemelos Digitales en un contexto de Industria 4.0 supone llevar a cabo 
tareas de identificación, selección y experimentación de las técnicas y tecnologías Big Data que 
intervienen en (i) la construcción del Gemelo Digital a partir de señales de comportamiento del 
Gemelo físico (iii) la visualización de las señales y procesos que intervienen en el Gemelo Digital, 
(ii) simulación de procesos industriales en los que intervienen los Gemelos Digitales y (iii) 
optimización de las condiciones de funcionamiento de los Gemelos Digitales que permita la 
actuación sobre el Gemelo Real. 
 
 
 
 
24 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
 
Figura 15. Elementos de estudio en el que interviene Big Data 
 
En el contexto de la industria conectada o Industria 4.0, nos encontramos la necesidad de estudiar 
la aplicación de técnicas y tecnologías Big Data para resolver retos relacionados con el Volumen, 
Variedad, Velocidad de los datos en los cuatro elementos representados en la figura. En concreto, 
los requerimientos que nos encontramos en cada uno de ellos son: 
 Gemelo Digital: grandes volúmenes de datos provenientes del Gemelo Real que deben 
ser capturados, transformados y analizados para producir un simulador de las señales del 
comportamiento. 
 Simulación del proceso: velocidad a la hora de interpretar la respuesta de cada uno de los 
Gemelos Digitales que intervienen en el proceso productivo. Es necesario ofrecer una 
respuesta rápida a la hora de simular grandes periodos de tiempo. 
 Visualización: análisis de estrategias de tratamiento de grandes volúmenes de datos para 
su representación eficiente. 
 Optimización: utilización de técnicas de procesamiento paralelo para la creación de 
modelos estadísticos que permitan la optimización a partir del aprendizaje automático 
con grandes volúmenes de datos. Velocidad a la hora de interpretar nuevos escenarios de 
funcionamiento y actuación sobre el Gemelo Físico. 
3.1 Construcción de un Gemelo Digital 
La aplicación de IoT (Internet of Things) en el entorno industrial es algo cada vez más común y con 
gran potencial. En ese entorno los procesos industriales o las diferentes máquinas que forman 
parte de dichos procesos industriales se sensorizan. Los datos generados por estos sensores son 
de gran importancia pues con el debido tratamiento van a permitir adquirir conocimiento nuevo, 
detectar anomalías de funcionamiento, además de permitir la optimización de procesos y 
máquinas. 
La extracción de conocimiento de dicha información se realizará mediante la aplicación de 
modelos estadísticos y algoritmos de Machine Learning. 
Uno de los intereses que tiene la industria consiste en la anticipación de los efectos que puede 
tener el cambio de uno o varios factores de funcionamiento o la reorganización de mi proceso 
 
 
 
 
25 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
productivo, tanto a nivel productivo como interno a cada una de las máquinas que forman parte 
del proceso. 
Para poder conocer dichos efectos aparece el concepto de Gemelo Digital. Este nuevo concepto 
implica la digitalización de una máquina en un entorno virtual para poder evolucionarla mediante 
técnicas de simulación. 
Cuando se desea modelar un objeto, habitualmente este objeto viene definido a través de varias 
mediciones y no una única, así para la simulación, debemos de pensar en una modelización 
multidimensional que respete la estructura interna de correlación entre las variables que lo 
definen. Si por ejemplo la presión de un fluido sube con la temperatura, y queremos simular 
dichas señales, no sería realista simular cada una de estas variables de forma independiente pues 
se observarían simulaciones incongruentes con la realidad, y las conclusiones a las que se podría 
llegar con nuestro Gemelo Digital se alejarían del objeto real que éste modela. 
Por lo tanto, la idea consiste en realizar una copia digital y virtual de todos aquellos sensores que 
definen a mi máquina y simularlos de forma multidimensional, con lo que podríamos observar 
cómo se comportan dichos sensores una vez integrada dicha máquina en mi proceso productivo. 
 
Figura 16. Esquema conceptual de una máquina virtual. 
 
La figura muestra el esquema conceptual de una máquina virtual. En dicha máquina se pueden 
observar cuatro tipos diferentes de variables: X, F, W y Q. La variable n-dimensional X 
representará los valores obtenidos por los sensores y sus valores representan el funcionamiento 
interno de la máquina y serán objeto de la detección de anomalías, la variable m-dimensional F 
será la variable que representa los factores de configuración manipulables por el humano y serán 
objeto de optimización, la variable p-dimensional W representa mediciones externas que pueden 
proceder o bien de sensores exteriores o bien de mediciones de otras máquinas en el proceso 
productivo y finalmente la variable k-dimensional Q serán nuestras
variables de calidad algunas 
de las cuales serán entradas a otras máquinas dentro del proceso productivo. 
 
Matemáticamente, 
 
𝑋 = ൭
𝑥1
⋮
𝑥𝑛
൱ M 𝑄 = ൭
𝑞1
⋮
𝑞𝑘
൱ 
𝐹 = ሺ𝑓1 ⋯ 𝑓𝑚ሻ 
𝑊 = ሺ𝑤1 ⋯ 𝑤𝑝ሻ 
 
 
 
 
26 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
F = {𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠 𝑒𝑥𝑡𝑒𝑟𝑛𝑜𝑠 𝑚á𝑞𝑢𝑖𝑛𝑎 𝑓𝑖𝑗𝑎𝑑𝑜𝑠 𝑝𝑜𝑟 ℎ𝑢𝑚𝑎𝑛𝑜} 
W = {𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑒𝑥𝑡𝑒𝑟𝑛𝑎𝑠} 
𝑋𝑔 = {𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑢𝑙𝑡𝑖𝑑𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑎𝑙𝑒𝑠 𝑠𝑖𝑚𝑢𝑙𝑎𝑑𝑜𝑠} 
X = ℱ(𝑋𝑔 , F, W) 
Q = ℱሺX, F, Wሻ 
Finalmente una vez obtenidos los diferentes modelos para cada una de las partes que modelan a 
nuestro gemelo digital podremos unirlos entre sí para poder modelar el proceso de producción 
completo y hacerlo funcionar de manera integrada mediante simulación. La simulación del 
modelo completo se realizará mediante el uso de Redes de Petri. Dichas redes de Petri permiten 
la transición de la producción a través de una función de tiempo que vendrá será ofrecida por 
alguna de las k variables Q. 
 
 
 
 
 
Figura 17. Esquema Red de Petri. 
La figura representa la estimación del tiempo de producción de cada modelo sirve para marcar el 
ritmo. Los círculos indican colas y estados que habilitan o no la producción, mientras que los 
rectángulos modelizan los ritmos de producción de piezas. En el interior de cada rectángulo se 
puede acceder a los diferentes valores de funcionamiento que modelizan dicha máquina (X,F,W,Q) 
durante la simulación de la producción. 
La modelización que pretende cubrir este capítulo tiene que ver con la simulación de las variables 
(X,F,W,Q) de cada máquina y no tanto con la forma en la que se comunican las diferentes 
máquinas para modelizar un proceso completo, y que se cubrirá en otro capítulo. El objetivo final 
de esta simulación no es otro que el conocer el comportamiento dinámico de una máquina dada 
(valores que toma X y Q) en función de unos parámetros de entrada (F) o variables externas (W) y 
el tiempo de producción. 
3.1.1 Problemática 
Tal se ha visto en el apartado de descripción del problema, el objetivo aquí consiste en la 
simulación de una máquina, para ello el concepto de máquina se concreta en una serie de 
mediciones obtenidas con varios sensores (X) que ofrecen medidas del comportamiento interno 
de dicha máquina, junto a factores (F) de configuración de la máquina que el usuario puede fijar, 
variables externas (W) procedentes del entorno o de otras máquinas. Todo ello nos ofrece 
finalmente una predicción de variables calidad (Q). 
Por lo tanto para poder obtener el modelo digital deberemos de poder establecer relaciones: 
X = ℱ(𝑋𝑔, F, W) 
Q = ℱሺX, F, Wሻ 
Donde tal y como se puede observar deberemos primero de obtener X para lo que además de F 
necesitaremos Xg. Esta variable n-dimensional Xg la vamos a estimar mediante simulación. Pero 
aquí hemos de darnos cuenta que dicha simulación no es una simulación unidimensional al uso, 
C1 M1 Cp Mp… 
 
 
 
 
27 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
pues dicha variable es n-dimensional, y cuando la simulemos deberemos de hacerlo con sentido, 
respetando la estructura de correlaciones existente entre todas las dimensiones que la 
conforman. 
Otro aspecto a tener en cuenta consiste en que la evolución de los sensores de la máquina 
guardan una clara relación cronológica con el tiempo, de tal forma que los valores que se estén 
simulando en un momento dado tendrán una autocorrelación directa con determinados valores 
pasados y no son el producto de una simulación aleatoria sin contexto pasado. 
Una vez obtenida la variable Xg, y puesto que los factores externos no han formado parte de dicha 
simulación, se ha de poder introducir a estos F junto a las condiciones externas W, para conseguir 
valores reales X que se vean influenciados por los valores tomados por los diferentes parámetros 
F y W en un momento dado. 
Finalmente, las variables de calidad, Q, serán predichas a partir de los valores X, F y W que 
resulten significativos a la hora de predecir dichos valores de calidad Q. 
3.1.2 Técnicas involucradas 
El Gemelo Digital que aquí se expone se compone de la aplicación de diversas técnicas hasta 
completar todas y cada una de las partes que lo implementan. Así, las partes a implementar son: 
simulación Xg, dotar de sentido temporal a las simulaciones, estimación del efecto de los factores 
de configuración de la máquina sobre el valor final de los sensores simulados, estimación de las 
variables de calidad a partir de los valores de sensores simulados y los factores de configuración. 
Para cada una de las partes se van a aplicar diferentes técnicas estadísticas y de Machine Learning. 
3.1.2.1 Simulación de Xg 
Aquí se va a aplicar una proyección PCA [18,19,20,21,22] que convierte las características 
originales en nuevas características que garantizan una mejor situación de normalidad y 
ortogonalidad que las características originales. A partir de esta conversión se hace uso de un 
simulador gaussiano multidimensional de estas nuevas características, generándose tantos 
puntos como se puedan y almacenándolos en un almacén de datos Big Data, donde a cada nuevo 
punto se le dota de un índice calculado mediante una función de hashing que se fundamenta en 
el cálculo de percentiles de la gaussiana unidimensional teórica que modelaría cada una de las 
componentes, consiguiendo así una distribución uniforme del número de sacos de cada grupo 
que identifique la función de hashing. La necesidad de introducir un índice para los puntos 
guardados está relacionada con la necesidad posterior de realizar búsquedas rápidas por cada uno 
de los puntos que se deseen simular posteriormente. Para poder garantizar que la simulación 
realizada es equivalente desde un punto de vista poblacional con la población de datos originales, 
se aplicará el test estadístico de T2-Hotelling [31]. 
3.1.2.2 Dotar de sentido temporal a las simulaciones 
El resultado de una simulación gaussiana consiste en una serie de puntos generados de forma 
aleatoria sin ninguna estructura secuencial y temporal, donde el valor de un punto generado en 
un momento dado no depende del valor de los puntos generados en instantes anteriores. Este 
modo de funcionamiento, que puede ser muy útil en una gran parte de los problemas no nos es 
útil aquí directamente pues el tipo de simulación a realizar aquí debe de llevar implícita la 
estructura secuencial y temporal de una típica serie temporal en un proceso industrial. Esto nos 
 
 
 
 
28 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
lleva a la necesidad de introducir un modelo que de alguna manera prediga el valor del siguiente 
instante en función de los valores anteriores, guardando así la estructura secuencial y temporal 
de la serie. Para poder introducir esta secuencia se hará uso de modelos ARIMA 
[23,24,25,26,27,28,29,30] (Autoregressive Integrated Moving Average) o redes recurrentes LSTM 
[34,35] sobre las componentes PCA que se ha decidido utilizar en la simulación gaussiana. 
3.1.2.3 Estimación del efecto de F y W sobre X. 
Con la simulación expuesta anteriormente se tendría una simulación multidimensional de los 
sensores internos de una máquina. Existen ocasiones en los que además de estos sensores se 
dispone de una serie de factores de configuración o incluso valores de estado externos (F), que se 
prefijan a unos valores durante la producción o en los diferentes instantes, por ejemplo: tengo o 
no tengo pieza. La introducción de estos factores de configuración suele tener algún tipo de 
influencia sobre los valores que finalmente toman los sensores. Para poder simular de manera 
más realista se ha de corregir la simulación anterior con algún tipo de error proveniente de la 
influencia que estos sensores tienen sobre los sensores internos. De manera general,
los valores 
finalmente generados (X) serán: 
X = Xg+E 
donde E se estimará como función de: 
E = ℱ(𝑋𝑔, F, W) 
dicha función F se estimará aplicando técnicas estadísticas y de Machine Learning como: PLS, 
Ecuaciones estructurales, Regresión Lineal, SVM, Redes Neuronales, etc. 
Una vez estimada la función ya se está en posición de realizar una simulación más realista que 
incluya la posible influencia de los factores de entrada. 
3.1.2.4 Estimación de las variables de calidad. 
Otro aspecto a considerar en la simulación de un Gemelo Digital son las variables de salida (Q). 
Estas variables de salida son variables dependientes de las variables de las variables explicativas X, 
F y W anteriormente expuestas. Algunas de estas variables de salida serán la entrada a alguna 
parte del proceso que une las diferentes máquinas en un proceso productivo de nivel de 
abstracción superior. Para poder ser modeladas se requerirá la estimación de una función: 
Q = ℱሺX, F, Wሻ 
Para realizar dicha estimación de la función F se podrá hacer uso de técnicas estadísticas y de 
Machine Learning similares a las vistas en el punto anterior: PLS, Ecuaciones estructurales, 
Regresión Lineal, SVM, Redes Neuronales, etc. 
Finalmente, una vez estimada esta función ya se estará en posición de realizar una simulación de 
la salida en función de las simulaciones de las entradas, esto permitirá observar el 
comportamiento simulado de la máquina al completo y su interconexión con otras partes del 
proceso. 
 
 
 
 
 
29 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
3.1.3 Big Data en el Gemelo Digital 
Los procesos de simulación suelen ser más fieles a la realidad conforme mayor sea el número de 
puntos simulados, pues a mayor número de puntos mejores estimaciones de los parámetros de 
interés. Por otra parte, cuanto mayor sea el número de puntos simulados, mayor será la 
necesidad de espacio para su almacenamiento y mayor el tiempo requerido para la búsqueda de 
dichos puntos simulados, esto plantea dos problemas, relacionados con el volumen de datos y la 
velocidad de acceso a éstos. 
En el simulador multidimensional que se plantea se presentan ambos problemas, pues se requiere 
de un sistema capaz de almacenar un gran volumen de datos y capaz, a su vez, de ofrecer las 
simulaciones en un tiempo razonable una vez el sistema esté en producción. 
Además las necesidades de volumen y de tiempos de búsqueda adecuados crecen de manera no 
lineal conforme mayor sea el número de dimensiones de nuestro simulador multidimensional. 
3.1.3.1 Acceso a datos 
Las técnicas de Big Data [32] en el proceso de simulación van a jugar un papel relevante en la 
persistencia de los datos simulados mediante el uso del simulado Gaussiano, para lo que se hará 
uso de almacenes de datos NoSQL distribuidos que nos garantizan escalado transparente y 
replicación. 
Además, el proceso de simulación del Gemelo Digital implica una búsqueda del punto más 
cercano entre todos los puntos generados. Para poder realizar dicha búsqueda en tiempo 
razonable para la simulación será necesario realizarla con una arquitectura distribuida [33]. 
Las BBDD distribuidas NoSQL, nos ofrecen la posibilidad de almacenar tantos puntos como 
necesitemos, pues dichos puntos se distribuyen entre los nodos existentes en un clúster y se trata 
conceptualmente de BBDD elásticas en el sentido de que sus capacidades crecen de manera 
transparente al introducir más nodos en dichos clústers. En cuanto a la velocidad de la búsqueda 
de los puntos gaussianos más cercanos, se plantean dos soluciones que se llevarán a cabo a la vez, 
una primera solución consiste en hacer uso de un índice de partición a partir de una función de 
HASHING que distribuya uniformemente los puntos bajo un mismo índice y por otra parte, una 
segunda solución, intrínseca ésta al propio concepto de BBDD distribuida, que consiste en que, al 
tratarse de una BBDD distribuida, las búsquedas de los puntos apropiados durante la simulación la 
realizan todos los nodos de forma paralela. 
Con éste planteamiento la velocidad de acceso a los puntos la podemos adaptar de manera 
sencilla a las necesidades temporales del simulador propuesto, buscando el compromiso 
apropiado entre el volumen de datos deseado, nivel de profundidad de la clave de hash pues un 
mayor nivel de profundidad de la clave hash produce un menor número de puntos, aglutinados 
bajo un mismo identificador, sobre los que realizar la búsqueda, y el número de nodos en el 
clúster, pues la búsqueda de los puntos más cercanos con el identificador ofrecido por la función 
de hash se realiza de manera paralela por todos los nodos que conforman nuestro clúster. 
Concretamente la BBDD NoSQL que vamos a utilizar es Cassandra. 
Cassandra es una base de datos NoSQL columnar distribuida basada en software libre y 
desarrollada por Facebook, permite una alta escalabilidad a lo largo de distintos data centers 
 
 
 
 
30 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
sobre hardware estándar, proporciona alta disponibilidad sin que ningún nodo actúe como punto 
de fallo único. 
La propia arquitectura de Cassandra es la responsable de su capacidad para escalar, ejecutar, y 
ofrecer ejecución de forma permanente en el tiempo. En lugar de utilizar un modelo esclavo-
servidor o una arquitectura fragmentada difícil de mantener, Cassandra tiene un diseño en forma 
de anillo sin maestro, que es elegante, fácil de instalar y fácil de mantener. 
En Cassandra, todos los nodos tienen un rol idéntico; no existe el concepto de nodo principal, 
todos los nodos se comunican entre sí por igual. La arquitectura de Cassandra permite que sea 
capaz de manejar grandes cantidades de datos, miles de usuarios y miles de operaciones por 
segundo, concurrentes incluso a través de múltiples data centers. No tiene ningún punto único de 
fallo y por lo tanto es capaz de ofrecer disponibilidad y acceso continuo. En caso de necesidad 
para poder ampliar el servicio únicamente hay que añadir nuevos nodos al clúster existente sin 
tener que parar el servicio. 
 
Figura 18. Incremento del tiempo de respuesta con el número de nodos del cluster. 
Los puntos a destacar son los siguientes: 
 Descentralizada: Cada nodo del clúster posee el mismo rol, no hay punto único de ruptura, 
la información se distribuye uniformemente a lo largo del clúster. 
 Capacidad de réplica y escalabilidad: Un clúster puede ser replicado en distintos data 
centers a modo de réplica y cada clúster puede aumentar el número de nodos para 
aumentar la capacidad del mismo 
 Tolerancia a fallos: La información es replicada en distintos nodos para tolerancia a fallos 
y la gestión de errores es gestionada de forma transparente. 
 Soporte map/reduce: Dispone de integración con Apache Hadoop así como Apache Pig y 
Apache Hive. 
3.1.3.2 Estimación de algoritmos 
La obtención de un Gemelo Digital conlleva la estimación de una serie de modelos que 
representen el comportamiento real del proceso que se desea modelar. En el simulador que se 
plantea aquí, la estimación de dichos modelos se basa en la obtención de una serie de mediciones 
obtenidas a partir del funcionamiento real de dicho objeto o proceso. Estas mediciones son la 
fuente de información necesaria para la estimación de los parámetros de dichos modelos. Dicha 
estimación será tanto mejor conforme más evidencias se tengan sobre dicho proceso y mayor sea 
el número de posibles configuraciones que se estudien para dicha estimación. 
Cuanto mayor sea el número de muestras de aprendizaje y mayor el número de configuraciones 
estudiadas mayores serán las necesidades de cómputo, y memoria necesarias. La disponibilidad 
de una arquitectura de cómputo paralela y distribuida que cumpla con las propiedades 
 
 
 
 
31 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
anteriormente
mencionadas, además de la posibilidad de disponer de GPUs en los nodos de 
cómputo, redundará en una mejora de la calidad de los modelos estimados, pues se podrán 
realizar más cálculos en el mismo tiempo además de disponer de mayor cantidad de memoria 
disponible. Esta mejora de los modelos redundará finalmente en la obtención de mejores 
simulaciones en el Gemelo Digital, consiguiendo así mejores aproximaciones a la máquina real, de 
la cual nuestro gemelo es una copia. 
En el simulador que planteamos se dan estos problemas, pues se requiere de un sistema capaz, 
de obtener modelos de simulación realistas, almacenar un gran volumen de datos y de ofrecer 
simulaciones en un tiempo razonable. El simulador ha de ser escalable conforme a las 
necesidades del proceso que se esté simulando en cada momento, y ha de tener una probabilidad 
baja de fallo, por falta de comunicación o caída de la máquina que contiene al gemelo digital. Para 
esta parte, y puesto que se dispone de un clúster paralelo distribuido, se puede hacer uso de 
Spark-ML y la programación funcional, que es directamente distribuible y paralelizable, además 
de TensorFlow, para algunos de los modelos a estimar, que hará uso de las GPUs de manera 
transparente si se dispone de dicha capacidad. 
3.2 Modelado y simulación dinámica de procesos industriales 
3.2.1 Simulación discreta de eventos (DES) 
Los sistemas de simulación discreta de eventos modelan la operación de un sistema como una 
secuencia de eventos en el tiempo. Cada evento ocurre en un instante de tiempo y marca un 
cambio en el estado del sistema. Entre eventos que tienen lugar de forma consecutiva no se 
produce ningún tipo de cambio ni alteración del sistema, ya que se simula que la salida de un 
evento es la entrada de otro consecutivo. Para aplicar esta técnica es necesario que las variables 
que definen el sistema no cambien su comportamiento durante el intervalo simulado. 
Estos sistemas se caracterizan por mantener un estado íntegro del sistema, que puede cambiar 
por la ocurrencia de un evento. El estado del sistema solo cambia mediante la ejecución de los 
eventos y por uno o varios procesos dedicados a su ejecución que, a medida que pasa el tiempo 
de simulación y los eventos terminan, eliminan los eventos pendientes para el valor de tiempo 
actual. La ejecución de un evento puede desencadenar la generación de nuevos eventos futuros, 
donde cada uno está marcado por su tiempo y por el orden de generación, que puede no coincidir 
con el orden de ejecución. 
Dentro de los sistemas de simulación discreta de eventos se distingue: 
 Tiempo de simulación: valor de tiempo que el simulador puede avanzar a una velocidad 
superior a la habitual de un reloj común, evolucionando así el estado de un sistema de 
forma acelerada. 
 Evento: suceso que hace cambiar las variables de estado del sistema. Durante el 
procesamiento de un evento el tiempo de simulación permanece fijo. Un evento 
pertenece a una entidad, y normalmente solo cambia atributos de esta, dejando 
invariante el resto del sistema. 
 Entidad: el sistema a simular se modela sobre la base de entidades o actores que 
representan, en conjunto, al sistema completo. El estado del sistema se entiende, 
entonces, como el agregado de los estados que lo conforman. 
 Actividad: secuencia de eventos pertenecientes a una entidad que cierran un ciclo 
funcional. A diferencia de un evento, que se ejecuta a tiempo de simulación constante, 
una actividad se desarrolla dentro de un intervalo de tiempo de simulación no puntual. 
 
 
 
 
32 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
 Simulación en tiempo acelerado: cuando el avance del tiempo de simulación es mayor de 
un segundo por cada segundo de tiempo real. 
 Simulación en tiempo real: cuando el avance del tiempo de simulación es exactamente 
de un segundo por cada segundo de tiempo real. 
3.2.2 Tipos de modelos 
La forma más inmediata para estudiar un sistema es experimentar sobre él. Sin embargo, esto 
puede ser desaconsejable e incluso imposible por varios motivos: 
1. Es posible que el sistema no exista y lo que se pretende sea, precisamente, su diseño. 
2. Porque sea inviable económicamente experimentar sobre el sistema real. 
3. Porque la experimentación sobre el sistema real puede conllevar unos plazos de tiempo 
muy dilatados. 
En cualquier caso, es necesario construir un modelo que refleje lo más fielmente posible las 
características del sistema a analizar y la experimentación que se llevará a cabo sobre éste. 
Los modelos físicos están formados por una estructura material que tiene unas características, en 
cuanto al objeto del estudio, similares a las del sistema real. Un modelo matemático, sin embargo, 
representa el sistema por medio de relaciones lógicas y cuantitativas entre sus variables de 
estado. Una vez construido se debe analizar cómo utilizarlo para resolver las preguntas 
planteadas sobre el sistema. Si el modelo matemático es sencillo, se podrá resolver de forma 
analítica para obtener una solución exacta a las preguntas. Si el modelo es complejo, se deberá 
recurrir a su simulación, proporcionando valores a determinadas variables de estado y calcular 
cuál es el valor resultante para el resto de variables, obteniendo así una representación o muestra 
de las posibles respuestas del modelo (del sistema que representa) ante distintas condiciones de 
partida. 
3.2.3 Necesidad de la simulación 
La complejidad a la hora de representar un modelo matemático puede tener varias causas: 
 En los sistemas continuos, cuando una o varias variables de estado representen la tasa o 
velocidad de cambio de otras variables de estado, siendo necesario el uso de ecuaciones 
diferenciales que indiquen este tipo de relaciones. 
 En los sistemas discretos, con la aparición de fenómenos aleatorios que solo pueden ser 
representados en términos probabilistas. En este caso, la formulación matemática implica 
relaciones donde aparecen funciones de distribución o de densidad de probabilidad, 
dificultando así su resolución analítica. 
3.2.4 Ventajas e inconvenientes de la simulación 
Algunos de los argumentos a favor de la utilización de la simulación son: 
 La mayoría de los sistemas no se pueden describir con precisión suficiente mediante un 
modelo matemático que se pueda resolver analíticamente. Por ello, con frecuencia la 
simulación es el único método posible de estudio de estos sistemas. 
 La simulación permite estimar el comportamiento de un sistema existente bajo un 
conjunto previsto de condiciones. 
 Permite la comparación de diseños o políticas de operación alternativas para especificar 
cuál es el que cumple de forma más adecuada los objetivos formulados. 
 
 
 
 
33 E.5.1 Estado del arte y análisis de las técnicas Big Data en Gemelos Digitales 
 Se puede tener un control sobre las condiciones del experimento que si re realizara sobre 
el propio sistema. 
 Permite estudiar un sistema cuya evolución se dilata en el tiempo en un periodo reducido 
de tiempo. 
Por otra parte, entre los inconvenientes se encuentran: 
 Por regla general, los modelos de simulación consumen una cantidad elevada de recursos 
técnicos y humanos durante un periodo prolongado de tiempo. 
 La gran cantidad de información que proporcionan, unido a veces a su capacidad de 
persuasión de algunos paquetes gráficos, hacen que, a menudo, se confíe en exceso en 
los resultados que proporcionan. SI un modelo de simulación no proporciona una 
representación válida del sistema real, la información que suministra puede no ser 
validada o, incluso, puede conducir a la toma de decisiones erróneas. 
3.2.5 Construcción del modelo. Verificación, validación y credibilidad 
Una vez construido y validado el modelo de simulación, se debe seleccionar el lenguaje que se va 
a utilizar para su programación. He aquí una lista: 
 Lenguajes de propósito general, como FORTRAN, C y C++. 
 Librerías
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡