Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Ingeniería Industrial. Actualidad y Nuevas Tendencias ISSN: 1856-8327 revistaiiaynt@gmail.com Universidad de Carabobo Venezuela Ruelas Santoyo, Edgar Augusto; Laguna González, José Antonio Comparación de predicción basada en redes neuronales contra métodos estadísticos en pronósticos de ventas Ingeniería Industrial. Actualidad y Nuevas Tendencias, vol. IV, núm. 12, enero-junio, 2014, pp. 91-105 Universidad de Carabobo Carabobo, Venezuela Disponible en: http://www.redalyc.org/articulo.oa?id=215037911008 Cómo citar el artículo Número completo Más información del artículo Página de la revista en redalyc.org Sistema de Información Científica Red de Revistas Científicas de América Latina, el Caribe, España y Portugal Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto http://www.redalyc.org/revista.oa?id=2150 http://www.redalyc.org/revista.oa?id=2150 http://www.redalyc.org/revista.oa?id=2150 http://www.redalyc.org/articulo.oa?id=215037911008 http://www.redalyc.org/comocitar.oa?id=215037911008 http://www.redalyc.org/fasciculo.oa?id=2150&numero=37911 http://www.redalyc.org/articulo.oa?id=215037911008 http://www.redalyc.org/revista.oa?id=2150 http://www.redalyc.org Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 91 Comparación de predicción basada en redes neuronales contra métodos estadísticos en el pronóstico de ventas Predictive comparison based in neural network versus statistical methods to forecast sales Edgar Augusto Ruelas Santoyo; José Antonio Laguna González Palabras Clave: Pronóstico de ventas, redes neuronales artificiales (RNA) Key words: Sales Forecast, artificial neural networks (ANN) RESUMEN La intención del presente artículo es realizar la comparación y selección de un método para pronosticar las ventas de forma eficiente y que beneficie a organizaciones que ofrecen sus productos al mercado ya que los pronósticos de ventas son datos de entrada a diferentes áreas de la empresa y de ser imprecisos pueden generar gastos para la organización. El caso de estudio en este artículo fue llevado a cabo dentro de la empresa Productos Frugo S.A. de C.V., dedicada a la comercialización de productos alimenticios. Los métodos y metodologías utilizados y posteriormente comparados al pronosticar las ventas de la empresa antes mencionada son: Método de Hold, Winters, la metodología Box Jenkins (ARIMA) y una Red Neuronal Artificial. Los resultados muestran que la red neuronal artificial obtuvo un mejor desempeño logrando el menor error cuadrático medio, de esta forma es posible establecer un panorama adecuado para el uso de la inteligencia artificial dentro de la industria. ABSTRACT The intention of this paper is to compare and select a method to forecast sales efficiently, and provide benefits to organizations offering their products to market because sales forecasts are an input to the company different areas and being inaccurate may cost for the organization. The study case in this paper was carried out within the company Frugo Products SA de C.V.; dedicated to the marketing of food products. The methods and methodologies used and then compared to forecast sales of the aforementioned company are: Hold Method, Winters, Box Jenkins methodology (ARIMA) and Artificial Neural Network. The results show that the artificial neural network achieved better performance scored the lowest mean square error, in this way it is possible to establish an appropriate scenario for the use of artificial intelligence in the industry. INTRODUCCIÓN Los pronósticos de ventas son indicadores de realidades económico-empresariales, básicamente en la situación de la industria en el mercado y en la participación de la empresa en ese mercado. El pronóstico determina qué puede venderse con base en la realidad, y el plan de ventas permite que esa realidad hipotética se materialice, guiando al resto de los planes operativos de la empresa. La elección e implementación de un método adecuado de pronósticos siempre ha sido un tema de gran importancia para las empresas. Se utilizan los pronósticos en el área de compras, marketing, ventas, etc. Un error significante en el pronóstico de ventas podría dejar a una empresa sin la materia prima o insumos necesarios para su producción, o podría generarle un inventario demasiado grande. En ambos casos, el pronóstico erróneo disminuye las utilidades de la empresa. El uso óptimo de los recursos y la creciente demanda de una mayor variedad de productos, entre otros, obliga a los fabricantes a realizar programas de producción más estrictos y flexibles para poder maximizar el uso de los costosos equipos de producción, mano de obra, inversiones en materias primas, de forma que se cumplan las fechas de entrega a los clientes finales minimizando los costos. El objetivo principal de los pronósticos se transforma entonces en convertirse en la entrada para el resto de los planes operativos. Para realizar Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 92 eficientes programas de producción que atiendan la demanda sin incurrir en excesivos costos de capital, es deseable un adecuado manejo de la información de ventas con el fin de realizar pronósticos con buen nivel de confianza para todos los departamentos de la empresa. Debido al comportamiento no lineal que presenta un pronóstico de ventas, las redes neuronales artificiales, ANNs, por sus siglas en ingles (Artificial Neural Networks) son un excelente candidato para la predicción de esta estimación. Las ANNs son usadas en modelos y sistemas altamente no lineales (Azadeh, 2008). En general las ANNs son técnicas matemáticas simples diseñadas para cumplir una gran variedad de tareas. Hoy en día las ANNs pueden ser configuradas en varios arreglos para desarrollar diversas tareas, tales como, el reconocimiento de patrones, minería de datos, clasificación y predicción, entre otras (Vahidinasab, 2008). Las ANNs están compuestas de atributos que aprenden soluciones en aplicaciones donde se necesita un mapeo lineal o no lineal. Algunos de estos atributos son: capacidad de aprender, generalización y procesamiento en paralelo, estos atributos hacen que las ANNs puedan resolver problemas complejos haciendo de esta técnica un método preciso y flexible (Balestrassi, 2009), (Freeman, 1991) y (Rabuñal, 2006). El objetivo del presente artículo, se enfoca al uso de redes neuronales para realizar pronósticos de ventas y contrastar los resultados obtenidos contra pronósticos de métodos estadísticos clásicos en función de un error cuadrático medio. Suponiendo que la utilización de un método de pronóstico no tradicional, como las redes neuronales, podrá brindar un pronóstico de ventas más acertado en comparación a los resultados obtenidos utilizando un método de pronóstico estadístico tradicional. Trabajo relacionado Desde la primera mitad del siglo XX se han empezado a desarrollar modelos computacionales que han intentado emular el comportamiento del cerebro humano (McCulloch y Pitts, 1943). Aunque se han propuesto una gran cantidad de ellos, todos usan una estructura en red en la cual los nodos o neuronas son procesos numéricos que involucran estados de otros nodos según sus uniones. Una clase de estos modelos computacionales son las redes de neuronas artificiales (HayKin, 2008). Las redes neuronales artificiales se han hecho muy populares debido a la facilidad en su uso e implementación y la habilidad para aproximar cualquier función matemática, además con su marcada habilidad para obtener resultados de datos complicados e imprecisos, pueden utilizarse para extraer patrones y detectar tramas que son muy difíciles de apreciar por humanos u otras técnicas computacionales. Una de las definiciones que se estima más certera de Red Neuronal Artificiales la siguiente: ``Las redes neuronales artificiales son conjuntos de elementos de cálculo simples, usualmente adaptativos, interconectados masivamente en paralelo y con una organización jerárquica que le permite interactuar con algún sistema del mismo modo que lo hace el sistema nervioso biológico'' (Kohonen, 1989). Su aprendizaje adaptativo, auto- organización, tolerancia a fallos, operación en tiempo real y fácil inserción dentro de la tecnología existente, han hecho que su utilización se haya extendido en áreas como la biológica, financiera, industrial, medio ambiental, militar, salud, etc. (Hilera y Martinez, 1995). Están funcionando en aplicaciones que incluyen identificación de procesos (Gonzalez y Martinez, 1998), detección de fallos en sistemas de control (Aldrich y Van Deventer, 1995), modelación de dinámicas no lineales (Meert y Rijckaert, 1998), control de sistemas no lineales (Rivals and Personnaz, 2000) y optimización de procesos (Nacimiento y Guardani, 2000). Investigaciones proponen el uso de redes neuronales artificiales como herramienta eficiente de pronósticos, ya que no presentan un análisis lineal (Toro et al; 2004) y (Saldaña, 2010). Otra parte importante de la investigación que se ha realizado es la caracterización de los métodos para pronósticos ya que la estimación del comportamiento futuro de algunas variables Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 93 puede realizarse utilizando diversos métodos de pronósticos. Cada uno de los métodos de proyección tiene una aplicación de carácter especial que hace de su selección un problema de decisión influido por diversos factores, como son, la validez y disponibilidad de los datos históricos, la precisión deseada del pronóstico, el costo del procedimiento, los beneficios del resultado, los periodos futuros que se desee pronosticar y el tiempo disponible para hacer el estudio entre otros (SapagChain, 2000). Dentro de los métodos de pronósticos se pueden clasificar en función de su carácter, esto es, aplicando métodos de carácter cualitativo, modelos causales y modelos de series de tiempo (Nojek et al., 2003). De acuerdo con Toro et al., en 2004, es posible entrenar a una red neuronal por medio de los niveles de ventas partiendo del siguiente algoritmo. Si V (t) es el nivel de ventas del mes t y k el número de períodos (meses) anteriores a usar en la predicción, se puede decir que el conjunto de datos V (t − k), V (t − k +1),…, V (t −1) son los datos de ventas de los k meses anteriores. Por lo tanto, el objetivo que debe cumplir la red neuronal es que su salida V’ (t), dada por la ecuación V (t) = F [V(t −k),V(t −k +1),…,V(t −1), t] (1) Sea lo más cercana posible a V (t). Por lo tanto, se puede decir que V’ (t) es la estimación de las ventas para el período t. En (Koulouriotis, 2012), se analiza la importancia de reducir el nivel de inventario en una organización a través del pronóstico de ventas, comparando diferentes técnicas entre ellas la inteligencia artificial en un ambiente industrial. Los resultados obtenidos muestran que es posible establecer buenos niveles de inventario a través de los pronósticos realizados por una red neuronal de propagación hacia adelante. Bajo ese mismo enfoque en (Azadeh, 2012), se presenta una red neuronal difusa para estimar el precio del gas natural a partir de parámetros con un cierto nivel de incertidumbre. En (Chang, 2012) establecen un mecanismo de prevención sobre el costo de fabricación basado en redes neurona les artificiales. Dentro de la investigación propuesta en (Nazemi, 2013), se determina que la inteligencia computación a través de una red neuronal resuelve de mejor forma problemas de optimización de cartera con comparación con otros modelos. En (Zhai, 2013) y (Sadeghi, 2013), se propone el uso de tecnologías de la inteligencia artificial como los sistemas difusos para la predicción de costos y establecer una planeación agregada, respectivamente. Ambas implementaciones de la inteligencia artificial dentro del sector industrial demuestran las ventajas de su uso en comparación con métodos tradicionales, propiciando una ventaja competitiva en las organizaciones Después de una breve introducción y análisis del trabajo relacionado al tema a tratar dentro de la sección 1, el artículo se organiza como sigue: en la sección 2, se da una explicación de la metodología a la que se dio seguimiento durante la investigación abordando aspectos como: La recolección de los datos, Autocorrelación y la descripción de cada método propuesto. Consecutivamente se muestran los resultados obtenidos durante la implementación de cada uno de los métodos seleccionados, así como la discusión de los resultados obtenidos dentro de las secciones 3 y 4 respectivamente. Finalmente, las conclusiones se mencionan en la sección 5. Para definir la metodología a emplearse se debe considerar que una serie de datos describe su propio comportamiento, por lo que es importante entender que con los métodos y los pasos resultantes de este trabajo se obtendrá una metodología para elegir los mejores modelos para pronosticar las ventas dentro de la empresa donde se llevó el caso de estudio, se debe estar consciente de que el modelo no será único para todas las situaciones dentro de la misma rama industrial, ya que el tratamiento de los datos se debe realizar bajo diferentes factores. Es decir la metodología propuesta está dedicada a la elección del mejor METODOLOGÍA Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 94 modelo de pronóstico y no a encontrar un modelo universal. En la figura 1, se describen los pasos básicos a seguir en la metodología para obtener los pronósticos de ventas: Figura 1. Esquema básico de la metodología empleada en la investigación La primera etapa para realizar pronósticos, es la recolección de datos válidos y confiables. Un pronóstico no puede ser más preciso que los datos en que se basa. Cuando se mide una variable a lo largo del tiempo, las observaciones en diferentes periodos con frecuencia están relacionadas o correlacionadas. Esta correlación se mide mediante el uso del coeficiente de autocorrelación. Posteriormente se selecciona el método de pronóstico adecuado en función del patrón que presenten los datos, el tipo de serie y la facilidad de aplicación (Makradakis, 1986). Además se deben de establecer los parámetros adecuados para el tipo de pronóstico, este paso fue resuelto mediante experimentación exhaustiva tomando como variable de respuesta un error cuadrático medio mínimo. Recolección de datos En la recolección de datos para pronósticos, se deben de identificar dos claras categorías, de entrada y prueba. La primera es vital para diseñar y construir el modelo que permita la realización del pronóstico, la segunda igual de importante, sirve como punto de referencia para validar el resultado obtenido por el pronóstico, ya que se está probando la estimación contra la realidad. Los datos de entrada fueron obtenidos de los registros históricos de los años 2010 y 2011, los cuales se convirtieron en los datos de entrada para cada uno de los métodos de pronósticos, ya construidos dichos modelos, se procede a la prueba de cada uno de ellos y se verifica su eficiencia. Los datos o históricos de prueba fueron las ventas de los años 2012 y 2013, la concentración de los datos fue realizada mensualmente. En la tabla 1, se muestra de forma detallada la información de las ventas necesaria para la evaluación de los modelos elegidos para el desarrollo de los pronósticos. Año Mes Tiemp o (X) Ventas en libras (Y) 2012 Enero 1 1,715,363 Febrero 2 2,338,955 Marzo 3 1,206,298 Abril 4 1,201,767 Mayo 5 1,046,660 Junio 6 1,884,477 Julio 7 1,282,274 Agosto 8 413,025 Septiembre 9 970,179 Octubre 10 1,324,767Noviembre 11 1,221,979 Diciembre 12 1,106,086 2013 Enero 13 1,784,131 Febrero 14 2,836,453 Marzo 15 3,283,337 Abril 16 2,362,562 Mayo 17 2,802,633 Junio 18 1,751,905 Julio 19 2,496,522 Agosto 20 1,881,808 Si No Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 95 Tabla 1. Histórico de ventas 2012 y 2013. Empresa Productos Frugo S.A. de C.V En la figura 2, se muestra un diagrama de dispersión para visualizar la relación que existe entre las ventas de mes a mes, de esta forma es sencillo observar el comportamiento de los datos. Figura 2. Representación gráfica de ventas. Microsoft Excel 2010. Análisis de autocorrelación Para evitar crear ambigüedades a la hora de tomar una decisión sobre el método más conveniente a la hora de realizar los pronósticos, es necesario utilizar una herramienta que permita evaluar el comportamiento de la serie y que además considere a los elementos que la componen, es decir, que muestre si la serie es aleatoria, tiene tendencia o un patrón estacional. Una herramienta viable y que fue utilizada para el análisis de autocorrelación es el autocorrelograma, con él es posible establecer un análisis del patrón de la serie de datos además de obtener el coeficiente de autocorrelación, que sin duda permitirá identificar qué elementos de la serie se encuentran presentes en ésta. La autocorrelación es la correlación que existe entre una variable retrasada con uno o más periodos. Los patrones de datos que incluyen componentes como tendencia, estacionalidad e irregularidad se pueden estudiar usando el enfoque del análisis de autocorrelación. Los coeficientes de autocorrelación para diferentes desfases de tiempo de una variable se emplean para identificar patrones en las series de tiempo de datos. La ecuación siguiente contiene la fórmula para calcular el coeficiente de autocorrelación (rk) entre las observaciones Yt y Yt-k, las causales se encuentran a k periodos de distancia. Septiembre 21 1,975,181 Octubre 22 2,649,544 Noviembre 23 2,945,026 Diciembre 24 2,329,979 Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 96 (2) Donde r = coeficiente de autocorrelación para un retraso de k periodos. = media de los valores de la serie. Yt = observaciones en el periodo t. Yt-k =observaciones de k periodos anteriores o durante un periodo t-k. Aplicando la ecuación 2, se obtiene el coeficiente de autocorrelación y de esta forma es posible verificar el comportamiento de la serie de tiempo tabla 2. En la figura 3, se muestra gráficamente que el valor obtenido para el retraso 1, r1 es de 0.61082, el cual indica que existe una autocorrelación significativa entre las ventas del primer mes con las ventas del mes siguiente. En general conforme aumente el número de retrasos de tiempo, k, disminuyen los coeficientes de autocorrelación. De acuerdo a los resultados obtenidos autocorrelograma se observa que los datos tienden a caer paulatinamente hacia cero, además que los primeros retrasos son bastante diferentes de cero, como resultado del análisis de los datos se concluye que está presente un patrón tendencial en la serie de tiempo. Tabla 2. Función de Autocorrelación para cada periodo. 222018161412108642 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Lag A u to co rr e la ti o n Autocorrelaciónde laventasdebrocóli Figura 3. Función de Autocorrelación. Software estadístico Minitab versión 15. Selección del método de pronóstico La selección de la técnica empleada para pronosticar, es definida en base al análisis de los factores que intervienen en la selección del modelo, en este caso se buscan modelos adecuados que se ajusten a patrones con tendencia. De acuerdo con Hanke y Reistch, en 2006, los modelos sugeridos a emplearse para realizar los pronósticos son: Suavización exponencial ajustado a la tendencia, Método de Holt y Suavización exponencial ajustado para variaciones de tendencia y estacionalidades, Método de Winters además de la metodología Box-Jenkins (ARIMA). Estos métodos y metodologías estadísticas serán comparados contra una red neuronal artificial la cual no requiere probar un supuesto de tendencia o estacionalidad en la serie de tiempo previo a la realización del pronóstico. Retrasos en cada periodo Función de Autocorrelación 1 0.610829 2 0.402748 3 0.243364 4 0.261904 5 0.093726 6 -0.084612 7 -0.046443 8 0.051484 9 -0.060716 Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 97 Método de Holt El nivel de la serie de tiempo puede cambiar ocasionalmente y cuando se usa el suavizamiento exponencial simple es requerido actualizaciones de nivel. En algunas ocasiones los datos observados tendrán una tendencia clara en la información que permita anticipar movimientos futuros hacia arriba. Cuando este sea el caso, será necesaria una función de pronóstico de tendencia lineal. Dado que las series económicas y de negocios rara vez exhiben una tendencia lineal fija que evolucione con el tiempo. Una aportación de Holt, en 1957, es el desarrollo de un método de suavizamiento exponencial lineal, el cual toma en cuenta las tendencias lineales locales en evolución dentro de una serie de tiempo y puede usarse para generar pronósticos. Cuando se anticipa la tendencia en la serie de tiempo, se requiere un estimado de la pendiente y de nivel actual. La técnica de Holt suaviza el nivel y la pendiente de manera directa al usar diferentes constantes de suavizamiento para cada una. Éstas proporcionan estimados de nivel y de la pendiente que se adapta a lo largo del tiempo conforme aparecen nuevas observaciones. Una de las ventajas de Holt es su flexibilidad al seleccionar los coeficientes que controlan el nivel y la tendencia. Los parámetros requeridos son Alfa (α) y Beta (β). Alfa se usa para suavizar los datos a fin de eliminar la aleatoriedad. La constante de suavizamiento β es como α, a excepción de que se usa para suavizar la tendencia en los datos. Ambas constantes de suavizamiento se usan para promediar los valores anteriores y, de esta forma, eliminar el fenómeno aleatorio presente en la serie de tiempo. Las constantes de suavizamiento α y β pueden seleccionarse de manera subjetiva o mediante la minimización de una medida de error de pronósticos como el error cuadrático medio (MSE) (Hanke y Reistch 2006). En la tabla 3, se muestran los resultados de la experimentación realizada para definir los parámetros α y β necesarios para el método Holt. Las tres ecuaciones que se utilizan para el método de Holt son: 1.La serie suavizada exponencialmente, o estimado del nivel actual: (3) 2.El estimado de la tendencia: (4) Pronósticos del periodo p en el futuro: (5) Dónde: Lt = nuevo valor suavizado (estimado del nivel actual) α = constante de suavización para el nivel (0 < α <1) Yt = observación nueva o valor real de la serie en el periodo t β = constante de suavización para el estimado de tendencia (0 < β < 1) Tt = estimado de tendencia p = periodo a pronosticar en el futuro = pronóstico para periodo p en el futuro Método de Winters El método Winters con tres parámetros de suavizamiento exponencial lineal y estacional, es una extensión del método de Holt, tiene el potencial de describir mejor los datos y reducir el error del pronóstico. En el método de Winters se usa una ecuación adicional para estimar la estacionalidad. En la versión multiplicativa del método de Winters, el estimado de la estacionalidad será como un índice estacional y se calcula mediante la ecuación del estimado de la estacionalidad. En la tabla 4, se muestran los resultados de la experimentación realizada para definir los parámetros alfa , beta y gama necesarios para el método Winters. Las cuatro ecuacionesutilizadas en el suavizamiento (multiplicativo) de Winters son: 1.El nivel de la serie estimado por suavizamiento exponencial: (6) 2.El estimado de la tendencia: (7) 3.El estimado de la estacionalidad: (8) 4.Pronóstico del periodo p en el futuro: (9) Donde Lt = nuevo valor suavizado o nivel actual estimado α = constante de suavizamiento para el nivel Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 98 Yt = nueva observación o valor real en el periodo t β = constante de suavizamiento para el estimado de tendencia Tt = estimado de tendencia = constante de suavizamiento para el estimado de estacinalidad St = estimado de estacionalidad p = número de periodo a pronosticarse s = longitud de estacionalidad = pronóstico para el periodo p en el futuro Tabla 3. Resultados de la experimentación para definir los parámetros en el método Holt. Tabla 4. Resultados de la experimentación para definir los parámetros en el método Winters. Error Cuadrático Medio 0.6 0.1 3938.6882 0.5 0.1 3969.30554 0.7 0.1 3977.204 0.8 0.1 4076.29505 0.4 0.1 4080.6369 0.6 0.2 4218.96766 0.9 0.1 4233.51164 0.5 0.2 4262.09318 0.7 0.2 4265.64826 0.3 0.1 4287.028504 0.8 0.2 4389.00711 0.4 0.2 4410.060095 0.6 0.3 4473.05642 0.5 0.3 4521.391724 0.7 0.3 4538.82546 0.9 0.2 4584.23129 0.2 0.1 4627.653574 0.3 0.2 4670.158746 0.8 0.3 4698.33332 0.4 0.3 4704.997091 0.5 0.5 4941.154883 0.9 0.3 4943.49782 0.4 0.4 4957.868414 0.2 0.2 5001.967229 0.3 0.3 5041.491025 0.6 0.6 5145.462445 0.1 0.1 5306.60193 0.3 0.4 5355.263543 0.2 0.3 5470.3474 0.1 0.2 5526.450276 Error Cuadrático Medio 0.7 0.1 0.4 4034.77 0.8 0.1 0.4 4057.31 0.7 0.2 0.5 4076.02 0.7 0.2 0.4 4076.54 0.6 0.2 0.4 4109.06 0.6 0.2 0.5 4110.78 0.6 0.1 0.5 4122.04 0.7 0.1 0.2 4137.4 0.6 0.1 0.4 4142.26 0.8 0.1 0.2 4159.72 0.7 0.2 0.2 4178.85 0.7 0.1 0.1 4187.19 0.6 0.2 0.2 4190.14 0.8 0.1 0.1 4203.67 0.7 0.2 0.1 4227.35 0.5 0.2 0.4 4229.18 0.5 0.2 0.5 4231.91 0.9 0.1 0.4 4232.56 0.6 0.2 0.1 4236.58 0.6 0.1 0.2 4240.99 0.6 0.3 0.4 4273.83 0.8 0.2 0.2 4277.29 0.7 0.3 0.4 4287.82 0.7 0.3 0.5 4288.82 0.6 0.3 0.5 4291.12 0.6 0.1 0.1 4292.48 0.8 0.2 0.1 4324.57 0.9 0.1 0.1 4325.9 0.6 0.3 0.2 4342.26 0.5 0.3 0.4 4349.34 Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 99 Método ARIMA Los Modelos de Promedio Móvil Autorregresivo Integrado, (ARIMA), por sus siglas en inglés, son una clase de modelos que tienen la capacidad de operar sobre series de tiempo estacionarias o no estacionarias. El primer paso en la identificación del modelo consiste en determinar si la serie es estacionaria, es decir, si la serie de tiempo aparenta variar alrededor de un nivel fijo. Una serie no estacionaria se indica si la serie parece crecer o decrecer con relación del tiempo y las autocorrelaciones no pueden desvanecerse con rapidez. Si la serie no es estacionaria, con frecuencia puede convertir a una serie estacionaria al tomar sus diferencias, es decir, la serie es remplazada por una serie de diferencias. Entonces, se especifica un modelo ARIMA para la serie de las diferencias. Se debe especificar el grado de diferenciación y el algoritmo de Box-Jenkins convierte los datos en una serie estacionaria y realizar los cálculos subsecuentes utilizando los datos convertidos. Una vez obtenida una serie estacionaria, se debe identificar la forma del modelo a utilizar. Este paso se logra mediante la comparación de los coeficientes de autocorrelación y de autocorrelación parcial se calcularon a partir de los datos para las autocorrelaciones y autocorrelaciones parciales teóricas de los diversos modelos ARIMA (Hanke y Reistch, 2006), por lo tanto de acuerdo a la figura 3 y 4, el modelo correspondiente es el modelo AR (2). 654321 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Lag Pa rt ia lA ut oc or re la ti on Partial Autocorrelation Function for VENTAS BROCOLI (with 5% significance limits for the partial autocorrelations) Figura 4. Autocorrelación parcial de la serie de tiempo. Software estadístico Minitab versión 15. Red Neuronal Artificial Una red neuronal artificial es un procesador masivo paralelo formado por unidades simples de procesamiento que tienen una propensión natural para almacenar conocimiento experimental, haciéndolo viable para su uso. La red neuronal se asemeja al cerebro en dos aspectos: i. El conocimiento es adquirido por la red desde su entorno a través de un proceso de aprendizaje. ii.Las fuerzas de las conexiones entre neuronas, conocidas como pesos sinápticos, son usadas para almacenar el conocimiento (Haykin, 2009). La arquitectura de una red neuronal consiste en la organización y disposición de las neuronas en la red formando capas o agrupaciones de neuronas. Los parámetros fundamentales son: número de capas, número de neuronas por capa, grado de conectividad y tipo de conexión entre neuronas (Villanueva, 2002). Redes multicapa: Las redes neuronales artificiales multicapa se forman con un grupo de capas simples en cascada. La salida de una capa es la entrada de la siguiente capa. Se ha demostrado que las redes multicapa presentan cualidades y aspectos por encima de las redes de una capa simple. Dado que este tipo de redes disponen de varias capas, las conexiones entre neuronas pueden ser del tipo feedforward (conexión hacia adelante) o del tipo feedback (conexión hacia atrás). Las redes feedforward son especialmente útiles en aplicaciones de reconocimiento o clasificación de patrones. En la figura 5, se muestra la estructura general de una red de este tipo. La figura y nomenclatura se adoptan de (Hagan, 2002). Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 100 Figura 5. Estructura general de una red neuronal multicapa. La entrada a la red es el vector p cuya longitud es igual a R, W es la matriz de pesos con dimensiones SxR, a y b son vectores de longitud S el cual, representa el número de neuronas de la red. La habilidad de la red perceptrón multicapa para aprender a partir de un conjunto de ejemplos, al aproximar relaciones no lineales, filtrar ruido en los datos, etc. hace que sea un modelo adecuado para abordar problemas reales, sin que esto indique que son las mejores herramientas como aproximadores universales. En la tabla 5, se muestra el esquema de la red neuronal artificial construida para la realización de los pronósticos de ventas, cabe destacar que no existe un método específico para llegar a la arquitectura de la red, el parámetro que definió esta arquitectura fue el error cuadrático medio mínimo al momento de realizar los pronósticos. La red de neuronas almacena información en una cadena de interconexiones neuronales por medio de los pesos. La función de transferencia utilizada es la tangente hiperbólica. La arquitectura de diferentes tipos de redes de neuronas artificiales fue explorada, con el objetivo de encontrar el diseño idóneo al problema que debemos resolver. Una etapa de aprendizaje debe ser considerada para la creación de un modelo neuronal, en esta parte es donde se introducen los datos de entrada a la red neuronal artificial. La fase de aprendizaje se utiliza para ajustar los pesos, los cuales inicialmente son valores aleatorios. El valor del error cuadrático medio sirve para evaluar la corrección de pesos en cada iteración. Finalmente, la red neuronal artificial aprende el comportamiento de la base de datos generada por medio de datos introducidos en su capa de entrada. Una vez definidos los parámetros y arquitecturas de los métodos para pronosticar se prueban los métodos seleccionados, para el método de Holt se determina que los mejores valores de acuerdo a un error cuadrático medio mínimo son: alfa de 0.6 y beta de 0.1(Ver tabla 3). Prosiguiendo con la misma lógica se determina que los mejores parámetros para el método de Winters son: alfa de 0.7, beta de 0.1 y gama 0.4 (Ver tabla 4). La metodología ARIMA queda definida como un modelo AR (2) después de comparar las autocorrelaciones parciales, y por último la red neuronal artificial empleada para la realización de los pronósticos descrita en la tabla 5. Los resultados de la aplicación del método Holt, Winters, metodología ARIMA y la red neuronal trabajando con sus parámetros adecuados para realizar los pronósticos se encuentran en la tabla 6 y figuras 6, 7, 8 y 9 Topología de la Red Neuronal Artificial Numero de Neuronas en la capa oculta 19 Tasa de aprendizaje 0.01 Numero de Iteraciones 4000 Error objetivo 1x10-5 RESULTADOS Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 101 respectivamente, las figuras fueron generadas a partir de Microsoft Excel 2010. Los resultados de los pronósticos se encuentran codificados, lo que consiste en dividir el dato real entre diez mil para un mejor manejo de la información, así que solo es necesario realizar la operación inversa para obtener el valor real arrojado por el método seleccionado. Tabla 6. Resultados de cada técnica de pronóstico. Año Mes Tie mpo (X) Resultados en libras (Y) Pronóstico con Método de Holt Pronóstico con Método de Winters Valor pronosticado ARIMA Valor pronosticado ANN 2010 Enero 1 1,715,363 171.5363 178.839179 181.98444 171.5467 Febrero 2 2,338,955 171.5363 211.109168 177.975959 233.8767 Marzo 3 1,206,298 212.6934 141.548676 216.792561 120.6265 Abril 4 1,201,767 155.673 115.525686 146.288296 120.1961 Mayo 5 1,046,660 130.4632 104.682685 146.006255 112.0354 Junio 6 1,884,477 109.525 150.920626 136.351342 188.4516 Julio 7 1,282,274 156.1541 133.040549 188.502763 128.2219 Agosto 8 413,025 136.998 60.1473986 151.017558 112.0207 Septiembre 9 970,179 71.4389 81.4201135 96.9095954 112.021 Octubre 10 1,324,767 80.1792 116.46938 131.590645 132.4692 Noviembre 11 1,221,979 108.0885 111.896028 153.662611 122.1821 Diciembre 12 1,106,086 113.9314 105.309848 147.264387 112.0911 2011 Enero 13 1,784,131 109.1157 144.671885 140.05042 178.3963 Febrero 14 2,836,453 152.0299 233.219576 182.256547 261.4035 Marzo 15 3,283,337 240.2319 273.193935 247.760216 261.4037 Abril 16 2,362,562 307.6118 233.188298 275.577312 261.4037 Mayo 17 2,802,633 275.0359 239.29389 218.262021 261.4037 Junio 18 1,751,905 288.7235 187.047837 245.65503 175.1843 Julio 19 2,496,522 224.3429 205.024267 180.250581 249.6467 Agosto 20 1,881,808 244.7862 190.72641 226.600602 188.1843 Septiembre 21 1,975,181 212.6843 172.981014 188.336627 197.5163 Octubre 22 2,649,544 204.536 235.303969 194.148796 261.4019 Noviembre 23 2,945,026 245.3636 247.765508 236.12573 261.4032 Diciembre 24 2,329,979 282.3719 230.263633 254.518537 233 Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 102 Figura 6. Ventas reales vs pronóstico con el Método de Holt. Figura 7. Ventas reales vs pronósticos con el Método de Winter. Figura 8. Ventas reales vs pronóstico con el Método de ARIMA. Figura 9. Ventas reales vs pronósticos con la Red neuronal artificial. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 103 Finalmente se llevó a cabo el comparativo y evaluación de cada una de la los métodos, considerando el error cuadrático medio para su evaluación. La finalidad es saber cuál de los métodos alcanzaría el menor error cuadrático medio y de esta forma poder probar la hipótesis planteada sobre la promoción de la inteligencia artificial como método de pronósticos en las organizaciones, como resultado se obtuvo que la red neuronal alcanzó el menor error cuadrático versus la técnica del método de Hold, método de Winters y la metodología Box Jenkin (ARIMA). En la figura 10, se muestran los resultados de la evaluación mediante el MSE. Figura 10. Resultados de la evaluación por el MSE. Microsoft Excel 2010. Como se ha mencionado, las empresas requieren de planes de producción que proporcionen una mejor programación de las actividades en cada una de las áreas, para eso requieren de saber con anticipación cuales pueden ser sus posibles ventas en el futuro de forma precisa, ya que dependiendo de esta información, es posible incurrir en graves errores como son: materia prima insuficiente, falta de personal, exceso de materia prima e incumplimiento en fechas de entrega lo que genera un incremento de costos de producción. La intención de este artículo es encontrar una metodología para pronosticar las ventas de la forma más precisa posible y de esta forma hacer más competitiva a la organización. Algunos investigadores de los pronósticos han notado similitud entre los métodos de inteligencia artificial como lo son las redes neuronales artificiales y los métodos convencionales de pronósticos, esa similitud es la forma en que intentan encontrar con éxito los parámetros de operación necesarios en su arquitectura para predecir la variable dependiente que en este caso son las ventas. Por otro lado, existen diferencias que propician ventajas de una técnica a otra, las redes neuronales no requieren ninguna suposición sobre las distribuciones de probabilidad de los datos, solo los aprenden, al contrario de muchos métodos convencionales de pronósticos, pueden operar con datos incompletos y analizar datos con alta o nula correlación. Una característica importante en las redes neuronales artificiales empleadas en los pronósticos, es que los datos no deben de ser analizados para probar el supuesto de tendencia o estacionalidad en la serie de tiempo previo a la realización del pronóstico. CONCLUSIONES Los resultados observados en esta investigación muestran que los métodos estadísticos para pronosticar utilizados parten del comportamiento de los datos históricos, en estos modelos se supone que el futuro será igual que el pasado, excepto por las variables reconocidas por el modelo. Pero si alguna variable cambia, se hacen ineficientes para seguir pronosticando, por que parten del supuesto de que la población siempre tendrán una distribución normal. En la red neuronal artificial no se requieren especificar supuestos como la distribución de probabilidad o patrón de comportamiento en la serie de tiempo para la realización de pronósticos de forma eficiente, pues el método involucra el aprendizaje de las relaciones mediante los DISCUSIÓN Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 104 ejemplos proporcionados, que es al contrario de los métodos convencionales para pronósticos donde se tiene que especificar el patrón de comportamiento de los datos históricos. De acuerdo al error cuadrático medio (MSE) como métrica de desempeño, la red neuronal artificial presento una mejor práctica a la hora de realizar pronósticos. En la fase de prueba llevada a cabo durante veinticuatro periodos descritos es la tabla 1, se puede observar que las ventas totales durante ese periodo de tiempo equivalen a: 44, 810, 911 libras. Las ventas pronosticadas mediante la red neuronal artificial son: 44, 560, 866 libras. Lo cual refleja un 99.442% de exactitud de las ventas reales vs pronóstico con la ANN, lo cual propicia un escenario adecuado para el uso de las redes neuronales artificiales a la hora de pronosticar ventas dentro la industria. REFERENCIAS 1.Aldrich C. and van Deventer J. S. J., (1995). Comparison of different artificial neural nets for the detection and location of gross errors in process systems. Industrial & Engineering Chemistry Research. 34(1):216-224. 2.Azadeh,A., Sheikhalishahi, M., Shahmiri S. (2012) A hybrid neuro-fuzzy simulation approach for improvement of natural gas price forecasting in industrial sectors with vague indicators. The International Journal of Advanced Manufacturing Technology. Springer Link. Volume 62, Issue 1- 4, pp 15-33. 3.Azadeh, A.; Ghaderi, S. F.; Sohrabkhani S., (2008). Annual Electricity Consumption Forecasting by Neural Network in high Energy Consuming Industrial sectors. Energy Conversion and Management. Volumen 49, Issue 8, p. 2272-2278. 4.Balestrassi, P.P.; Popova, E.; Paiva, A.P.; Marangon, J.W., (2009). Design of experiments on Neural Network’s training for nonlinear time series. Forecasting Neurocomputing. Volumen72, Issues 4-6, p. 1160-1178. 5.Chang, P., Lin, J., Dzan, W. (2012) Forecasting of manufacturing cost in mobile phone products by case-based reasoning and artificial neural network models. Journal of Intelligent Manufacturing. Springer Link. Volume 23, Issue 3, pp 517-531. 6.Freeman, J.; Skapura, D., (1991). Neural Networks Algorithms, Applications, and Programming Techniques. Addison-Wesley, New York. 7.González-García R.; Martínez-Rico R,; and Kevrekidis I. G., (1998). Identification of distributed parameter systems: A neural net based approach. Computers and Chemical Engineering, 22:965-968. 8.Hagan M. T., Demuth H. B., Beale H. M., (2002). Neural Network Design, Volumen 10. Campus Pub. Service, University of Colorado Bookstore. 9.Hanke J.; Reitsch A., (2006). Pronósticos en los Negocios, Octava Edición, Prentice Hall, México. 10.Haykin S., (2008). Neural Networks: A Comprehensive Foundation. Prentice Hall, NJ, USA. 11.Haykin, Simon (2009). Neural Networks and Learning Machines. New Jersey; Editorial Pearson Prentice Hall. 12.Hilera J. R.; and Martinez V. J.; Addison-Wesley, (1995). Redes neuronales artificiales Fundamentos, modelos y aplicaciones. Iberoamericana S.A, Madrid. 13.Holt, C.C. (1957). Forecasting trends and seasonals by exponentially weighted averages, Carnegie. Institute of Technology, Pittsburgh ONR memorandum No. 52. 14.Kohonen T., (1989). Self-organization and associative memory. Springer Verlag. New York. 15.Koulouriotis, D., Mantas, G. (2012) Health products sales forecasting using computational intelligence and adaptive neuro fuzzy inference systems. Operational Research. Springer Link. Volume 12, Issue 1, pp 29-43. 16.Makridakis S., (1986). The Art and Science of Forecasting. International Journal of Forecasting 2. 17.McCulloch W. S. and W. Pitts (1943). A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematical Biology, 5(4):115-133. 18.Meert K. and Rijckaert M., (1998). Intelligent modelling in the chemical process industry with neural networks: a case study. Computers and Chemical Engineering. 22:587-593. 19.Nascimento C. A. O.; Giudici R., and Guardani R., (1996). Neural network based approach for optimization of industrial chemical processes. Redes de neuronas artificiales y algoritmos genéticos. Servicio de Publicaciones Universidad de la Coruña. 20.Nazemi, A., Tahmasbi, N., (2013) A computational intelligence method for solving a class of portfolio optimization problems. Soft Computing. Springer Link. Recuperado de http://link.springer.com/article/10.1007/s00500-013-1186-4. 21.Nojek, S.1.; Britos, P. (2003). Pronosticos de ventas: Comparacion de predicción basada en redes neuronales versus estadístico. Departamento de Ingeniería Industrial. Instituto Tecnológico de Buenos Aires. 22.Rabuñal, J. R.; Dorrado, J., (2006). Artificial neural networks in real-life applications. Idea GroupPublishing, USA. 23.Rivals and Personnaz L., (2000). Nonlinear internal model control using neural networks: application to processes with delay and design issues. IEEE Transactions on Neural Networks. 11(1):80-90. 24.Sadeghi, M., Razavi S., Sadat, S. (2013) A fuzzy grey goal programming approach for aggregate production planning. The International Journal of Advanced Manufacturing Technology. Springer Link. Volume 64, Issue 9-12, pp 1715-1727. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 105 25.Saldaña, A; Jöns, S. (2010). Pronósticos para el Rendimiento Del Trigo Usando Redes Neuronales Artificiales 26.SapagChain (2000). Preparación y evaluación de proyectos. Mc-Graw Hill. 27.Toro, E; Mejía, D. (2004). Pronóstico de ventas usando redes neuronales. Universidad Tecnológica de Pereira. 28.Vahidinasab, V.; Jadid, S.; Kazemi, A., (2008). Day-ahead price Forecasting in Restructured Power Systems using Artificial Neural Networks. Electric Power Systems Research. Volumen 78, Issue 8, p. 1332-1342. 29.Villanueva E., M. (2002). Las Redes Neuronales Artificiales y su Importancia como Herramienta en la Toma de Decisiones. Trabajo de Investigación (Lic.) Universidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. EAP de Investigación Operativa. 30.Zhai, K., Jiang, N., Pedrycz, W. (2013) Cost prediction method based on an improved fuzzy model. The International Journal of Advanced Manufacturing Technology. Springer Link. Volume 65, Issue 5-8, pp 1045-1053. Autores Edgar Augusto Ruelas Santoyo. Graduado en Ingeniería y en la Maestría en Ingeniería Industrial en el Instituto Tecnológico de Celaya en 2008 y 2011, respectivamente. Actualmente, estudia un doctorado en el Posgrado Interinstitucional en Ciencia y Tecnología (PICYT). Profesor en el Departamento de Ingeniería Industrial, Instituto Tecnológico Superior de Irapuato, Guanajuato, México. E-mail: edruelas@itesi.edu.mx José Antonio Laguna González. Graduado en Ingeniería y en la Maestría en Ingeniería Industrial del Instituto Tecnológico Superior de Irapuato (ITESI) en el 2002 y 2013, respectivamente. Profesor en el Departamento de Ingeniería Industrial, Instituto Tecnológico Superior de Irapuato, Ext. Abasolo, Guanajuato, México. Se ha desempeñado en empresas del giro alimenticio y metalmecánico. E-mail: jolaguna@itesi.edu.mx Recibido: 07/09/2013 Aceptado: 20/12/2013
Compartir