Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Data Science: Factor Clave en la empresa de hoy Matías Rojas Business Analytics Universidad de los Andes Facultad de Ciencias Económicas y Empresariales 1 Introducción 2Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Glosario Siglo XXI • Business Analytics: El uso de datos de diversas fuentes, tratados mediante análisis estadístico, análisis cuantitativo, data mining, modelado predictivo y otras tecnologías y técnicas, para mejorar y/o desarrollar procesos de negocios que agreguen valor en las empresas. • Data Science: Ciencia dedicada al estudio de los datos, buscando extraer el conocimiento presente en ellos para responder preguntas. • Inteligencia Artificial: Estructura computacional diseñada para realizar determinadas operaciones que se consideran propias de la inteligencia humana, como el autoaprendizaje. • Machine Learning: Es una rama de la Inteligencia Artificial que crea sistemas que aprenden automáticamente, identificando patrones complejos ocultos en los datos, en ella se crean sistemas capaces de generalizar comportamientos a partir de una información no estructurada suministrada en forma de ejemplos. • Big Data: Conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales. 3Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Historia de la IA 4Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics 1950 El matemático Alan Turing propone test para medir inteligencia de las máquinas 1974-1993 Invierno en Inteligencia Artificial 1997 Deep Blue, computador de IBM programado para jugar ajedrez, vence a campeón mundial Gary Kasparov 2011 IBM con su computador contesta-preguntas Watson gana 1 millón de dólares en el programa de TV Jeopardy 2017 La inteligencia artificial de Google Alpha Go vence a Ke Jie en el complejo juego Go, que tiene del orden de 10170 combinaciones (más que la cantidad de átomos del universo observable) 2018: Asistente de Google 5Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Fuente video: https://www.youtube.com/watch?v=pKVppdt_-B4 https://www.youtube.com/watch?v=pKVppdt_-B4 2020: GPT3 6Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Fuente paper: https://arxiv.org/pdf/2005.14165 https://arxiv.org/pdf/2005.14165 2020: GPT3 7Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Fuente video: https://youtu.be/PqbB07n_uQ4 https://youtu.be/PqbB07n_uQ4 Tipos de Aprendizaje en máquinas 8Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics 2. Aprendizaje No Supervisado: Se deducen patrones (estructuras subyacentes) a partir de datos no etiquetados: 1. Aprendizaje Supervisado: Se muestran respuestas correctas e incorrectas con datos etiquetados: Input Etiqueta Pera Manzana Pera Manzana Predicción ? Veo un patrón aquí Modelo 3. Aprendizaje de Refuerzo: Híbrido entre supervisado y no supervisado, existe recompensa por éxito: es aprendizaje por ensayo y error. … Ramas de la Inteligencia Artificial • A fin de cuentas no es magia, es matemática y computación. 9Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Aplicaciones • Aplicaciones 10Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Ruta más rápida… Recomendación de amigos… Recomendación de canciones… Recomendación de productos… etc… Predicción de clima… Aplicaciones en Empresas • Segmentación de Clientes. • Pronósticos de Ventas. • Sistemas de recomendación. • Cálculo de Scoring Crediticio. • Modelos de fuga. • Optimizaciones avanzadas en logística. • Predicción de fallas en maquinaria. • Orquestación de Procesos. • … 11Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Avances en la Inteligencia Artificial • Aplicaciones 12Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Avances en la Inteligencia Artificial: Música • Deep Bach 13Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Fuente artículo: https://arxiv.org/pdf/1612.01010.pdf Fuente video: https://www.youtube.com/watch?v=QiBM7-5hA6o https://arxiv.org/pdf/1612.01010.pdf https://www.youtube.com/watch?v=QiBM7-5hA6o Avances en la Inteligencia Artificial: Arte • Neural Style Transfer 14Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Fuente artículo: https://arxiv.org/pdf/1508.06576.pdf https://arxiv.org/pdf/1508.06576.pdf Avances en la Inteligencia Artificial: Arte • Cómo no probarlo… 15Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Avances en la Inteligencia Artificial: Arte • Volveremos a este paper más adelante… 16Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Tipos de análisis (analytics) • ¿Qué tipos de analítica podemos hacer? 17Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Tipos de análisis (analytics) • Análisis Descriptivo: – Utiliza los datos históricos, identificando comportamientos y dibujando cómo se están haciendo las cosas. Es la analítica más usada y su objetivo es realizar una fotografía de la situación para poder tomar decisiones. Cuenta en realidad cómo está nuestro negocio hasta la fecha, permitiendo visualizar, detectar, averiguar, calcular e identificar. – Se consultan diferentes indicadores de negocio de cara a obtener una visión de lo que ha pasado y está pasando. – La pregunta más habitual es: ¿Qué pasó? 18Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Tipos de Analítica Descriptiva Predictiva Prescriptiva Tipos de análisis (analytics) • Análisis Predictivo: – Como su nombre indica hace posible la creación de modelos que permiten vaticinar lo que va a ocurrir con antelación. En realidad mira al futuro y nos ayuda a entender cómo puede evolucionar nuestro entorno y hasta la propia compañía. Su propósito es hacer pronósticos. Está basada en métodos matemáticos avanzados como la estadística o el aprendizaje automático (machine learning) para predecir los datos que faltan y describir lo que va a suceder. – Busca extraer conocimiento en forma de patrones, modelos o tendencias que ayuden mejor a acertar con situaciones futuras. – La pregunta más habitual es: ¿Qué pasará? 19Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Tipos de análisis (analytics) • Análisis Prescriptivo: – Analiza los datos para encontrar cuál es la solución entre una gama de variantes. Su tarea es optimizar recursos y aumentar la eficiencia operativa. Usa técnicas de simulación y optimización, logrando señalar cuál es el camino que conviene realmente elegir. – En realidad informa acerca de lo que debiera suceder buscando mejorar el resultado proporcionando recomendaciones para maximizar indicadores de negocio. – La pregunta más habitual es: ¿Qué debemos hacer? 20Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Proceso Data Science • Proceso CRISP-DM (Cross Industry Standard Process for Data Mining) 21Universidad de los Andes Facultad de CienciasEconómicas y EmpresarialesBusiness Analytics La Nube 22Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Google Colab 23 https://colab.research.google.com/ https://colab.research.google.com/ Aplicación: Arte en Python 24 https://colab.research.google.com/github/tensorflow/models/blob/master/research/nst_blogpost/4_Neur al_Style_Transfer_with_Eager_Execution.ipynb *En el entorno de ejecución, cambiar el tipo de entorno de ejecución y acelerar con GPU. https://colab.research.google.com/github/tensorflow/models/blob/master/research/nst_blogpost/4_Neural_Style_Transfer_with_Eager_Execution.ipynb Red Neuronal Artificial: Resumen 25 ¿Cómo funciona? Inspirada en el cerebro humano, una red neuronal consiste en redes de neuronas altamente conectadas que relacionan las entradas con las salidas deseadas. La red se entrena modificando iterativamente los pesos de las conexiones para que desde las entradas se pueda llegar a la respuesta correcta. Cada neurona es una estructura en la que se reciben las entradas ponderadas y según un criterio de activación transmitirá una salida. red neuronal ¿Cuándo se usa? ● Para clasificación o regresión ● El modelo es altamente no lineal. ● La cantidad de data aumenta y se desea actualizar constantemente el modelo. ● Pueden tenerse cambios inesperados en las entradas. ● La interpretación del modelo no es relevante. Red neuronal: Intuición Biológica 26 Neuronas Artificiales ● Una neurona artificial puede verse como una función, la cual recibe entradas (provenientes del exterior [data de entrada] o de neuronas precedentes), dichas entradas son sumadas de manera ponderada (aplicándose un peso 𝑤) y agregándose un bias (similar al intercepto o 𝛽0 en una regresión lineal) ● El resultado de esa suma ponderada pasará a una función de activación, en donde si se supera un umbral determinado, transmitirá el mensaje. Red neuronal: Funciones de Activación 27 ● Existen muchas funciones de activación y dependerán de la naturaleza del problema y la red neuronal utilizada cual usar. Ejemplo: Reconocimiento de caracteres 28 ● Queremos armar una red neuronal que sea capaz de reconocer dígitos escritos a mano. ● Es un problema de Aprendizaje Supervisado, tenemos etiquetas. Ejemplo: Reconocimiento de caracteres 29 ● Supongamos que cada dígito es de 784 pixeles (282) ● Es un problema de Aprendizaje Supervisado, tenemos etiquetas. 282=784 Consideremos que cuando un pixel está totalmente negro, tiene valor de 1 y cuando no tiene tinta, su valor es 0, los grises tomarán un valor entre 0 y 1. 16 16 10 Ejemplo: Reconocimiento de caracteres 30 ● Tomemos una red con dos capas ocultas de 16 nodos. ● Si cada conexión tiene un peso y cada neurona un bias (excepto las de entrada), cuántos parámetros debemos optimizar? Al final minimizaremos la distancia al cuadrado entre la salida obtenida y la esperada y de la optimización saldrán los pesos óptimos El algoritmo de entrenamiento usado en este tipo de redes se llama Backpropagation y va desde las salidas a las entradas. La optimización, matemáticamente, se realiza utilizando el método del gradiente. Cada salida de una neurona será una función de sus entradas al final estará todo muy “no linealmente” entrelazado. 0 0 0 0 0 0 0 0 1 Salida esperada contra la cual se compara https://www.youtube.com/playlist?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi Videos sugeridos https://www.youtube.com/playlist?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi Aplicación: Logística en R 31 Problema 2: ● Supongamos una gran ciudad con 100 clientes importantes. Quisiéramos instalar nuestros centros de distribución (20 como máximo) para atender de mejor manera a los clientes. ● El problema es que existe un costo de transporte (proporcional a la distancia) y un costo fijo por cada centro. ● ¿Cómo podemos pedirle al computador que nos ayude a encontrar la manera más económica de instalarnos? Conclusiones • El curso de Data Analytics (ex Sistemas de Información) busca desarrollar las siguientes competencias en los alumnos: – Manejo básico de lenguaje de programación y del entorno de desarrollo integrado (IDE) – Construcción de modelos matemáticos basados en datos que representen simplificaciones de Problemas Reales aplicados en distintas áreas de la empresa, identificando sus elementos principales. – Validaciones de calidad para modelos predictivos y clasificación. – Tomar decisiones complejas a partir de análisis de datos y/o modelos que representan situaciones de incertidumbre. 32Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics Data Science: Factor Clave en la empresa de hoy Matías Rojas Business Analytics Universidad de los Andes Facultad de Ciencias Económicas y Empresariales 33
Compartir