Logo Studenta

Data Science_Jun2021 - Yuliana Ruiz Borrayo

¡Este material tiene más páginas!

Vista previa del material en texto

Data Science: 
Factor Clave en la empresa de hoy
Matías Rojas
Business Analytics Universidad de los Andes Facultad de Ciencias Económicas y Empresariales 1
Introducción
2Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Glosario Siglo XXI
• Business Analytics: El uso de datos de diversas fuentes, tratados mediante análisis estadístico, 
análisis cuantitativo, data mining, modelado predictivo y otras tecnologías y técnicas, para mejorar 
y/o desarrollar procesos de negocios que agreguen valor en las empresas.
• Data Science: Ciencia dedicada al estudio de los datos, buscando extraer el conocimiento presente 
en ellos para responder preguntas.
• Inteligencia Artificial: Estructura computacional diseñada para realizar determinadas operaciones 
que se consideran propias de la inteligencia humana, como el autoaprendizaje.
• Machine Learning: Es una rama de la Inteligencia Artificial que crea sistemas que aprenden 
automáticamente, identificando patrones complejos ocultos en los datos, en ella se crean sistemas 
capaces de generalizar comportamientos a partir de una información no estructurada suministrada 
en forma de ejemplos.
• Big Data: Conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), 
complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, 
procesamiento o análisis mediante tecnologías y herramientas convencionales.
3Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Historia de la IA
4Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
1950
El matemático Alan Turing propone test para medir inteligencia de las máquinas
1974-1993
Invierno en Inteligencia Artificial
1997
Deep Blue, computador de IBM programado para jugar ajedrez, vence a 
campeón mundial Gary Kasparov
2011
IBM con su computador contesta-preguntas Watson gana 1 millón de dólares en 
el programa de TV Jeopardy
2017
La inteligencia artificial de Google Alpha Go vence a Ke Jie en el complejo juego 
Go, que tiene del orden de 10170 combinaciones (más que la cantidad de átomos 
del universo observable)
2018: Asistente de Google
5Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Fuente video: https://www.youtube.com/watch?v=pKVppdt_-B4
https://www.youtube.com/watch?v=pKVppdt_-B4
2020: GPT3
6Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Fuente paper: https://arxiv.org/pdf/2005.14165
https://arxiv.org/pdf/2005.14165
2020: GPT3
7Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Fuente video: https://youtu.be/PqbB07n_uQ4
https://youtu.be/PqbB07n_uQ4
Tipos de Aprendizaje en máquinas
8Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
2. Aprendizaje No Supervisado: 
Se deducen patrones (estructuras subyacentes) a partir de datos 
no etiquetados:
1. Aprendizaje Supervisado: 
Se muestran respuestas correctas e 
incorrectas con datos etiquetados:
Input Etiqueta
Pera
Manzana
Pera
Manzana
Predicción
?
Veo un patrón 
aquí
Modelo
3. Aprendizaje de Refuerzo: 
Híbrido entre supervisado y no supervisado, existe recompensa 
por éxito: es aprendizaje por ensayo y error.
… 
Ramas de la Inteligencia Artificial
• A fin de cuentas no es magia, es matemática y computación.
9Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Aplicaciones
• Aplicaciones
10Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Ruta más rápida…
Recomendación de 
amigos…
Recomendación de 
canciones…
Recomendación 
de productos…
etc…
Predicción de 
clima…
Aplicaciones en Empresas
• Segmentación de Clientes.
• Pronósticos de Ventas.
• Sistemas de recomendación.
• Cálculo de Scoring Crediticio.
• Modelos de fuga.
• Optimizaciones avanzadas en logística.
• Predicción de fallas en maquinaria.
• Orquestación de Procesos.
• …
11Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Avances en la Inteligencia Artificial
• Aplicaciones
12Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Avances en la Inteligencia Artificial: Música
• Deep Bach
13Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Fuente artículo: https://arxiv.org/pdf/1612.01010.pdf
Fuente video: https://www.youtube.com/watch?v=QiBM7-5hA6o
https://arxiv.org/pdf/1612.01010.pdf
https://www.youtube.com/watch?v=QiBM7-5hA6o
Avances en la Inteligencia Artificial: Arte
• Neural Style Transfer
14Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Fuente artículo: https://arxiv.org/pdf/1508.06576.pdf
https://arxiv.org/pdf/1508.06576.pdf
Avances en la Inteligencia Artificial: Arte
• Cómo no probarlo…
15Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Avances en la Inteligencia Artificial: Arte
• Volveremos a este paper más adelante…
16Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Tipos de análisis (analytics)
• ¿Qué tipos de analítica podemos hacer?
17Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Tipos de análisis (analytics)
• Análisis Descriptivo: 
– Utiliza los datos históricos, identificando comportamientos y dibujando cómo se están haciendo 
las cosas. Es la analítica más usada y su objetivo es realizar una fotografía de la situación para 
poder tomar decisiones. Cuenta en realidad cómo está nuestro negocio hasta la fecha, 
permitiendo visualizar, detectar, averiguar, calcular e identificar. 
– Se consultan diferentes indicadores de negocio de cara a obtener una visión de lo que ha pasado 
y está pasando.
– La pregunta más habitual es: ¿Qué pasó?
18Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Tipos de Analítica
Descriptiva Predictiva Prescriptiva
Tipos de análisis (analytics)
• Análisis Predictivo:
– Como su nombre indica hace posible la creación de modelos que permiten vaticinar lo que va a 
ocurrir con antelación. En realidad mira al futuro y nos ayuda a entender cómo puede 
evolucionar nuestro entorno y hasta la propia compañía. Su propósito es hacer pronósticos. Está 
basada en métodos matemáticos avanzados como la estadística o el aprendizaje automático 
(machine learning) para predecir los datos que faltan y describir lo que va a suceder. 
– Busca extraer conocimiento en forma de patrones, modelos o tendencias que ayuden mejor a 
acertar con situaciones futuras. 
– La pregunta más habitual es: ¿Qué pasará?
19Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Tipos de análisis (analytics)
• Análisis Prescriptivo:
– Analiza los datos para encontrar cuál es la solución entre una gama de variantes. Su tarea es 
optimizar recursos y aumentar la eficiencia operativa. Usa técnicas de simulación y optimización, 
logrando señalar cuál es el camino que conviene realmente elegir. 
– En realidad informa acerca de lo que debiera suceder buscando mejorar el resultado
proporcionando recomendaciones para maximizar indicadores de negocio.
– La pregunta más habitual es: ¿Qué debemos hacer?
20Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Proceso Data Science
• Proceso CRISP-DM 
(Cross Industry
Standard Process for
Data Mining)
21Universidad de los Andes Facultad de CienciasEconómicas y EmpresarialesBusiness Analytics
La Nube
22Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Google Colab
23
https://colab.research.google.com/
https://colab.research.google.com/
Aplicación: Arte en Python
24
https://colab.research.google.com/github/tensorflow/models/blob/master/research/nst_blogpost/4_Neur
al_Style_Transfer_with_Eager_Execution.ipynb
*En el entorno de ejecución, cambiar el tipo de entorno de ejecución y acelerar con GPU.
https://colab.research.google.com/github/tensorflow/models/blob/master/research/nst_blogpost/4_Neural_Style_Transfer_with_Eager_Execution.ipynb
Red Neuronal Artificial: Resumen
25
¿Cómo funciona?
Inspirada en el cerebro humano, una red neuronal consiste en redes de neuronas altamente conectadas 
que relacionan las entradas con las salidas deseadas. La red se entrena modificando iterativamente los 
pesos de las conexiones para que desde las entradas se pueda llegar a la respuesta correcta. Cada 
neurona es una estructura en la que se reciben las entradas ponderadas y según un criterio de activación 
transmitirá una salida.
red neuronal
¿Cuándo se usa?
● Para clasificación o regresión
● El modelo es altamente no lineal.
● La cantidad de data aumenta y se 
desea actualizar constantemente el 
modelo.
● Pueden tenerse cambios inesperados 
en las entradas.
● La interpretación del modelo no es 
relevante.
Red neuronal: Intuición Biológica
26
Neuronas Artificiales
● Una neurona artificial puede 
verse como una función, la cual 
recibe entradas (provenientes del 
exterior [data de entrada] o de 
neuronas precedentes), dichas 
entradas son sumadas de 
manera ponderada (aplicándose 
un peso 𝑤) y agregándose un 
bias (similar al intercepto o 𝛽0 en 
una regresión lineal)
● El resultado de esa suma 
ponderada pasará a una función 
de activación, en donde si se 
supera un umbral determinado, 
transmitirá el mensaje.
Red neuronal: Funciones de Activación
27
● Existen muchas funciones de activación y dependerán de la naturaleza del problema y la red 
neuronal utilizada cual usar.
Ejemplo: Reconocimiento de caracteres
28
● Queremos armar una red neuronal que sea capaz de reconocer dígitos escritos a mano.
● Es un problema de Aprendizaje Supervisado, tenemos etiquetas.
Ejemplo: Reconocimiento de caracteres
29
● Supongamos que cada dígito es de 784 pixeles (282)
● Es un problema de Aprendizaje Supervisado, tenemos etiquetas.
282=784
Consideremos que cuando un 
pixel está totalmente negro, 
tiene valor de 1 y cuando no 
tiene tinta, su valor es 0, los 
grises tomarán un valor entre 
0 y 1.
16 16
10
Ejemplo: Reconocimiento de caracteres
30
● Tomemos una red con dos capas ocultas de 16 nodos.
● Si cada conexión tiene un peso y cada neurona un bias (excepto las de entrada), cuántos parámetros 
debemos optimizar?
Al final minimizaremos la distancia al 
cuadrado entre la salida obtenida y la 
esperada y de la optimización saldrán los 
pesos óptimos
El algoritmo de entrenamiento usado en 
este tipo de redes se llama 
Backpropagation y va desde las salidas 
a las entradas.
La optimización, matemáticamente, se 
realiza utilizando el método del gradiente.
Cada salida de una neurona 
será una función de sus 
entradas al final estará todo muy 
“no linealmente” entrelazado. 0
0
0
0
0
0
0
0
1
Salida esperada contra la 
cual se compara
https://www.youtube.com/playlist?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi
Videos 
sugeridos
https://www.youtube.com/playlist?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi
Aplicación: Logística en R
31
Problema 2:
● Supongamos una gran ciudad 
con 100 clientes importantes. 
Quisiéramos instalar nuestros 
centros de distribución (20 
como máximo) para atender 
de mejor manera a los 
clientes.
● El problema es que existe un 
costo de transporte 
(proporcional a la distancia) y 
un costo fijo por cada centro.
● ¿Cómo podemos pedirle al 
computador que nos ayude a 
encontrar la manera más 
económica de instalarnos?
Conclusiones
• El curso de Data Analytics (ex Sistemas de Información) busca 
desarrollar las siguientes competencias en los alumnos:
– Manejo básico de lenguaje de programación y del entorno de desarrollo 
integrado (IDE) 
– Construcción de modelos matemáticos basados en datos que representen 
simplificaciones de Problemas Reales aplicados en distintas áreas de la empresa, 
identificando sus elementos principales.
– Validaciones de calidad para modelos predictivos y clasificación.
– Tomar decisiones complejas a partir de análisis de datos y/o modelos que 
representan situaciones de incertidumbre.
32Universidad de los Andes Facultad de Ciencias Económicas y EmpresarialesBusiness Analytics
Data Science: 
Factor Clave en la empresa de hoy
Matías Rojas
Business Analytics Universidad de los Andes Facultad de Ciencias Económicas y Empresariales 33

Continuar navegando