Logo Studenta

5451409-sesion-6-google-analisis-de-datos-para-la-ia_2024

¡Este material tiene más páginas!

Vista previa del material en texto

LATAM Customer Engineer
Artificial Intelligence and Machine Learning
Andrés Villa
Análisis de datos para la 
Inteligencia Artificial
2
Presentación del ponente
Ingeniero en Informática
Master en Big Data & Data Science
IBM (6 años)
SAS Institute (9 años)
Google
Tecnología: APIs, Cloud, Python, CI/CD, IoT
Inteligencia Artificial: Machine Learning, Computer Vision, GenAI
2
https://www.linkedin.com/in/andresvilla/
https://www.linkedin.com/in/andresvilla/
¿Quién es Google?
3
La gran misión de Google 
“Organizar la información del 
mundo y hacer que sea útil y 
accesible para todos”
4
¿Qué es Inteligencia Artificial?
Sistemas que emulan tareas humanas, 
se alimentan de data. Son muy 
precisos y rápidos. 
Los vemos actualmente en 
automatización de procesos, análisis 
de patrones y predicciones, visión 
computarizada, procesamiento de 
lenguaje natural. 
Un poco de historia… 
❏ En 1950 y 1960 .. se 
examinaron los principios de 
la neurodinámica y se 
expandió el ML simbólico.. 
Nace el concepto de 
“General AI” 
❏ 1970 “AI winter ” 
❏ 1980 nuevo enfoque 
“sistemas expertos”.. Luego 
otro “AI winter ” 
❏ 1990 nuevos casos de uso y 
algoritmos.. 
❏ 2000 -2010 Big data, mayor 
procesamiento, nuevos 
algoritmos
5
¿Qué es Inteligencia Artificial?
6
The Moral Machine experiment
following an exploration strategy that focuses on nine 
factors: 
1. Sparing humans (versus pets)
2. Staying on course (versus swerving)
3. Sparing passengers (versus pedestrians)
4. Sparing more lives (versus fewer lives)
5. Sparing men (versus women)
6. Sparing the young (versus the elderly
7. Sparing pedestrians who cross legally (versus 
jaywalking)
8. Sparing the fit (versus the less fit)
9. Sparing those with higher social status (versus 
lower social status)
Additional characters were included in some scenarios 
(for example, criminals, pregnant women or doctors), 
who were not linked to any of these nine factors. 
7
8
Western:
▪ EEUU
▪ Europa
Eastern:
▪ Japón
▪ Taiwan 
▪ Indonesia 
▪ Pakistán
▪ Arabia Saudita
Southern:
▪ Centro América
▪ Sudamérica 
9
¿Qué es Inteligencia Artificial?
Sistemas que emulan tareas humanas, se 
alimentan de data. Son muy precisos y 
rápidos. Los vemos actualmente en visión 
computarizada, procesamiento de lenguaje 
natural, automatización de procesos, 
análisis de patrones y predicciones.
10
¿Cómo funciona la Inteligencia Artificial?
Sistemas Expertos vs. Sistemas 
Inteligentes
¿Es lo mismo?¿Cual es la diferencia?
¿Existe?¿Puedo clasificarlos?
¿Iguales o muy diferentes?
Hablemos de la IA
¿Cuándo es realmente útil?
★ Tenemos un problema de negocio bien definido
★ Se puede entender (medir) el valor de resolver el problema
★ Se tiene (suficiente) data (buena) 
Tipos de IA 
▪ “General AI” cualquier película de ciencia ficción… (o no?)
▪ “Weak AI”… DeepBlue (ajedrez), Watson (jeopardy) 
▪ Los más avanzado hoy en día es “Generative AI”… Modelos de Lenguaje como , Gemini, 
Gemma, Claude y muchas otras… generación de imágenes, textos, preguntas/respuesta… 
13
¿Por qué IA en las empresas y organizaciones, para que la usan?
Conocimiento (Insight)
Decisiones impulsadas por 
datos (data-driven)
Tendencias y patrones
Distingue entre lo objetivo y 
lo subjetivo
Analítica Avanzada
Analítica predictiva
Analítica prescriptiva
Automatización
Tareas repetitivas y tediosas
Decisiones y acciones
Inteligencia humana 
aumentada
Sistemas inteligentes
Vehículos autónomos
Internet de las cosas (IoT)
Robots autónomos
Descubrir
Potencial en los datos
Nuevas líneas de negocios
Nuevos productos o tipos de 
clientes
Corregir o mejorar
Evitar fraudes
Reducir costos y 
desperdicios de materiales o 
tiempo
Optimizar
14
¿Cuáles son los datos que impulsan la Inteligencia Artificial?
Ventas
Sensores
Usuarios
Marketing
Logs
Eventos
Operacional
Transaccional
Data de terceros
Data Comercial
Data Pública
(web scraping) 
No Estructurados
Redes Sociales
15
Algoritmos: ¿Qué es Machine Learning?
"Field of study that gives computers the ability to learn without being 
explicitly programmed".
- Arthur Samuel (1959)
“A computer program is said to learn from experience E with respect to 
some class of tasks T and performance measure P, if its performance at 
tasks in T, as measured by P, improves with experience E.”
- Tom Mitchell (1997)
16
¿Qué es Machine Learning?
Machine Learning –aprendizaje automático– es una 
rama de la inteligencia artificial que permite a las 
máquinas aprender sin ser expresamente 
programadas para ello. Ideales para encontrar o 
descubrir patrones y hacer predicciones. Estas 
técnicas están presente en un sinfín de aplicaciones 
como las recomendaciones de Netflix o Spotify, las 
respuestas inteligentes de Gmail o el asistente de Siri y 
Google Voice.
17
¿Qué es Machine Learning?
18
¿Qué es Machine Learning?
19
Tradicional
20
Machine Learning
21
22
Cambio importante de paradigma
Respuesta
Reglas
Data
Reglas
Data
Respuesta *NN
Programa
Entrenamiento
23
“perro” CNN/R
NN
Conocimiento
(Modelo)
perro:87%
Cambio importante de paradigma
24
Aprendizaje Supervisado
✔ La data tiene etiquetas
✔ Generalmente creas nuevas variables
✔ Tienes mucha data histórica
✔ Conoces el objetivo
25
✔ Tienes mucha data pero no sabes exactamente lo que estas 
buscando
✔ Estás buscando patrones pero aun no tienes un objetivo claro
✔ Muy bueno para encontrar anomalías y grupos
Aprendizaje No Supervisado
26 26
✔ Un tipo de aprendizaje semi-supervisado 
✔ No requiere data de entrenamiento
✔ Tiene un enfoque psicológico 
✔ Básicamente es ensayo y error
Aprendizaje Reforzado
27 27
Clasificación (Classification)
27
Identificar a qué categoría pertenece un objeto
Ejemplo: Clasificar correo spam, diagnosticar diabetes (u otras enfermedades), clasificar 
texto
Algoritmos:
Regresión Lineal
Rápida de entrenar
Modelo lineal
Suport Vector Machine
Uno de los mejores algoritmos supervisados
Mas robusto con outliers
Maneja modelos no lineales
Random Forest
Rápido para entrenar
Maneja variables categóricas
No requiere escalar variables
Captura escenarios no lineales e interacción 
entre variables
Naive Bayes
Bueno para clasificación de texto
Asume cada variable como independiente
28 28
Regresión Lineal (Regression)
Predecir un valor continuo
Ejemplo: Predecir precios de casas en base a numero de baños y metraje, predecir el precio 
de un carro usado en base al año y el kilometraje
29 29
Regresión Lineal
30 30
Regresión Lineal
Error Cuadrático Medio o 
Función de Pérdida o 
Costo (Loss Function)
31 31
Regresión Lineal
Método del gradiente 
descendente.
Paraboloide que 
representa el ECM en 
función de b & w
32 32
Regresión Lineal
33 33
Agrupación (Clustering)
Agrupar de forma automática objetos similares en un grupo (cluster)
Ejemplo: Segmentación de clientes, personas, atletas, empleados. Grupos de productos, 
comportamientos
34 34
K-means
34
✔ Se basa en buscar grupos
✔ Se establece cuantos clúster debe 
buscar
✔ Genera 3 puntos aleatorios iniciales 
y luego comienza a iterar entre 
calculando las distancias buscando 
un mejor centro
35 3535
▪ El método del codo
K-means
36 3636
K-means
36A
ge
 🡪
A
ge
 🡪
A
ge
 🡪
Alto Valor
Promedio
Crisis Laboral
Junior
Años en la 
compañía
RendimientoAge 🡪Rendimiento
Filtro Colaborativo (Collaborative Filtering)
Identificar valores ausentes en una matriz de asociación entre clientes y productos, muy 
utilizado en sistemas de recomendaciones
Ejemplo: Recomendaciones de productos, películas, comida, intereses…
38
• NN: Neural Networks
• Son una simulación abstracta del sistema nervioso
• Redes neuronales biológicas:
• Las neuronas y sus conexiones son la clave del procesado de la información 
Dentritas
(entradas)
Axón
(salida)
Cuerpo
¿Redes Neuronales?
¿Redes Neuronales?
 Perceptrón:
▪ Es una red que dispone de una única neurona
▪ Es capaz de resolver problemas linealmente separables: Umbral de activación
Valor de entrada:
Salida:
x1
xN
w1
wN
y
¿Redes Neuronales?
▪ Un perceptrón sólo es capaz de resolver problemas linealmente separables
 
Para sistemas más complejos:
▪ Perceptrón multicapa
¿Redes Neuronales?
▪ Perceptrón multicapa
▪ Ejemplos de sistemas no linealmente separables que se pueden resolver
¿Redes Neuronales?
 Topología:
▪ Los elementos de proceso de conectan formando capas
Capa de
entrada
Capa de
salida
 Capas 
ocultas
¿Redes Neuronales Profundas?
Las redes neuronales se utilizan ampliamente en el aprendizaje supervisado y en los problemas de 
aprendizaje por refuerzo. Estas redes se basan en un conjunto de capas conectadas entre sí.
Principalmente utilizamos el método de descenso de gradiente para optimizar la red y minimizar la 
función de pérdida.
Entrenamiento es arduo.. Ejemplo Imagenet..
Casos de uso y aplicaciones
Uso de IA/ML en el mundo real
44
¿Qué tan importante es la data?
Es el fundamento del aprendizaje de un modelo o algoritmo en la mayoría de los casos no es posible 
hacer nada 
Estructurada
No-Estructurada
Semi-Estructura
da
XML
JSON
Imágenes
Audio
Video
TextoFecha Precio Oferta SKU
09-10-22 100 50 2392837
09-11-22 134 44 3878993
Data-Generada
Predicción - Regresión
Entradas Salida numérica 
continuaModelo
Data Etiquetada Precio de acciones
APPL = $ 234
Casos de uso
▪ Customer lifetime value (CLV)
▪ Predicción de revenue y 
crecimiento
▪ Precios dinámicos
▪ Acciones y trading algorítmico
▪ Mantenimiento predictivo 
Ejemplo
▪ Magnitud de terremotos
▪ Precios de casas
▪ Uber’s ETA
▪ Precios de productos 
nuevos
Sistemas de recomendaciones y personalización 
Entradas Salida numérica 
continuaModelo
Data usuario
Data producto/artículo
Gustos
Comprar
Ver
Leer
Casos de uso
▪ Recomendaciones de productos
▪ Recomendaciones de música, películas, 
libros
▪ Personalización de contenido web, 
promociones, noticias
Ejemplo
▪ Amazon y Netflix
▪ Spotify Mix, Dicover
▪ Facebook, Instagram, Tiktok
▪ Twitter trends
▪ Vue.ia shopping
Filtro colaborativo
Basado en contenido
Reconocimiento 
Entradas ReconocimientoModelo / Algo
Data 
no estructurada
Patrón
Valor
Sentimiento
Cara o Facción 
Casos de uso
▪ Imagen y video
✔ Reconocimiento de objetos, detección, identificación 
✔ Reconocimiento facial, expresión y sentimiento 
✔ Detección de gestos y movimiento
✔ OCR, escritura a mano
▪ Audio
✔ Aplicaciones speech to text
✔ Speaker id
✔ Análisis de sentimiento
Face_recognition
Haars
Edges patterns
Ejemplo
▪ Facebook Facial Recog
▪ Pinterest Lens
▪ Afectiva reconocimiento de 
emociones
▪ Shazam music
▪ Vivino etiquetas de vino
Visión de Computador
Entradas ReconocimientoModelo / Algo
Imágenes
Video (muchas 
imágenes)
Detección 
Reconocimiento
Identificación 
Análisis de movimiento
Casos de uso
▪ Reconocimiento de imágenes
▪ Detención de movimiento
▪ Drones y vehículos autónomos
▪ Robótica
▪ Movimientos de cliente en tienda
Ejemplo
▪ Tesla, Google vehículos autónomos
▪ Amazon Go
▪ Syte.ai búsqueda visual
▪ ViSenze
Agrupaciones (Clusters)
Entradas
Reconocimiento
Modelo / Algo
Data no etiquetada
Si / No
Casos de uso
▪ Segmentación de clientes
▪ Motores de recomendaciones
▪ Imágenes medicas
▪ Agrupación de productos
▪ Análisis de redes sociales
▪ Detención de anomalías
Ejemplo
▪ Salesforce, Facebook
▪ Mayoría de GPC, Retail, e-commerce
▪ Estudios sociales INE
Reconocimiento
Clusters o numero de 
agrupaciones
Detección de anomalías (Clusters)
Entradas
Reconocimiento
Modelo / Algo
Data no etiquetada
Si / No
Casos de uso
▪ Fraude
▪ Ciberseguridad
▪ Detección de defectos y errores
▪ Sistemas de salud
▪ Robo de identidad
Ejemplo
▪ Ciberseguridad
▪ Desarrollo de 
software
▪ Servicios financieros
▪ Telcos
Reconocimiento
Clusters o número de 
agrupaciones
Modelos de lenguaje masivos (solo texto)
Entradas
Respuesta o 
razonamiento
LLM
Data no 
estructurada
Casos de uso
▪ Preguntas y respuestas
▪ Resúmenes
▪ Generación de ideas, textos
▪ Razonamiento de máquina
▪ Codificación o documentación de código 
Ejemplo
▪ Asistentes
▪ Creatividad
▪ Desarrollo del 
software
▪ Documentacion
Generación de 
Texto
Modelos de lenguaje masivos (multimodal)
Entradas
Respuesta o 
razonamiento
LLM (MM)
Data no estructurada 
(texto, audio, video)
Casos de uso
▪ Preguntas y respuestas
▪ Resúmenes
▪ Generación de ideas, textos
▪ Razonamiento de máquina
▪ Codificación o documentación de código
▪ En videos o audios, Q&A, resúmenes, 
descripción 
Ejemplo
▪ Asistentes
▪ Creatividad
▪ Desarrollo del 
software
▪ Documentación
Generación de 
Texto
Recursos gratuitos
1. Introduction to Large Language Models:
🔗 https://lnkd.in/eBVdss4T
2. Introduction to Generative AI:
🔗 https://lnkd.in/ee4gxDvT
3. Generative AI Fundamentals:
🔗 https://lnkd.in/erJaqDCK
4. Introduction to Responsible AI:
🔗 https://lnkd.in/eUcqfz_r
5. Encoder-Decoder Architecture:
🔗 https://lnkd.in/euqrJZz6
6. Introduction to Image Generation:
🔗 https://lnkd.in/eDS2Af4y
7. Transformer Models and BERT Model:
🔗 https://lnkd.in/e4nyJJZG
8. Attention Mechanism:
🔗 https://lnkd.in/eJayUv5K
9. Introduction to Generative AI Studio:
🔗 https://lnkd.in/eZ5pWUqA
10. Create Image Captioning Models:
🔗 https://lnkd.in/ewJFAfb7
Consola de Google
Más información cada semana:
https://www.linkedin.com/in/andresvilla/
https://lnkd.in/eBVdss4T
https://lnkd.in/ee4gxDvT
https://lnkd.in/erJaqDCK
https://lnkd.in/eUcqfz_r
https://lnkd.in/euqrJZz6
https://lnkd.in/eDS2Af4y
https://lnkd.in/e4nyJJZG
https://lnkd.in/eJayUv5K
https://lnkd.in/eZ5pWUqA
https://lnkd.in/ewJFAfb7
https://pantheon.corp.google.com/
https://www.linkedin.com/in/andresvilla/
Proprietary + Confidential
Gracias