Vista previa del material en texto
LATAM Customer Engineer Artificial Intelligence and Machine Learning Andrés Villa Análisis de datos para la Inteligencia Artificial 2 Presentación del ponente Ingeniero en Informática Master en Big Data & Data Science IBM (6 años) SAS Institute (9 años) Google Tecnología: APIs, Cloud, Python, CI/CD, IoT Inteligencia Artificial: Machine Learning, Computer Vision, GenAI 2 https://www.linkedin.com/in/andresvilla/ https://www.linkedin.com/in/andresvilla/ ¿Quién es Google? 3 La gran misión de Google “Organizar la información del mundo y hacer que sea útil y accesible para todos” 4 ¿Qué es Inteligencia Artificial? Sistemas que emulan tareas humanas, se alimentan de data. Son muy precisos y rápidos. Los vemos actualmente en automatización de procesos, análisis de patrones y predicciones, visión computarizada, procesamiento de lenguaje natural. Un poco de historia… ❏ En 1950 y 1960 .. se examinaron los principios de la neurodinámica y se expandió el ML simbólico.. Nace el concepto de “General AI” ❏ 1970 “AI winter ” ❏ 1980 nuevo enfoque “sistemas expertos”.. Luego otro “AI winter ” ❏ 1990 nuevos casos de uso y algoritmos.. ❏ 2000 -2010 Big data, mayor procesamiento, nuevos algoritmos 5 ¿Qué es Inteligencia Artificial? 6 The Moral Machine experiment following an exploration strategy that focuses on nine factors: 1. Sparing humans (versus pets) 2. Staying on course (versus swerving) 3. Sparing passengers (versus pedestrians) 4. Sparing more lives (versus fewer lives) 5. Sparing men (versus women) 6. Sparing the young (versus the elderly 7. Sparing pedestrians who cross legally (versus jaywalking) 8. Sparing the fit (versus the less fit) 9. Sparing those with higher social status (versus lower social status) Additional characters were included in some scenarios (for example, criminals, pregnant women or doctors), who were not linked to any of these nine factors. 7 8 Western: ▪ EEUU ▪ Europa Eastern: ▪ Japón ▪ Taiwan ▪ Indonesia ▪ Pakistán ▪ Arabia Saudita Southern: ▪ Centro América ▪ Sudamérica 9 ¿Qué es Inteligencia Artificial? Sistemas que emulan tareas humanas, se alimentan de data. Son muy precisos y rápidos. Los vemos actualmente en visión computarizada, procesamiento de lenguaje natural, automatización de procesos, análisis de patrones y predicciones. 10 ¿Cómo funciona la Inteligencia Artificial? Sistemas Expertos vs. Sistemas Inteligentes ¿Es lo mismo?¿Cual es la diferencia? ¿Existe?¿Puedo clasificarlos? ¿Iguales o muy diferentes? Hablemos de la IA ¿Cuándo es realmente útil? ★ Tenemos un problema de negocio bien definido ★ Se puede entender (medir) el valor de resolver el problema ★ Se tiene (suficiente) data (buena) Tipos de IA ▪ “General AI” cualquier película de ciencia ficción… (o no?) ▪ “Weak AI”… DeepBlue (ajedrez), Watson (jeopardy) ▪ Los más avanzado hoy en día es “Generative AI”… Modelos de Lenguaje como , Gemini, Gemma, Claude y muchas otras… generación de imágenes, textos, preguntas/respuesta… 13 ¿Por qué IA en las empresas y organizaciones, para que la usan? Conocimiento (Insight) Decisiones impulsadas por datos (data-driven) Tendencias y patrones Distingue entre lo objetivo y lo subjetivo Analítica Avanzada Analítica predictiva Analítica prescriptiva Automatización Tareas repetitivas y tediosas Decisiones y acciones Inteligencia humana aumentada Sistemas inteligentes Vehículos autónomos Internet de las cosas (IoT) Robots autónomos Descubrir Potencial en los datos Nuevas líneas de negocios Nuevos productos o tipos de clientes Corregir o mejorar Evitar fraudes Reducir costos y desperdicios de materiales o tiempo Optimizar 14 ¿Cuáles son los datos que impulsan la Inteligencia Artificial? Ventas Sensores Usuarios Marketing Logs Eventos Operacional Transaccional Data de terceros Data Comercial Data Pública (web scraping) No Estructurados Redes Sociales 15 Algoritmos: ¿Qué es Machine Learning? "Field of study that gives computers the ability to learn without being explicitly programmed". - Arthur Samuel (1959) “A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.” - Tom Mitchell (1997) 16 ¿Qué es Machine Learning? Machine Learning –aprendizaje automático– es una rama de la inteligencia artificial que permite a las máquinas aprender sin ser expresamente programadas para ello. Ideales para encontrar o descubrir patrones y hacer predicciones. Estas técnicas están presente en un sinfín de aplicaciones como las recomendaciones de Netflix o Spotify, las respuestas inteligentes de Gmail o el asistente de Siri y Google Voice. 17 ¿Qué es Machine Learning? 18 ¿Qué es Machine Learning? 19 Tradicional 20 Machine Learning 21 22 Cambio importante de paradigma Respuesta Reglas Data Reglas Data Respuesta *NN Programa Entrenamiento 23 “perro” CNN/R NN Conocimiento (Modelo) perro:87% Cambio importante de paradigma 24 Aprendizaje Supervisado ✔ La data tiene etiquetas ✔ Generalmente creas nuevas variables ✔ Tienes mucha data histórica ✔ Conoces el objetivo 25 ✔ Tienes mucha data pero no sabes exactamente lo que estas buscando ✔ Estás buscando patrones pero aun no tienes un objetivo claro ✔ Muy bueno para encontrar anomalías y grupos Aprendizaje No Supervisado 26 26 ✔ Un tipo de aprendizaje semi-supervisado ✔ No requiere data de entrenamiento ✔ Tiene un enfoque psicológico ✔ Básicamente es ensayo y error Aprendizaje Reforzado 27 27 Clasificación (Classification) 27 Identificar a qué categoría pertenece un objeto Ejemplo: Clasificar correo spam, diagnosticar diabetes (u otras enfermedades), clasificar texto Algoritmos: Regresión Lineal Rápida de entrenar Modelo lineal Suport Vector Machine Uno de los mejores algoritmos supervisados Mas robusto con outliers Maneja modelos no lineales Random Forest Rápido para entrenar Maneja variables categóricas No requiere escalar variables Captura escenarios no lineales e interacción entre variables Naive Bayes Bueno para clasificación de texto Asume cada variable como independiente 28 28 Regresión Lineal (Regression) Predecir un valor continuo Ejemplo: Predecir precios de casas en base a numero de baños y metraje, predecir el precio de un carro usado en base al año y el kilometraje 29 29 Regresión Lineal 30 30 Regresión Lineal Error Cuadrático Medio o Función de Pérdida o Costo (Loss Function) 31 31 Regresión Lineal Método del gradiente descendente. Paraboloide que representa el ECM en función de b & w 32 32 Regresión Lineal 33 33 Agrupación (Clustering) Agrupar de forma automática objetos similares en un grupo (cluster) Ejemplo: Segmentación de clientes, personas, atletas, empleados. Grupos de productos, comportamientos 34 34 K-means 34 ✔ Se basa en buscar grupos ✔ Se establece cuantos clúster debe buscar ✔ Genera 3 puntos aleatorios iniciales y luego comienza a iterar entre calculando las distancias buscando un mejor centro 35 3535 ▪ El método del codo K-means 36 3636 K-means 36A ge 🡪 A ge 🡪 A ge 🡪 Alto Valor Promedio Crisis Laboral Junior Años en la compañía RendimientoAge 🡪Rendimiento Filtro Colaborativo (Collaborative Filtering) Identificar valores ausentes en una matriz de asociación entre clientes y productos, muy utilizado en sistemas de recomendaciones Ejemplo: Recomendaciones de productos, películas, comida, intereses… 38 • NN: Neural Networks • Son una simulación abstracta del sistema nervioso • Redes neuronales biológicas: • Las neuronas y sus conexiones son la clave del procesado de la información Dentritas (entradas) Axón (salida) Cuerpo ¿Redes Neuronales? ¿Redes Neuronales? Perceptrón: ▪ Es una red que dispone de una única neurona ▪ Es capaz de resolver problemas linealmente separables: Umbral de activación Valor de entrada: Salida: x1 xN w1 wN y ¿Redes Neuronales? ▪ Un perceptrón sólo es capaz de resolver problemas linealmente separables Para sistemas más complejos: ▪ Perceptrón multicapa ¿Redes Neuronales? ▪ Perceptrón multicapa ▪ Ejemplos de sistemas no linealmente separables que se pueden resolver ¿Redes Neuronales? Topología: ▪ Los elementos de proceso de conectan formando capas Capa de entrada Capa de salida Capas ocultas ¿Redes Neuronales Profundas? Las redes neuronales se utilizan ampliamente en el aprendizaje supervisado y en los problemas de aprendizaje por refuerzo. Estas redes se basan en un conjunto de capas conectadas entre sí. Principalmente utilizamos el método de descenso de gradiente para optimizar la red y minimizar la función de pérdida. Entrenamiento es arduo.. Ejemplo Imagenet.. Casos de uso y aplicaciones Uso de IA/ML en el mundo real 44 ¿Qué tan importante es la data? Es el fundamento del aprendizaje de un modelo o algoritmo en la mayoría de los casos no es posible hacer nada Estructurada No-Estructurada Semi-Estructura da XML JSON Imágenes Audio Video TextoFecha Precio Oferta SKU 09-10-22 100 50 2392837 09-11-22 134 44 3878993 Data-Generada Predicción - Regresión Entradas Salida numérica continuaModelo Data Etiquetada Precio de acciones APPL = $ 234 Casos de uso ▪ Customer lifetime value (CLV) ▪ Predicción de revenue y crecimiento ▪ Precios dinámicos ▪ Acciones y trading algorítmico ▪ Mantenimiento predictivo Ejemplo ▪ Magnitud de terremotos ▪ Precios de casas ▪ Uber’s ETA ▪ Precios de productos nuevos Sistemas de recomendaciones y personalización Entradas Salida numérica continuaModelo Data usuario Data producto/artículo Gustos Comprar Ver Leer Casos de uso ▪ Recomendaciones de productos ▪ Recomendaciones de música, películas, libros ▪ Personalización de contenido web, promociones, noticias Ejemplo ▪ Amazon y Netflix ▪ Spotify Mix, Dicover ▪ Facebook, Instagram, Tiktok ▪ Twitter trends ▪ Vue.ia shopping Filtro colaborativo Basado en contenido Reconocimiento Entradas ReconocimientoModelo / Algo Data no estructurada Patrón Valor Sentimiento Cara o Facción Casos de uso ▪ Imagen y video ✔ Reconocimiento de objetos, detección, identificación ✔ Reconocimiento facial, expresión y sentimiento ✔ Detección de gestos y movimiento ✔ OCR, escritura a mano ▪ Audio ✔ Aplicaciones speech to text ✔ Speaker id ✔ Análisis de sentimiento Face_recognition Haars Edges patterns Ejemplo ▪ Facebook Facial Recog ▪ Pinterest Lens ▪ Afectiva reconocimiento de emociones ▪ Shazam music ▪ Vivino etiquetas de vino Visión de Computador Entradas ReconocimientoModelo / Algo Imágenes Video (muchas imágenes) Detección Reconocimiento Identificación Análisis de movimiento Casos de uso ▪ Reconocimiento de imágenes ▪ Detención de movimiento ▪ Drones y vehículos autónomos ▪ Robótica ▪ Movimientos de cliente en tienda Ejemplo ▪ Tesla, Google vehículos autónomos ▪ Amazon Go ▪ Syte.ai búsqueda visual ▪ ViSenze Agrupaciones (Clusters) Entradas Reconocimiento Modelo / Algo Data no etiquetada Si / No Casos de uso ▪ Segmentación de clientes ▪ Motores de recomendaciones ▪ Imágenes medicas ▪ Agrupación de productos ▪ Análisis de redes sociales ▪ Detención de anomalías Ejemplo ▪ Salesforce, Facebook ▪ Mayoría de GPC, Retail, e-commerce ▪ Estudios sociales INE Reconocimiento Clusters o numero de agrupaciones Detección de anomalías (Clusters) Entradas Reconocimiento Modelo / Algo Data no etiquetada Si / No Casos de uso ▪ Fraude ▪ Ciberseguridad ▪ Detección de defectos y errores ▪ Sistemas de salud ▪ Robo de identidad Ejemplo ▪ Ciberseguridad ▪ Desarrollo de software ▪ Servicios financieros ▪ Telcos Reconocimiento Clusters o número de agrupaciones Modelos de lenguaje masivos (solo texto) Entradas Respuesta o razonamiento LLM Data no estructurada Casos de uso ▪ Preguntas y respuestas ▪ Resúmenes ▪ Generación de ideas, textos ▪ Razonamiento de máquina ▪ Codificación o documentación de código Ejemplo ▪ Asistentes ▪ Creatividad ▪ Desarrollo del software ▪ Documentacion Generación de Texto Modelos de lenguaje masivos (multimodal) Entradas Respuesta o razonamiento LLM (MM) Data no estructurada (texto, audio, video) Casos de uso ▪ Preguntas y respuestas ▪ Resúmenes ▪ Generación de ideas, textos ▪ Razonamiento de máquina ▪ Codificación o documentación de código ▪ En videos o audios, Q&A, resúmenes, descripción Ejemplo ▪ Asistentes ▪ Creatividad ▪ Desarrollo del software ▪ Documentación Generación de Texto Recursos gratuitos 1. Introduction to Large Language Models: 🔗 https://lnkd.in/eBVdss4T 2. Introduction to Generative AI: 🔗 https://lnkd.in/ee4gxDvT 3. Generative AI Fundamentals: 🔗 https://lnkd.in/erJaqDCK 4. Introduction to Responsible AI: 🔗 https://lnkd.in/eUcqfz_r 5. Encoder-Decoder Architecture: 🔗 https://lnkd.in/euqrJZz6 6. Introduction to Image Generation: 🔗 https://lnkd.in/eDS2Af4y 7. Transformer Models and BERT Model: 🔗 https://lnkd.in/e4nyJJZG 8. Attention Mechanism: 🔗 https://lnkd.in/eJayUv5K 9. Introduction to Generative AI Studio: 🔗 https://lnkd.in/eZ5pWUqA 10. Create Image Captioning Models: 🔗 https://lnkd.in/ewJFAfb7 Consola de Google Más información cada semana: https://www.linkedin.com/in/andresvilla/ https://lnkd.in/eBVdss4T https://lnkd.in/ee4gxDvT https://lnkd.in/erJaqDCK https://lnkd.in/eUcqfz_r https://lnkd.in/euqrJZz6 https://lnkd.in/eDS2Af4y https://lnkd.in/e4nyJJZG https://lnkd.in/eJayUv5K https://lnkd.in/eZ5pWUqA https://lnkd.in/ewJFAfb7 https://pantheon.corp.google.com/ https://www.linkedin.com/in/andresvilla/ Proprietary + Confidential Gracias