Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Big Data en negocios e instituciones Ciencia Medicina Ciencias Sociales y Humanidades Negocio, Comercio e Industria Entretenimiento y Ocio Nuestro mundo gira en torno a los datos Exabytes: 1018 bytes. La explosión de los datos La explosión de los datos Zettabyes: 1021 bytes. El progreso y la innovación ya no se ven obstaculizados por la capacidadde recopilar datos, sino por la capacidad de: • Extraer el valor de los datos • Convertir datos en conocimiento ¿Qué hacemos con estos datos? El valor de la información El reto del “Big Data” ¿Por qué Big Data? Tecnologías para Big Data y Big Data Analytics. Ciencia de Datos El poder de los datosy su impacto en la sociedad ¿Por qué Big Data ? ¿Cómo podemos procesar 1000 TB(1 PB) ó 10000 TB? Propuesta de Google 2004: Paradigma MapReduce (aproximación más popular a big data) • Problema: Escalabilidad de grandes cantidades de datos • Ejemplo: • Exploración 100 TB en 1 nodo @ 50 MB/sec =23 días • Solución Divide-Y-Vencerás – Exploración en un clúster de 1000 nodos = 33 minutos Fragmentación Datos Procesamiento Paralelo Fusión de Modelos Big Data en 3 V’s Volumen VelocidadVariedad Doug Laney, Gartner Feb. 6, 2011 3-D Data Management: Controlling Data Volume, Velocity andVariety. Big Data Some Make it 4V’s: Veracity ¿Qué es Big Data ? “Big Data” son datos cuyo volumen, diversidad y complejidad requieren nueva arquitectura, técnicas, algoritmos y análisis para gestionar y extraer valor y conocimiento oculto en ellos ... 3 V’s de Big Data 10 2001 3V’s Gartner Doug Laney 2004 MapReduce Google Jeffrey Dean 2008 Hadoop Yahoo! Doug Cutting Big Data 2010 Spark U Berckeley Apache Spark Feb. 2014 Matei Zaharia 2009-2013 Flink TUBerlin Flink Apache (Dec. 2014) Volker Markl 2010-2015: Big Data Analytics: Mahout, MLLib, … Hadoop Ecosystem Aplicaciones Nuevas Tecnologías Big Data: Cronología 2001-2010 2010-2015 Clustering Recommendation Systems Classification Association Real Time Analytics/ Big Data Streams Social Media Mining Social Big Data Big Data Analytics Potentiales escenarios Ámbito del conocimiento que engloba las habilidades asociadas al análisis inteligente de datos, incluyendo Big Data Ciencia de Datos Científico de datos ¿Por qué Big Data ? Tecnologías para Big Data y Big Data Analytics. Ciencia de Datos El poder de los datos y su impacto en la sociedad El valor de la información: el reto del “Big Data” Críticos y editores literarios La voz de Amazon (1995) El poder de losdatos Análisis de transacciones Amazon: Sistema de recomendación Los datos incrementaron tremendamente las ventas Ahora más de 1/3 de las ventas son gracias a las recomendaciones Dilema: ¿Lo que los clics decían o lo que opinaban los críticos? Greg Linde (1997) propuso un sistema de recomendaciones, filtrado colaborativo “artículo a artículo” Fuente: Big Data. La revolución de los datos masivos. Pag. 69. The power of habit, Charles Duhigg. Feb. 2012 Fuente: Big Data. La revolución de los datos masivos. Pag. 77 v Descubrimiento: Cremas sin perfume al tercer mes. Dos docenas de productos Predicción de fecha parto Modelo de predicción de clientes embarazadas por medio de sus patronesde compra. Acción: Envío de cupones para cada fase del embarazo Disculpas Empresa. Disculpas del padre, confirmación del embarazo de la hija Enfado de un padre: Su Hija recibe publicidad de productos para embarazadas El poder de losdatos Análisis de transacciones Target (cadena de grandes almacenes) que utiliza el análisis de transacciones y asociaciones. Unos días después el director llamó al padre para disculparse. Respuesta conciliadora del padre: “He estado hablando con mi hija –dijo el padre– Resulta que en mi casa han tenido lugar ciertas actividades de las que yo no estaba del todo informado. Mi hija sale de cuentas en agosto. Soy yo el que les debe una disculpa”. Fuente: Big Data. La revolución de los datos masivos. Pag. 77. El poder de losdatos Análisis de transacciones Un chivo expiatorio Analizando Twitter para medir la Salud Pública Se obtienen 13 grupos coherentes de mensajes correlacionados - Gripe estacional (r= 0.689) y alergias (r = 0.810) - Ejercicio y obesidad relacionados con datos geográficos, .. Discovering Health Topics in Social Media Using TopicModels Michael J. Paul, Mark Dredze, Johns Hopkins University, Plos One 9(8) e103408, 2014 doi:10.1371/journal.pone.0103408 You Are What You Tweet Un sistema de filtrado de datos de Twitter puede inferir aspectos de salud analizando 144M de tuits (2014-2016) http://elpais.com/elpais/2015/01/29/ciencia/1422520042_066660.html http://www.sciencemag.org/content/347/6221/536 Banca: Identificación de personas con las compras de TDC Identificación por el número de compras Identificación por el género Identificación por el poder adquisitivo Banca: Identificación de personas con las compras de TDC Salud Redes sociales como fuente de datos Industria, comercio, banca, … Ocio y cultural (Ej. Recomendaciones) Política Bien social (Social good) Impacto en la sociedad http://www.elmundo.es/elmundo/2013/09/03/navegante/137 ml 8243782.ht Big Data: Gran Impacto en la Sociedad y presencia en losmedios de comunicación http://economia.elpais.com/economia/2013/09/27/actualidad/1380 283725_938376.html La demanda de profesionales formados en Ciencia de Datos y Big Data es enorme. Se estima que la conversión de datos en información útil generó un mercado de 132.000 millones de dólares en 2015 y que se crearán más de 4.4 millones de empleos. España necesitaba para 2015 más de 60.000 profesionales con formación en Ciencia de Datos y Big Data. Impacto Económico Capítulo 3. http://issuu.com/secacult_uja/docs/libro_francisco_herrera.indd El valor de la información: el Big Data Lecturas rápida: Tecnología y sobre el poder de los datos
Compartir