Logo Studenta

SiS4tro - Adalberto Garza

¡Este material tiene más páginas!

Vista previa del material en texto

BIG DATA, DATA MINING Y DATA ANALYTICS 
Integrantes del Equipo
Adalberto Josué Garza López 1669312
Alexis de Jesus Jasso Beltrán 1794999
Ángel Arnulfo Rodríguez Hernández 1677532
Manuel Francisco Rodríguez Ortega 1734505
Sistemas de Información IV
Gpo: 51 
1
 Big Data
Big Data
3
¿Qué es Big data?
Gartner Inc: Big data son datos que contienen una mayor variedad que se presentan en volúmenes crecientes y a una velocidad superior. Esto se conoce como "las tres V".
https://www.youtube.com/watch?v=w4vsFKMO7XA
4
Volumen
Con big data, deberá procesar grandes volúmenes de datos no estructurados de baja densidad. 
Para algunas organizaciones, esto puede suponer decenas de terabytes de datos. Para otras, incluso cientos de petabytes.
5
Velocidad
La velocidad es el ritmo al que se reciben los datos y al que se aplica alguna acción. Algunos productos inteligentes habilitados para Internet funcionan en tiempo real o prácticamente en tiempo real y requieren una evaluación y actuación en tiempo real.
6
Variedad
Con el auge del big data, los datos se presentan en nuevos tipos de datos no estructurados. 
Los tipos de datos no estructurados y semiestructurados, como el texto, audio o vídeo, requieren de un procesamiento adicional para poder obtener significado y habilitar los metadatos.
7
Ventajas de big data y de la analítica de datos
El big data permite obtener respuestas más completas, ya que dispone de mayor cantidad de información.
La disponibilidad de respuestas más completas significa una mayor fiabilidad de los datos.
8
Desafíos de Big Data
El big data se caracteriza por su gran tamaño. El volumen de datos duplica su tamaño cada dos años aproximadamente. 
Disponer de datos limpios, datos relevantes para el cliente y organizados de tal modo que permitan un análisis significativo. 
9
Como funciona Big Data
El big data concentra datos de numerosas fuentes y aplicaciones distintas.  Analizar conjuntos de big data de uno o más terabytes, o incluso petabytes.
Durante la integración, los datos, deben estar formateados y disponibles de tal forma que los analistas empresariales puedan empezar a utilizarlos.
10
Integrar
Como funciona Big Data
El big data requiere almacenamiento. Su solución de almacenamiento puede residir en la nube, on premise (local) o ambas. Puede almacenar sus datos de cualquier forma que desee e incorporar los requisitos de procesamiento de su preferencia .
11
Gestionar
Como funciona Big Data
La inversión en big data se rentabiliza en cuanto se analizan y utilizan los datos. Adquiera una nueva claridad con un análisis visual de sus diversos conjuntos de datos. 
12
Analizar
https://www.lavanguardia.com/deportes/futbol/20190731/463802936857/premier-league-prediccion-resultado-temporada-2019-2020-big-data.html
13
Noticias acerca de Big Data
Bibliografías y Referencias
14
https://www.oracle.com/mx/big-data/guide/what-is-big-data.html
Data Mining
Situación rica en datos pero pobre en información
Definición	
No existe una única definición del término Data Mining. 
Se puede decir que DM se refiere a un conjunto de métodos estadísticos que proporcionan información cuando se dispone de muchos datos.
 Esta idea de DM lleva a la siguiente estructura de conocimiento: 
 Datos + Estadística → Información 
El símbolo → tiene el siguiente sentido: los datos están bien recogidos y la estadística bien aplicada.
16
Data Mining
Básicamente, el data mining surge para intentar ayudar a comprender el contenido de un repositorio de datos. 
Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. 
Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento.
17
Etapas
18
Aunque en data minning cada caso concreto puede ser radicalmente distinto al anterior, el proceso común a todos ellos se suele componer de cuatro etapas principales:
Determinación de los objetivos: Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data mining.
Pre procesamiento de los datos: Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.
Etapas
19
Determinación del modelo: Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial.
Análisis de los resultados: Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.
Ventajas
 En resumen, el data mining se presenta como una tecnología emergente, con varias ventajas:
Resulta un buen punto de encuentro entre los investigadores y las personas de negocios.
Ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios. 
Trabajar con esta tecnología implica cuidar un sin número de detalles debido a que el producto final involucra "toma de decisiones".
20
Áreas de Aplicación
Algunas áreas de aplicación del DM son:
Toma de Decisiones. Ejemplos: banca, finanzas, seguros, marketing, políticas sanitarias o demográficas.
Procesos Industriales.
Investigación Científica Ejemplos: medicina, epidemiología, bioinformática, psicología.
Soporte al Diseño de Bases de Datos.
Mejora de Calidad de Datos.
Mejora en el área de empresas de Consulting.
21
Ejemplos de Aplicación
 A continuación se indican algunos ejemplos de aplicación del DM. 
Comercio/Marketing 
Identificación de patrones de compra de los clientes. 
Búsqueda de asociaciones entre clientes y características demográficas. 
Predicción de respuesta a campañas de correo. 
Análisis de cestas de la compra.
22
Ejemplos de Aplicación
23
2. Banca 
Detección de patrones de uso fraudulento de tarjetas de crédito.
Identificación de clientes leales. 
Predicción de clientes con probabilidad de cambiar su afiliación. 
Determinación del gasto de tarjeta de crédito por grupos. 
Búsqueda de correlaciones entre indicadores financieros. 
Identificación de reglas de mercado de valores a partir de históricos
Ejemplos de Aplicación
24
3. Seguros y Salud Privada
Análisis de procedimientos médicos solicitados.
Predicción de qué clientes compran nuevas pólizas.
Identificación patrones de comportamiento para clientes con riesgo.
Identificación de comportamiento fraudulento.
Ejemplos de Aplicación
25
4. Transportes
Determinación de la planificación de la distribución entre tiendas.
Análisis de patrones de carga.
Ejemplos de Aplicación
26
5. Medicina
a) Identificación de terapias médicas adecuadas para diferentes enfermedades.
b) Asociación de síntomas y clasificación diferencial de patologías.
c) Estudio de factores (genéticos, precedentes, hábitos, alimenticios, etc.) de riesgo
en distintas patologías.
d) Segmentación de pacientes para una atención más adecuada según su grupo.
e) Predicciones temporales de los centros asistenciales para el mejor uso de recursos, consultas, salas y habitaciones.
f ) Estudios epidemiológicos, análisis de rendimientos de campañas de información, prevención, sustitución de fármacos, etc.
Ejemplo de éxito del Data Mining
27
Este coche conduce automáticamente enla autovía. 
Utiliza una cámara digital y las imágenes se elaboran para reconocer las líneas blancas.
Video
28
https://www.youtube.com/watch?v=ueAaIEr0PY4
Noticias
29
Futuro laboral para el marketer
https://www.unir.net/marketing-comunicacion/revista/noticias/la-mineria-de-datos-un-futuro-laboral-abierto-para-el-marketer/549203633849/
Data mining: ¿siempre es bueno?
https://amp.eluniversal.com.mx/amp/note/amp/eluniversal/1179490
Data mining vs Big data
http://www.tuataratech.com/2015/06/mineria-de-datos-data-mining-vs-grandes.html?m=1
Data Analytics
Data Analytics
 Data analytics es el componente principal de la minería de datos y el llamado Business Intelligence (BI). En pocas palabras, es la clave para obtener la información que impulsa la toma de decisión comercial.
31
Cuarta V (Valor)
32
4 Tipos de Data Analytics
33
Descriptivo
Diagnostico
Predictivo
Prescriptivo
Plataformas 
34
Recursos	 
35
https://www.youtube.com/watch?v=uQmcgvxx_g0
Usos de Análisis de Datos
36
Un centro de sismología podría predecir un terremoto horas antes de que éste ocurra a partir de datos con ciertos patrones, provenientes de sensores.
Los diferentes Gobiernos necesitan comprender variables importantes como el clima y la demografía para incluir medidas y planes en sus políticas de gobierno.
Una cadena de almacenes retail quisiera conocer al instante lo que están comprando sus clientes, dado un evento o acontecimiento (como un fenómeno climático o de carácter social), a partir de los datos generados por su sistema de Puntos de Venta POS. 
Componentes 
37
Data Warehousing
38
Data Warehousing como el conjunto de arquitecturas que facilitan o apoyan procesos de o BI.
Colección de datos en la cual, dos o más fuentes de datos dispares pueden ser reunidas mediante una estrategia de gestión integrada y variable en el tiempo.
NoSQL
39
Además de proponer diferentes modelos de datos, estas herramientas incluyen arquitecturas de computación distribuida y lenguajes de alto nivel para acceder a los datos, hecho que las ubica como las tecnologías y herramientas más utilizadas para Big Data.
Estas tecnologías se caracterizan por mantener una organización muy simple o sin esquema, con una semántica llave-valor y un esquema de almacenamiento altamente escalable. 
Cloud Computing
40
Un estilo de computación en la cual capacidades de escalabilidad y elasticidad son ofrecidas como servicio usando tecnologías de internet.
En la actualidad, grandes representantes de la computación en la nube, como es el caso de Amazon Web Services , están haciendo una gran apuesta al área del Big Data Analytics poniendo poderosas herramientas de computación en la nube al alcance de otras organizaciones emergentes que se encuentran ubicadas en la ciencia, la industria y el Gobierno.
Reflexión
Ángel Arnulfo Rodríguez Hernández
Viendo el gran progreso y la velocidad a la que la tecnología esta avanzando no es muy difícil de pensar el porque de la gran cantidad de datos que se almacena en base de datos día con día. 
Por lo que es normal que con el pasar del tiempo, se hayan creado, elaborado y aplicando nuevos métodos para no solo guardar los datos adquiridos, sino también para sacarle el mayor provecho a estos mismos y no solo conseguir información valiosa; también conocimiento. 
41
Reflexión
Manuel Francisco Rodríguez Ortega 
Para mi esta revolución en la tecnología que se esta dando en una gran avance que se ayudando ha que los procesos sean mas independientes sin la necesidad de la intervención del ser humano. También vi que la búsqueda de datos es mas extensa ya que esto ayuda a que la información de los datos este mejor relacionada y así obtener una mejor respuesta de búsqueda .
42
Reflexión
Alexis de Jesus Jasso Beltrán
Cada día vamos avanzando más, cada día los conocimientos de las personas van quedando obsoletos y eso nos ayuda a que día con día estemos en constante investigación, con enriquezcamos de información para andar al pie de la letra, un gran ejemplo de esto es la revolución industrial, y sobre todo de los avances de los Datos que almacenamos día con dia, surgen siempre conocimientos nuevos que hacen que la vida de mi informática sea cada vez más importante interesante y sobre todo eficaz. Ya que me quedo con este trabajo que siempre hay que estar un paso adelante de todo, con un simple clic en la computadora nos llenamos de información y enriquezcamos de conocimientos para así en un futuro ser la nueva generación adaptada par el manejo de grandes cantidades de datos adaptandole una buena seguridad a los mismos.
43
Reflexión
Adalberto Josué Garza López
El Big Data es tan útil para las empresas principalmente del mercado multinacional ya que brinda la clave para observar cual es el camino que llevara a los mejores resultados en el futuro y mejorar las acciones a llevarse a cabo, en pocas palabras, una herramienta derivada de las principales tecnologías actuales, pasara mucho tiempo para que este método tecnológico sea cambiado por otra innovación que pueda surgir en el futuro, por el momento, muchas de las empresas lideres en servicio del sector comercial y de investigación siguen aprovechando esta maravillosa herramienta.
44
Bibliografías
http://myweb.sabanciuniv.edu/rdehkharghani/files/2016/02/The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei-Han-Micheline-Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques-3rd-Edition-Morgan-Kaufmann-2011.pdfw
https://www.exinfm.com/pdffiles/intro_dm.pdf
halweb.uc3m.es/esp/Personal/personas/.../introduccion-DM.pdf
https://www.gestiopolis.com/que-es-data-mining/
https://www.sinnexus.com/business_intelligence/datamining.aspx
https://s3.amazonaws.com/academia.edu.documents/38520697/Tabares_Hernandez_2014-big_data_analytics_FINAL.pdf?response-content-disposition=inline%3B%20filename%3DB
https://www.google.com/search?q=big+data+analytics+components&source=lnms&tbm=isch&sa=X&ved=0ahUKEwi3g46zv_vjAhUMi6wKHTFQDh0Q_AUIESgB&biw=1600&bih=746
45

Continuar navegando

Materiales relacionados

35 pag.
2

San Francisco De Uco

User badge image

ancrve03

31 pag.
Clase_6_Data_Mining

UNAM

User badge image

sanchezdavalos229

15 pag.
M1_Big_Data

User badge image

Fernando Nano Fer Rguez