Logo Studenta

d BD2019GRUPO05-TP07

¡Estudia con miles de materiales!

Vista previa del material en texto

BASE DE DATOS 
TRABAJO PRACTICO Nº7 
TEMA: Business Inteligence (BI), Data Warehouse (DW) y Data Mining (DM) 
Fecha de entrega: 13/11/2019 
 
Integrantes 
Guari, Juan Pablo de la Cruz 
Choque, Fabián Guillermo 
Churquina, Javier Pablo 
Cruz, Alfredo 
Ibañez, Ignacio Francisco 
 
 
 
1) 
Se denomina inteligencia empresarial, inteligencia de negocios, inteligencia 
comercial o BI, al conjunto de estrategias, aplicaciones, datos, productos, tecnologías y 
arquitectura técnicas, los cuales están enfocados a la administración y creación 
de conocimiento sobre el medio, a través del análisis de los datos existentes en 
una organización o empresa. 
https://es.wikipedia.org/wiki/Inteligencia_empresarial - 13/11/2019 
Se define Business Intelligence como el conjunto de metodologías, aplicaciones y 
tecnologías que permiten reunir, depurar y transformar datos de los sistemas 
transaccionales e información desestructurada (interna y externa a la compañía) en 
información estructurada, para su explotación directa o para su análisis y conversión en 
conocimiento, dando así soporte a la toma de decisiones sobre el negocio. 
https://www.sinnexus.com/business_intelligence/ - 13/11/2019 
Por ejemplo, cuando buscamos un producto o servicio en internet, esta búsqueda se 
guarda en algún lugar, se analiza y procesa, así la próxima vez que nos conectamos a 
internet nos aparecen sugerencias y publicidad de los productos o servicios que estabas 
buscando. 
2) 
Sistema de un supermercado 
Tipos de información: 
• Información de los empleados, sus datos personales nombre y apellido, DNI, 
teléfono, domicilio, su puesto de trabajo, salario, antigüedad, etc. 
• Información de clientes como el detalle de la compra realizada, modo de pago, 
datos de la tarjeta y banco con el que pago la compra, etc. 
• Información de los productos que se venden como nombre, stock, precio, tamaño, 
marca, etc. 
• Información de las ventas, los datos de las cantidades de productos vendidos en 
un día, una semana o un mes con los cuales se podrían realizar estadísticas. 
• Información de los proveedores como nombre, cuit, teléfono, domicilio, productos 
que provee, etc. 
Usuarios: 
• Gerente que controla principalmente las finanzas del supermercado. 
• Encargado se ocupa de administrar la sucursal y controlar a los empleados. 
• Empleados como Cajeros, Repositores, Personal de limpieza, Seguridad. 
• Clientes personas que realizan la compra de productos. 
• Proveedores quienes suministran los productos al supermercado. 
 
 
https://es.wikipedia.org/wiki/Inteligencia_empresarial
https://www.sinnexus.com/business_intelligence/
3) 
Cuadrante Mágico de Gartner: 
Es la culminación de la investigación en un mercado específico, que le brinda una visión 
gran angular de las posiciones relativas de los competidores del mercado. Al aplicar un 
tratamiento gráfico y un conjunto uniforme de criterios de evaluación, un Cuadrante 
Mágico lo ayuda a determinar rápidamente qué tan bien los proveedores de tecnología 
están ejecutando sus visiones declaradas y qué tan bien se están desempeñando contra 
la visión de mercado de Gartner. 
https://www.gartner.com/en/research/methodologies/magic-quadrants-research - 
13/11/2019 
4) 
Data Warehouse (DW): Es una Base de Datos corporativa que se caracteriza por integrar 
y depurar información de una o más fuentes distintas, para luego procesarla permitiendo 
su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. 
 
Data Mart: Es un subconjunto de un DW hecho a la medida de un departamento. 
Por ejemplo, una tienda en internet tendría su Data Warehouse en donde se concentra 
toda la información, mientras que los departamentos como ventas, clientes, pedidos, 
envíos, etc. Serian cada uno un Data Mart. 
5) 
La finalidad de ETL es preparar los datos origen para el Data Warehouse. Consiste en 
extraer datos operacionales de una aplicación de origen, transformarlo, cargarlo e 
indexarlo, asegurando su alta calidad y publicación. 
6) 
Un cubo de información OLAP es una base de datos almacenada en un vector 
multidimensional, en donde se puede acceder a los datos a través del índice de alguna 
sus dimensiones. La ventaja del cubo de información es que permite realizar selección y 
análisis, de grandes cantidades de datos, muy rápido. 
7) 
Data Mining (minería de datos): es el conjunto de técnicas y tecnologías que permiten 
explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo 
de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento 
de los datos en un determinado contexto. 
https://www.sinnexus.com/business_intelligence/datamining.aspx - 13/11/2019 
El Data Mining se usa, por ejemplo, para detectar hábitos de compras en internet, analizar 
el comportamiento de los usuarios en un sitio web de internet. 
 
 
https://www.gartner.com/en/research/methodologies/magic-quadrants-research
https://www.sinnexus.com/business_intelligence/datamining.aspx
8) Tecnologías en la que se apoya el DM 
Redes neuronales (predictivo-descriptivo): Genéricamente, son métodos de proceso 
numérico en paralelo, en el que las variables interactúan mediante transformaciones 
lineales o no lineales, hasta obtener unas salidas. Estas salidas se contrastan con los que 
tenían que haber salido, basándose en unos datos de prueba, dando lugar a un proceso 
de retroalimentación mediante el cual la red se reconfigura, hasta obtener un modelo 
adecuado. 
Árbol de decisión ID3 (predictivo): el uso del algoritmo ID3 se engloba en la búsqueda 
de hipótesis o reglas en él, dado un conjunto de ejemplos, trata de obtener las hipótesis 
que clasifiquen ante nuevas instancias, si dicho ejemplo va a ser positivo o negativo. 
Redes de Kohonen (descriptivo): es un tipo de red neuronal artificial, que es entrenada 
usando aprendizaje no supervisado para producir una representación discreta del espacio 
de las muestras de entrada, llamado mapa. 
K-means (descriptivo): es un método de agrupamiento, que tiene como objetivo la 
partición de un conjunto de n observaciones en k grupos en el que cada observación 
pertenece al grupo cuyo valor medio es más cercano. 
9) 
RapidMiner: es un programa informático para el análisis y minería de datos. Permite el 
desarrollo de procesos de análisis de datos mediante el encadenamiento de operadores a 
través de un entorno gráfico. 
Fue Desarrollado en Java, es Multiplataforma, permite representación interna de los 
procesos de análisis de datos en ficheros XML además el desarrollo de programas a 
través de un lenguaje de script. 
Puede usarse de diversas maneras: a través de un GUI, en línea de comandos, en batch 
(lotes), o desde otros programas a través de llamadas a sus bibliotecas. 
Es extensible e incluye gráficos y herramientas de visualización de datos. 
 
Weka: es una plataforma de software para el aprendizaje automático y la minería de 
datos escrito en Java, contiene una colección de herramientas de visualización 
y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de 
usuario para acceder fácilmente a sus funcionalidades.

Continuar navegando

Materiales relacionados

26 pag.
Introducción de datos

ESTÁCIO

User badge image

mateus

31 pag.
Clase_6_Data_Mining

UNAM

User badge image

sanchezdavalos229

15 pag.
M1_Big_Data

User badge image

Fernando Nano Fer Rguez

45 pag.
SiS4tro - Adalberto Garza

User badge image

Desafío México Veintitrés