Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
BASE DE DATOS TRABAJO PRACTICO Nº7 TEMA: Business Inteligence (BI), Data Warehouse (DW) y Data Mining (DM) Fecha de entrega: 13/11/2019 Integrantes Guari, Juan Pablo de la Cruz Choque, Fabián Guillermo Churquina, Javier Pablo Cruz, Alfredo Ibañez, Ignacio Francisco 1) Se denomina inteligencia empresarial, inteligencia de negocios, inteligencia comercial o BI, al conjunto de estrategias, aplicaciones, datos, productos, tecnologías y arquitectura técnicas, los cuales están enfocados a la administración y creación de conocimiento sobre el medio, a través del análisis de los datos existentes en una organización o empresa. https://es.wikipedia.org/wiki/Inteligencia_empresarial - 13/11/2019 Se define Business Intelligence como el conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales e información desestructurada (interna y externa a la compañía) en información estructurada, para su explotación directa o para su análisis y conversión en conocimiento, dando así soporte a la toma de decisiones sobre el negocio. https://www.sinnexus.com/business_intelligence/ - 13/11/2019 Por ejemplo, cuando buscamos un producto o servicio en internet, esta búsqueda se guarda en algún lugar, se analiza y procesa, así la próxima vez que nos conectamos a internet nos aparecen sugerencias y publicidad de los productos o servicios que estabas buscando. 2) Sistema de un supermercado Tipos de información: • Información de los empleados, sus datos personales nombre y apellido, DNI, teléfono, domicilio, su puesto de trabajo, salario, antigüedad, etc. • Información de clientes como el detalle de la compra realizada, modo de pago, datos de la tarjeta y banco con el que pago la compra, etc. • Información de los productos que se venden como nombre, stock, precio, tamaño, marca, etc. • Información de las ventas, los datos de las cantidades de productos vendidos en un día, una semana o un mes con los cuales se podrían realizar estadísticas. • Información de los proveedores como nombre, cuit, teléfono, domicilio, productos que provee, etc. Usuarios: • Gerente que controla principalmente las finanzas del supermercado. • Encargado se ocupa de administrar la sucursal y controlar a los empleados. • Empleados como Cajeros, Repositores, Personal de limpieza, Seguridad. • Clientes personas que realizan la compra de productos. • Proveedores quienes suministran los productos al supermercado. https://es.wikipedia.org/wiki/Inteligencia_empresarial https://www.sinnexus.com/business_intelligence/ 3) Cuadrante Mágico de Gartner: Es la culminación de la investigación en un mercado específico, que le brinda una visión gran angular de las posiciones relativas de los competidores del mercado. Al aplicar un tratamiento gráfico y un conjunto uniforme de criterios de evaluación, un Cuadrante Mágico lo ayuda a determinar rápidamente qué tan bien los proveedores de tecnología están ejecutando sus visiones declaradas y qué tan bien se están desempeñando contra la visión de mercado de Gartner. https://www.gartner.com/en/research/methodologies/magic-quadrants-research - 13/11/2019 4) Data Warehouse (DW): Es una Base de Datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. Data Mart: Es un subconjunto de un DW hecho a la medida de un departamento. Por ejemplo, una tienda en internet tendría su Data Warehouse en donde se concentra toda la información, mientras que los departamentos como ventas, clientes, pedidos, envíos, etc. Serian cada uno un Data Mart. 5) La finalidad de ETL es preparar los datos origen para el Data Warehouse. Consiste en extraer datos operacionales de una aplicación de origen, transformarlo, cargarlo e indexarlo, asegurando su alta calidad y publicación. 6) Un cubo de información OLAP es una base de datos almacenada en un vector multidimensional, en donde se puede acceder a los datos a través del índice de alguna sus dimensiones. La ventaja del cubo de información es que permite realizar selección y análisis, de grandes cantidades de datos, muy rápido. 7) Data Mining (minería de datos): es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. https://www.sinnexus.com/business_intelligence/datamining.aspx - 13/11/2019 El Data Mining se usa, por ejemplo, para detectar hábitos de compras en internet, analizar el comportamiento de los usuarios en un sitio web de internet. https://www.gartner.com/en/research/methodologies/magic-quadrants-research https://www.sinnexus.com/business_intelligence/datamining.aspx 8) Tecnologías en la que se apoya el DM Redes neuronales (predictivo-descriptivo): Genéricamente, son métodos de proceso numérico en paralelo, en el que las variables interactúan mediante transformaciones lineales o no lineales, hasta obtener unas salidas. Estas salidas se contrastan con los que tenían que haber salido, basándose en unos datos de prueba, dando lugar a un proceso de retroalimentación mediante el cual la red se reconfigura, hasta obtener un modelo adecuado. Árbol de decisión ID3 (predictivo): el uso del algoritmo ID3 se engloba en la búsqueda de hipótesis o reglas en él, dado un conjunto de ejemplos, trata de obtener las hipótesis que clasifiquen ante nuevas instancias, si dicho ejemplo va a ser positivo o negativo. Redes de Kohonen (descriptivo): es un tipo de red neuronal artificial, que es entrenada usando aprendizaje no supervisado para producir una representación discreta del espacio de las muestras de entrada, llamado mapa. K-means (descriptivo): es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano. 9) RapidMiner: es un programa informático para el análisis y minería de datos. Permite el desarrollo de procesos de análisis de datos mediante el encadenamiento de operadores a través de un entorno gráfico. Fue Desarrollado en Java, es Multiplataforma, permite representación interna de los procesos de análisis de datos en ficheros XML además el desarrollo de programas a través de un lenguaje de script. Puede usarse de diversas maneras: a través de un GUI, en línea de comandos, en batch (lotes), o desde otros programas a través de llamadas a sus bibliotecas. Es extensible e incluye gráficos y herramientas de visualización de datos. Weka: es una plataforma de software para el aprendizaje automático y la minería de datos escrito en Java, contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades.
Compartir