Logo Studenta

Data warehouse Cubos Olap

¡Estudia con miles de materiales!

Vista previa del material en texto

Nombre del alumno: Antony Arturo García Pérez
Matrícula: 2020690020
Carrera: Licenciatura en Ciencia de Datos
Nombre de la materia: Minería de Datos
Nombre del docente: Dr. José Luis Cendejas Valdez
Data warehouse – Cubos Olap
Sabinas, Coahuila							30/05/2022
Data warehouse
Un data warehouse es un tipo de sistema de gestión de datos diseñado para habilitar y dar soporte a las tareas de inteligencia empresarial (BI), especialmente las analíticas. Los data warehouses solo se han diseñado para realizar consultas y tareas de análisis, y suelen contener grandes cantidades de datos históricos. A menudo, la información dentro de un data warehouse proviene de una amplia gama de fuentes, como los archivos de registro de aplicaciones o las aplicaciones de transacción.
Un data warehouse centraliza y fusiona grandes cantidades de datos de múltiples fuentes. Gracias a sus capacidades analíticas, las organizaciones pueden obtener información empresarial valiosa a partir de los datos y mejorar las decisiones. Con el tiempo, se construye un registro histórico de gran valor para los expertos en datos y los analistas de negocio. Debido a estas funciones, se puede considerar a la data warehouse como la “única fuente de información” de una entidad.
Un data warehouse típico suele incluir los siguientes elementos:
· Una base de datos relacional para almacenar y gestionar los datos.
· Una solución de extracción carga y transformación (ELT) para preparar los datos para el análisis.
· Análisis estadísticos, informes y funciones de extracción de datos.
· Herramientas de análisis de clientes para visualizar y presentar datos a usuarios de negocio.
· Otras aplicaciones analíticas más sofisticadas que generan información procesable aplicando data science y algoritmos de inteligencia artificial (IA)
Ventajas de un data warehouse
Los data warehouses ofrecen una ventaja exclusiva y global: permitir a las organizaciones analizar grandes cantidades de datos de variables y extraer un valor significativo, además de mantener un registro histórico.
Los data warehouses cuentan con cuatro características exclusivas (descritas por el experto en informática William Inmon, considerado el originador de los data warehouses) por las que pueden aportar esta ventaja global. Según esta definición, los data warehouses disponen de las siguientes características:
· Orientados a sujetos. Pueden analizar datos sobre un tema particular o área funcional (como las ventas).
· Integrados. Los data warehouses crean uniformidad entre diferentes tipos de datos de fuentes dispares.
· No volátiles. Cuando la información entra en un data warehouse, es estable y no cambia.
· Tienen en cuenta las variaciones a lo largo del tiempo. La analítica de los data warehouses toma en consideración los cambios que se producen con el tiempo.
Un data warehouse bien diseñado realizará consultas muy rápidamente, ofrecerá una gran producción de datos y aportará la flexibilidad necesaria para que los usuarios finales puedan “cortar y fragmentar” o reducir el volumen de datos para realizar un examen más detallado y cumplir con diferentes demandas, ya sea a un nivel muy global o detallado. El data warehouse es la base funcional para los entornos de BI middleware que suministran informes, cuadros de mando y otras interfaces a los usuarios finales.
¿Qué son los cubos OLAP?
La tecnología OLAP permite un uso más eficaz de las bodegas de datos para el análisis en línea, proporcionando respuestas rápidas a consultas analíticas complejas e iterativas. Los modelos de datos multidimensionales de OLAP y las técnicas de agregación de datos, organizan y resumen grandes volúmenes de datos para que puedan ser evaluados con rapidez mediante el análisis en línea y las herramientas gráficas. La respuesta a una consulta realizada sobre datos históricos a menudo suele conducir a consultas posteriores en las que el analista busca respuestas más concretas o explora posibilidades. Los sistemas OLAP proporcionan la velocidad y la flexibilidad necesarias apoyar a los analistas del negocio.
OLAP proporciona varias ventajas a analistas del negocio, por ejemplo:
· Un modelo de datos intuitivo y multidimensional que facilita la selección, recorrido y exploración de los datos.
· Un lenguaje analítico de consulta que proporciona la capacidad de explorar las complejas relaciones existentes entre los datos empresariales.
· Un precálculo de los datos consultados con más frecuencia que permite una rápida respuesta a las consultas ad hoc.
Descripción de los Cubos de Datos
Los cubos OLAP, vienen a ser una representación lógica del modelo dimensional físico (estrella) que veíamos en el tema anterior. Tomemos como ejemplo la siguiente figura:
En este caso tenemos un cubo de tres dimensiones: Time, Route y Source. Estas dimensiones sirven para identificar cada parte del cubo. En la figura se han resaltado en gris los datos correspondientes al tercer trimestre. Las dimensiones actúan como una suerte de ejes coordenados, que nos permiten identificar una porción de los datos dentro del universo posible.
En el ejemplo tenemos 4 trimestres, 6 continentes y 4 medios de transporte. Esto nos da un total de 4x6x4 =96 cubitos de datos. En el mismo ejemplo la dimensión Time tiene 7 valores posibles, la dimensión Route tiene 9 valores posibles, y la dimensión Source 7 posibilidades. Esto nos da, por combinatoria, un total de 7x9x7=441 posibles preguntas sobre los datos existentes. En el mismo ejemplo, si tuviéramos los datos a nivel de mes significa que tendríamos 12x6x4=288 cubitos, y (7+12) x6x4=456 posibles preguntas anuales.

Otros materiales

Materiales relacionados

3 pag.
big data

UAQ

User badge image

nanay contrnay