Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Bases de datos Clase 02. Data Analytics RECUERDA PONER A GRABAR LA CLASE Conocer qué es una base de datos y sus generalidades. Identificar los componentes de una base de datos. Identificar los tipos de bases de datos. Integrar conocimientos generales de data warehouse. Que es SQL Server y como Instalarlo (Inicio) OBJETIVOS DE LA CLASE BASES DE DATOS: INTRODUCCIÓN Los temas que veremos en esta clase son introductorios. En nuestro módulo de base de datos relacionales profundizaremos en los más importantes. ¿QUÉ ES UNA BASE DE DATOS? Un conjunto de datos almacenados en un formato específico e interrelacionados por un contexto en común COMPONENTES DE UNA BASE DE DATOS Hablar sobre como el data analytics comenzó a ser usado por cualquier industria. INFORMACIÓN La información se obtiene de la base de datos, está integrada y además es compartida. SGBD Sistema de gestión de base de datos (DBMS por sus siglas en inglés). Ej: Oracle, MySQL, SQLServer, Access, entre otros. USUARIOS Aplicaciones y Personas que interactúan con la BD HARDWARE Almacenamiento secundario. Procesadores, memoria, etc. SGBD: Sistemas de gestión de bases de datos Aplicaciones que han sido diseñadas para gestionar grandes cantidades de información. ¡Nosotros usaremos este! La gestión de los datos implica tanto la definición de estructuras para almacenar la información como la provisión de mecanismos para la manipulación de la información. Características de un SGBD Recuperación Capacidad de proteger los datos ante fallos en el sistema o en las aplicaciones. Concurrencia Permiten que muchas transacciones puedan acceder a una misma base de datos a la vez. Integridad Se refiere a la correctitud y completitud de la información en una base de datos. Seguridad Es la protección de la base de datos frente a usuarios no autorizados MODELO DE BASE DE DATOS Concepto Un modelo de base de datos permite generar la estructura lógica de la base, incluidas las relaciones y limitaciones que determinan cómo se almacenan los datos y cómo se accede a ellos. TIPOS DE MODELO DE BASE DE DATOS Relacional Colección de tablas para representar tanto los datos como sus relaciones Entidad - Relación Percepción del mundo real que consiste en una colección de objetos básicos, denominados entidades, y de las relaciones entre ellos ¡Nosotros usaremos estos! Orientado a objetos La información se representa mediante objetos como los presentes en la programación orientada a objetos. No Relacional No tienen un identificador que sirva de relación entre un conjunto de datos y otros Jerárquico Los datos son organizados en una estructura parecida a un árbol Red Set de registros, los cuales están conectados entre sí por medio de enlaces en una red MODELADO DE BASE DE DATOS Permite definir la estructura y comunicarse con una base de datos. Típicamente permite describir: Concepto Las estructuras de datos de la base: el tipo de datos que hay en la base y la forma en que se relacionan. Estructuras de datos Varchar o NVarchar Int Decimal Float Bit Tipos de Datos (Genéricos) Las restricciones de integridad: Un conjunto de condiciones que deben cumplir los datos para reflejar la realidad deseada. Restricciones de integridad Operaciones de manipulación de los datos: generalmente, operaciones de agregado, borrado, modificación y recuperación de los datos de la base. Operaciones de manipulación LENGUAJES DE CONSULTAS ESTRUCTURADAS Lenguaje de consultas estructuradas Los sistemas de gestión proporcionan un lenguaje de definición para especificar el esquema de la base de datos y un lenguaje de manipulación para expresar las consultas y las modificaciones de la base. Structured Query Language Sublenguajes del SQL Data Definition Language: Permite crear, modificar y eliminar estructuras. Data Manipulation Language: Permite modificar el contenido. Data Control Language: Permite asignar y modificar permisos. Transaction Control Language: Permite gestionar transacciones. DDL DML TCL DCL DATAWAREHOUSE Concepto Permite a una organización o empresa ejecutar análisis potentes en grandes volúmenes (petabytes y petabytes) de datos históricos de formas que una base de datos estándar simplemente no puede. Forrester Wave™: Data Management for Analytics, Q1 2020. El Forrester Wave, es la herramienta creada por Forrester Research (consultora de investigación tecnológica), para medir las herramientas más usadas en distintas disciplinas de la tecnología. Tecnologías que intervienen ☕ BREAK ¡5/10 MINUTOS Y VOLVEMOS! BASE DE DATOS EN UNA ARQUITECTURA DE RED Diseñarás el diagrama de una arquitectura de red, vista en la vida cotidiana, y resaltaremos las bases de datos que allí podemos encontrar. Tiempo: 40 minutos Las bases de datos están en todos lados Una arquitectura de red es la conexión de varios dispositivos por medio de una red cableada o WiFi. Por ejemplo nuestro modem en casa conecta al mismo tiempo a nuestros celulares y computadoras con nuestros almacenamientos en la nube o impresora. En base al diagrama de ejemplo (siguiente slide), crearás un diagrama en el que se puedan identificar al menos tres bases de datos. La red puede ser real o ficticia. Podemos inspirarnos en una empresa, escuela, universidad o hasta nuestra propia casa. Durante 15 minutos te reuniras con tu equipo para desarrollar el desafío, y luego de esto haremos una puesta en común para debatir con el resto de la clase. Usar para las subsiguientes slides de challenges genéricos. EJEMPLO ¡PARA PENSAR! CONTESTA LAS ENCUESTAS DE ZOOM Una base de datos es: Conjunto de datos almacenados. Conjunto de archivos. Filas y columnas. Datos relacionales Un datawarehouse es: Central de tablas. Hardware y software de almacenamiento. Un SGBD. Una base de datos no relacional. Cual es el modelo de datos más usado? Red Jerárquico Relacional No relacional Un componente de la base de datos es: a. SGBD. b. Tarjeta perforada. c. Teradata. d. ORACLE. Uno de los sublenguajes SQL es:. DDL MML TLA2 TLA El sublenguaje DML permite: Definir el contenido Crear la estructura Manipular el contenido Transferir la estructura DEFINICIÓN DE LA FUENTE DE INFORMACIÓN Seleccionar la base de datos que usaremos en el Proyecto Final. El trabajo en equipo nos permite conocer diferentes fuentes de información. Si tu equipo cuenta con un set de datos y tú no ¡es momento de aprender de una nueva temática! 3 DEFINICIÓN DE LA FUENTE DE INFORMACIÓN Formato: Base de datos almacenada en formato de archivo plano (xls, csv, txt). >> Consigna: Presentar (máximo) tres sets de datos que puedan ser usados como fuente de información para sus proyectos finales. IMPORTANTE: La información será accedida por todo el equipo, así como sus tutores y profesor. Evitar utilizar datos sensibles. >> Recomendaciones: Una forma correcta de seleccionar un set de datos es pensar en alguna iniciativa o proyecto personal, laboral o de estudio en el que necesites analizar datos y medir información relevante. Por ejemplo, la información recolectada para un proyecto de tesis, o el histórico de ventas vs presupuesto de un emprendimiento. Lo ideal es que los archivos que serán su fuente de información estén relacionados con las temáticas definidas en la clase uno, pero no es obligatorio. En esta instancia los cambios de temáticas aún son bienvenidos. DEFINICIÓN DE LA FUENTE DE INFORMACIÓN Formato: Base de datos almacenada en formato de archivo plano (xls, csv, txt). >>Aspectos a incluir en el entregable: Cada set de datos debe contener al menos diez columnas con datos. Si contiene varias hojas también es aceptado. >>Ejemplo: Si no cuentan con un set de datos, propio o conocido, algunas bases de datos públicas: https://www.ncdc.noaa.gov/cdo-web/datatools/lcd https://data.buenosaires.gob.ar/dataset/estaciones-bicicletas-publicashttps://data.worldbank.org/ https://www.imf.org/en/Data http://data.europa.eu/euodp/en/data/ https://trends.google.com/trends/?q=google&ctab=0&geo=all&date=all&sort=0 https://www.aeaweb.org/resources/data/us-macro-regional https://www.kaggle.com/datasets DEFINICIÓN DE LA FUENTE DE INFORMACIÓN Formato: Base de datos almacenada en formato de archivo plano (xls, csv, txt). >>Ejemplo: BONUS: GUÍA PARA SELECCIONAR LA FUENTE DE INFORMACIÓN Mientras busquen un set de datos para explorar, es importante que se hagan las siguientes preguntas: 1) ¿Es este un tema que nos interesa? No elijan un set de datos de forma indiferente. Busquen uno que realmente les atraiga para crear algo interesante. Por ejemplo, si tienen interés en el deporte, busquen datos que les permitan identificar ideas sobre Mundiales, Olimpiadas, etc. 2) ¿Este set de datos nos permitirá realizar visualizaciones claras sin tener que transformar de manera significativa los datos? Deben asegurarse de que el conjunto de datos esté listo para su análisis. De lo contrario, requerirá una gran inversión de tiempo en la limpieza de datos antes de que puedan realizar cualquier análisis. 3) ¿Los datos están en forma numérica? El set de datos que elijan puede incluir una combinación de datos categóricos (no numéricos), pero también debe tener datos numéricos. Luego utilizaremos estadísticas para analizarlos. Pueden tomar como parámetro los sets brindados en la consigna para comparar. 4) ¿Cuál es el nivel de complejidad? No es recomendable elegir un set de datos demasiado complejo para el análisis. Tengan en cuenta que luego deberán presentar la información de manera convincente. Si parece demasiado difícil de explicar e interpretar, puede ser recomendable buscar otra alternativa. También consideren que no sea un set con información sensible. Les recomendamos realizarse estas preguntas previo a seleccionar su set de datos. También pueden seleccionar más de una alternativa, para quedarse con la mejor. ¿QUIERES SABER MÁS? TE DEJAMOS MATERIAL AMPLIADO DE LA CLASE Youtube : Historia de las bases de datos | CodeTuts Artículo & E-book: ¿Que es un Data Warehouse? | IBM ¡PARA RECORDAR! Para la próxima clase deberás tener instalada la aplicación Microsoft SQL Server Express. En la carpeta de la camada encontrarás un instructivo de instalación. ¿PREGUNTAS? ¡MUCHAS GRACIAS! Resumen de lo visto en clase hoy: Bases de datos. Tipos de modelos de datos. Modelado de datos. OPINA Y VALORA ESTA CLASE #DEMOCRATIZANDOLAEDUCACIÓN
Compartir