Logo Studenta

Clase 02 - Bases de datos

¡Este material tiene más páginas!

Vista previa del material en texto

Bases de datos
 Clase 02. Data Analytics
RECUERDA PONER A GRABAR LA CLASE
Conocer qué es una base de datos y sus generalidades.
Identificar los componentes de una base de datos.
Identificar los tipos de bases de datos.
Integrar conocimientos generales de data warehouse.
Que es SQL Server y como Instalarlo
(Inicio)
OBJETIVOS DE LA CLASE
BASES DE DATOS: INTRODUCCIÓN
Los temas que veremos en esta clase son introductorios.
 
En nuestro módulo de base de datos relacionales profundizaremos en los más importantes.
¿QUÉ ES UNA BASE DE DATOS?
Un conjunto de datos almacenados en un formato específico e interrelacionados por un contexto en común
COMPONENTES DE UNA BASE DE DATOS
Hablar sobre como el data analytics comenzó a ser usado por cualquier industria. 
INFORMACIÓN
La información se obtiene de la base de datos, está integrada y además es compartida.
SGBD
Sistema de gestión de base de datos (DBMS por sus siglas en inglés). Ej: Oracle, MySQL, SQLServer, Access, entre otros.
USUARIOS
Aplicaciones y Personas que interactúan con la BD
HARDWARE
Almacenamiento secundario.
Procesadores, memoria, etc.
SGBD: Sistemas de gestión de bases de datos
Aplicaciones que han sido diseñadas para gestionar grandes cantidades de información. 
¡Nosotros usaremos este! 
La gestión de los datos implica tanto la definición de estructuras para almacenar la información como la provisión de mecanismos para la manipulación de la información. 
Características de un SGBD
Recuperación
Capacidad de proteger los datos ante fallos en el sistema o en las aplicaciones. 
Concurrencia 
Permiten que muchas transacciones puedan acceder a una misma base de datos a la vez.
Integridad
Se refiere a la correctitud y completitud de la información en una base de datos.
Seguridad
Es la protección de la base de datos frente a usuarios no autorizados
 
MODELO DE BASE DE DATOS
Concepto
Un modelo de base de datos permite generar la estructura lógica de la base, incluidas las relaciones y limitaciones que determinan cómo se almacenan los datos y cómo se accede a ellos.
TIPOS DE MODELO DE BASE DE DATOS
Relacional
Colección de tablas para representar tanto los datos como sus relaciones
Entidad - Relación
Percepción del mundo real que consiste en una colección de objetos básicos, denominados entidades, y de las relaciones entre ellos
¡Nosotros usaremos estos! 
Orientado a objetos
La información se representa mediante objetos como los presentes en la programación orientada a objetos.
No Relacional
No tienen un identificador que sirva de relación entre un conjunto de datos y otros
Jerárquico
Los datos son organizados en una estructura parecida a un árbol
Red
Set de registros, los cuales están conectados entre sí por medio de enlaces en una red
MODELADO DE BASE DE DATOS
Permite definir la estructura y comunicarse con una base de datos. Típicamente permite describir:
Concepto
Las estructuras de datos de la base: el tipo de datos que hay en la base y la forma en que se relacionan.
Estructuras de datos
Varchar o NVarchar
Int
Decimal
Float
Bit
Tipos de Datos (Genéricos)
Las restricciones de integridad: Un conjunto de condiciones que deben cumplir los datos para reflejar la realidad deseada.
Restricciones de integridad
Operaciones de manipulación de los datos: generalmente, operaciones de agregado, borrado, modificación y recuperación de los datos de la base.
Operaciones de manipulación
LENGUAJES DE CONSULTAS ESTRUCTURADAS
Lenguaje de consultas estructuradas
Los sistemas de gestión proporcionan un lenguaje de definición para especificar el esquema de la base de datos y un lenguaje de manipulación para expresar las consultas y las modificaciones de la base.
Structured Query Language
Sublenguajes del SQL
Data Definition Language: Permite crear, modificar y eliminar estructuras.
Data Manipulation Language: Permite modificar el contenido.
Data Control Language: Permite asignar y modificar permisos.
Transaction Control Language: Permite gestionar transacciones.
DDL
DML
TCL
DCL
DATAWAREHOUSE
Concepto
Permite a una organización o empresa ejecutar análisis potentes en grandes volúmenes (petabytes y petabytes) de datos históricos de formas que una base de datos estándar simplemente no puede.
Forrester Wave™: Data Management for Analytics, Q1 2020.
El Forrester Wave, es la herramienta creada por Forrester Research (consultora de investigación tecnológica), para medir las herramientas más usadas en distintas disciplinas de la tecnología. 
Tecnologías que intervienen
☕ 
BREAK
¡5/10 MINUTOS Y VOLVEMOS!
BASE DE DATOS EN UNA ARQUITECTURA DE RED 
Diseñarás el diagrama de una arquitectura de red, vista en la vida cotidiana, y resaltaremos las bases de datos que allí podemos encontrar.
Tiempo: 40 minutos
Las bases de datos están en todos lados
Una arquitectura de red es la conexión de varios dispositivos por medio de una red cableada o WiFi. Por ejemplo nuestro modem en casa conecta al mismo tiempo a nuestros celulares y computadoras con nuestros almacenamientos en la nube o impresora. 
En base al diagrama de ejemplo (siguiente slide), crearás un diagrama en el que se puedan identificar al menos tres bases de datos. 
La red puede ser real o ficticia. Podemos inspirarnos en una empresa, escuela, universidad o hasta nuestra propia casa. 
Durante 15 minutos te reuniras con tu equipo para desarrollar el desafío, y luego de esto haremos una puesta en común para debatir con el resto de la clase. 
Usar para las subsiguientes slides de challenges genéricos.
EJEMPLO
¡PARA PENSAR!
CONTESTA LAS ENCUESTAS DE ZOOM
Una base de datos es: 
Conjunto de datos almacenados. 
Conjunto de archivos. 
Filas y columnas. 
Datos relacionales 
Un datawarehouse es:
Central de tablas. 
Hardware y software de almacenamiento. 
Un SGBD.
Una base de datos no relacional.
Cual es el modelo de datos más usado?
Red
Jerárquico
Relacional
No relacional
Un componente de la base de datos es:
a.	SGBD. 
b.	Tarjeta perforada. 
c.	Teradata. 
d.	ORACLE.
Uno de los sublenguajes SQL es:. 
DDL 
MML 
TLA2 
TLA 
El sublenguaje DML permite:
Definir el contenido
Crear la estructura
Manipular el contenido
Transferir la estructura
DEFINICIÓN DE LA FUENTE DE INFORMACIÓN 
Seleccionar la base de datos que usaremos en el Proyecto Final. 
El trabajo en equipo nos permite conocer diferentes fuentes de información. Si tu equipo cuenta con un set de datos y tú no ¡es momento de aprender de una nueva temática! 
3
	DEFINICIÓN DE LA FUENTE DE INFORMACIÓN 		
	Formato: Base de datos almacenada en formato de archivo plano (xls, csv, txt).		
	
>> Consigna: 
Presentar (máximo) tres sets de datos que puedan ser usados como fuente de información para sus proyectos finales. 
IMPORTANTE: La información será accedida por todo el equipo, así como sus tutores y profesor. Evitar utilizar datos sensibles.
>> Recomendaciones: 
Una forma correcta de seleccionar un set de datos es pensar en alguna iniciativa o proyecto personal, laboral o de estudio en el que necesites analizar datos y medir información relevante. Por ejemplo, la información recolectada para un proyecto de tesis, o el histórico de ventas vs presupuesto de un emprendimiento.
Lo ideal es que los archivos que serán su fuente de información estén relacionados con las temáticas definidas en la clase uno, pero no es obligatorio. En esta instancia los cambios de temáticas aún son bienvenidos. 		
	DEFINICIÓN DE LA FUENTE DE INFORMACIÓN 		
	Formato: Base de datos almacenada en formato de archivo plano (xls, csv, txt).		
	>>Aspectos a incluir en el entregable: 
Cada set de datos debe contener al menos diez columnas con datos. Si contiene varias hojas también es aceptado. 
>>Ejemplo: 
Si no cuentan con un set de datos, propio o conocido, algunas bases de datos públicas:
https://www.ncdc.noaa.gov/cdo-web/datatools/lcd
https://data.buenosaires.gob.ar/dataset/estaciones-bicicletas-publicashttps://data.worldbank.org/
https://www.imf.org/en/Data
http://data.europa.eu/euodp/en/data/
https://trends.google.com/trends/?q=google&ctab=0&geo=all&date=all&sort=0
https://www.aeaweb.org/resources/data/us-macro-regional
https://www.kaggle.com/datasets		
	DEFINICIÓN DE LA FUENTE DE INFORMACIÓN 		
	Formato: Base de datos almacenada en formato de archivo plano (xls, csv, txt).		
	>>Ejemplo: 		
BONUS: GUÍA PARA SELECCIONAR LA FUENTE DE INFORMACIÓN
Mientras busquen un set de datos para explorar, es importante que se hagan las siguientes preguntas: 
1) ¿Es este un tema que nos interesa? 
No elijan un set de datos de forma indiferente. Busquen uno que realmente les atraiga para crear algo interesante. Por ejemplo, si tienen interés en el deporte, busquen datos que les permitan identificar ideas sobre Mundiales, Olimpiadas, etc.
2) ¿Este set de datos nos permitirá realizar visualizaciones claras sin
tener que transformar de manera significativa los datos?
Deben asegurarse de que el conjunto de datos esté listo para su análisis. De lo contrario, requerirá una gran inversión de tiempo en la limpieza de datos
antes de que puedan realizar cualquier análisis.
3) ¿Los datos están en forma numérica?
El set de datos que elijan puede incluir una combinación de datos categóricos (no numéricos), pero también debe tener datos numéricos. Luego utilizaremos estadísticas para analizarlos. Pueden tomar como parámetro los sets brindados en la consigna para comparar.
4) ¿Cuál es el nivel de complejidad?
No es recomendable elegir un set de datos demasiado complejo para el análisis. Tengan en cuenta que luego deberán presentar la información de manera convincente. Si parece demasiado difícil de explicar e interpretar, puede ser recomendable buscar otra alternativa.
También consideren que no sea un set con información sensible. 
Les recomendamos realizarse estas preguntas previo a seleccionar su set de datos. También pueden seleccionar más de una alternativa, para quedarse con la mejor.
¿QUIERES SABER MÁS? TE DEJAMOS MATERIAL AMPLIADO DE LA CLASE
Youtube : Historia de las bases de datos | CodeTuts
Artículo & E-book: ¿Que es un Data Warehouse? | IBM
¡PARA RECORDAR!
Para la próxima clase deberás tener instalada la aplicación
Microsoft SQL Server Express. En la carpeta de la camada encontrarás un instructivo de instalación.
¿PREGUNTAS?
¡MUCHAS GRACIAS!
Resumen de lo visto en clase hoy: 
Bases de datos. 
Tipos de modelos de datos. 
Modelado de datos.
OPINA Y VALORA ESTA CLASE
#DEMOCRATIZANDOLAEDUCACIÓN

Continuar navegando