Logo Studenta

Gestion de Datos - UNIDAD I - 2019 - PARTE I

¡Este material tiene más páginas!

Vista previa del material en texto

Gestión	de	Datos	
2019
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Los	sistemas	centrados	en	Bases	de	Datos	(Database:	DB)	representan	una	
disciplina	compleja	y	evolutiva.	La	motivación	original	para	el	desarrollo	de	
estos	sistemas	proviene	de	la	necesidad	de	contar	con	un	entorno	adecuado	
para	la	manipulación	y	procesamiento	de	grandes	masas	de	datos,	necesidad	
que	 se	 vio	 acrecentada	 por	 el	 salto	 tecnológico	 ocurrido	 en	 el	 área	 de	 los	
computadores	 durante	 las	 dos	 últimas	 décadas,	 particularmente	 en	 los	
medios	masivos	de	almacenamiento	de	datos	y	su	interconexión	mediante	la	
utilización	de	redes.
Sistemas	de	Bases	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Las	necesidades	de	información	de	nuestra	sociedad	son	imperiosas.	La	toma	de	
decisiones,	la	investigación	y	la	planificación	exigen	información	:
Precisa
Oportuna
Completa
El	Papel	de	la	Información	
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Las cualidades que debe contener la información, como recurso fundamental de las 
organizaciones y de los individuos son:
Precisión:		Porcentaje	de	información	correcta	sobre	la	información	total	del	Sistema.		
Oportunidad:	Tiempo	transcurrido	desde	el	momento	en	que	se	produjo	el	hecho	que	
origino	el	dato	hasta	que	se	pone	a	disposición	del	usuario.		
Completitud:		contener	toda	la	información	que	permita	cumplir	con	los	fines.
Significancia:		debe	poseer	el	máximo	de	contenido	semántico	posible.
Coherencia:		Debe	ser	consistente	con	las	reglas	semánticas	propias	de	mundo	real,	al	que	
ha	de	representar	lo	mas	fielmente	posible.
Cualidades	de	la	Información	
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Grandes	Volúmenes	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
VLDB Fundación (Very Large Database Fundation) 
Es	 una	 organización	 no	 gubernamental	 que	 lleva	 acciones	 de	 difusión	 de	 las	
grandes	 Bases	 de	 Datos	 en	 el	 mundo,	 con	 el	 propósito	 de	 promover	 el	
intercambio	 y	 trabajo	 académico	 en	 la	 base	 de	 datos	 y	 los	 campos	
relacionados	en	todo	el	mundo. 
Grandes	Volúmenes	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
• Calidad	en	Bases	de	Datos	
• Administración	de	Datos	Inciertos	
• Acceso	Personalizado	y	Administración	de	perfiles 
• Administración	de	datos	para	Redes	de	Sensores	
• Inteligencia	de	Negocios	en	Tiempo	Real	
• Evaluación	del	Desempeño	y	Evaluación	comparativa 
• Base	de	datos	XML	
• Administración	segura	de	datos	
• Administración	de	datos	semánticos
VLDB	Fundación	 
Casos	Críticos	de	Estudio	Presentados	en	Congresos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
James	Martin	dio	una	excelente	definición	de	Bases	de	Daos,	considerando	 los	
conceptos	subyacentes	(1975):		
"...(una)	DB	puede	definirse	como	una	colección	de	 
datos	interrelacionados,	almacenados	en	conjuntos	 
sin	redundancias	perjudiciales	o	innecesarias..."
Definición	de	Bases	de	Datos:
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Los orígenes de las bases de datos se remontan a la antigüedad, donde ya 
existían bibliotecas. 
 Charles Babbage (1791-1871) diseñó y 
parcialmente implementó una máquina a vapor, 
de diferencia mecánico para calcular tablas de 
números. También diseñó, pero nunca construyó, 
la máquina analítica para ejecutar programas 
de tabulación o computación; por estos inventos 
se le considera como una de las primeras 
personas en concebir la idea de lo que hoy 
llamaríamos una computadora.
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos
Los orígenes de las bases de datos se remontan a la antigüedad, donde ya 
existían bibliotecas. 
 Charles Babbage (1791-1871) diseñó y 
parcialmente implementó una máquina a vapor, 
de diferencia mecánico para calcular tablas de 
números. También diseñó, pero nunca construyó, 
la máquina analítica para ejecutar programas 
de tabulación o computación; por estos inventos 
se le considera como una de las primeras 
personas en concebir la idea de lo que hoy 
llamaríamos una computadora.
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
En 1884, Herman Hollerith (1860-1929) creó la “Máquina Automática 
Perforadora de Tarjetas” con la cual en el censo de los Estados Unidos de 
Norteamérica de 1890 se obtuvieron los resultados al cabo de dos años y medio 
de proceso, mientras que en el censo anterior el proceso duro siete años. 
 En el invento de Herman Hollerith, 
cada perforación en las tarjetas 
representaba un número y cada dos 
perforaciones una letra, cada tarjeta 
tenía capacidad para 80 variables. 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
En la década de los ’50 se empezaron a usar las cintas magnéticas, para 
automatizar la información y hacer respaldos. 
En la década del ’60 las computadoras bajaron los precios para que las 
compañías privadas las pudieran adquirir. 
 En esta época se dan inicio a las bases 
de datos en red y a las bases de datos 
jerárquicas, ya que era posible guardar 
estructuras de datos en listas y arboles 
(DBMS o SGDB). 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Continuando con la década del ‘60, un hito fue la alianza entre IBM y American 
Airlines, para desarrollar SABRE (Semi-Automated Business Research 
Environment), un sistema operativo que manejaba las transacciones, reservas de 
vuelo e información de los pasajeros. 
 General Electrics desarrollo el IDS; un nuevo 
tipo de sistema de bases de datos conocido como 
sistema de red que permitió la creación de un 
estándar de bases de datos, gracias a la 
conferencia de lenguajes de sistemas de 
información (CODASYL), el cual fue una de las 
primeras normas formales en este campo. 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
“Consiste en una colección de datos interrelacionados y un 

conjunto de programas para acceder a dichos datos, en donde la 
colección de datos debe ser denominada como Bases de Datos, 
y entender que la misma contiene información relevante para la 
empresa, siendo su objetivo principal proporcionar una forma 
de almacenar y recuperar la información de una base de datos de 
manera que sea tanto practicacomo eficiente” 
(Silberschatz	Abraham	-	Korth	Henry	F.	–	Sudarshan	-	2006).
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Definición	de	DBMS	o	SGDB:	
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
En la Década de 1970, Edgar Frank Codd en el articulo “Un modelo relacional 
de datos para grandes bancos de datos compartidos” (“Relational Model of 
Data for large Shared Data Banks” – IBM Research Lab, San José, California, 
Communications of the ACM), definió el modelo relacional y publico una serie 
de reglas para los sistemas de bases de datos relacionales. 
 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Modelo	Relacional
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
En esta época se desarrollo un lenguaje de consulta llamado SQL (SEQUEL). 
Durante esta década quedó claro que era indispensable el tratamiento de 
grandes volúmenes de información, de forma tal que pueda accederse a ella 
desde cualquier aplicación que involucre parte o toda esa información. Como 
resultado, se logró un cierto grado de integración de archivos utilizados hasta 
ese momento con poca o ninguna estructuración común. 
 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Lenguaje	de	Consulta	Estructurado
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
El SQL (Structured Query Language) es un estándar aceptado en 
 productos de bases de datos, además SQL es un ejemplo de lenguaje 
orientado a transformaciones es decir un lenguaje diseñado para 
usar relaciones con el fin de transformar los datos, SQL tiene 
algunos componentes que son la definición de un lenguaje de Datos 
y de un lenguaje de manipulación de datos”.
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Definición	de	SQL
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
A principio de los ’80 comienza el Auge la comercialización de los sistemas 
relacionales (RIM, R:BASE, PARADOX), y así SQL comienza a ser el estándar 
de la industria. 
En los ’90 el desarrollo de las herramientas EXCEL y ACCESS marcan el inicio 
de las bases de datos orientadas a objetos (OOBD). 
El futuro de las bases de datos es incierto. Todo indica que un nuevo proyecto de 
Microsoft denominado LINQ, se convertirá en el líder de la industria y mientras 
que los sistemas de bases de datos relacionales van a perder mercado frente a los 
sistemas gestores de Bases de datos. 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Bases	de	Datos	Relacionales	y	Orientadas	a	Objetos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
“Son bases de datos que ofrecen flexibilidad para manejar algunos de 
estos requisitos y no están limitadas por los tipos de datos y los lenguajes 
de consulta de los sistemas de bases de datos tradicionales. Una 
característica clave de las bases de datos orientadas a objetos es la 
potencia que proporcionan al diseñador al permitirle especificar 
tanto la estructura de objetos complejos, como las operaciones que se 
pueden aplicar sobre dichos objetos”.
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Definición	de	OODB
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
A partir de una estructura de archivos, es posible montar una metaestructura de 
bases de datos, la cual podemos tipificar en tres etapas: 
• La Estructura General de Datos se define utilizando un Lenguaje de 
Definición de Datos (Data Definition Language: DDL). 
• La Transformación de Datos se realiza usando un Lenguaje de 
Manipulación de una DB (Database Manipulation Language: DML). 
• Los métodos utilizados para la recuperación de subconjuntos de datos, 
basados en consultas a la DB específicas, se realiza mediante un Lenguaje 
de Consultas (Database Query Language: DQL). 
 
Sistemas	de	Administración	de	Bases	de	Datos	(DBMS) 
Metaestructura	de	Bases	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
DDL
DQ
LDM
L
Data Definition 
 Language
Data Manipulation 
Language
Data Query 
Language
Metaestructura	de	Bases	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Vamos a considerar que un DBMS, además de las tareas enunciadas 
anteriormente, consiste en un conjunto de recursos que colectivamente 
permiten: 
• Almacenar una DB 
• Mantener la seguridad de una DB mediante el uso adecuado de 
restricciones de privacidad e integridad, como así también permitir 
respaldos de la información para la recuperación luego de fallas en 
hardware/software. 
• Proveer las rutinas de entrada/salida para facilitar el uso de la DB. 
Sistemas	de	Bases	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Por funcional entendemos que 
“ésta arquitectura indica las diferentes funciones o facilidades presentes 
en una DB, teniendo en cuenta que tal arquitectura no refleja 
necesariamente la construcción física de la DB”. 
Como vemos en ella, podemos en principio centrarnos en el estudio de nueve 
componentes, los que serán nuestra meta de estudio en las siguientes 
subsecciones. 
Arquitectura	Funcional	de	una	Base	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Esquema Conceptual 
Posee el mayor nivel de 
mayor abstracción y es el 
punto de partida en el diseño 
de una DB. Desarrollado en 
Lenguaje Natural.
Esquema Lógico 
Es el esquema de una DB 
dado por “una descripción de 
los datos almacenados en una 
DB, con una especificación 
adecuada del tipo de datos y 
sus caminos de acceso”. 
Ta m b i é n c o n t i e n e l a s 
restricciones de privacidad y 
de integridad. 
Esquema Físico 
 Es el encargado de la descripción de la estructura 
física de una DB, resultando así el esquema que 
contiene detalles específicos, tales como el tipo de 
archivos utilizado, formato de registros, factores de 
bloqueo, etc. 
Arquitectura	Funcional	de	una	Base	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Subsistema de Privacidad 
 “privacidad en una DB como la 
propiedad que refleja la medida 
en la que 
están protegidos los datos 
contra accesos no autorizados”.
Subsistema de Integridad 
“integridad de una DB a la 
propiedad que refleja la 
medida en que la DB es un 
modelo seguro de aquella 
parte del universo que la 
misma representa”.
Subsistema de Recuperación y Respaldo 
 Es un módulo encargado de reconstruir una DB 
luego de fallas en hardware o software, siendo 
posible la recuperación de una posible corrupción 
en los datos mediante estrategias de bloqueo, 
transacciones, archivos de respaldo, etc.
Arquitectura	Funcional	de	una	Base	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Para completar nuestro análisis, veamos la distinción entre los tres esquemas estudiados 
mediante ejemplos simplesdados en lenguaje natural: 
 CS : El universo de discurso consiste en un grupo de 15 compañías, todas ellas 
pertenecientes a un mismo grupo económico, con la particularidad de que ninguna emplea 
menos de 40 empleados ni más de 250. Los empleados solo trabaja para una única 
compañía, y su edad no supera los 70 años. 
LS : La estructura de datos lógica se soporta en el modelo relacional, y consiste en una 
única relación con dominios nomemp, edad y compañía. 
PS : La relación se mantiene mediante un archivo indexado de nivel único, utilizando el 
campo nomemp como llave, conjuntamente con un grupo de listas invertidas, una por cada 
compañía. 
Ejemplo	de	una	aplicación	que	integre	CS,	LS	y	PS
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
1. Fundamentos	 de	 bases	 de	 datos.	 Capitulo	 1	 (Abraham	 Silberschatz,	 Henry	 F.	
Korth	/y/	S.	Sudarshan.—(Tra.	Fernándo	Sáenz	Pérez,	Antonio	García	Cordero	/y/	
Jesús	Correas	Fernández.--	Rev.	Tca.	Luis	Grau	Fernández).	McGraw	Hill.	Madrid	/c.
2006/5a.	Edic.	
2. Apuntes	de	Catedra	de	Gestion	de	datos
Referencias	Bibliográficas
Apuntes	del	Mg.	Ing.	Gustavo	E.	Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional

Continuar navegando