Logo Studenta

Gestion de Datos - Unidad I - 2018 - Parte 1

¡Este material tiene más páginas!

Vista previa del material en texto

Gestión	de	Datos
Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Los	 sistemas	 centrados	 en	 Bases	 de	 Datos	 (Database:	 DB)	 representan	 una	
disciplina	compleja	y	evolutiva.	La	motivación	original	para	el	desarrollo	de	estos	
sistemas	 proviene	 de	 la	 necesidad	 de	 contar	 con	 un	 entorno	 adecuado	 para	 la	
manipulación	 y	 procesamiento	 de	 grandes	masas	 de	 datos,	 necesidad	 que	 se	 vio	
acrecentada	 por	 el	 salto	 tecnológico	 ocurrido	 en	 el	 área	 de	 los	 computadores	
durante	 las	 dos	 últimas	 décadas,	 particularmente	 en	 los	 medios	 masivos	 de	
almacenamiento	de	datos	y	su	interconexión	mediante	la	utilización	de	redes.
Sistemas	de	Bases	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Las	 necesidades	 de	 información	 de	 nuestra	 sociedad	 son	 imperiosas.	 La	 toma	 de	
decisiones,	la	investigación	y	la	planificación	exigen	información	:
Precisa
Oportuna
Completa
El	Papel	de	la	Información	
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Las cualidades que debe contener la información, como recurso fundamental de las 
organizaciones y de los individuos son:
Precisión:		Porcentaje	de	información	correcta	sobre	la	información	total	del	Sistema.		
Oportunidad:	Tiempo	transcurrido	desde	el	momento	en	que	se	produjo	el	hecho	que	origino	el	
dato	hasta	que	se	pone	a	disposición	del	usuario.		
Completitud:		contener	toda	la	información	que	permita	cumplir	con	los	fines.
Significancia:		debe	poseer	el	máximo	de	contenido	semántico	posible.
Coherencia:		Debe	ser	consistente	con	las	reglas	semánticas	propias	de	mundo	real,	al	que	ha	de	
representar	lo	mas	fielmente	posible.
Cualidades	de	la	Información	
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Grandes	Volúmenes	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
VLDB Fundación (Very Large Database Fundation) 
Es	una	organización	no	gubernamental	que	 lleva	acciones	de	difusión	de	 las	grandes	
Bases	 de	 Datos	 en	 el	 mundo,	 con	 el	 propósito	 de	 promover	 el	 intercambio	 y	 trabajo	
académico	en	la	base	de	datos	y	los	campos	relacionados	en	todo	el	mundo. 
Grandes	Volúmenes	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
• Calidad	en	Bases	de	Datos	
• Administración	de	Datos	Inciertos	
• Acceso	Personalizado	y	Administración	de	perfiles 
• Administración	de	datos	para	Redes	de	Sensores	
• Inteligencia	de	Negocios	en	Tiempo	Real	
• Evaluación	del	Desempeño	y	Evaluación	comparativa 
• Base	de	datos	XML	
• Administración	segura	de	datos	
• Administración	de	datos	semánticos
VLDB	Fundación	 
Casos	Críticos	de	Estudio	Presentados	en	Congresos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
James	 Martin	 dio	 una	 excelente	 definición	 de	 Bases	 de	 Daos,	 considerando	 los	
conceptos	subyacentes	(1975):		
"...(una)	DB	puede	definirse	como	una	colección	de	 
datos	interrelacionados,	almacenados	en	conjuntos	 
sin	redundancias	perjudiciales	o	innecesarias..."
Definición	de	Bases	de	Datos:
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Los orígenes de las bases de datos se remontan a la antigüedad, donde ya existían 
bibliotecas. 
 Char les Babbage (1791-1871) d i señó y 
parcialmente implementó una máquina a vapor, de 
diferencia mecánico para calcular tablas de 
números. También diseñó, pero nunca construyó, la 
máquina analítica para ejecutar programas de 
tabulación o computación; por estos inventos se le 
considera como una de las primeras personas en 
concebir la idea de lo que hoy llamaríamos una 
computadora.
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
En 1884, Herman Hollerith (1860-1929) creó la “Máquina Automática Perforadora de 
Tarjetas” con la cual en el censo de los Estados Unidos de Norteamérica de 1890 se 
obtuvieron los resultados al cabo de dos años y medio de proceso, mientras que en el 
censo anterior el proceso duro siete años. 
 
En el invento de Herman Hollerith, cada 
perforación en las tarjetas representaba 
un número y cada dos perforaciones una 
letra, cada tarjeta tenía capacidad para 
80 variables. 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
En la década de los ’50 se empezaron a usar las cintas magnéticas, para automatizar la 
información y hacer respaldos. 
En la década del ’60 las computadoras bajaron los precios para que las compañías 
privadas las pudieran adquirir. 
 
En esta época se dan inicio a las bases de 
datos en red y a las bases de datos 
jerárquicas, ya que era posible guardar 
estructuras de datos en listas y arboles 
(DBMS o SGDB). 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Continuando con la década del ‘60, un hito fue la alianza entre IBM y American 
Airlines, para desarrollar SABRE (Semi-Automated Business Research Environment), un 
sistema operativo que manejaba las transacciones, reservas de vuelo e información de 
los pasajeros. 
 General Electrics desarrollo el IDS; un nuevo tipo de 
sistema de bases de datos conocido como sistema de 
red que permitió la creación de un estándar de bases 
de datos, gracias a la conferencia de lenguajes de 
sistemas de información (CODASYL), el cual fue una 
de las primeras normas formales en este campo. 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
“Consiste en una colección de datos interrelacionados y un 

conjunto de programas para acceder a dichos datos, en donde la 
colección de datos debe ser denominada como Bases de Datos, 
y entender que la misma contiene información relevante para la 
empresa, siendo su objetivo principal proporcionar una forma 
de almacenar y recuperar la información de una base de datos de 
manera que sea tanto practica como eficiente” 
(Silberschatz	Abraham	-	Korth	Henry	F.	–	Sudarshan	-	2006).
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Definición	de	DBMS	o	SGDB:	
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
En la Década de 1970, Edgar Frank Codd en el articulo “Un modelo relacional de 
datos para grandes bancos de datos compartidos” (“Relational Model of Data for 
large Shared Data Banks” – IBM ResearchLab, San José, California, Communications 
of the ACM), definió el modelo relacional y publico una serie de reglas para los 
sistemas de bases de datos relacionales. 
 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Modelo	Relacional
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
En esta época se desarrollo un lenguaje de consulta llamado SQL (SEQUEL). Durante 
esta década quedó claro que era indispensable el tratamiento de grandes volúmenes de 
información, de forma tal que pueda accederse a ella desde cualquier aplicación que 
involucre parte o toda esa información. Como resultado, se logró un cierto grado de in-
tegración de archivos utilizados hasta ese momento con poca o ninguna estructuración 
común. 
 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Lenguaje	de	Consulta	Estructurado
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
El SQL (Structured Query Language) es un estándar aceptado en 
 productos de bases de datos, además SQL es un ejemplo de lenguaje 
orientado a transformaciones es decir un lenguaje diseñado para 
usar relaciones con el fin de transformar los datos, SQL tiene 
algunos componentes que son la definición de un lenguaje de Datos 
y de un lenguaje de manipulación de datos”.
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Definición	de	SQL
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
A principio de los ’80 comienza el Auge la comercialización de los sistemas 
relacionales (RIM, R:BASE, PARADOX), y así SQL comienza a ser el estándar de la 
industria. 
En los ’90 el desarrollo de las herramientas EXCEL y ACCESS marcan el inicio de las 
bases de datos orientadas a objetos (OOBD). 
El futuro de las bases de datos es incierto. Todo indica que un nuevo proyecto de 
Microsoft denominado LINQ, se convertirá en el líder de la industria y mientras que 
los sistemas de bases de datos relacionales van a perder mercado frente a los sistemas 
gestores de Bases de datos. 
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Bases	de	Datos	Relacionales	y	Orientadas	a	Objetos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
“Son bases de datos que ofrecen flexibilidad para manejar algunos de 
estos requisitos y no están limitadas por los tipos de datos y los lenguajes 
de consulta de los sistemas de bases de datos tradicionales. Una 
característica clave de las bases de datos orientadas a objetos es la 
potencia que proporcionan al diseñador al permitirle especificar 
tanto la estructura de objetos complejos, como las operaciones que se 
pueden aplicar sobre dichos objetos”.
Análisis	Histórico	de	la	Evolución	de	las	Bases	de	Datos 
Definición	de	OODB
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
A partir de una estructura de archivos, es posible montar una metaestructura de bases 
de datos, la cual podemos tipificar en tres etapas: 
• La Estructura General de Datos se define utilizando un Lenguaje de Definición de 
Datos (Data Definition Language: DDL). 
• La Transformación de Datos se realiza usando un Lenguaje de Manipulación de 
una DB (Database Manipulation Language: DML). 
• Los métodos utilizados para la recuperación de subconjuntos de datos, basados en 
consultas a la DB específicas, se realiza mediante un Lenguaje de Consultas 
(Database Query Language: DQL). 
 
Sistemas	de	Administración	de	Bases	de	Datos	(DBMS) 
Metaestructura	de	Bases	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
DDL
DQL
DML
Data Definition 
 Language
Data Manipulation 
Language
Data Query 
Language
Metaestructura	de	Bases	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Vamos a considerar que un DBMS, además de las tareas enunciadas anteriormente, 
consiste en un conjunto de recursos que colectivamente permiten: 
• Almacenar una DB 
• Mantener la seguridad de una DB mediante el uso adecuado de restricciones de 
privacidad e integridad, como así también permitir respaldos de la información 
para la recuperación luego de fallas en hardware/software. 
• Proveer las rutinas de entrada/salida para facilitar el uso de la DB. 
Sistemas	de	Bases	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Por funcional entendemos que 
“ésta arquitectura indica las diferentes funciones o facilidades presentes 
en una DB, teniendo en cuenta que tal arquitectura no refleja 
necesariamente la construcción física de la DB”. 
Como vemos en ella, podemos en principio centrarnos en el estudio de nueve 
componentes, los que serán nuestra meta de estudio en las siguientes subsecciones. 
Arquitectura	Funcional	de	una	Base	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Esquema Conceptual 
Posee el mayor nivel de mayor 
abstracción y es el punto de 
partida en el diseño de una DB. 
Desarrollado en Lenguaje 
Natural.
Esquema Lógico 
Es el esquema de una DB 
dado por “una descripción de 
los datos almacenados en una 
DB, con una especificación 
adecuada del tipo de datos y sus 
caminos de acceso”. También 
contiene las restricciones de 
privacidad y de integridad. 
Esquema Físico 
 Es el encargado de la descripción de la estructura 
física de una DB, resultando así el esquema que 
contiene detalles específicos, tales como el tipo de 
archivos utilizado, formato de registros, factores de 
bloqueo, etc. 
Arquitectura	Funcional	de	una	Base	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Subsistema de Privacidad 
 “privacidad en una DB como la 
propiedad que refleja la medida en 
la que 
están protegidos los datos contra 
accesos no autorizados”.
Subsistema de Integridad 
“integridad de una DB a la 
propiedad que refleja la medida 
en que la DB es un modelo 
seguro de aquella parte del 
u n i v e r s o q u e l a m i s m a 
representa”.
Subsistema de Recuperación y Respaldo 
 Es un módulo encargado de reconstruir una DB luego 
de fallas en hardware o software, siendo posible la 
recuperación de una posible corrupción en los datos 
mediante estrategias de bloqueo, transacciones, 
archivos de respaldo, etc.
Arquitectura	Funcional	de	una	Base	de	Datos
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
Para completar nuestro análisis, veamos la distinción entre los tres esquemas estudiados mediante 
ejemplos simples dados en lenguaje natural: 
 CS : El universo de discurso consiste en un grupo de 15 compañías, todas ellas pertenecientes a 
un mismo grupo económico, con la particularidad de que ninguna emplea menos de 40 empleados 
ni más de 250. Los empleados solo trabaja para una única compañía, y su edad no supera los 70 
años. 
LS : La estructura de datos lógica se soporta en el modelo relacional, y consiste en una única 
relación con dominios nomemp, edad y compañía. 
PS : Larelación se mantiene mediante un archivo indexado de nivel único, utilizando el campo 
nomemp como llave, conjuntamente con un grupo de listas invertidas, una por cada compañía. 
Ejemplo	de	una	aplicación	que	integre	CS,	LS	y	PS
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
1. Fundamentos	de	bases	de	datos.	Capitulo	1	(Abraham	Silberschatz,	Henry	F.	Korth	/y/	
S.	 Sudarshan.—(Tra.	 Fernándo	 Sáenz	 Pérez,	 Antonio	 García	 Cordero	 /y/	 Jesús	 Correas	
Fernández.--	Rev.	Tca.	Luis	Grau	Fernández).	McGraw	Hill.	Madrid	/c.2006/5a.	Edic.	
2. Apuntes	de	Catedra	de	Gestion	de	datos
Referencias	Bibliográficas
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional
Apuntes del Mg. Ing. Gustavo E. Juárez
FRT	-UTN	
Cátedra:	Gestión	de	Datos 

Departamento	Sistemas 

Facultad	Regional	Tucumán

Universidad	Tecnológica	Nacional

Continuar navegando