Logo Studenta

UNIDAD II - PARTE I

¡Este material tiene más páginas!

Vista previa del material en texto

Gestión de Datos
2020
Cátedra de Gestion de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Los sistemas centrados en Bases de Datos (Database: DB) representan una
disciplina compleja y evolutiva. La motivación original para el desarrollo de
estos sistemas proviene de la necesidad de contar con un entorno adecuado
para la manipulación y procesamiento de grandes masas de datos, necesidad
que se vio acrecentada por el salto tecnológico ocurrido en el área de los
computadores durante las dos últimas décadas, particularmente en los
medios masivos de almacenamiento de datos y su interconexión mediante la
utilización de redes.
Sistemas de Bases de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Arquitectura funcional de una bases de datos. Conceptual, lógico
y físico. Medios físicos de Almacenamiento de datos,
clasificación, RAID. Modelos de datos y metodologías de diseño
de Bases de Datos. Entidad-Relación (Peter Chen), Objetos
Semánticos (Michael Hammer y Dennis McLeod) y Relacional (E.
F. Codd). Bases de datos Orientadas a Objetos.
UNIDAD TEMATICA Nº 2: Generalidades sobre Bases de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Las necesidades de información de nuestra sociedad son imperiosas. La toma de
decisiones, la investigación y la planificación exigen información :
Precisa
Oportuna
Completa
El Papel de la Información 
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Las cualidades que debe contener la información, como recurso fundamental de las
organizaciones y de los individuos son:
Precisión: Porcentaje de información correcta sobre la información total del Sistema. 
Oportunidad: Tiempo transcurrido desde el momento en que se produjo el hecho que 
origino el dato hasta que se pone a disposición del usuario. 
Completitud: contener toda la información que permita cumplir con los fines.
Significancia: debe poseer el máximo de contenido semántico posible.
Coherencia: Debe ser consistente con las reglas semánticas propias de mundo real, al que 
ha de representar lo mas fielmente posible.
Cualidades de la Información 
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Grandes Volúmenes de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
VLDB Fundación (Very Large Database Fundation)
Es una organización no gubernamental que lleva acciones de difusión de las
grandes Bases de Datos en el mundo, con el propósito de promover el
intercambio y trabajo académico en la base de datos y los campos
relacionados en todo el mundo.
Grandes Volúmenes de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
• Calidad en Bases de Datos
• Administración de Datos Inciertos
• Acceso Personalizado y Administración de perfiles
• Administración de datos para Redes de Sensores
• Inteligencia de Negocios en Tiempo Real
• Evaluación del Desempeño y Evaluación comparativa
• Base de datos XML
• Administración segura de datos
• Administración de datos semánticos
VLDB Fundación
Casos Críticos de Estudio Presentados en Congresos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
James Martin dio una excelente definición de Bases de Daos, considerando los
conceptos subyacentes (1975):
"...(una) DB puede definirse como una colección de 
datos interrelacionados, almacenados en conjuntos 
sin redundancias perjudiciales o innecesarias..."
Definición de Bases de Datos:
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Los orígenes de las bases de datos se remontan a la antigüedad, donde ya
existían bibliotecas.
Charles Babbage (1791-1871) diseñó y
parcialmente implementó una máquina a vapor,
de diferencia mecánico para calcular tablas de
números. También diseñó, pero nunca
construyó, la máquina analítica para ejecutar
programas de tabulación o computación; por
estos inventos se le considera como una de las
primeras personas en concebir la idea de lo que
hoy llamaríamos una computadora.
Análisis Histórico de la Evolución de las Bases de Datos
Los orígenes de las bases de datos se remontan a la antigüedad, donde ya
existían bibliotecas.
Charles Babbage (1791-1871) diseñó y
parcialmente implementó una máquina a vapor,
de diferencia mecánico para calcular tablas de
números. También diseñó, pero nunca
construyó, la máquina analítica para ejecutar
programas de tabulación o computación; por
estos inventos se le considera como una de las
primeras personas en concebir la idea de lo que
hoy llamaríamos una computadora.
Análisis Histórico de la Evolución de las Bases de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
En 1884, Herman Hollerith (1860-1929) creó la “Máquina Automática
Perforadora de Tarjetas” con la cual en el censo de los Estados Unidos de
Norteamérica de 1890 se obtuvieron los resultados al cabo de dos años y medio
de proceso, mientras que en el censo anterior el proceso duro siete años.
En el invento de Herman Hollerith,
cada perforación en las tarjetas
representaba un número y cada dos
perforaciones una letra, cada tarjeta
tenía capacidad para 80 variables.
Análisis Histórico de la Evolución de las Bases de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
En la década de los ’50 se empezaron a usar las cintas magnéticas, para
automatizar la información y hacer respaldos.
En la década del ’60 las computadoras bajaron los precios para que las
compañías privadas las pudieran adquirir.
En esta época se dan inicio a las bases
de datos en red y a las bases de datos
jerárquicas, ya que era posible guardar
estructuras de datos en listas y arboles
(DBMS o SGDB).
Análisis Histórico de la Evolución de las Bases de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Continuando con la década del ‘60, un hito fue la alianza entre IBM y American
Airlines, para desarrollar SABRE (Semi-Automated Business Research
Environment), un sistema operativo que manejaba las transacciones, reservas de
vuelo e información de los pasajeros.
General Electrics desarrollo el IDS; un nuevo
tipo de sistema de bases de datos conocido como
sistema de red que permitió la creación de un
estándar de bases de datos, gracias a la
conferencia de lenguajes de sistemas de
información (CODASYL), el cual fue una de las
primeras normas formales en este campo.
Análisis Histórico de la Evolución de las Bases de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
“Consiste en una colección de datos interrelacionados y un 
conjunto de programas para acceder a dichos datos, en donde la 
colección de datos debe ser denominada como Bases de Datos, 
y entender que la misma contiene información relevante para la 
empresa, siendo su objetivo principal proporcionar una forma 
de almacenar y recuperar la información de una base de datos de 
manera que sea tanto practica como eficiente” 
(Silberschatz Abraham - Korth Henry F. – Sudarshan - 2006).
Análisis Histórico de la Evolución de las Bases de Datos
Definición de DBMS o SGDB: 
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
En la Década de 1970, Edgar Frank Codd en el articulo “Un modelo relacional de
datos para grandes bancos de datos compartidos” (“Relational Model of Data for
large Shared Data Banks” – IBM Research Lab, San José,California,
Communications of the ACM), definió el modelo relacional y publico una serie de
reglas para los sistemas de bases de datos relacionales.
Análisis Histórico de la Evolución de las Bases de Datos
Modelo Relacional
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
En esta época se desarrollo un lenguaje de consulta llamado SQL (SEQUEL).
Durante esta década quedó claro que era indispensable el tratamiento de
grandes volúmenes de información, de forma tal que pueda accederse a ella
desde cualquier aplicación que involucre parte o toda esa información. Como
resultado, se logró un cierto grado de integración de archivos utilizados hasta
ese momento con poca o ninguna estructuración común.
Análisis Histórico de la Evolución de las Bases de Datos
Lenguaje de Consulta Estructurado
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
El SQL (Structured Query Language) es un estándar aceptado en
productos de bases de datos, además SQL es un ejemplo de lenguaje 
orientado a transformaciones es decir un lenguaje diseñado para 
usar relaciones con el fin de transformar los datos, SQL tiene 
algunos componentes que son la definición de un lenguaje de Datos 
y de un lenguaje de manipulación de datos”.
Análisis Histórico de la Evolución de las Bases de Datos
Definición de SQL
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
A principio de los ’80 comienza el Auge la comercialización de los sistemas
relacionales (RIM, R:BASE, PARADOX), y así SQL comienza a ser el estándar
de la industria.
En los ’90 el desarrollo de las herramientas EXCEL y ACCESS marcan el inicio
de las bases de datos orientadas a objetos (OOBD).
El futuro de las bases de datos es incierto. Todo indica que un nuevo proyecto de
Microsoft denominado LINQ, se convertirá en el líder de la industria y mientras
que los sistemas de bases de datos relacionales van a perder mercado frente a
los sistemas gestores de Bases de datos.
Análisis Histórico de la Evolución de las Bases de Datos
Bases de Datos Relacionales y Orientadas a Objetos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
“Son bases de datos que ofrecen flexibilidad para manejar algunos de 
estos requisitos y no están limitadas por los tipos de datos y los lenguajes 
de consulta de los sistemas de bases de datos tradicionales. Una 
característica clave de las bases de datos orientadas a objetos es la 
potencia que proporcionan al diseñador al permitirle especificar 
tanto la estructura de objetos complejos, como las operaciones que se 
pueden aplicar sobre dichos objetos”.
Análisis Histórico de la Evolución de las Bases de Datos
Definición de OODB
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
A partir de una estructura de archivos, es posible montar una metaestructura de
bases de datos, la cual podemos tipificar en tres etapas:
• La Estructura General de Datos se define utilizando un Lenguaje de
Definición de Datos (Data Definition Language: DDL).
• La Transformación de Datos se realiza usando un Lenguaje de
Manipulación de una DB (Database Manipulation Language: DML).
• Los métodos utilizados para la recuperación de subconjuntos de datos,
basados en consultas a la DB específicas, se realiza mediante un Lenguaje
de Consultas (Database Query Language: DQL).
Sistemas de Administración de Bases de Datos (DBMS)
Metaestructura de Bases de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
DDL
DQL
DML
Data Definition
Language
Data Manipulation 
Language
Data Query
Language
Metaestructura de Bases de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Vamos a considerar que un DBMS, además de las tareas enunciadas
anteriormente, consiste en un conjunto de recursos que colectivamente
permiten:
• Almacenar una DB
• Mantener la seguridad de una DB mediante el uso adecuado de
restricciones de privacidad e integridad, como así también permitir
respaldos de la información para la recuperación luego de fallas en
hardware/software.
• Proveer las rutinas de entrada/salida para facilitar el uso de la DB.
Sistemas de Bases de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Por funcional entendemos que 
“ésta arquitectura indica las diferentes funciones o facilidades presentes
en una DB, teniendo en cuenta que tal arquitectura no refleja
necesariamente la construcción física de la DB”. 
Como vemos en ella, podemos en principio centrarnos en el estudio de nueve
componentes, los que serán nuestra meta de estudio en las siguientes
subsecciones.
Arquitectura Funcional de una Base de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Esquema Lógico
Es el esquema de una DB
dado por “una descripción de los
datos almacenados en una DB, con
una especificación adecuada del
tipo de datos y sus caminos de
acceso”. También contiene las
restricciones de privacidad y de
integridad.
Esquema Físico
Es el encargado de la descripción de la estructura física de
una DB, resultando así el esquema que contiene detalles
específicos, tales como el tipo de archivos utilizado, formato
de registros, factores de bloqueo, etc.
Esquema Conceptual
Posee el mayor nivel de mayor
abstracción y es el punto de
partida en el diseño de una DB.
Desarrollado en Lenguaje Natural.
Arquitectura Funcional de una Base de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Subsistema de Recuperación y Respaldo
Es un módulo encargado de reconstruir una DB luego
de fallas en hardware o software, siendo posible la
recuperación de una posible corrupción en los datos
mediante estrategias de bloqueo, transacciones, archivos
de respaldo, etc.
Subsistema de Integridad
“integridad de una DB a la
propiedad que refleja la medida en
que la DB es un modelo seguro de
aquella parte del universo que la
misma representa”.
Subsistema de Privacidad
“privacidad en una DB como la
propiedad que refleja la medida en
la que están protegidos los datos
contra accesos no autorizados”.
Arquitectura Funcional de una Base de Datos
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Para completar nuestro análisis, veamos la distinción entre los tres esquemas estudiados
mediante ejemplos simples dados en lenguaje natural:
CS : El universo de discurso consiste en un grupo de 15 compañías, todas ellas
pertenecientes a un mismo grupo económico, con la particularidad de que ninguna emplea
menos de 40 empleados ni más de 250. Los empleados solo trabaja para una única
compañía, y su edad no supera los 70 años.
LS : La estructura de datos lógica se soporta en el modelo relacional, y consiste en una
única relación con dominios nomemp, edad y compañía.
PS : La relación se mantiene mediante un archivo indexado de nivel único, utilizando el
campo nomemp como llave, conjuntamente con un grupo de listas invertidas, una por cada
compañía.
Ejemplo de una aplicación que integre CS, LS y PS
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
1. Fundamentos de bases de datos. Capitulo 1 (Abraham Silberschatz, Henry F.
Korth /y/ S. Sudarshan.—(Tra. Fernándo Sáenz Pérez, Antonio García Cordero /y/
Jesús Correas Fernández.-- Rev. Tca. Luis Grau Fernández). McGraw Hill. Madrid
/c.2006/5a. Edic.
2. Apuntes de Catedra de Gestion de datos
Referencias Bibliográficas
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
Universidad Tecnológica Nacional
Gestión de Datos
Departamento Sistemas
Facultad Regional Tucumán
UniversidadTecnológica Nacional

Continuar navegando

Materiales relacionados