Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Gestión de Datos 2020 Cátedra de Gestion de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Los sistemas centrados en Bases de Datos (Database: DB) representan una disciplina compleja y evolutiva. La motivación original para el desarrollo de estos sistemas proviene de la necesidad de contar con un entorno adecuado para la manipulación y procesamiento de grandes masas de datos, necesidad que se vio acrecentada por el salto tecnológico ocurrido en el área de los computadores durante las dos últimas décadas, particularmente en los medios masivos de almacenamiento de datos y su interconexión mediante la utilización de redes. Sistemas de Bases de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Arquitectura funcional de una bases de datos. Conceptual, lógico y físico. Medios físicos de Almacenamiento de datos, clasificación, RAID. Modelos de datos y metodologías de diseño de Bases de Datos. Entidad-Relación (Peter Chen), Objetos Semánticos (Michael Hammer y Dennis McLeod) y Relacional (E. F. Codd). Bases de datos Orientadas a Objetos. UNIDAD TEMATICA Nº 2: Generalidades sobre Bases de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Las necesidades de información de nuestra sociedad son imperiosas. La toma de decisiones, la investigación y la planificación exigen información : Precisa Oportuna Completa El Papel de la Información Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Las cualidades que debe contener la información, como recurso fundamental de las organizaciones y de los individuos son: Precisión: Porcentaje de información correcta sobre la información total del Sistema. Oportunidad: Tiempo transcurrido desde el momento en que se produjo el hecho que origino el dato hasta que se pone a disposición del usuario. Completitud: contener toda la información que permita cumplir con los fines. Significancia: debe poseer el máximo de contenido semántico posible. Coherencia: Debe ser consistente con las reglas semánticas propias de mundo real, al que ha de representar lo mas fielmente posible. Cualidades de la Información Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Grandes Volúmenes de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional VLDB Fundación (Very Large Database Fundation) Es una organización no gubernamental que lleva acciones de difusión de las grandes Bases de Datos en el mundo, con el propósito de promover el intercambio y trabajo académico en la base de datos y los campos relacionados en todo el mundo. Grandes Volúmenes de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional • Calidad en Bases de Datos • Administración de Datos Inciertos • Acceso Personalizado y Administración de perfiles • Administración de datos para Redes de Sensores • Inteligencia de Negocios en Tiempo Real • Evaluación del Desempeño y Evaluación comparativa • Base de datos XML • Administración segura de datos • Administración de datos semánticos VLDB Fundación Casos Críticos de Estudio Presentados en Congresos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional James Martin dio una excelente definición de Bases de Daos, considerando los conceptos subyacentes (1975): "...(una) DB puede definirse como una colección de datos interrelacionados, almacenados en conjuntos sin redundancias perjudiciales o innecesarias..." Definición de Bases de Datos: Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Los orígenes de las bases de datos se remontan a la antigüedad, donde ya existían bibliotecas. Charles Babbage (1791-1871) diseñó y parcialmente implementó una máquina a vapor, de diferencia mecánico para calcular tablas de números. También diseñó, pero nunca construyó, la máquina analítica para ejecutar programas de tabulación o computación; por estos inventos se le considera como una de las primeras personas en concebir la idea de lo que hoy llamaríamos una computadora. Análisis Histórico de la Evolución de las Bases de Datos Los orígenes de las bases de datos se remontan a la antigüedad, donde ya existían bibliotecas. Charles Babbage (1791-1871) diseñó y parcialmente implementó una máquina a vapor, de diferencia mecánico para calcular tablas de números. También diseñó, pero nunca construyó, la máquina analítica para ejecutar programas de tabulación o computación; por estos inventos se le considera como una de las primeras personas en concebir la idea de lo que hoy llamaríamos una computadora. Análisis Histórico de la Evolución de las Bases de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional En 1884, Herman Hollerith (1860-1929) creó la “Máquina Automática Perforadora de Tarjetas” con la cual en el censo de los Estados Unidos de Norteamérica de 1890 se obtuvieron los resultados al cabo de dos años y medio de proceso, mientras que en el censo anterior el proceso duro siete años. En el invento de Herman Hollerith, cada perforación en las tarjetas representaba un número y cada dos perforaciones una letra, cada tarjeta tenía capacidad para 80 variables. Análisis Histórico de la Evolución de las Bases de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional En la década de los ’50 se empezaron a usar las cintas magnéticas, para automatizar la información y hacer respaldos. En la década del ’60 las computadoras bajaron los precios para que las compañías privadas las pudieran adquirir. En esta época se dan inicio a las bases de datos en red y a las bases de datos jerárquicas, ya que era posible guardar estructuras de datos en listas y arboles (DBMS o SGDB). Análisis Histórico de la Evolución de las Bases de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Continuando con la década del ‘60, un hito fue la alianza entre IBM y American Airlines, para desarrollar SABRE (Semi-Automated Business Research Environment), un sistema operativo que manejaba las transacciones, reservas de vuelo e información de los pasajeros. General Electrics desarrollo el IDS; un nuevo tipo de sistema de bases de datos conocido como sistema de red que permitió la creación de un estándar de bases de datos, gracias a la conferencia de lenguajes de sistemas de información (CODASYL), el cual fue una de las primeras normas formales en este campo. Análisis Histórico de la Evolución de las Bases de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional “Consiste en una colección de datos interrelacionados y un conjunto de programas para acceder a dichos datos, en donde la colección de datos debe ser denominada como Bases de Datos, y entender que la misma contiene información relevante para la empresa, siendo su objetivo principal proporcionar una forma de almacenar y recuperar la información de una base de datos de manera que sea tanto practica como eficiente” (Silberschatz Abraham - Korth Henry F. – Sudarshan - 2006). Análisis Histórico de la Evolución de las Bases de Datos Definición de DBMS o SGDB: Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional En la Década de 1970, Edgar Frank Codd en el articulo “Un modelo relacional de datos para grandes bancos de datos compartidos” (“Relational Model of Data for large Shared Data Banks” – IBM Research Lab, San José,California, Communications of the ACM), definió el modelo relacional y publico una serie de reglas para los sistemas de bases de datos relacionales. Análisis Histórico de la Evolución de las Bases de Datos Modelo Relacional Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional En esta época se desarrollo un lenguaje de consulta llamado SQL (SEQUEL). Durante esta década quedó claro que era indispensable el tratamiento de grandes volúmenes de información, de forma tal que pueda accederse a ella desde cualquier aplicación que involucre parte o toda esa información. Como resultado, se logró un cierto grado de integración de archivos utilizados hasta ese momento con poca o ninguna estructuración común. Análisis Histórico de la Evolución de las Bases de Datos Lenguaje de Consulta Estructurado Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional El SQL (Structured Query Language) es un estándar aceptado en productos de bases de datos, además SQL es un ejemplo de lenguaje orientado a transformaciones es decir un lenguaje diseñado para usar relaciones con el fin de transformar los datos, SQL tiene algunos componentes que son la definición de un lenguaje de Datos y de un lenguaje de manipulación de datos”. Análisis Histórico de la Evolución de las Bases de Datos Definición de SQL Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional A principio de los ’80 comienza el Auge la comercialización de los sistemas relacionales (RIM, R:BASE, PARADOX), y así SQL comienza a ser el estándar de la industria. En los ’90 el desarrollo de las herramientas EXCEL y ACCESS marcan el inicio de las bases de datos orientadas a objetos (OOBD). El futuro de las bases de datos es incierto. Todo indica que un nuevo proyecto de Microsoft denominado LINQ, se convertirá en el líder de la industria y mientras que los sistemas de bases de datos relacionales van a perder mercado frente a los sistemas gestores de Bases de datos. Análisis Histórico de la Evolución de las Bases de Datos Bases de Datos Relacionales y Orientadas a Objetos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional “Son bases de datos que ofrecen flexibilidad para manejar algunos de estos requisitos y no están limitadas por los tipos de datos y los lenguajes de consulta de los sistemas de bases de datos tradicionales. Una característica clave de las bases de datos orientadas a objetos es la potencia que proporcionan al diseñador al permitirle especificar tanto la estructura de objetos complejos, como las operaciones que se pueden aplicar sobre dichos objetos”. Análisis Histórico de la Evolución de las Bases de Datos Definición de OODB Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional A partir de una estructura de archivos, es posible montar una metaestructura de bases de datos, la cual podemos tipificar en tres etapas: • La Estructura General de Datos se define utilizando un Lenguaje de Definición de Datos (Data Definition Language: DDL). • La Transformación de Datos se realiza usando un Lenguaje de Manipulación de una DB (Database Manipulation Language: DML). • Los métodos utilizados para la recuperación de subconjuntos de datos, basados en consultas a la DB específicas, se realiza mediante un Lenguaje de Consultas (Database Query Language: DQL). Sistemas de Administración de Bases de Datos (DBMS) Metaestructura de Bases de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional DDL DQL DML Data Definition Language Data Manipulation Language Data Query Language Metaestructura de Bases de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Vamos a considerar que un DBMS, además de las tareas enunciadas anteriormente, consiste en un conjunto de recursos que colectivamente permiten: • Almacenar una DB • Mantener la seguridad de una DB mediante el uso adecuado de restricciones de privacidad e integridad, como así también permitir respaldos de la información para la recuperación luego de fallas en hardware/software. • Proveer las rutinas de entrada/salida para facilitar el uso de la DB. Sistemas de Bases de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Por funcional entendemos que “ésta arquitectura indica las diferentes funciones o facilidades presentes en una DB, teniendo en cuenta que tal arquitectura no refleja necesariamente la construcción física de la DB”. Como vemos en ella, podemos en principio centrarnos en el estudio de nueve componentes, los que serán nuestra meta de estudio en las siguientes subsecciones. Arquitectura Funcional de una Base de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Esquema Lógico Es el esquema de una DB dado por “una descripción de los datos almacenados en una DB, con una especificación adecuada del tipo de datos y sus caminos de acceso”. También contiene las restricciones de privacidad y de integridad. Esquema Físico Es el encargado de la descripción de la estructura física de una DB, resultando así el esquema que contiene detalles específicos, tales como el tipo de archivos utilizado, formato de registros, factores de bloqueo, etc. Esquema Conceptual Posee el mayor nivel de mayor abstracción y es el punto de partida en el diseño de una DB. Desarrollado en Lenguaje Natural. Arquitectura Funcional de una Base de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Subsistema de Recuperación y Respaldo Es un módulo encargado de reconstruir una DB luego de fallas en hardware o software, siendo posible la recuperación de una posible corrupción en los datos mediante estrategias de bloqueo, transacciones, archivos de respaldo, etc. Subsistema de Integridad “integridad de una DB a la propiedad que refleja la medida en que la DB es un modelo seguro de aquella parte del universo que la misma representa”. Subsistema de Privacidad “privacidad en una DB como la propiedad que refleja la medida en la que están protegidos los datos contra accesos no autorizados”. Arquitectura Funcional de una Base de Datos Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Para completar nuestro análisis, veamos la distinción entre los tres esquemas estudiados mediante ejemplos simples dados en lenguaje natural: CS : El universo de discurso consiste en un grupo de 15 compañías, todas ellas pertenecientes a un mismo grupo económico, con la particularidad de que ninguna emplea menos de 40 empleados ni más de 250. Los empleados solo trabaja para una única compañía, y su edad no supera los 70 años. LS : La estructura de datos lógica se soporta en el modelo relacional, y consiste en una única relación con dominios nomemp, edad y compañía. PS : La relación se mantiene mediante un archivo indexado de nivel único, utilizando el campo nomemp como llave, conjuntamente con un grupo de listas invertidas, una por cada compañía. Ejemplo de una aplicación que integre CS, LS y PS Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional 1. Fundamentos de bases de datos. Capitulo 1 (Abraham Silberschatz, Henry F. Korth /y/ S. Sudarshan.—(Tra. Fernándo Sáenz Pérez, Antonio García Cordero /y/ Jesús Correas Fernández.-- Rev. Tca. Luis Grau Fernández). McGraw Hill. Madrid /c.2006/5a. Edic. 2. Apuntes de Catedra de Gestion de datos Referencias Bibliográficas Gestión de Datos Departamento Sistemas Facultad Regional Tucumán Universidad Tecnológica Nacional Gestión de Datos Departamento Sistemas Facultad Regional Tucumán UniversidadTecnológica Nacional
Compartir