Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO FACULTAD DE FILOSOFIA Y LETRAS DIVISION DE ESTUDIOS DE POSGRADO PRESERVACION DIGITAL Tesis que para obtener el grado de Maestro en Bibliotecología y Estudios de la Información Presenta HUGO EDUARDO ESCOBEDO AGUIRRE TUTOR: DR. JUAN VOUTSSAS México, D.F. Septiembre 2007 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. Preservación Digital A Dios… Por darme los padres que me dio Por ponerme en mi corta ruta la gente que camina junto a mí, unos segundos, unos minutos, unos días, y algunos solo algunos unos años. Por permitirme bajar tan bajo como para bucear un barco hundido Por permitirme caminar tan alto de alcanzar un Volcán Por permitirme ver un atardecer en Manhattan Por permitirme sentarme enfrente del Capitolio. Por permitirme ver, sentir, oler, comer, descansar, escuchar, caminar, trepar, correr, nadar, bucear, ir, venir a tantos lugares y cosas que no acabaría de escribir. Por lo que ya se fueron y admire, y algún día alcanzare, por los que se están yendo, por los que veré ir, y los que me verán ir. Y finalmente por haberme permitido teclear todas estas miles de letras de este trabajo. Tabla de Contenido Introducción……………………………………………………………………………………………………1 Justificación y Planteamiento del Problema………………………………………………….9 Definición del Problema……………………………………………………………………………….13 Objetivo General y Objetivos Específicos……………………………………………………15 Resultados Esperados………………………………………………………………………………….17 Capítulo 1 1. Preservación digital……………………………………………………………………………….19 1.1 Definición e Importancia de la Preservación Digital………………..19 1.1.1 Definición………………………………………………………………………………19 1.1.2 Importancia de la Preservación Digital……………………………….23 1.1.2.1.1 Problemas que crean los Documentos Digitales….25 1.1.2.1.2 Acumulación de Información………………………………..26 1.1.2.1.3 Destrucción Inadvertida de la Información………….29 1.1.2.1.4 Alteración o Falsificación de la Información………..29 1.1.2.1.5 Falta de Metadatos……………………………………………….30 1.1.2.1.6 Falta de Estrategias Confiables…………………………….31 1.1.2.1.7 Diferentes Formatos de Archivos………………………….32 1.1.2.1.8 Papel Tradicional versus Papel Digital………………….33 1.2 Estado del Arte de la Preservación Digital………………………………35 1.2.1 Estrategias de Preservación Digital……………………………………39 1.2.1.1 Conservación de Tecnología……………………………………..39 1.2.1.2 Emulación de Tecnología…………………………………………..40 1.2.1.3 Migración de Información………………………………………….45 1.2.1.4 Encapsulamiento………………………………………………………..53 1.2.2 Decidiendo la Mejor Estrategia……………………………………………58 Preservación Digital Capítulo 2 2. El Objeto Digital………………………………………………………………………………………63 2.1.1 Definiciones……………………………………………………………………………….64 2.2 La experiencia de los Objetos………………………………………………………….67 2.3 Propuesta Teórica de un Objeto Digital de Información (ODI) o Formato de Archivo para Preservación Digital…………………………..72 2.4 Descripción del Objeto Digital de Información ………………………….73 2.5 Elementos de Evaluación de la Propuesta……………………………………….76 2.5.1 Estabilidad y Procedencia………………………………………………………….76 2.5.2 Calidad, Permanencia, e interoperabilidad……………………………….80 2.5.3 Referencia (localizar, catalogar e indexar)……………………………….85 2.5.4 Metadatos…………………………………………………………………………………..86 2.5.4.1 El Modelo PREMIS…………………………………………………………89 2.5.4.2 El Modelo OAIS……………………………………………………………..94 2.5.4.3 El Modelo NISO……………………………………………………………..95 2.5.5 El Objeto Digital vs.el Papel como Contenedor de Información.97 Capítulo 3 3. Evaluación los Formatos de Archivo Actuales para Preservación Digital.99 2.6 Introducción………………………………………………………………………………..99 2.7 Imágenes……………………………………………………………………………………101 2.8 Video………………………………………………………………………………………….105 2.9 Audio………………………………………………………………………………………….110 2.10 Texto………………………………………………………………………………………….115 2.11 Consideraciones Finales…………………………………………………………….120 Discusión Final………………………………………………………………………………………………123 Conclusiones…………………………………………………………………………………………………131 Preservación Digital Pag. 1 Introducción Sin que nadie lo dude la sociedad se encamina hacia un aumento en la demanda de información, donde su presentación aumenta cada día en formato digital, esto está influyendo enormemente en los espacios donde se desenvuelven las bibliotecas y los centros de información. Siendo la biblioteca la encargada del preservar el conocimiento humano, ya que cuenta con grandes tesoros en papel, y otros materiales los cuales a pesar de los esfuerzos tradicionales de conservación que con el pasar de los siglos, también tenderán a desaparecer. Sin embargo hoy podemos leer libros de más de 400 años, impresos por Gutenberg y un disco de computadora de hace 15 años es casi imposible de leer, el almacenamiento en medios electrónicos es frágil en comparación con el papel u otros medios físicos. Además ciertos documentos electrónicos sólo pueden ser usados con hardware y software específicos, que no son soportados por las nuevas generaciones. Aun así, personas, bibliotecas, gobiernos y empresas continúan en la ruta de la digitalización, por mencionar solo algunas, Google con su proyecto de biblioteca digital1, la Comisión Europea con un plan a 5 años de digitalizar 6 millones de documentos2, la Biblioteca del Congreso que en 2004 anunció 15 millones de dólares en reconocimiento a 8 instituciones para identificar, colectar y preservar materiales digitales “de documentos nacidos 1 Google Book Search http://print.google.com/googleprint/library.html 2 Steve Ranger, Europe's digital library taking shape, C|net 3 Marzo de 2006 Preservación Digital Pag. 2 digitalmente”,3 el programa incluye un amplio conjunto de organizaciones, las cuales desarrollan criterios para determinar cuáles materiales digitales se van a capturar y preservar incluyendo audio y video, fotografías, publicaciones en sitios web de gobiernos, institutos, centros de investigación, etc. Podríamos preguntarnos qué ha pasado con los sitos de web pioneros que se crearon en 1993, ¿Alguien los conservó? ¿Y qué decir de las primeras publicaciones en Web?. Hoy nos maravillamos de los primeros impresos mexicanos, pero en el 2300 ¿Será posible decir? este fue el primer sitio Web del mundo o de México, incluso las revistas electrónicas que están en la biblioteca ¿estarán disponibles para el 2070? o nuestros archivos personales, ¿Los podrán leer nuestros nietos?. Los medios durables tales como las piedras y las tabletas de arcilla pueden durar largo tiempo, pero ni son eficientes ni fácilmente portables. La revolución de la información a través de los siglos dependióen mucho de la invención del papel como medio de grabación, así como de la invención de la imprenta. Cuando el papel cambió de algodón y lino a pulpa de madera, se empezaron a registrar grandes cantidades de información en papel ácido accesible y barato, sin embargo la composición química de la pulpa de madera es altamente reactiva al ambiente, en los cuales los libros son almacenados y usados. Además las altas temperaturas y la humedad aceleran el proceso químico que lleva a la destrucción del papel y con ello la información en ellos. 3 Albanese, Andrew LC:$15M Digital Preservation, Library Journal, November 2004 Preservación Digital Pag. 3 Para los bibliotecarios la preservación se trata en gran medida acerca de la protección de sus principales colecciones, especialmente de materiales que son únicos para esa institución. Un plan de preservación debe ser un componente clave en la administración de la biblioteca para proporcionar recursos de información a los usuarios a lo largo del tiempo. Por un lado el robo o tras papeleo de documentos es la excepción y no la regla en las bibliotecas, las pérdidas por la degradación física es el destino inevitable de todos los elementos de la colección, por lo que un programa de preservación de colecciones se basa en retardar el envejecimiento natural y mitigar los efectos de su manejo, lo cual es inevitable. Dado que el propósito de la preservación es mantener un elemento tan próximo a su condición original como sea posible, la práctica de la preservación exitosa es con frecuencia el arte bibliotecario no visto. Dado que el usuario final solo ve los libros en los estantes y no todo el trabajo que hay detrás de ello. Una estrategia común es remover los documentos del servicio y suministrar a los usuarios copias de fotografías, imágenes digitalizadas, micro formatos y fotocopias, así como en el caso de incunables publicar ediciones facsimilares. Esto último podría ser tomado como un reformateo y trasvase de la información que existe en medios inestables, tal como papel quebradizo, película de nitrato y cilindros de cera hacia formatos más estables y accesibles. Preservación Digital Pag. 4 Las nuevas tecnologías del siglo XX aumentaron la captura de información. El audio se capturó en discos acústicos y las imágenes en movimiento en películas. Los sonidos han sido grabados por casi un siglo en dispositivos “analógicos” antes de la aparición del disco compacto. Cuando emergió la tecnología digital ofreció un sobresaliente y eficiente nuevo medio de almacenar y recuperar información, mediante la partición de la información analógica en pequeños elementos codificados en bits y bytes la tecnología digital ha hecho posible almacenar información en proporciones colosales, usando medios que ocupan espacios muy pequeños. Además la facilidad con la cual la información puede ser creada y diseminada, ha provocado una desconcertante proliferación de información, dado que ahora quien quiera puede crear y auto-publicar información. Ser digital puede ser una gran cosa para aquellos interesados en suministrar información rápida y fácilmente, pero desde el punto de vista de la preservación ha empeorado un problema de por sí desafiante. La información digital es vulnerable a una multitud de nuevas amenazas de preservación; por ejemplo los datos grabados en cintas magnéticas están expuestos a pérdidas y corrupción por el simple paso del tiempo. Los datos digitales están en riesgo de volverse irrecuperables cuando la configuración de hardware/software en la cual están codificados se vuelve obsoleta. Aunque los documentos digitales que están en formatos de archivo que son usados con mayor frecuencia por la gente, tienen una posibilidad más alta de persistir. A diferencia de un libro en el estante, un archivo digital que reside intacto en un disco duro por décadas o centurias es probable que no sea legible cuando una persona del futuro trate de recuperarlo. Preservación Digital Pag. 5 Se afirma que el 80% de la información que se produce actualmente se hace en una computadora, esto lo podemos percibir en un libro, periódico o inclusive esta tesis, se escribe usando una computadora, aunque su publicación final sea en medios tradicionales como el papel. También el avance tecnológico ha provocado el abaratamiento de los costos de almacenamiento, por lo que ha hecho que la digitalización sea considerada como una acción para la distribución y almacenamiento de información, como lo es y lo fue el microfilme. Pero el aumento de la información en formato digital, se ha encontrado que el almacenamiento en medios electrónicos es frágil en comparación con el papel u otros medios físicos. Hoy “La evidencia del mundo donde vivimos” se crea en algún formato digital y se puede estar perdiendo. Si encontráramos una carta de cualquier ciudadano romano de más de 2000 años, escribiéndole a su amada, sería una joya antropológica e histórica, dentro de 500, o 1000 años ¿Cuánta de la actual información existirá? por ejemplo: ¿existirán los sitios de blogs?, ¿los sitios de fotos?. Las cartas de Frida Kahlo a Diego Rivera ¿seria lo mismo si hubieran sido correos electrónicos?. ¿Serian joyas antropológicas e históricas? Aunque quién nos garantiza que es original en el caso de la carta de papel la antigüedad, el tipo de escritura, una prueba de carbono catorce, la podría ubicar en el tiempo pero un archivo digital ¿Cómo se puede determinar su edad con la seguridad de que no fue alterado? Preservación Digital Pag. 6 Este y otros hechos ofrecen una problemática que nos obliga a plantearnos investigar los problemas asociados a la Preservación Digital (PD). También ofrecen un reto tecnológico, administrativo y de visión hacia la preservación digital. Ante este nuevo panorama, la formación del profesional bibliotecario requiere complementarse con el conocimiento que le permita enfrentar esta actividad. De lo arriba afirmado se genera la inquietud del presente trabajo, el cual pretende que a partir del análisis de diferentes iniciativas, planes y programas muestre a los profesionales bases para la toma de decisiones en la preservación digital. Así esta tesis se estructura con base a los siguientes capítulos: En el primer capítulo definiremos y analizaremos el porqué de la preservación digital, como interés de la bibliotecología. Más allá de la digitalización y bibliotecas digitales, dado que los documentos electrónicos presentan una problemática tal como la falta de estabilidad, como la facilidad de los creadores para cambiar el contenido, además las técnicas usadas para proteger los contenidos asociados a hardware o dispositivos específicos pueden hacer que en pocos años no puedan ser leídos. Preservación Digital Pag. 7 Analizaremos el estado del arte y las diferentes estrategias de preservación digital que se han estado dando en los últimos años. En el segundo capítulo, introduciremos la propuesta de un objeto digital donde trataremos de resolver las carencias actuales de los formatos que se utilizan para almacenar el contenido de la información, tanto de documentos digitalizados como los que “nacen” digitalmente y la problemática asociada a la integridad de los mismos. Plantearemos el modelo de un objeto de solución, así como los elementos de evaluación del mismo, analizaremos los metadatos que actualmente están en desarrollo o en estado experimental. Por último, en el tercer capítulo en base al modelo propuesto del capítulo anterior, plantearemos las recomendaciones para la preservación de documentos y mostraremos las tendencias de las principales instituciones del mundo para la Preservación Digital.Preservación Digital Pag. 9 Justificación y Planteamiento del Problema Nos centraremos en la preservación donde la finalidad de preservar tiene que ver obviamente con lograr heredar un documento a futuras generaciones. Dependiendo de la fragilidad del soporte en el que se encuentre, de su edad y de su estado de conservación, el documento o información puede estar en riesgo de destrucción inminente, debemos preocuparnos entonces de “fijarlo” en otro soporte para poder evitar la destrucción del documento- soporte, más no así la de su contenido. En otros casos, el factor de preservación puede evitar su manipulación, a pesar de que su estado de conservación sea satisfactorio y podrá alargar la vida del soporte actual. Más allá de la preservación, se tiene por parte de los bibliotecarios el deseo de distribuir ampliamente la información; de que se divulgue, se desplace, se consulte y que esté al alcance del mayor número posible de lectores, por ello puede desearse convertirla a un nuevo soporte, para maximizar las posibilidades de que esto suceda, se busca que el soporte esté al alcance de muchos usuarios, y por supuesto que pueda hacerse a costos razonables. En estos casos, no existe tanto la necesidad de preservar; al menos urgentemente; hay soportes físicos lo suficientemente robustos para estar en riesgo inminente de manipulación, como son los documentos grabados en piedra. O pueden ser ediciones en papel lo suficientemente numerosas como para no tener que preocuparse todavía por la manipulación, pero el deseo de optimizar su distribución persiste. Preservación Digital Pag. 10 Esta es la primera decisión de fondo que el bibliotecario debe de tomar al momento de pensar en digitalizar una colección, ya que de esa decisión dependen muchas cosas. En primer lugar conviene establecer que el resultado de la digitalización a nivel documental, debe ser lo que se conoce como “reproducción digital fiel”. Este concepto significa que el documento resultante reúne tres características indispensables: calidad, en el entendido de ésta como su funcionalidad y valor de uso; permanencia, en el concepto de que el documento podrá ser accesible por un lapso de tiempo considerable; e interoperabilidad, significando esto que el documento será accesible a lo largo de varias plataformas y programas de computadora. Cuando a esta “reproducción original fiel” se le agregan los metadatos, es decir, los elementos que permiten su recuperación posterior, podremos obtener un “objeto digital”. Un Objeto digital es por tanto, cualquier entidad documental: texto, imagen, sonido, etcétera, que ha sido codificado numéricamente bajo algún formato y ensamblado junto con algún conjunto de metadatos de tal forma que puede ser almacenado, buscado, encontrado, y usado a partir de una colección dentro de un sistema de cómputo. Por lo tanto, la primera decisión a tomar, como ya hemos mencionado, es establecer si vamos a crear objetos digitales para preservación, para distribución o ambos, ya que las características y los costos de cada uno de ellos son sumamente distintos. En general el consenso es que la digitalización es una excelente forma de maximizar el acceso a materiales; es decir, con fines de distribución es una formidable herramienta y debe ser usada ampliamente. Con fines de preservación de documentos a largo plazo es otra historia; el contexto tecnológico todavía no está del todo maduro; puede usarse con cautela y Preservación Digital Pag. 11 siempre y cuando se tenga algún “respaldo” de otro tipo; por ejemplo, se recomienda digitalizar a partir de copias microfilmadas de documentos y no al revés. También cuando el estado físico de los documentos originales sea sumamente grave. En las palabras de varios autores como Abby Smith “Digitalización no es preservación; mucho se gana digitalizando, pero no permanencia y autenticidad, en el estado actual del desarrollo tecnológico, no están esas ganancias”4. De igual manera se puede ver en el artículo de ¿Digitization as a Means of Preservation? de la European Commission on Preservation and Access5 4 Smith, Abby. 1999. “Why Digitize?”. CLIR. Council on Library and Information Resources. Commission on Preservation and Access. 2:99, ISBN 1-887334-65-3. 5 Weber, Hartmut, y Dörr, Marianne. 1997. “Digitization as a Method of Preservation?” CLIR. Council on Library and Information Resources. Commission on Preservation and Access. 10:97. ISBN 1-887334-53-6. Preservación Digital Pag. 13 Definición del Problema El problema que se plantea en esta investigación es el siguiente: ¿En qué medida la digitalización permitirá mantener la capacidad de visualizar, recuperar y utilizar colecciones digitales frente a las infraestructuras y elementos tecnológicos y de organización como medio idóneo para la conservación y preservación de materiales de investigación en bibliotecas y archivos? El abordar este problema nos va a permitir conocer: 1. La importancia de que los planes, iniciativas y programas contemplen la preservación digital. 2. Los conocimientos de preservación digital aplicables a la bibliotecología. 3. Las recomendaciones para la digitalización de documentos y los formatos para la conservación y preservación de los mismos. Preservación Digital Pag. 15 Objetivo General Analizar la importancia y problemática de la preservación digital y el establecimiento de un modelo de un objeto digital como elemento de evaluación de soluciones, en el ámbito bibliotecario. Objetivos Específicos Establecer el concepto e importancia de la preservación digital como tema de investigación. Proponer un modelo de un objeto digital idóneo en base al análisis de la problemática de los formatos actuales que contienen a los documentos digitales. Revisar las principales estructuras de datos para dotar de metadatos al modelo digital. Proponer recomendaciones para la preservación digital. Preservación Digital Pag. 17 Resultados Esperados Como resultado de los análisis de iniciativas, factores, propuestas y problemática de los documentos electrónicos. Se espera establecer un modelo de un objeto digital que contenga las características y elementos de evaluación necesarios para la solución ideal de la preservación digital. En base al punto anterior se espera ofrecer recomendaciones prácticas para los bibliotecarios no expertos en tecnología que les ofrezca una pauta de cómo realizar, evaluar y llevar a cabo procesos de digitalización con bases para la preservación digital. Dado que las recomendaciones llevarán al lector hacia el software y formatos de archivo que contengan en una medida u otra elementos de evaluación en los formatos, tipos de archivo y tecnología existente. Pag. 19 Capítulo 1 Preservación digital Definición e Importancia de la Preservación Digital Definición Para entender el término preservación digital, buscaremos definir brevemente primero los términos preservación y digital. Preservar En el diccionario de la Real Academia de la Lengua Española encontramos que preservar es “Proteger, resguardar anticipadamente a una persona, animal o cosa, de algún daño o peligro”1 En la definición del diccionario de la universidad de Princeton “Actividad de proteger algo de una pérdida o daño. La condición de ser o estar preservado, el proceso que salva sustancias orgánicas de la descomposición” 2 Con respecto a la definición de la biblioteca de la universidad de Oregón tenemos “La totalidad de procesos y operaciones relacionadas en la estabilización y protecciónde documentos en contra del daño o deterioro y el tratamiento de documentos dañados o deteriorados. La preservación puede también incluir transferencia de información a otro medio tales como microfilmes”3. 1 Diccionario de la lengua española http://www.rae.es/ 2 Definicion de Preservacion por Miller, G. A. and C. Fellbaum (2006). WordNet Search - 2.1, Cognitive Science Laboratory Princeton University. http://wordnet.princeton.edu/perl/webwn?s=preservation 3 Handbook, Oregon State University Archives & Records Management. "A Glossary for Archivists, Manuscript Curators and Records Managers " Review of Reviewed . (2003), http://osulibrary.oregonstate.edu/archives/handbook/definitions/. Pag. 20 Con base en una búsqueda en internet4, respecto a diferencias, sobre la definición de preservación, encontramos que las particularidades más relevantes estarían recogidas en las definiciones arriba mencionadas. De las definiciones podemos empezar a destacar los términos comunes, proteger, evitar daño, deterioro, aunque no se tiene mención porqué o cuál es el objetivo de la preservación. Resumiremos el término preservación La preservación tiene el objetivo de asegurar el acceso ininterrumpido y permanente a largo plazo de la información y a materiales culturales de valor. Cualquier evento de mejora que por virtud prevenga pérdida, daño o cualquier otro cambio. A esta definición le nacen variantes como la mencionada en la Library of Congress5, sobre la misión del departamento de preservación, que es asegurar en el largo plazo, el acceso al contenido intelectual de las colecciones, en su formato original y reformateado. En la definición de digital tenemos: Digital6. Referente a procedimientos de comunicación, técnicas y equipos por los cuales la información es codificada en forma binaria. Digital7: Representación de datos como números; Procesamientos, almacenamientos, trasmisión y representación o visualización de datos en forma de dígitos numéricos. 4 Búsqueda en Google de del termino Preservation http://www.google.com/search?q=define:preservation&hl=en&lr=&oi=definel&defl=en 5 Definición tomada de la Biblioteca del Congreso http://www.loc.gov/preserv/prd/ 6 Pocket Glossary of Computer Temrs Second Edition, Black Bock Pag. 21 Digital8: Es la palabra más comúnmente usada en computación y electrónica, donde especialmente la información del mundo real es convertida a números binarios, como el audio digital, la fotografía digital. Entonces combinando estos términos podemos decir que la preservación digital, se refiere a la idea de proteger, evitar daño o deterioro usando una técnica o proceso binario, sin embargo no menciono que preservó en esta primera definición. Llevando el término a nuestro ambiente de la bibliotecología tendremos que las bibliotecas en su definición mantienen el concepto de información, libros, documentos, entonces nuestra definición se convertirá en proteger, evitar daño, deterioro de la información, documentos, libros, usando una técnica o proceso binario de representación. De acuerdo a Petes S. Grame el término preservación digital refiere a materiales que fueron originalmente creados digitalmente y que no existen en forma impresa o análoga, así como los que son convertidos mediante el uso de la tecnología a documentos digitales para acceso y propósitos de preservación. Aunque el término de preservación digital puede causar confusión, ya que todo documento digital es sujeto a obsolescencia tecnológica y deterioro físico9. De acuerdo a la definición de la biblioteca de la Universidad de Cornell, la meta de la preservación digital es mantener la habilidad de mostrar, 7 Microsoft® Encarta® 2006. © 1993-2005 Microsoft Corporation. 8 Definición del Termino Digital tomado de Wikipedia Ingles. http://en.wikipedia.org/wiki/Digital 9 Basado en la Definición de Petes S. Gram. (1993) Intellectual Preservation and Electronic Digital Resources Pag. 22 recuperar y usar colecciones digitales en respuesta al rápido cambio de infraestructuras y tecnologías. 10 Por lo que podemos resumir la definición de la preservación digital: Preservación Digital: Se refiere a la administración de procesos y actividades tales como digitalización, almacenamiento, recuperación y visualización libre de errores que asegure el acceso continuo a toda clase de registros, información, documentos científicos y herencia cultural existente en formatos digitales en el largo plazo o todo el tiempo que sea requerido. 10 Rieger, Anne R. Kenney Oya Y. Moving Theory into Practice, Digital Imaging for Libraries and Archives: Cornell University Library 2000-2003. http://www.library.cornell.edu/preservation/tutorial/preservation/preservation-01.html Pag. 23 Importancia de la Preservación Digital La Escuela Nacional de Bibliotecología y Archivonomía (ENBA), reza en su eslogan “Educar para preservar la memoria de la humanidad”11 aunque en los objetivos de la carrera de bibliotecología no se hace mención a la acción de preservar como parte de los mismos12. Y solamente en su programa de estudios en el cuarto semestre se menciona la materia Conservación Preventiva, y en el sexto semestre Conversión y Migración de Información, que pudiéramos deducir tiene que ver con su lema13. El Colegio de Bibliotecología, de la UNAM, en la carrera de bibliotecología no hace ninguna mención a la palabra “preservación”, ni tampoco en el plan de estudios. Así mismo en el Centro Universitario de Investigaciones Bibliotecológicas (CUIB) de la UNAM, sólo unas pocas líneas de investigación actuales están enfocadas a la preservación. En el plan de estudios de posgrado la palabra preservación es mencionada sólo dos veces, una en la introducción al programa y otra en referencia a otro tema no al hecho de la acción de preservar14. Este breve análisis de cómo las principales escuelas del país, ubican el término de la preservación, nos dará la pauta para hacer posteriormente algunas conclusiones sobre la importancia de la preservación. Gobiernos e instituciones están haciendo grandes inversiones e investigaciones en la preservación digital, tal como el que lleva la Biblioteca 11 Visitar la pagina de la ENBA o paginas similares dgb.conaculta.gob.mx/enba46.htm 12 http://www.enba.sep.gob.mx/lic%20y%20profesionales/lic/lpa_biblioteconomia.htm 13 Plan de Estudios ENBA Carrera Bibliotecologia http://www.enba.sep.gob.mx/lic%20y%20profesionales/lic/lpa_biblioteconomia.htm 14 Plan de Estudios Posgrado http://www.filos.unam.mx/POSGRADO/programa/biblio.htm Pag. 24 del Congreso (LC) donde en diciembre del 2000 el congreso Norteamericano le asignó un presupuesto de 100 millones de dólares, para liderar una estrategia digital nacional. La Biblioteca del Congreso fue elegida no solo porque en su misión esta “Mantener y preservar una colección universal de conocimiento y creatividad para las futuras generaciones”, sino también porque tiene un rol como uno de los proveedores de contenido de alta calidad en Internet15. Este hecho nos podría hacer reflexionar si la UNAM, que es considerada el proveedor de contenido de Internet16 mas importante en el país tuviera que asignar parte de sus actividades a una estrategia de preservación digital; dado que la UNAM tiene a su cargo la Biblioteca y Hemeroteca Nacional que conserva el patrimonio documental del País; ademásla mayoría de las bibliotecas universitarias de las mejores universidades del mundo tienen un apartado en sus sitios Web, donde presentan los esfuerzos y estrategias que están llevando a cabo en este rubro, esto demuestra que en México la preservación digital no se ha tomado con la importancia adecuada. 15 Acerca del Programa de Preservacion de la Biblioteca del Congreso. http://www.digitalpreservation.gov/about/index.html 16 EL PORTAL WEB DE LA UNAM OBTUVO EL PREMIO IBEST COMO EL MEJOR DEL PAÍS EN EDUCACIÓN http://www.dgcs.unam.mx/boletin/bdboletin/2001_620.html Pag. 25 En octubre del 2003, la UNESCO emitió una carta sobre la preservación del patrimonio digital, dado que gran parte de nuestra herencia cultural y de nuestros conocimientos actuales corren peligro de desaparición de hecho, se hace mención que nos acercamos a una oscura era digital (Digital Dark Age).17 La propia UNESCO hace un llamamiento en el que advierte de la necesidad de involucrar a los productores en la preservación, desde el mismo diseño de sus productos, ya que las dimensiones del problema sobrepasan en gran medida las posibilidades de acción de los actores tradicionales en el ámbito de la preservación. Problemas que Crean los Documentos Digitales. Después del creciente auge de las bibliotecas digitales y del “Furor digitalizador”18 la Preservación Digital debe ser considerada importante. El futuro del pasado depende de la atención a la Preservación Digital. Una vez que tenemos un documento en digital, ejemplo un documento en Word, o desde el proceso de escanearlo, empiezan los problemas asociados a la Preservación Digital. (Ver figura). 17 A Digital Dark Ages? Challenges in the Preservation of Electronic Information 63RD IFLA Council and General Conference Workshop: Audiovisual and Multimedia joint with Preservation and Conservation, Information Technology, Library Buildings and Equipment, and the PAC Core Programme, September 1997 18 Frase tomada de la clase Bibliotecas Digitales/UNAM 2006 del Doctor Voutssas Pag. 26 Preservación Digital Acumulación de Información Alteración ó Falsificación de la Información Falta de Estrategias confiables Falta de Metadatos Destrucción Inadvertida de Información Problemas Asociados a la Preservación Digital Diferentes Formatos (JPG, PDF, ect) Fuente: Autor de la Tesis Acumulación de Información. Sabemos que hay una revolución digital en la información, por lo que la biblioteca está en franca evolución, debido al rápido incremento de fuentes de información en formatos digitales así como la aparición de las bibliotecas digitales o grandes centros de información en línea públicos y privados. Como ejemplo podemos mencionar el sitio CORBIS www.corbis.com el cual tiene una colección de 65 millones de fotografías19. Otro ejemplo es el crecimiento de las revistas electrónicas en el “LC21 A digital strategy for the Library of Congress” que menciona un estudio de las revistas y boletines 19 Congress, Library. "Digital Revolution, Library Evolution " In Lc21: A Digital Strategy for the Library of Congress 288 THe National Academies Press, 2000. Pag. 27 electrónicos anunciados en el sitio Newjour20 el cual es un índice de títulos de revistas y boletines electrónicos mantenido por académicos de la Universidad de Yale, Pensilvana, San Diego y otras más. Dicho sitio revela que en 1989 eran menos de diez revistas electrónicas los que estaban disponibles y en el 2000 eran 8404 títulos. Cuando emergió la tecnología digital, nos ofreció un nuevo medio de almacenar y recuperar información de forma sobresaliente y eficiente. La tecnología digital nos ha hecho posible almacenar información en proporciones colosales usando medios que ocupan espacios muy pequeños. Además, la facilidad con la cual la información puede ser creada y diseminada, ha llevado a una desconcertante proliferación de información. Dado que casi cualquiera puede crear y auto-publicar información. Tres hechos están impulsando a los Documentos Digitales o Electrónicos, los libros y el papel que se digitalizan como medio de preservación, los libros que nacen electrónicos e internet así como el uso creciente de los usuarios por parte de los mismos. (Ver figura siguiente) 20 Ann Shumelda Okerson, Ann Shumelda Okerson 1995, 1996, 1997, 1998, 1999 New Jour Electronic Journas and Newsletters. In, University of California at San Diego Libraries., http://gort.ucsd.edu/newjour/ . Pag. 28 Finalmente podemos decir que la creación del contenido de origen digital crece cada año, tal como se publica en la tabla siguiente. Pag. 29 Destrucción Inadvertida de la Información Esta afirmación está basada en que la información se mantiene intacta dado que el medio que la contiene es el papel, sin embargo la información electrónica es fácil de editar o modificarse. De hecho aparece un término nuevo la “preservación intelectual".21 Peter Graham menciona que la preservación intelectual debe proteger los documentos electrónicos de los cambios fáciles que pudieran ser accidentales o bien intencionados o incluso falsificados. Y esta protección debiera ser a plazos mayores que la misma vida humana. La afirmación de la “maleabilidad” de los documentos, fue notada por Barry Neavill de la biblioteca escolar de la Universidad en 1984, donde se resalta la facilidad con que los documentos pueden ser transformados y manipulados22. Este problema afecta a cualquier documento electrónico, (texto, web, audio, grafico, fotos, bases de datos etc.). Tan simple como el lector puede estar seguro que el documento que yo encontré es el mismo que use e hice referencia en pie de nota. ¿Y cómo asegurarle que no ha sido cambiado?. Alteración o falsificación de la información En la relación a la destrucción inadvertida de la información, nos referimos a un cambio bien intencionado, pero cuando el cambio o alteración es para un acto fraudulento, la importancia se torna mayor. La alteración de las bases de datos para cometer fraudes es común en las empresas, pero más aun 21 Intellectual Preservation and Electronic Intellectual Property, Peter S. Graham http://www.ifla.org/documents/infopol/copyright/graham.txt 22 Gordon B. Neavill, "Electronic Publishing, Libraries, and the Survival of Information," Library Resources & Technical Services 28: 76-89 (Jan. 1984), p. 78. Pag. 30 tomemos como ejemplo el famoso Telegrama Zimmermann23 de 1917. En ese telegrama se instruía al embajador alemán para que se acercara al gobierno mexicano, con una propuesta para formar una alianza contra los Estados Unidos durante la Primera Guerra Mundial. Hoy ese telegrama es un papel con validez histórica, el siguiente supuesto el Presidente Bush y el presidente Fox, negociaron en aceptar los migrantes a cambio de petróleo y que la única prueba de que existió esa negociación fuera un correo electrónico. Podríamos decir que los documentos electrónicos pueden tener una importancia para la sociedad en el hecho de conocer a los autores de cada documento electrónico. También podemos afirmar que los documentos electrónicos, no son fiables para los historiadores, dada su facilidad de alteración o falsificación que podrían cambiar el rumbo de la historia. Falta de Metadatos Los metadatos son datos sobre los datos, que también son un conjunto de datos que se le anexan a cada documento electrónico o digital que actualmente están en desarrollo o en estado experimental. Sin embargo los metadatos son la clavepara asegurar que los recursos digitales continúen siendo accesibles en el futuro. Un documento electrónico se puede perder entre millones de otros documentos. 23 Imagen del Telegrama Alexander, Mary and Marilyn Childress. "The Zimmerman Telegram." Social Education 45, 4 (April 1981): 266 http://www.archives.gov/education/lessons/zimmermann/ Pag. 31 Los metadatos hacen la misma función en la localización de recursos documentales, como una buena catalogación lo hace. Al permitir que los recursos sean identificados, sean encontrados por criterios de relevancia y brindar similares. Sin embargo muchos esquemas de diferentes metadatos están siendo desarrollados en una variedad de ambientes de usuario y disciplinas. Falta de Estrategias Confiables Ninguna de las estrategias de preservación, resuelven el problema al 100 %, algunas son solo para salir del paso como se dice comúnmente. Existe una separación entre los creadores de los documentos electrónicos y su responsabilidad de preservarlos. La preocupación de conservar los documentos electrónicos a largo plazo se está llevando a cabo principalmente en las instituciones. Como la RLG-DLF (Research Library Group-Digital Library Federation) donde se conforma la Task Force on Policy & Practice for Long-term Retention of Digital Materials24, por varias universidades, aunque debería envolver a todos los participantes. 24 Sitio del RLG-DLF Task Force on Policy & Practice for Long-term Retention of Digital Materials http://www.rlg.org/index.php Pag. 32 Erróneamente se cree que la estrategia de digitalizar es preservar en las palabras de Abby Smith25: “digitalización no es preservación; mucho se gana digitalizando, pero permanencia y autenticidad, en el actual estado del desarrollo tecnológico, no están entre esas ganancias”. Una opinión parecida puede verse en el “Reporte Final del Grupo de Trabajo de la Asociación Alemana de Investigación”26 al referirse a ¿Digitalización como medio de preservación?. Diferentes Formatos de Archivos Otro problema fundamental de la preservación digital, es la cantidad de formatos electrónicos, que en el caso de imágenes pueden ser JPG, TIFF, BMP etc. En el caso de documentos, pueden ser Word, formatos propietarios, PDF etc. Este hecho hace que algunos formatos no sean compatibles con otros o caigan en desuso con el tiempo, la cual es una de las principales causas de perder información con el tiempo (obsolescencia del formato). 25 Smith, Abby. 1999. “Why Digitize?”. CLIR. Council on Library and Information Resources. Commission on Preservation and Access. 2:99, ISBN 1-887334-65-3. 26 Weber, Hartmut, y Dörr, Marianne. 1997. “Digitization as a Method of Preservation?” CLIR. Council on Library and Information Resources. Commission on Preservation and Access. 10:97. ISBN 1-887334-53-6. Pag. 33 Papel Tradicional versus Papel Digital Sin embargo, cabría analizar si toda esta problemática es sólo de los documentos electrónicos o también procedía desde el formato de papel. Problema Documento Papel Electrónico Acumulación de Información Si Si Mayor Destrucción Inadvertida de la Información Si Si Mayor Alteración de la Información Si Baja Si Mayor Falta de Metadatos No Aplica Si Diferentes Formatos Si Si Mayor En formato de papel ya existía un problema de acumulación de información Gabriel Zaid menciona en su libros “Los demasiados libros”, (por cada libro leído hay cuatro mil mas por leer), por otro lado Lynne Withey27 directora de la editorial Universitaria de la Universidad de California se cuestionó en una ponencia en 2003 sobre el futuro de las editoriales universitarias ¿Por qué estamos en crisis?. Tenemos demasiados libros para pocos clientes,28 sin mencionar la información de Internet, por mencionar algunos casos. Sobre la pérdida de información, como olvidar el siglo XVI ¿cuántos libros se perdieron? o los libros expurgados; al final todo papel se puede falsificar 27 Press, University of California. "Lynne Withey Named New Director of the University of California Press " University of California Press 2002. http://www.ucpress.edu/press/releases/director.html 28 Withey, Lynne. "Crises and Opportunities: The Futures of Scholarly Publishing." En Remarks at the 2003 ACLS Annual Meeting, 2003. http://www.acls.org/03am/withey.pdf Pag. 34 pero no fácilmente, claro está que todo lo electrónico es falsificable y alterable. También existen diferentes formatos o soportes para los documentos en papel como pueden ser fotos, tamaños, texturas etc. Aunque quizás sean menos, por lo que podemos apreciar que en realidad lo que viene a hacer el formato electrónico o digital son solamente a magnificar un problema que ya existía y se conocía de alguna; forma mantener la información en el largo plazo. Pag. 35 Estado del Arte de la Preservación Digital La preservación digital envuelve dos aspectos: la retención o almacenamiento de la información y su soporte, además debe soportar la recreación del objeto de información asegurando su autenticidad y accesibilidad como hemos expuesto anteriormente. Pero la Preservación Digital, es compleja por su dependencia del ambiente tecnológico. Las técnicas actuales de preservación de información digital se centran en cuatro estrategias o métodos: • Conservación de Tecnología. • Emulación de Tecnología. • Migración de la información. • Encapsulamiento. Aún así no se puede asegurar que la información continué legible, por lo que analizaremos cada estrategia con sus pros y contras. Los documentos digitales pueden ser almacenados en cualquier medio donde puedan ser representados por una secuencia de números binarios, como un CD-ROM, DVD o un HDD (Hard Disk Device: Disco Duro). Por lo que para almacenar esta secuencia de números binarios requerimos un medio estable. Pag. 36 Si el medio de almacenamiento se deteriora o llega a ser obsoleto antes de ser copiado a otro medio, entonces perderemos la información. En consecuencia, también la Preservación Digital involucra copiar la información digital de un medio físico a otro antes de que el viejo medio sea obsoleto o se deteriore y no se pueda acceder a la información, esto es llamado copiado de la información o actualización de la información (refresh).29 30 31 Hay que mencionar que no se considera como estrategia totalmente, este proceso está orientado para una solución a corto plazo y aplicado al medio físico de almacenamiento y evitar la obsolescencia del hardware del medio de almacenamiento nada más. Para darnos una idea, Kurt Gerecke, físico y experto de almacenamiento de IBM advierten que el rango de vida de CDS quemados (CD’s para grabar) es de 2 a 5 años32. Dado que el material que se usa es una superficie, consiste en una capa de tinta que se modifica por calor (de ahí el termino de “quemar un CD”) para almacenar la información. 29 D. Woodyard, Farewell My Floppy: A Strategy for Migration of Digital Information, Proc. Conf. VALA, Melbour 30 Definicion de Refreshing por la Biblioteca de la Universidad de Cornell http://www.library.cornell.edu/preservation/tutorial/preservation/preservation-03.html 31 Technical Advisory Service for Image Advice Paper. 2002. Establishing a Digital Preservation Strategy. In, TASI www.tasi.ac.uk, http://www.tasi.ac.uk/advice/delivering/pdf/digpres2.pdf 32Blau, John. "Ibm Expert Warns of Short Life Span for Burned Cds Burned Cds Havea Life Span of between Two to Five Years, Storage Expert Says." InfoWorld. Articulo Advertencia de la vida de los CD-R http://www.infoworld.com/article/06/01/10/73755_HNcdlifespan_1.html Pag. 37 Asegura que el medio ambiente también a largo plazo puede afectarlos. De acuerdo a las recomendaciones de la CLIR (Council on Library and Information Resources) la temperatura para el almacenamiento de un CD a largo plazo debería ser de 4 a 20 grados, lo que nos muestra como a temperatura normal, o cualquier día de verano es dañino para los CD. Kurt Gerecke recomienda que se usen cintas magnéticas las cuales tienen un rango de vida de 30 a 100 años. Aquí habría que hacer, una mención que volvemos al mismo punto de ¿qué pasara cuando no existan la máquinas que puedan leer estas cintas magnéticas?. El Technical Advisory Service for Images, muestra en la figura siguiente como ha sido la línea del tiempo de medios de almacenamiento removibles33. Technical Advisory Service for Images 33 Byers, Fred R. Care and Handling of Cds and Dvds —a Guide for Librarians and Archivists. Edited by NIST Special Publication 500-252. Washington D.C.: Council on Library and Information Resources. http://www.itl.nist.gov/div895/carefordisc/CDandDVDCareandHandlingGuide.pdf Byers, Fred R. Care and Handling of Cds and Dvds —a Guide for Librarians and Archivists. Edited by NIST Pag. 38 Hay que considerar que la guía fue publicada en octubre del 2003. Ahora hay que esperar el avance de las memorias flash, así como los discos duros externos las cuales se han vuelto muy populares en los últimos años debido al éxito de la interfaz USB. Aunque ya empiezan a surgir comentarios de en vez de tener discos duros34 (HDD Hard Disk Drive), podemos tener memorias embebidas formando HDD sin problemas de daños de vibración con bajo consumo de energía. Una memoria flash tiene un rango de vida de 100,000 Ciclos de Lecturas-Escrituras antes que no sea confiable para almacenar datos. Actualmente ya se ofrecen IDE Flash Drives que es como se llaman estos discos duros de memoria flash35. Y qué decir de los CD’s de 10 TB más de 2000 veces la capacidad de un DVD actual de 4.7 GB. Lo que se puede notar es que la tecnología nos está ofreciendo una mayor capacidad de almacenamiento en menos espacio y menor costo pero no con mayor durabilidad. Recientemente están apareciendo CD-R llamados de oro36 que estan hechos de Phthalocyanine que junto con una tecnología llamada MAM- A (Mitsui Advanced Media Versión A)37 refuerza los materiales con lo que se fabrican 34 Hachman, Mark. "Microsoft Proposes Combining Flash, Hard Drives." Extreme Tech 2004.http://www.extremetech.com/article2/0,1558,1585978,00.asp 35 Gasior, Geoff. "Super Talent's 2.5" Ide Flash Hard Drive Why Wait for Hybrids?" Review of Reviewed Item. The Tech Report no. (2006), http://techreport.com/reviews/2006q3/supertalent-flashide/index.x?pg=1 . 36 MAM-A. 2006. Mam's Patented Phthalocyanine In, MAM-A Inc, http://www.mam-a.com/technology/cd/organic_dyes.html (Acceso Junio 2006, 2006). 37 Idem 38 http://www.mam-a.com/technology/quality/index.html Pag. 39 los CD’s, los cuales están prometiendo una vida de 300 años38. Estas tecnologías resolverían por lo menos el problema del refresco o traspaso de un medio a otro. Se antoja pensar que si tenemos un documento nacido digitalmente, y es sumamente importante, sería necesario imprimirlo en papel para preservarlo, contrariamente a lo que presume la tecnología. Es por eso que Zwanevel sugiere que podrían ser cinco estrategias o técnicas de acuerdo a ciertos criterios, incluyendo la vida útil39. Estrategias de Preservación Digital Conservación de Tecnología La Conservación de Tecnología, se refiere a conservar el ambiente tecnológico de hardware y software, para su decodificación en el futuro. El cual consiste en la conservación de réplicas trabajando de plataformas de hardware y software para un futuro uso, esto implica, pero no limita conservar el programa original con que se creó el documento digital, el sistema operativo, y la plataforma de hardware. Esta estrategia es conocida también por la solución estilo Museo40 o de Museo de Computadoras41. 38 Idem 39 http://www.mam-a.com/technology/technical_papers/documents/whymam.pps#271,13,Why MAM CD- R? 39 E. H. Zwaneveld, Standards and New Technology Strategies to Preserve Content on Magnetic and Disc Media, Point of View, SMPTE J.109, 628-635 (2000). 40 Bath., UKOLN is based at the University of. 2006. Digital Preservation. In, Good Practice Guide for Developers of Cultural Heritage Web Services http://www.ukoln.ac.uk/interop-focus/gpg/Preservation/. (Acceso 2006). 41 Library, Cornell University. 2003 Digital Preservation Strategies. In Digital Preservation Management Implementing Short-Term Strategies for Long-Term Problems, The Society of American Archivist SAA, Cornell University. (Acceso Junio 2006. http://www.library.cornell.edu/iris/tutorial/dpm/terminology/strategies.html Pag. 40 Quizás en un caso de emergencia y a muy corto plazo puede ser apropiada, pero la problemática generada del costo-espacio, imposibilitan que realmente pueda ser implementada a gran escala, y de todas maneras con los años las computadoras por sí mismas se degradarán. Aun así el museo de Ciencias y la Sociedad de Conservación de Computadoras (Science Museum and the Computer Conservation Society (CCS),42 43 en el Reino Unido, están interesados en esta estrategia y actualmente mantienen viejos sistemas de computación que pudieran proporcionar valiosos recursos para los académicos e instituciones en el futuro. Granger afirma que este procedimiento no cumple con el criterio de interoperabilidad44. Russell supone un museo completo de equipo obsoleto, que pudiera ser mantenido con la idea de replicar cualquier vieja configuración de hardware y software45, esta técnica no es mencionada por otros autores. Emulación de Tecnología La Emulación de Tecnología, consiste en emular vía software o máquinas virtuales, viejo hardware, plataformas y sistemas operativos; este criterio resuelve parcialmente la interoperabilidad y permanencia. 42 Society, British Computer. 2006. The Computer Conservation Society. In, British Computer Societ, http://www.tech.port.ac.uk/staffweb/andersod/CCS/CCS.php 43 Seamus Ross, Ann Gow. Digital Archaeology: Rescuing Neglected and Damaged Data Resources, Jisc/Npo Study within the Electronic Libraries (Elib) Programme on the Preservation of Electronic Materials. London: Library Information Technology Centre, 1999. Digital Pag 35 http://eprints.erpanet.org/47/01/rosgowrt.pdf 44 S. Granger, Emulation as a Digital Preservation Strategy, D-LibMag. 6(10),(2000), http://www.dlib.org/dlib/october00/granger/10granger.html 45 K. Russell, Digital Preservation and the CEDARS Project Experience, Proc. Int’l Conf. Preservation and Long Term Accessibility of Digital Materials, York, England (2000) pp. 139-154. Pag. 41 A pesar de que adicionalmente al Computer Conservation Society (CCS), existen otras asociaciones que también están conservando o restaurando viejos sistemas de computación,46 algunas computadoras fueron desintegradas como la ENIAC (primera computadora del mundo eléctrica) y sus componentes no pueden ser recuperados; sin embargo alternativas a la restauración son la simulación y emulación, las cuales pueden ser tanto de hardware o software o la combinación de ambas. Como ejemplo de ello, un grupo de estudiantes de la More School for Engineering at the University of Pennsylvania,conducida por el Profesor Jan Vander Spiegel demuestra la viabilidad de la simulación del hardware cuando construyeron la ENIAC en un chip en 1995 con motivo del 50 aniversario de la misma, este chip tiene toda la funcionalidad de la computadora ENIAC47 y fue posible correr programas de la ENIAC usando este chip. Esta estrategia tiene cosas en común con la estrategia anterior de preservación de tecnología, ya que incluye la preservación del programa original de la aplicación. Los emuladores de programas pueden ser diseñados para correr sobre futuras plataformas. Un emulador es programado para simular el comportamiento de viejas plataformas de hardware o software. Esto es útil porque se puede liberar del hardware. En el ejemplo de la ENIAC fue desarrollado un Hardware (Chip) para emular un 46 Idem 45 Apendice 2 List of preservation institutes and emulation software sites http://eprints.erpanet.org/47/01/rosgowrt.pdf 47 SPIEGEL, JAN VAN DER. "Eniac-on-a-Chip." Review of Reviewed Item., no. (1996), http://www.upenn.edu/computing/printout/archive/v12/4/pdf/chip.pdf Pag. 42 viejo hardware, sin embargo un software puede emular a un hardware. Por ejemplo, la vieja Commodore 64, computadora casera muy popular en los 80’s que se podía comprar en el supermercado y tiendas departamentales, hoy es posible conseguir, un emulador, donde los viejos programas pueden ser ejecutados en un ambiente Windows 95,98, 2000 o XP. Aquí podemos notar cómo se elimina la dependencia al hardware. En esencia esta estrategia copia el contexto técnico de los recursos digitales para ser usado de un original o una copia en el futuro. Rothenberg recomienda la emulación como buena solución, y presenta resultados de la primera fase de un experimento de emulación por la Networked European Deposit Library (NEDLIB)48. J. Rothenberg, en su artículo, “An Experiment in Using Emulation to Preserve Digital Publications”49 (un experimento usando la simulación para preservar Publicaciones Digitales), describe los elementos que debe tener la estrategia de la emulación de la tecnología 48 T. Werf-Davelaar, Long-term Preservation of Electronic Publica-tions, D-Lib Mag.5(9), (1999), http://www.dlib.org/dlib/september99/vanderwerf/09vanderwerf.html 49 J. Rothenberg, An Experiment in Using Emulation to Preserve Digital Publications, Koninklijke Bibliotheek, Hague, Netherlands (2000) 85 pp. http://nedlib.kb.nl/results/emulationpreservationreport.pdf Pag. 43 La figura muestra como se separa la plataforma (old platform) por una máquina virtual que puede correr en diferentes plataformas con la migración de la máquina virtual a cada una o futura. Por ejemplo un proceso actual en el mundo de la computación es la Máquina Virtual de Java. La emulación de la tecnología nos resolvería algunos problemas que presenta la migración o conversión de la información en nuevos formatos; ya que cada vez que un documento original es convertido en un nuevo formato, el formato subsecuente puede ir corrompiendo al documento, como cambiar su apariencia original, estructura, comportamiento interactivo, etc., más aun cada conversión es hecha sobre el resultado de una previa en la cual la corrupción del documento puede ser acumulativa y es posible que no se detecte a primera vista. Esto puede comprobarse en una hoja de Excel hecha en LOTUS 123 y migrada a Excel 95, después a 97 y ahora Excel 2007 Elementos Basados en la Técnica de Preservación Pag. 44 o un documento hecho en Word 95 abierto en Word 2003 es casi seguro que se pierde su formato. Entonces la única forma de evitar este tipo de corrupción es mantener el augh50 indica que el emulador puede contener un virus que podría hacer ranger51 concluye que la emulación no es una solución completa pero si ussell52 afirma que el acceso de recursos digitales complejos, podría ser la documento digital original en el software original, pero esto requiere mantener el software original indefinidamente. La emulación de tecnología permite usar el software en futuras computadoras reproduciendo el funcionamiento de las viejas. W perder la información con el tiempo. G parcial, también menciona que podría ser una estrategia a mediano plazo1. R mejor solución53 54. Gilheany55 discute la necesidad de emuladores para preservar la funcionalidad de los computadores. 50 Waugh et al., Preserving Digital Information Forever, Proc. Conf. ACM Digital Libraries, San Antonio (2000) pp. 175-184. 51 S.Granger, Emulationasa Digital Preservation Strategy, D-LibMag. 6(10),(2000), p://www.dlib.org/dlib/october00/granger/10granger.htmlhtt . Ac f Digital Materials, York, England (2000) pp. 139-154. ing of Digital information, The W. DC May 1996 tml 52 K. Russell, Digital Preservation and the CEDARS Project Experience, Proc. Int’l Conf. Preservation and Long Term cessibility o 53 J. Garret and D. Waters, Preserving Digital Information, Report of the Task Force on Archiv commition on Preservation and Access The researches Library Group 54 D. Woodyard, Digital Preservation: The Australian Experience, Proc. Third Conf. Digital Library: Positioning the Fountain of Knowledge, Malaysia (2000), http://www.nla.gov.au/nla/ staffpaper/dw001004.h Pag. 45 Podemos ir pensando que puede ser útil para ciertos casos, aunque tarde o temprano se tendrá que buscar otra solución, también podemos decir que pudiera ser una estrategia especializada donde la necesidad de mantener la presencia física del recurso digital es de gran importancia para el usuario. Migración de Información Se refiere a convertir periódicamente los recursos digitales viejos, en un nuevo formato independiente del hardware y software del que fueron creados. Su propósito es preservar la integridad de los recursos digitales y de tener la habilidad de recuperarlos, mostrarlos y usarlos por los usuarios a pesar de los cambios constantes de la tecnología. El modelo Open Archiving Information System (OAIS) 56 desarrollado por el Consultative Committee for Space Data Systems (CCSDS), divide la Migración en cuatro categorías (refreshment, replication, repackaging, and transformation)57 refresco (actualización inmediata), replicación, reempacado y transformación. 55 S.Gilheany, Preserving Information Foreveranda Call for Emulators, Proc. Digital Libraries Conference and Exhibition: The Digital Era: Implications, Challenges and Issues, Singapore (1998), http://www.archivebuilders.com/aba010.html 56 Reference Model for an Open Archival Information System(OAIS),CCSDS650.0-R1, Consultative Committee for Space Data Systems, May 1999, 140 pp, http://www.ccsds.org/documents/pdf/CCSDS-650.0-R-1.pdf 57 Consultive Commite for space Data Suystem, Reference Model for a n open Archival Information System (OAIS), CCSDS 650.0-B-1 BLUE BOOK January 2002 http://public.ccsds.org/publications/archive/650x0b1.pdf Paginas5-4 Pag. 46 Donde el acto de Refrescar asegura una copia genuina y exacta del objeto digital, es decir lo suficientemente exacta que puede visualizarse como antes. La Replicación se da en una migración cuando no hay cambios en el empaque, contenido de la información y la información de la descripción de preservación. El Reempacado ocurre cuando existen algunos cambios a la información de empacado durante la transferencia. Dicho de otra manera, la replicación y el reempacado aseguran un paquete manejable y disponible del recurso digital. La transformaciónmodifica los bytes de objeto o documento digital, incluyendo cambios en el contenido, pero manteniendo al máximo los elementos de preservación. Esta técnica parece ser mejor que las dos anteriores pero, desgraciadamente no se puede aplicar en todos los casos, además requiere de transferencias periódicas de los materiales digitales de una generación de tecnología a la subsecuente. La migración tiende a centrarse en el contenido intelectual y asegurar su acceso con la tecnología actual; esta estrategia se refiere a transferir los recursos digitales a recursos más estables como papel o Pag. 47 microfilmes58; sin embargo la calidad pudiera verse afectada al perder características no soportadas en las tecnologías subsecuentes. Hendley59 considera que la migración tiene un futuro promisorio. Bearman60 también cree que este método es prometedor en el caso de registros electrónicos. Russell61 apunta que es una estrategia de corto y medio plazo. Waugh cree que la clave para la migración es el conocimiento del formato original y su acercamiento en funcionalidad, entre el formato original y formato de reemplazo. Esta estrategia podría facilitar la conversión de recursos digitales en un pequeño número de formatos estándares buscando la independencia del hardware y si es posible del software. En este punto se daría el caso de que algunos documentos digitales, sean preservados en papel, aunque esta solución llevaría la perdida de funcionalidad y presentación de los objetos digitales. La migración más 58 F.L.Eaton, The National Archives and Electronic Records for Preservation, Preservation of Electronic Formats & Formats for Electronic Preservation, Janice Mohlhenrich, ed., Ft.Atkinson, Highsmith(1993). 59 T. Hendley, Comparison of Methods & Costs of Digital Preservation, British Library Research and Innovation Report 106, British Library Research and Innovation Center, West Yorkshire (1998) 121 pp 60 D. Bearman, Reality and Chimeras in the Preservation of Electronic Records, D-LibMag. 5(4),(1999), 61 K. Russell, Digital Preservation and the CEDARS Project Experience, Proc. Int’l Conf. Preservation and Long Term Accessibility of Digital Materials, York, England (2000) pp. 139-154. Pag. 48 conocida es usar software compatible con las versiones anteriores, donde sea posible decodificar y codificar los archivos en las nuevas versiones, tal como se mencionó anteriormente un documento en Word 95 convertirlo a Word 2003. Esta estrategia puede funcionar en un corto tiempo siempre y cuando los recursos digitales sean creados en paquetes o software líderes, aunque históricamente tarde o temprano un formato de otra compañía sustituirá a otro; como ejemplo Lotus 123 con su formato WKS (Works for Windows Spreadsheet) el cual nació en 1983 y fue muy popular en los ochentas, hasta que el crecimiento de Microsoft fue gradualmente usurpando su posición con su hoja de cálculo Excel. Nadie nos garantiza que indefinidamente podremos seguir migrando documentos de Excel en 100 años. Otro procedimiento de esta estrategia implica migrar la información digital de una gran variedad de formatos, a un número más pequeño y manejable de formatos estándares. Entre menos formatos, menos volatilidad tendremos, aunque es posible que algunos formatos no puedan ser codificados debido a su complejidad con que fueron creados. Pag. 49 La decisión sobre cuales formatos deberían ser migrados o convertidos a recursos digitales, debería basarse en la estructura original del documento digital, en los objetivos de la colección y en los requerimientos de los usuarios de la colección.62 63 Un reporte de la Task Force on the Commission on Preservation and Access (CPA) and the Research Libraries Group (RLG) menciona que hay una gran variedad de estrategias de migración. Este reporte también define la migración como “la transferencia periódica de materiales digitales de una configuración de hardware/software a otra o de una generación de tecnología a una subsecuente”. 64 Y presenta cuatro escenarios: 1. La rutina de refrescar los archivos digitales. Hasta hace unos pocos años atrás, la transferencia de archivos de un medio a otro fue la característica central de la migración. Con la disponibilidad de más medios de almacenamiento confiables. 2. Cambiar los formatos digitales cuando los archivos son convertidos de una aplicación a otra. Un ejemplo de esta forma de migración seria mover un documento del sistema operativo de una Macintosh a Windows 98. 62 Digital Preservation Guidance Note 1: Selecting file formats for Long Preservation http://www.nationalarchives.gov.uk/preservation/advice/pdf/selecting_file_formats.pdf 63 T. Hendley. "Comparison of Methods & Costs of Digital Preservation." Place Published: British Library Research and Innovation Report 106 1999. http://www.ukoln.ac.uk/services/elib/papers/supporting/pdf/hendley-report.pdf 64 Information, Task Force on Archiving of Digital. "Preserving Digital Information." edited by The Commission on Preservation and Access and The Research Libraries Group, 71, 1996. Pag. 50 3. Cambiar radicalmente los formatos digitales. Por ejemplo convertir archivos de un procesador de palabras de un formato propietario a formato ASCII. 4. Hacer copias derivativas de un formato digital maestro. Algunos programas de preservación adoptan un formato de archivo maestro no permitido para acceso general solo para generar copias a un formato más adecuado. Por ejemplo guardar las imágenes en TIFF al escanearlas y este podría ser convertido a PDF para su distribución y uso. Wheatley 65 intenta dividir la migración en casos específicos mencionados en el Creative Archiving at Michigan and Leeds: Emulating the Old and the New (CAMILEON) Project, donde divide migración mínima, migración preservación, recreación, migración con conversión humana y migración con conversión automática. Donde se aplica en cada caso materiales de prueba y discute su utilidad para la preservación digital. Adicionalmente el concepto de migración sobre demanda ha sido concebido por la Consortium of University Research Libraries Exemplars for Digital Archives (CEDARS) Project en donde los objetos digitales son mantenidos y preservados con la adición de una herramienta de migración, la cual corre sobre una plataforma actual y puede ser empleada por los usuarios cuando sea necesaria, sin embargo cuando la herramienta de migración sea obsoleta, esto no va funcionar, siendo necesario a este tipo de migración 65 P. Wheatley, Migration—A CAMiLEON Discussion Paper (2000) http://www.ariadne.ac.uk/issue29/camileon/ Pag. 51 mantenerla junto con la estrategia de emulación para seguir manteniendo la herramienta de migración. Hendley considera a la migración como la más prometedora en el futuro. Bearman 66 también cree que la migración es la estrategia que más promete para la preservación de registros electrónicos. Russell apunta que es el procedimiento más práctico al menos para el corto o mediano plazo. Sin embargo para los recursos digitales que tienen un formato muy complejo y el contenido es multimedia, esta no será una opción fácil. Múltiples componentes podrán ser requeridos así como separadas actividades de migración, además para algunos recursos de multimedia, la migración no será posible sin comprometer su funcionalidad. Russell menciona también que los costos de migración a lo largo del tiempo, excederán los costos necesarios para preservarlos por la tecnología por si misma o los problemas que pudieran enfrentarse si se decide preservarlos mediante la estrategia deemulación. 66 Reality and Chimeras in the Preservation of Electronic Records D-Lib Mag. 5 (4), (1999), www.dlib.org/dlib/april99/bearman/04bearman.html Pag. 52 Waugh cree que la clave para una migración exitosa es el conocimiento del formato de datos original y la igualación cercana en las funcionalidades entre el formato original y el de reemplazo, también considera que la migración es simple en un corto y mediano plazo. Rothenberg descarta la estrategia de migración de registros electrónicos antes de que sean inaccesibles, no olvidemos que mencionamos anteriormente que él asume que en cada migración existe corrupción y esta es acumulativa. Lawrence 67 ha intentado cuantificar los riesgos que se involucran en el uso de la migración y ha analizado varias herramientas de migración comercialmente disponibles con relativa precisión. Donde identifica algunas claves para los requerimientos de migración de software como el acceso a la especificación de datos técnicos del formato usado y un análisis de las diferencias entre el original y el formato final. Identificación del grado de riesgo en el caso de errores, precisión de la conversión entre el archivo fuente y destino. Sin embargo ninguna de las herramientas se acerca a todos los requerimientos. Es importante notar que los estándares técnicos, pueden cambiar rápidamente por lo que esta estrategia no asegura que la información digital 67 G. W. Lawrence et al., Risk Management of Digital Information: A File Format Investigation, The Council on Library and Information Resources, Washington DC, June 2000. http://www.clir.org/pubs/reports/pub93/pub93.pdf Pag. 53 permanezca accesible. Recientemente el formato XML ha sido aceptado como un formato estándar en bibliotecas digitales, Web, formatos de archivos, la estandarización basada en XML pudieran ser los primeros pasos en dirección del problema de la preservación digital. Encapsulamiento El Encapsulamiento, tiene el propósito de superar los problemas de la obsolescencia tecnológica de los formatos de archivos poniendo énfasis en cómo interpretar la información encapsulada como parte de un objeto digital. Asume un concepto nuevo en el objeto digital (información y soporte), donde el objeto y cualquier otra cosa necesaria para proporcionar acceso al documento, son agrupados juntos y preservados, esta estrategia pudiera ser la solución de varios problemas tecnológicos. Trata de crear una aplicación original con lo que fue creado o se accede al objeto digital en futuras plataformas. Esta propuesta puede resolver la interoperabilidad, estabilidad y referenciabilidad. Esta metodología tiene bases en el concepto del contenedor de Bento68 el cual fue diseñado para aumentar la compatibilidad de datos entre aplicaciones de computadoras. 68 J. HarrisandI. Ruben, Bento Specification, Apple Computer Inc, July 1993, http://info.wgbh.org/upf/pdfs/BentoSpec1_0d5.pdf . Pag. 54 Esta estrategia involucra incluir la aplicación original que fue usada para crear o acceder al documento digital. Esto permitiría en el futuro usar el documento en nuevas plataformas tecnológicas. Parte del proceso de encapsulamiento pudiera ser migrar el documento a otro formato más fácil o manejable. El concepto de encapsulamiento es similar al contenedor (soporte lógico) de Bento69. El cual fue desarrollado en 1993 y su idea es incrementar la compatibilidad de datos entre aplicaciones de computadora. Bento es una especificación para el almacenamiento e intercambio de elementos mixtos y está diseñado para ser una plataforma y contenido neutral. Esto proporciona un contenedor (soporte lógico) para transportar cualquier tipo de contenido mixto entre múltiples plataformas. La encapsulación puede ser lograda usando estructuras físicas o lógicas llamadas contenedores ó recubrimientos que proporcionan una relación entre todos los componentes de información como un objeto digital. Incluso puede soportar metadatos. El Modelo de referencia para la OAIS (Open Archival Information System) también describe los tipos de información soportada que debería ser incluida en la encapsulación. Ellos incluyen la información de representación que será usada para interpretar los bits apropiadamente, la procedencia (Provenance) 69 J. Harris and I. Ruben, Bento Specification, Apple Computer Inc, July 1993, http://info.wgbh.org/upf/pdfs/BentoSpec1_0d5.pdf Pag. 55 que describe el origen de la fuente del objeto, el contexto que describe como el objeto se relaciona con información fuera del contenedor, una referencia de uno o más identificadores que hacen al objeto único. Y la estabilidad (fixity) que proporciona evidencia de que el objeto no ha sido alterado. El Universal Preservation Format (UPF)70 es un método que está siendo desarrollado para la preservación digital, basado en la teoría de encapsulamiento, es por sí solo una tecnología de almacenamiento auto descriptiva, la cual usa una envoltura para mantener el objeto digital y los metadatos juntos y protegidos de la obsolescencia tecnológica. La Digital Rosseta Stone (DRS)71, es un método para almacenar la información de representación necesaria para interpretar el contenido digital de un objeto separado del encapsulamiento evitando el uso ineficiente de espacio de almacenamiento. Basado en la historia de la Piedra de Rosseta donde en algún punto del siglo cuarto todo el conocimiento de los antiguos manuscritos egipcios fueron perdidos, sin dejar un método disponible para descifrar el lenguaje de los jeroglíficos los cuales habían sido preservados en los monumentos egipcios, tablas de piedra, hojas de papiro, pero 70 D. MacCarn, Toward a Universal Data Format for the Preservation of Media, SMPTE J. http://info.wgbh.org/upf/pdfs/991231_UPF_RP.pdf 71 A. R. Heminger and S. B. Robertson, Digital Rosetta Stone: A Conceptual Model for Maintaining Long- term Access to Digital Documents, Proc. Sixth Delos Workshop, Tomar, Portugal (1998), http://www.ercim.org/publication/ws- proceedings/DELOS6/rosetta.pdf Pag. 56 afortunadamente en una expedición a Egipto en 179972, la armada de Napoleón descubrió un artefacto, el cual ha sido conocido como la piedra de Rosseta en honor al pueblo donde se descubrió. Esta piedra contiene la inscripción de un decreto emitido por Ptolomeo V en 196 antes de Cristo. El decreto fue repetido tres veces, en griego, egipcio demótico (un tipo de escritura cursiva) y egipcio con jeroglíficos, entonces como hay bastante información sobre los dialectos griegos; fue posible descifrar el significado de los textos antiguos egipcios; actualmente seguimos interpretando cualquier jeroglífico o papiro egipcio gracias a esta piedra. Entonces la idea es crear información de representación, que en un momento dado pueda servir para interpretar el contenido de un objeto digital en el futuro. Desafortunadamente crear una piedra de Rosseta Digital (DRS) no es tan simple, en este caso la DRS debe estar fundada en tres procesos principales, que son necesarios para preservar y acceder a nuestra historia digital; preservación de conocimiento, recuperación de datos, reconstrucción de los documentos. El proceso de preservación del conocimiento suporta los procesos de recuperación de datos y reconstrucción de documentos. 72 La Piedra de Roseta http://www.thebritishmuseum.ac.uk/compass/ixbin/goto?id=OBJ67 Pag. 57 Rothenberg ha promovido ampliamente la estrategia
Compartir