12. GESTIÓN DE DATOS: PRINCIPIOS ARCHIVÍSTICOS EN UN ENTORNO BASADO EN FICHEROS

Las principales acciones de archivo digital tienen que ver con la preservación de bits, es decir, con un conjunto de acciones que mantengan la integridad de los datos digitales («corrientes de bits») que gestiona la institución responsable.

Más allá de la preservación de bits habrá que actuar, en última instancia, cuando el formato del contenido quede obsoleto. La acción más común consistirá en migrar de formato, aunque (como se señala en los comentarios de la sección 10) puede haber contextos en los que se requiera la emulación del sistema. Mientras que las decisiones sobre la preservación de bits pueden confiarse a los especialistas en tecnología de la información y las aplicaciones y los equipos informáticos apropiados, las acciones más allá de la preservación de bits deberán contar con la participación de profesionales del ámbito de la conservación. Lo que está en juego requiere tener en cuenta las propiedades significativas del contenido y las características de la comunidad de investigadores a la que se presta servicio, así como una evaluación de la obsolescencia de los formatos y las opciones de nuevos formatos de destino. La gestión de datos debe observar los siguientes principios básicos:

  • Por regla general los ficheros llegan a nuestro sistema de almacenamiento mediante un copiado. Este proceso debe generar duplicados que puedan verificarse como idénticos a los originales. La comprobación de la integridad de los datos se hace mediante la creación previa de una suma de verificación, también conocida como hash o digest. El proceso de verificación debe tener lugar justo después de la creación de la copia, y a poder ser como procedimiento automatizado.
  • La integridad en el tiempo de los datos del contenido digital debe verificarse periódicamente para garantizar que se puedan leer exactamente como se escribieron, sin errores ni alteraciones.
  • Sin embargo, dependiendo del formato de fichero original, puede ser preferible transcodificar a un nuevo formato de destino en lugar de copiar el fichero original sin más (véanse las secciones 10 y 11). Este proceso se conoce como migración de formato.
  • El contenido digital, ya sea basado en un fichero o en un soporte físico, debe copiarse a un nuevo soporte físico antes de que se produzcan errores no corregibles. Cuando los formatos original y de destino son los mismos, este proceso se conoce como migración de refresco o de medios.
  • Es esencial conservar al menos dos copias de preservación digital, y si pueden ser más, mejor, y utilizar otras copias para el acceso, según convenga. Las copias de preservación deben guardarse en distintos lugares geográficos siempre que sea posible. El uso de diferentes tecnologías de almacenamiento para cada conjunto de copias de preservación puede aportar una seguridad adicional. Al elegir las tecnologías que se van a utilizar hay que tener presente que una estrategia será tan robusta como su eslabón más débil.
  • Deben hacerse copias de acceso siempre que sea posible. Sin embargo, a diferencia de lo que ocurre con los ficheros maestros, esas copias de acceso o de distribución pueden modificarse subjetivamente, según las necesidades de los usuarios. Asimismo se puede emplear la reducción de datos cuando sea compatible con las peticiones de los usuarios. Como ocurre en los procesos de creación de ficheros maestros de preservación, en este caso también es esencial documentar cuidadosamente todos los parámetros y procedimientos empleados.
  • Siempre que sea posible, las comprobaciones para garantizar la integridad de los datos serán automáticas, como ocurre en los repositorios digitales de confianza. Si ello no es posible, se recurrirá a las comprobaciones manuales sobre una base estadísticamente significativa.

Comentario:

Si bien estos principios se aplican por igual a cualquier forma de preservación digital, el gran tamaño relativo de los ficheros y la naturaleza temporal del contenido audiovisual exigen considerar con atención las capacidades de almacenamiento y de ancho de banda.

Esencialmente, estos principios son los mismos que los recomendados para el mundo analógico. Sin embargo, una diferencia fundamental es la dimensión cualitativa del mundo digital basado en ficheros, que permite la validación objetiva de la integridad de las grabaciones. La supervisión periódica de la integridad de los datos es una de las obligaciones fundamentales de las rutinas de preservación digital. Los soportes y sistemas digitales pueden fallar y fallan, sin previo aviso, en cualquier momento. Las estrategias para reducir al mínimo los riesgos para los ficheros digitales se basan, en gran medida, en la conexión en red entre la colección primaria, el usuario y las copias de seguridad.