6.2 Captura

6.2.1 Paquete de sumisión de información (SIP)

6.2.1.1      El SIP es un paquete de información entregado al repositorio y al sistema de almacenamiento digital para su captura. El SIP incluye los datos de audio sujetos a almacenamiento así como todos los metadatos necesarios relacionados con el objeto y su contenido. La captura en el modelo OAIS es el proceso que acepta el contenido y sus metadatos asociados (paquete SIP), verifica el fichero, extrae los datos relevantes y prepara el paquete AIP para el almacenamiento, y asimismo asegura que los AIPs y su Información Descriptiva relacionada queden establecidos dentro del modelo OAIS.

6.2.1.2      Un sistema de preservación y de repositorio digital debería ser capaz de aceptar y validar un fichero de audio. La validación es el proceso encargado de asegurar que los archivos aceptados en el sistema de almacenamiento digital cumplan con ciertos estándares. Los ficheros no estandarizados pueden resultar de difícil utilización en el futuro, cuando los actuales sistemas de reproducción ya no se hallen disponibles. Existen instrumentos para la validación automática de formatos de archivo. Algunos de ellos, disponibles y en continuo desarrollo, son soluciones de código abierto, como JHOVE (JSTOR/Harvard Object Validation Environment).

6.2.2 Formato

6.2.2.1      La IASA recomienda el uso de ficheros .wav o preferiblemente BWF [EBU Tech 3285]. La diferencia entre ambos radica en que BWF contiene un conjunto de cabeceras utilizables para organizar y manejar metadatos. Aunque los metadatos en BWF son adecuados para muchos propósitos, en sistemas más sofisticados y situaciones de intercambio puede resultar necesario un conjunto más completo de metadatos. En estas circunstancias se utiliza a menudo el estándar METS, Metadata Encoding and Transmission Standard. El esquema METS es un estándar para la codificación de metadatos descriptivos, administrativos y estructurales relacionados con los objetos de una biblioteca digital, expresados mediante XML (eXtensible Markup Language). Un paquete METS consta de metadatos y contenido y se utiliza a menudo como estándar de intercambio entre archivos digitales.24

6.2.2.2      Material eXchange Format (MXF) es un formato de contenedor destinado a los medios audiovisuales profesionales y definido por un conjunto de estándares de la SMPTE (Society of Motion Picture and Television Engineers). El formato MXF ha sido mayoritariamente adoptado por la comunidad archivística de vídeo, aunque es capaz también de gestionar audio. Como METS, se trata principalmente de un conjunto de metadatos que «envuelve» el contenido, en este caso, audio. Ambos formatos son muy útiles en el intercambio y gestión de contenido e información entre archivos y repositorios.

6.2.2.3      El formato del paquete SIP dependerá del sistema y el tamaño y complejidad de la tarea. La creación de un archivo SIP resulta razonablemente viable a partir de ficheros .wav, introduciendo de forma manual en el sistema la mayor parte de los metadatos necesarios y adquiriendo a su vez todos los metadatos técnicos necesarios durante el proceso de captura. Esto, sin embargo, solo será apropiado para una colección diminuta. Las colecciones de mayor tamaño, con grandes cantidades de material y procesos de digitalización separados y remotos, deberán construir sofisticados sistemas de captura e intercambio de datos para asegurar la adecuada captura de contenido en los sistemas de almacenamiento de datos. El software de producción y verificación deberá generar muchos de estos datos en forma de ficheros XML estandarizados que puedan ser utilizados a efectos de preservación. La Biblioteca Nacional de Nueva Zelanda, por ejemplo, dispone de un instrumento de extracción de metadatos (The National Library of New Zealand Metadata Extractor tool) basado en tecnología Java que es capaz de extraer metadatos de preservación a partir de objetos digitales y devolverlos en el formato estandarizado XML.


24. Ver sección 3.8 (n. de los t.).

6.2.3 Metadatos de preservación

6.2.3.1      Los metadatos necesarios para la gestión de los procesos de preservación en el estadio de captura son aquellos relacionados con la creación del objeto de audio digital y los cambios de formato que hayan podido ocurrir antes de la captura. De esta forma se preserva la información sobre la proveniencia técnica del objeto, lo que permite establecer un vínculo que puede rastrearse entre la forma presente del ítem y la forma original con la que fue creado.

6.2.3.2      El formato BWF dispone de una recomendación no obligatoria titulada Format for Coding History field in Broadcast Wave Format (Formato para el campo de historia de la codificación en BWF), disponible en http://www.ebu.ch/CMSimages/en/tec_text_r98-1999_tcm6-4709.pdf. Esta recomendación explica cómo describir los cambios a los que hayamos sometido el fichero. El uso local del campo de texto libre en código ASCII permite la descripción del equipamiento técnico o del software utilizado en la creación del objeto de audio digital.