6.2 L’ingestion

6.2.1 Paquet d'informations à verser (SIP)

6.2.1.1 Le SIP est un paquet d'informations transmis système de dépôt et stockage numérique pour ingestion (par l’entité des entrées). Le SIP comprend les données audio à stocker ainsi que toutes les métadonnées relatives à l'objet et à ses contenus. L’ingestion, dans le modèle OAIS, désigne le processus d'acceptation des contenus et des métadonnées afférentes (SIP), le processus de vérification des fichiers, d'extraction des données pertinentes et de préparation des AIP pour le stockage. Ce processus apporte la garantie que les paquets d'informations archivés (AIPs) et leur description s'inscrivent bien dans le modèle OAIS.

6.2.1.2 Un système d'entrepôt de données numériques et de conservation devrait être en mesure d'accueillir et de valider un fichier audio. La validation est un processus qui apporte la garantie de conformité normative des fichiers acceptés dans le système de stockage. On peut rencontrer des difficultés pour utiliser ultérieurement des fichiers non normalisés lorsque les dispositifs de lecture d'époque ne sont plus disponibles. Des outils permettent la validation automatique des formats de fichiers, et un certain nombre de solutions open source, comme JHOVE (JSTOR/Harvard Object Validation Environment), sont disponibles et en cours de développement.

6.2.2 Formats

6.2.2.1 L'IASA recommande l'utilisation de fichiers .wav, ou BWF.wav de préférence (EBU tech 3285). La différence entre ces deux formats consiste en la présence, dans la trame du format BWF, d'en-têtes qui peuvent être utilisés pour organiser et gérer les métadonnées. Les métadonnées BWF conviennent pour de nombreuses applications, mais dans le cas de situations et d'échanges complexes, il est nécessaire de disposer d'un paquet plus compréhensible ; et en de telles circonstances, on utilisera souvent la norme de codage et de transmission de métadonnées METS (Metadata Encoding and Transmission Standard). Le schéma METS est une norme d'encodage de métadonnées descriptives, administratives, et structurelle des objets détenus par les bibliothèques numériques, exprimé sous forme XML (eXtensive Markup Language), langage de balisage extensible. Un ensemble METS, qui comporte les métadonnées et les contenus, est souvent utilisé comme norme d'échange entre bibliothèques numériques.

6.2.2.2 Le format MXF (Material eXchange Format) est un format conteneur destiné aux professionnels des média vidéo et audio numériques ; il est défini par un jeu de normes SMPTE. MXF a été adopté surtout par la communauté des archivistes vidéo, bien qu'il soit capable de gérer aussi les archives audio. Ainsi en est-il du format METS, qui est essentiellement un ensemble de métadonnées qui couvrent le contenu, c'est-à-dire l'audio dans ce cas. Ces deux formats sont très utiles pour la gestion des contenus et informations associées, ainsi que pour les échanges entre services d'archives et dépôts.

6.2.2.3 Le format du SIP dépendra du système, de la taille et du degré de perfectionnement du projet. Il est tout à fait possible de constituer un service d'archives viable constitué de fichiers .wav, avec introduction manuelle de la plupart des métadonnées nécessaires, et de conduire l'acquisition des données techniques nécessaires lors de la phase d’ingestion dans le système. Ceci, toutefois ne concerne que les plus petites collections. Pour les grandes collections dont les processus de numérisation sont effectués à l'extérieur, à distance, les grands volumes de fichiers doivent bénéficier d'une entité d'entrée et de systèmes d'échange de données élaborés afin d'assurer une ingestion correcte des contenus dans le système de stockage. Un logiciel de production et de vérification génère beaucoup de données sous format de fichiers XML normalisés pouvant être utilisés à des fins de conservation. Par exemple, l'outil d'extraction de données (Metadata Extractor tool) développé par la Bibliothèque nationale de Nouvelle Zélande en langage Java, effectue l'extraction des métadonnées de conservation des objets numériques et la production de celle-ci dans un format normalisé (XML).

6.2.3 Métadonnées de conservation

6.2.3.1 Les métadonnées nécessaires à la gestion du processus de conservation dans l'étape d'entrée représentent toute l'information dont on dispose sur la création de l'objet audionumérique ainsi que sur les modifications de formats intervenues avant la phase d'entrée dans le système. De cette manière, la connaissance de l'origine technique de l'objet est conservée, ce qui permet de tracer le parcours de l'item entre sa forme présente et sa forme d'origine, à partir de laquelle il a été créé pour permettre sa traçabilité.

6.2.3.2 Le format BWF suit les recommandations non obligatoires du guide "Format for Coding History field in Broadcast Wave Format : format de codage dans le champ CodingHistory du format pour la radiodiffusion BWF" http://www.ebu.ch/CMSimages/en/tec_text_r98-1999_tmc7-4709.pdf qui décrit la manière dont les modifications apportées aux fichiers peuvent être formulées. L'utilisation du code libre texte ASCII permet de décrire les équipements techniques ou les logiciels ayant servi à la création de l'objet numérique audio.