3.7 Métadonnées d'administration – Métadonnées de conservation

3.7.1 Les informations décrites dans ce paragraphe font partie du regroupement des métadonnées administratives. Celles-ci rassemblent les informations de l'en-tête des fichiers audio  et encodent les  informations d'exploitation nécessaires. De cette manière, le système informatique reconnaît le fichier et la manière dont il doit être utilisé grâce à l'association du fichier d'extension avec un logiciel particulier, et grâce à la lecture de l'information codée dans l'en-tête du fichier. Ces informations doivent aussi être  référencées dans un fichier à part afin de faciliter la gestion et les futurs accès, car les extensions de fichiers constituent, au mieux, des indicateurs ambigus des fonctionnalités du fichier. Les champs qui décrivent cette information explicite, y compris le type et la version, peuvent-être automatiquement extraits des en-têtes du fichier et utilisés pour alimenter les champs du système de gestion des métadonnées. Si un système d'exploitation en cours ou à venir n'a pas la capacité d'activer un fichier .wav ou de lire une instance .xml par exemple, le logiciel ne pourra reconnaître l'extension ni accéder au fichier ou déterminer son type. En explicitant cette information dans l'inscription d'une métadonnée, on permet au futur utilisateur de disposer des données de gestion et d'être en mesure de décoder les données d'information. Les normes , en cours d’élaboration dans l'AES-X098B  et qui seront publiées par l'Audio Engineering Society sous le titre AES57 "AES standard for audio metadata - audio object structures for preservation and restoration" ("Norme AES portant sur les métadonnées audio - structures des objets audio pour la conservation et la restauration" (en anglais (NDT))  codifient cet aspect de la question.

3.7.2 Des registres de format sont disponibles aujourd'hui, bien qu'encore en développement, pour faciliter la catégorisation et la validation des formats de fichiers dans les tâches de pré-chargement : PRONOM (registre technique en ligne, comprend les formats de fichiers, maintenu par TNA (The National Archives, UK), qui peut être utilisé conjointement avec un autre outils de TNA, DROID (Digital Record Object Identification (Identification d'enregistrement numérique d'objets) - qui effectue l'identification automatique de lots de formats de fichiers et de sorties de métadonnées). En provenance des Etats-Unis, Université de Harvard, les outils GDFR (Global Digital Format Registry) (Registre de format numérique global) et JHOVE (JSTOR/Harvard Object Validation Environment identification, validation, and characterization of digital object) (identification de l'environnement, validation et caractérisation des objets numériques) offrent des services comparables permettant la conservation des compilations de métadonnées. Une information précise des formats de fichiers est essentielle pour atteindre l'objectif de conservation à long terme.

3.7.3 Le plus important concerne les aspects de conservation et de transfert relatifs aux fichiers audio, y compris la totalité des paramètres techniques, qui doivent être soigneusement évalués et préservés. Ce qui implique l'ensemble des mesures qui doivent être prises pour assurer la sauvegarde des documents audio tout le long de leur vie. Même si de nombreuses métadonnées discutées ici peuvent être ajoutées sans encombre à une date postérieure, l'enregistrement de la création du fichier audionumérique (et  tout changement apporté à son contenu)  doit être créé au moment où se produit l'événement. Cet historique des métadonnées permet de suivre l'intégrité de l'item audio et, si l'on utilise le format BWF, elles peuvent être enregistrées en tant que partie intégrante du fichier par codage de l'historique dans le bloc BEXT. Cette information constitue une partie essentielle des recommandations formulées à l'adresse des métadonnées de conservation PREMIS. L'expérience montre que les systèmes informatiques sont en mesure de produire d'abondantes données techniques lors du processus de numérisation. Des données qu'il faudra peut-être distiller dans les métadonnées qui doivent être conservées. Des ensembles d'éléments utiles sont proposés dans la série provisoire AudioMD (http://www.loc.gov/rr/mopic/avprot/audioMD_v8.xsd), un schéma d'extension développé par la Library of Congress (Bibliothèque du Congrès), ou bien par le schéma de l'AES audio Object XML qui, au moment d'écrire ces lignes est en révision pour normalisation.      

3.7.4 Dans le cas de la numérisation de collections légales, ces schémas sont utiles, non seulement pour décrire les fichiers numériques, mais également pour décrire l'original physique. Des précautions doivent prises afin d'éviter toute ambiguïté à propos des objets en cours de description dans les métadonnées : il devient nécessaire de décrire les tâches, leurs manifestations originales, les versions numériques subséquentes, mais la capacité de pouvoir distinguer ce qui est décrit dans chaque instance revêt une importance critique. PREMIS réalise la distinction des différentes composantes dans la séquence de changement en les associant avec les événements et en reliant les métadonnées résultantes au cours du temps.