Recommandations pour la production et la conservation des objets audionumériques

TC04 IASAVoici la version française de l'édition web du IASA-TC04 (deuxième édition, septembre 2009), une référence reconnue en matière de conservation audio numérique dans le domaine de l'archivage sonore.

Les exemplaires papier et PDF peuvent être commandés à partir de la page consacrée au Publication spécialisées. Les membres de IASA peuvent aussi télécharger gratuitement une version PDF. Si vous n'êtes pas membre, pourquoi ne pas rejoindre IASA? IASA-TC04 est également disponible encatalan,espanol etanglais.

Recommended citation style:
IASA Comité Technique, Recommandations pour la production et la conservation des objets audionumériques, édition revue par Kevin Bradley. Deuxième édition, traduction francaise, publiée en 2015. (= normes recommandées, bonnes pratiques et stratégies, IASA-TC 04). www.iasa-web.org/audio-preservation-tc04

Table des matières

Informations sur la publication

IASA Comité Technique

Normes recommandées, bonnes pratiques et stratégies

Recommandations pour la production et la conservation des objets audionumériques

IASA-TC04, Deuxième édition

Edition : Kevin Bradley

Auteurs contributeurs :

Kevin Bradley, National Library of Australia, président de l’IASA, vice-président du Comité technique ; Mike Casey, Indiana University ; Stefano S. Cavaglieri, Fonoteca nazionale Svizzera ; Chris Clark, British Library (BL) ; Matthew Davies, National Film and Sound Archive (NFSA) ; Jouni Frilander,  Société finlandaise de radiodiffusion ; Lars Gaustad, Bibliothèque nationale de Norvège et président du Comité technique ; Ian Gilmour, NFSA ; Albrecht Häfner, Südwestrudfunk, Allemagne ; Franz Lechleitner, Phonogrammarchiv, Académie autrichienne des sciences (OAW) ; Guy Maréchal, PROSIP ; Michel Merten, Memnon ; Greg Moss, NFSA ; Will Prentice, BL ; Dietrich Schüller, OAW ; Lloyd Stickells et Nadia Wallaszkovitz, OAW.

Révision par le Comité technique de l’IASA comprenant, pour cette édition (outre les personnes mentionnées ci-dessus) :
Tommy Sjöberg, Folkmusikens Hus, Suède ; Bruce Gordon, Harvard University ; Bronwyn Officer, National Library of New Zealand ; Stig L. Molneryd, Archives nationales des documents sonores et de l’image animée, Suède ; George Boston ; Drago Kunej, Académie slovène des sciences et arts ; Nigel Bewley, BL ; Jean-Marc Fontaine, Laboratoire d’acoustique musicale ; Chris Lacinak ; Gilles St. Laurent, Library and Archives, Canada ; Xavier Sené, Bibliothèque Nationale de France.

Traduction : Jean-Marc Fontaine
Relecture : Xavier Loyant

L’impression de cette traduction française a été possible grâce au généreux soutien de Memnon, a Sony Company   
Publié par l'Association internationale des archives sonores et audiovisuelles

1ère édition publiée en 2004
2è édition publiée en 2009
2è édition, traduction française, publiée en 2015

IASA TC-04, Recommandations pour la production et la conservation des objets audionumériques : normes recommandées, bonnes pratiques et stratégies : 2è édition revue par Kevin Bradley

Cette publication destinée aux archivistes audiovisuels constitue un guide de niveau professionnel pour la production et de la conservation des objets audionumériques.

Inclut des références bibliographiques

Copyright : Association internationale des archives sonores et audiovisuelles (IASA) 2009

Toute traduction additionnelle ne peut être entreprise qu'avec l'accord du bureau exécutif de IASA et doit être entreprise conformément aux Recommandations pour la traduction des publications de IASA (http://www.iasa-web.org/translation-publications-guidelines)

Préface de la deuxième édition

Débattre des principes qui sous-tendent les tâches de la conservation du son puis discuter, codifier et documenter les pratiques que nous, archivistes professionnels du son, utilisons et recommandons, passe nécessairement par l’identification des forces et faiblesses de notre travail quotidien. Lorsque la première version/édition de TC-04 : Recommandations pour la production et la conservation des objets audio numériques fut achevée et imprimée en 2004, il y eut, malgré une certaine fierté d'avoir réalisé cette première publication, peu de doute parmi les membres du comité technique de IASA sur la nécessité de produire une deuxième édition pour traiter des domaines sur lesquels nous savions devoir travailler. Durant les quatre années qui se sont écoulées, nous, en tant que comité, nous  sommes agrandis, avons étendu nos connaissances et notre expertise en maints domaines et aidé au développement de normes et systèmes qui mettent en œuvre des actions durables et des pratiques de conservation. Cette deuxième édition bénéficie de ce travail, elle comporte une grande partie de ce qui est essentiel dans le domaine évolutif de la conservation durable du son par des moyens numériques.

Bien que nous ayons incorporé de nombreuses et nouvelles informations, et affiné quelques-uns des chapitres fondamentaux, les conseils prodigués dans la deuxième édition ne se trouvent pas en contradiction avec ceux de la première édition. Le document TC-04 : Recommandations pour la production et la conservation des objets audio numériques de l'IASA s'appuie sur TC-03 : Sauvegarde du patrimoine sonore : éthique, principes et stratégies de conservation. La version révisée de TC-03 publiée en 2006 tient compte des nouveaux développements dans l’archivage audio numérique et du rôle beaucoup plus pragmatique de TC-04. Le document TC-03 de 2006 se concentre sur les principes, il annule et remplace les versions antérieures et ses recommandations constituent l’incarnation pratique des principes.

On pourra trouver les amendements majeurs de cette deuxième édition de TC-04 dans les chapitres traitant des entrepôts et des architectures numériques. Le chapitre 3, Métadonnées, a été considérablement développé, il fournit des conseils significatifs et détaillés sur l’approche de la gestion des données et des métadonnées que l'on peut suivre à des fins de conservation, reformatage, analyse, découverte et utilisation. Le chapitre s’étend largement sur le domaine en question,  des schémas jusqu’aux structures de gestion et d'échanges de contenus, et prend en considération les composantes majeures que sont les dictionnaires de données, les schémas, les ontologies et les encodages. Le pendant en est le chapitre 4, Identifiants Uniques et Persistants, qui donne des conseils sur le nommage et la numérotation des fichiers et des tâches numériques.

La nouvelle section adjointe en tant que chapitre 6, "Formats et systèmes cibles de pérennisation", est structurée autour des catégories fonctionnelles identifiées dans le Modèle de référence pour un système ouvert d'archivage d'information (Reference Model for an Open Archival Information System (OAIS)) : entrée, stockage des archives, planification de pérennisation, administration et gestion de données, accès ; les rubriques traitent de chacun des domaines. L’utilisation de ce modèle conceptuel dans l’organisation  de cet ouvrage a deux conséquences importantes : premièrement, il utilise les mêmes catégories fonctionnelles que les architectures conçues pour les principaux systèmes de stockage et de gestion de données, ce qui signifie qu’il a une réelle pertinence mondiale ; deuxièmement, identifier des éléments séparés et abstraits d’une stratégie de pérennisation numérique permet à l’archiviste de prendre des décisions sur les diverses parties du processus plutôt que d’essayer de résoudre et de mettre en application l’ensemble de manière monolithique. Le chapitre 9, "Partenariats, planification de projet et ressources", est entièrement nouveau, il fournit des conseils sur les problématiques à considérer si un gestionnaire de collection décide de sous-traiter tout ou partie des processus impliqués dans la conservation des collections audio.

Le chapitre 7, "Approches à échelle réduite des systèmes de stockage numérique", évoque comment monter à faible coût un système de gestion numérique qui, bien que limité dans ses objectifs, réponde encore aux principes et aux mesures de qualité identifiés dans le chapitre 6.

Le chapitre 8 revisite les risques associés au stockage des disques optiques, il donne des recommandations quant à la gestion de ceux-ci tout en suggérant le fait que les conseils prodigués aux chapitres 6 et 7 peuvent être plus utiles pour gérer à long terme les contenus numériques.

Le chapitre 5, "Extraction du signal des supports originaux", constituait l’un des apports les plus concrets et les mieux avisés de la première édition, il demeure une source de connaissances sur des aspects pratiques, une source d’informations sur les normes et enfin une source de conseils. Du fait du processus de relecture de ce document, les chapitres sur l’extraction du signal ont été approfondis et des conseils utiles ajoutés. Une section supplémentaire, 5.7 Technologies d’enregistrement sur le terrain et approches d’archivage,  a été ajoutée : elle aborde la question de la manière de réaliser un enregistrement sonore in situ lorsque le contenu est destiné à l'archivage à long terme.

Le chapitre 2, "Principes numériques clefs", reste conforme aux standards présentés dans la version antérieure. Il comporte cependant beaucoup plus de détails et des informations techniques, en particulier sur les processus de conversion numérique, ceci dans un langage plus précis et normalisé.

TC-04 représente un effort considérable et un engagement du comité technique de IASA, non seulement de ceux qui ont produit le texte original mais aussi de ceux qui ont relu et analysé les chapitres jusqu’à obtenir la clarté souhaitée. À mes amis et collègues du comité technique va mon respect pour leur connaissance approfondie et ma gratitude pour leur générosité à la partager. La qualité de cette nouvelle édition est un témoignage de leur expertise.

Kevin Bradley
Éditeur
Novembre 2008
 

Introduction à la première édition

L’audio numérique a, au cours des toutes dernières années, atteint un niveau de développement qui le rend à la fois efficace et abordable pour la conservation de collections audio, quelle que soit leur taille. Du fait de l’intégration de l’audio aux systèmes de données, du développement de normes appropriées et de l'adoption générale des procédures de diffusion audio numériques, tous les autres médias sont supplantés à un niveau tel que le choix est restreint pour assurer la conservation du son, hormis le stockage numérique.  La technologie numérique a le potentiel de fournir une approche qui réponde à nombre d’attentes de la communauté archivistique grâce à la migration sans perte du signal audio dans le temps. Cependant, les processus de conversion numérique de l’audio analogique, de transfert sur des systèmes de stockage, de gestion et d’entretien des données audio, de fourniture d’accès et de garantie de l’intégrité de l’information stockée, présentent une nouvelle étendue de risques qui doivent être gérés pour garantir les bénéfices de la conservation et de l’archivage. Échouer dans la gestion appropriée de ces risques peut aboutir à des pertes significatives de données, de leur valeur et même de contenus audio.

Cette publication du comité technique de l'IASA (Association internationale des archives sonores et audiovisuelles), Recommandations pour la production et la conservation d’objets audio numériques, a pour objectif de fournir des conseils aux archivistes audiovisuels sur les approches professionnelles permettant de constituer et de conserver des objets audio numériques.

Elle constitue l'aboutissement, sur le plan pratique, de la précédente publication du comité technique de l'IASA, TC-03 : Sauvegarde du patrimoine sonore : éthique, principes et stratégie de conservation, version 3, décembre 2005. Les Recommandations abordent, à des fins de conservation, la production de copies numériques à partir des originaux analogiques, le transfert d’originaux nés numériques vers des systèmes de stockage, ainsi que l’enregistrement des contenus originaux numériques en vue de leur archivage à long terme. Tout processus de numérisation est sélectif, le contenu audio intrinsèque fournit davantage d’information aux utilisateurs potentiels qu’il n’en est contenu dans le signal proposé. Les normes de conversion analogique - numérique fixent les limites de la résolution de l’audio de manière permanente et, à moins d’être entreprise avec soin, partielle.

Les Recommandations comprennent trois parties principales :

  • Les normes, principes et métadonnées
  • L'extraction du signal à partir des originaux
  • Les formats cibles

Normes, principes et métadonnées. Des quatre tâches fondamentales accomplies par toutes les archives (acquisition, documentation, accès, conservation), l'action principale consiste à conserver l’information placée sous la responsabilité du service de la collection (IASA TC-03, 2005). Ainsi, si les tâches d’acquisition et de documentation sont établies en relation avec une stratégie de conservation numérique correctement planifiée et conforme aux normes en référence, les opérations de fourniture d’accès sont facilitées. L’accès à long terme dépend des bonnes conditions de conservation.

Etre conforme aux normes relatives à la conservation de l’audio numérique, largement utilisées et acceptées, est une nécessité fondamentale. Les Recommandations de IASA préconisent le format PCM (Pulse Code Modulation) (Modulation par impulsions codées) linéaire, entrelacé pour la stéréo, dans un fichier .wav ou de préférence .wav BWF (UER Tech 3285) pour toutes séquences audio deux pistes. L’utilisation d'un quelconque codage dit perceptif (« compression avec pertes ») est fortement déconseillée. Il est recommandé que l’audio soit numérisé à 48 kHz ou plus, avec une profondeur de mot d’au moins 24 bits. La conversion analogique / numérique (A/N) est un processus précis, aussi des convertisseurs à bas coût intégrés aux cartes son des ordinateurs ordinaires ne peuvent généralement répondre aux exigences des programmes de conservation pour l’archivage.

Une fois le signal encodé en tant que fichier de données,  sa conservation  pose de nombreux problèmes, similaires à ceux de toutes données numériques, c'est-à-dire, en premier lieu, leur gestion, l’attribution d’un identifiant persistant (IP) unique et l'insertion de métadonnées appropriées.
 
Une métadonnée n'est pas simplement une information de description permettant à l’utilisateur ou au service d’archives d’identifier le contenu, elle comporte également l'information technique qui rend possible la reconnaissance et la lecture des séquences sonores ; enfin, la métadonnée de conservation détient l'information sur les processus mis en œuvre pour générer le fichier audio. C’est la seule manière de garantir l’intégrité du contenu audio. Le service d’archives numériques devra conserver des métadonnées complètes pour maintenir sa collection. Une archive numérique bien planifiée automatisera la production de la plupart des métadonnées, qui  devront inclure des informations à propos du support original, son format et son état de conservation, des équipements et des paramètres de relecture, de la résolution et du format de fichier, de tous les équipements utilisés, des opérateurs impliqués dans les opérations et plus généralement de tout processus ou procédure entrepris.

Extraction du signal à partir des originaux. « Les services d'archives sonores doivent apporter la garantie, lors du processus de relecture, que les signaux enregistrés puissent être restitués, autant que possible, avec la même, sinon meilleure, fidélité en comparaison avec les signaux d'origine… (en outre), les supports sont porteurs d’information : information souhaitée ou primaire dans le contenu sonore recherché, et information ancillaire ou secondaire qui peut prendre des formes multiples. L’information primaire et l'information secondaire font toutes deux partie du patrimoine audio » (IASA TC-03, 2005).

Pour bénéficier  de tout le potentiel qu'offre l’audio numérique, il est nécessaire de souscrire aux principes mentionnés ci-dessus et de s’assurer que la lecture de l’original audio soit effectuée avec une parfaite conscience de toutes les contraintes. Ceci implique la connaissance approfondie des évolutions des anciennes technologies audio et une bonne culture technique des progrès de la technologie des moyens de lecture. Le cas échéant, les Recommandations fournissent des conseils à propos de systèmes mécaniques historiques de lecture et autres formats obsolètes comprenant les cylindres et les disques à sillon large (78 tours), le fil magnétique et systèmes dictaphones, les disques vinyle, la bande magnétique analogique en cassette et en bobine libre, ;  leurs conseils portent aussi sur les supports magnétiques numériques tels que les DAT et ses prédécesseurs sur bande vidéo, et enfin sur les disques optiques tels que CD et DVD. Pour chacun des formats de support, des conseils sont prodigués pour la sélection de la meilleure copie existante, le nettoyage, la restauration du support, l’équipement de lecture, la vitesse et l’égalisation, les corrections adoptées pour pallier les défauts d'alignement des dispositifs d’enregistrement, la suppression des artefacts du signal survenus lors du stockage, et la durée requise pour entreprendre un transfert vers le numérique. Tous ces thèmes importants sont abordés dans les Recommandations en tenant compte des questions d'éthiques qui s'y rapportent ; on notera le dernier point, crucial, car de nombreux projets de numérisation ne peuvent être financés en raison des contraintes considérables de durée que les processus de transfert audio impliquent.

Tous les paramètres mentionnés ci-dessus doivent être déterminés objectivement, et les compte rendus correspondant à chaque processus doivent être conservés. Le stockage numérique, sa technologie et les normes dans lesquelles il s'inscrit permettent une approche éthique de l’archivage sonore en rendant possible la production d’une documentation et l'intégration de celle-ci dans des champs de métadonnées associés.

Formats cibles. Les données peuvent être stockées de différentes et nombreuses manières sur de nombreux supports, aussi le type de technologie approprié dépendra-t-il du contexte de l’institution et de ses collections. Les Recommandations fournissent conseils et informations sur diverses approches et technologies appropriées, incluant les systèmes de stockage numérique de masse (Digital Mass Storage Systems –DMSS) et les systèmes de stockage numérique à petite échelle comme les bandes numériques, les disques durs, les disques optiques (CD, DVD enregistrables) et les disques magnéto-optiques (MO).

Aucun format cible ne constitue une solution absolument permanente pour la conservation audio numérique et aucun développement technologique ne fournira jamais la solution suprême. Dans une telle situation de développement d'un processus par étapes, les institutions resteront responsables de la disponibilité des données au-delà des changements technologiques, elles devront assurer leur migration du système en cours d'utilisation vers le suivant, aussi longtemps que les données restent valables. Les systèmes DMSS avec les logiciels de gestion adaptés se montrent être les plus appropriés pour l’entretien à long terme des données audio. « De tels systèmes autorisent la vérification automatique de l’intégrité des données, leur recyclage et, enfin, leur migration avec un recours minimum aux ressources humaines » (IASA TC-03, 2005). Ces systèmes peuvent être dimensionnés pour s’adapter à de plus petites archives sachant que cela impliquera, très souvent, une plus grande responsabilité lors de la vérification manuelle des données. Des formats discrets de stockage tels que les CD et DVD enregistrables et les disques MO sont par nature moins fiables. Les Recommandations suggèrent des normes et des approches pour l’entretien des données sur ces supports tout en conseillant des solutions plus fiables qui se trouvent dans les systèmes intégrés de stockage et qui doivent être fortement privilégiées.
 

1: Contexte

1.1    Les services d'archives audiovisuelles ont une certaine responsabilité dans la conservation d’un patrimoine culturel couvrant tous les domaines de l’activité musicale, artistique, sacrée, scientifique, linguistique, de la communication qui reflètent la vie publique et privée ainsi que l’environnement naturel ; d'un patrimoine constitué sous forme de sons et d’images enregistrés, publiés et inédits.

1.2     La conservation a pour objectif final la transmission à ceux qui nous succèdent et à leurs usagers de toute l’information  que contiennent nos fonds, et autant qu’il nous est possible  d’y parvenir dans notre contexte professionnel. Il relève de la responsabilité d’un service d'archives d’apprécier les besoins de ses usagers, tant actuels que ceux à venir, et de mettre en balance les attentes, l'état et les ressources de la structure. Le but ultime de la conservation est de garantir l’accès des contenus audio de la collection aux utilisateurs autorisés, actuels et futurs, sans faire encourir de menaces indues ou dommages excessifs aux documents.

1.3     Étant donné  que l’espérance de vie de tous les supports audio est limitée  par leur instabilité physico chimique et par le manque de disponibilité de la technologie qui permet de les reproduire ; étant donné encore que la technologie de reproduction elle-même peut être une source potentielle de dommages pour de nombreux supports sonores, la conservation des contenus audio est toujours passée par la réalisation de copies susceptibles de remplacer l’original en tant qu'exemplaires de conservation devenus, dans le langage de l’archivage numérique, des « substituts de conservation ». La nécessité de migrer le contenu vers un autre système de stockage concerne, peut-être avec encore plus d'acuité, les supports originaux audio numériques, qui peuvent présenter davantage de risques du fait d'une durée de vie plus courte des systèmes matériels très sophistiqués et des logiciels dédiés qui, parfois, après quelques années seulement de commercialisation, disparaissent du marché, conduisant l’équipement de lecture à une situation de totale obsolescence. Mais les contraintes qui s’appliquent à l’original se reporteront totalement ou en partie au format cible de conservation, nécessitant des procédures continuelles de duplication. Si, dans le domaine analogique, on avait poursuivi la conservation des contenus par les duplications successives, cela aurait engendré une dégradation du signal audio à chaque nouvelle génération.

1.4     La solution qu'offre la réalisation de substituts numériques à des fins de conservation semble répondre aux questions posées par la conservation et l'accès aux documents. Cependant, les décisions prises à propos des formats numériques, des résolutions, des supports et des systèmes technologiques imposeront toujours des limites quant à l’efficacité du processus irréversible de la conservation numérique, et quant à la qualité des séquences audio encodées. L’extraction optimale du signal des supports originaux est le point de départ essentiel de tout processus de numérisation. Étant donné que le média d’enregistrement requiert très souvent une technologie de lecture tout à fait spécifique, les opérations de copies numériques doivent être effectivement menées à bien avant que l’obsolescence des matériels ne devienne critique.

1.5     La capacité de pouvoir dupliquer la copie numérique sans perte supplémentaire ou sans dégradation a souvent amené d’enthousiastes archivistes à qualifier de telles opérations de  « conservation éternelle ». La facilité à produire des copies de diffusion à basse résolution élargit la capacité des services d'archives à fournir l’accès à leurs collections sans mettre en danger l'original. Cependant, loin d’être éternelles, des pratiques d’archivage numérique mal gérées peuvent mener à une réduction de l’espérance de vie effective et de l’intégrité du contenu audio, alors qu’une conversion et une stratégie de conservation numérique bien gérées permettront la réalisation des avantages promis par la technologie numérique. De même, un système mal organisé requérant des interventions manuelles peut nécessiter un travail de gestion considérable allant jusqu'à dépasser les capacités des services de collection, des conservateurs, et mettre ainsi la collection en danger. Un dispositif d'archivage bien planifié devrait rendre possible l’automatisation des processus et permettre ainsi un déroulement correct des opérations de conservation dans le temps. Aucun système de conservation du son ne fournira de solution unique ; toute solution nécessitera des transferts et migrations ultérieurs qui doivent être planifiés dès la première numérisation et le premier stockage des contenus.

1.6     Les Recommandations abordent les supports audio tels que les cylindres et les disques 78 tours, le fil magnétique et les dictaphones, les disques vinyle, la bande magnétique analogique, la cassette et la bobine libre, les supports magnétiques numériques tels que la cassette  DAT et ses prédécesseurs sur bande vidéo, et enfin les supports disques optiques tels que les CD et DVD. Bien que de nombreux principes évoqués ici lui soient applicables, le son pour le film n’est pas abordé de manière spécifique. Ce document ne prend pas en compte non plus les rouleaux de piano, les fichiers MIDI ou d’autres systèmes qui représentent des repères de lecture plutôt que de l’audio encodé. Les principes qui suivent tracent les grandes lignes des secteurs pour lesquels des décisions critiques doivent être prises dans les processus de transfert et la gestion des séquences audio numériques.
 

2: Clés du numérique -­ Principes

2.1     Normes : Les formats, les résolutions, les supports et les systèmes technologiques sélectionnés sont parties intégrantes de la conservation de l'audio lorsqu'ils souscrivent aux normes internationales établies à des fins d'archivage. Les formats, résolutions et versions hors normes ne pourront à l'avenir s'inscrire dans les dispositions de conservation permettant l'accès à long terme et la future migration de format.    

2.2    Taux d’échantillonnage : le taux d’échantillonnage fixe la limite maximum de la réponse en fréquence. Quand il s’agit de produire des copies numériques de séquences sonores analogiques, IASA recommande un taux minimum d’échantillonnage de 48 kHz pour tout document. Cependant, des taux d’échantillonnage plus élevés sont aisément disponibles et peuvent être intéressants pour de nombreux types de contenus. Bien que les taux plus élevés encodent le signal audio au-delà de l’étendue de l’audition, ces dispositions et les technologies de conversion participent à l'amélioration de la qualité audio dans l'étendue fréquentielle idéale de l'ouïe humaine. Les artefacts involontaires et indésirables dans un enregistrement font aussi partie du document sonore, qu’ils soient inhérents à la réalisation de l’enregistrement ou qu'ils aient été ultérieurement ajoutés au signal original suite à l'usure, à une mauvaise manipulation ou au stockage défectueux. Les deux types d'artefact doivent être conservés avec la plus grande exactitude. Pour certains signaux et quelques types de bruit, des taux d’échantillonnage supérieurs à 48 kHz peuvent être avantageux. IASA recommande le taux d'échantillonnage plus élevé de 96 kHz que l'on considèrera comme une indication, non comme limite maximum. Cependant, pour la plupart des documents audio, les taux d’échantillonnage décrits devraient être adaptés. Pour le contenu audio né numérique, le taux d’échantillonnage de la technologie de la version stockage devrait égaler celui de l’original.

2.3 Quantification : la quantification fixe l'échelle dynamique d’un événement sonore encodé ou d'un item. 24 bits encode théoriquement une dynamique qui approche les limites physiques de l’audition, bien que, en réalité, les limites techniques du système soient légèrement moindres. Le signal quantifié en 16 bits, norme CD, peut être incorrect pour saisir la dynamique de nombreux types de signaux, notamment quand des transitoires de niveau élevé sont encodés, par exemple lors du transfert de disques endommagés. IASA recommande un taux d’encodage d’au moins 24 bits pour capturer tous les signaux analogiques. Pour les séquences nées numériques, le niveau de quantification utilisé par le système de stockage devrait au moins égaler celui de l’original. Il est important d'être attentif, lors de l’enregistrement, au fait que le procédé de transfert respecte toute la dynamique.

2.4 Convertisseurs analogique numérique (A/N)

2.4.1 En convertissant le signal audio analogique en un flux de données numériques, le convertisseur A/N ne devrait pas apporter de coloration au son ou ajouter le moindre bruit. Il s'agit de l'élément le plus critique dans les opérations de conservation numérique. En pratique, le convertisseur A/N incorporé dans la carte son d'un ordinateur ne peut respecter les spécifications requises du fait des circuits à bas coût et du bruit électrique inhérent à l'ordinateur. L'IASA recommande l'utilisation de convertisseurs A/N séparés (autonomes), connectés via une interface AES/UER ou S/PDIF, un bus IEEE1394 (firewire) ou une interface série USB, qui assure la conversion du signal audio en conformité avec les spécifications qui suivent. Toutes les spécifications mesurées à la sortie numérique du convertisseur A/N sont conformes à la norme AES (Audio Engineering Society) AES 17-1998 (r2004), IEC 61606-3 et les normes associées identifiées.

2.4.1.1 Distorsion harmonique totale + bruit (Total Harmonic Distorsion (THD+N))
Pour un signal de 997 Hz à -1 dB FS (Full Scale), la THD+N du convertisseur A/N doit-être inférieure à -105 dB non pondérés et -107 dB pondérés dBA, avec une bande passante de 20 Hz à 20 kHz.

Pour un signal de 997 Hz à -20 dB FS, la THD+N du convertisseur A/N sera inférieure à -95 dB non pondérés et -97 dBA, avec une bande passante de 20 Hz à - 20 kHz.

2.4.1.2 Dynamique (rapport signal sur bruit)
La dynamique du convertisseur A/N ne sera pas inférieure à 115 dB non pondérés, pour 117 dBA, (mesurée selon une THD+N relative à 0 dB FS, bande passante 20 Hz - 20 kHz, pour un signal de 997 Hz à -60 dB FS).

2.4.1.3 Réponse en fréquence
Pour une fréquence d'échantillonnage A/N de 48 kHz, la réponse en fréquence sera meilleure que ± 0,1 dB sur 20 Hz-20 kHz.

Pour une fréquence d'échantillonnage A/N de 96 kHz, la réponse en fréquence mesurée sera meilleure que ± 0,1 dB sur l'étendue 20 Hz-20 kHz et ± 0,3 dB sur 20 kHz-40 kHz.

Pour une fréquence d'échantillonnage A/N de 192 kHz, la réponse en fréquence mesurée sera meilleure que ± 0,1 dB sur 20 Hz-20 kHz et ± 0,3 dB sur 20 kHz-50 kHz (signal audio de référence -997 Hz, amplitude -20 dB FS).

2.4.1.4 Distorsion d'intermodulation (Intermodulation Distorsion (IMD)) (SMPTE/DIN/AES17)
Le convertisseur A/N IMD n'excèdera pas -90 dB (AES17/SMPTE/DIN séquences test à deux tons, combinaison de deux fréquences équivalente à une onde sinusoïdale d'amplitude pleine échelle).

2.4.1.5 Amplitude linéaire
Le convertisseur A/N affichera une linéarité de l'amplitude de ± 0,5 dB sur l'échelle -120 dB/-0 dB FS (stimulus sinusoïdal de 997 Hz).

2.4.1.6 Signaux harmoniques parasites
Réponse inférieure à -130 dB FS avec un signal stimulus de 997 Hz à -1 dBFS.

2.4.1.7 Précision de la fréquence d'échantillonnage de l'horloge interne
Pour un convertisseur A/N synchronisé avec son horloge interne, la précision de fréquence de l'horloge mesurée en sortie du flux numérique sera d'au moins ± 25 ppm (parties par million).

2.4.1.8 Jitter
Jitter de l'interface mesuré à la sortie A/N < 5 ns.

2.4.1.9 Synchronisation externe
Lorsque l'horloge du convertisseur A/N est synchronisée avec un signal de référence externe, le convertisseur A/N doit réagir de manière transparente aux variations du taux d'échantillonnage de ± 0,2 % du taux d'échantillonnage nominal. Le circuit de synchronisation externe doit effectuer une réjection du jitter entrant afin que l'horloge synchronisée au taux d'échantillonnage soit exempte de tout artefact et perturbation.

2.4.2     Interfaces IEEE1394 et USB Audio. De nombreux convertisseurs A/N sont à présent équipés pour être connectés directement à l'ordinateur hôte via l'interface grande vitesse IEEE1394 (firewire) et l'interface série USB 2.0. Les deux systèmes servent d'interface de transmissions audio sur les principales plateformes d'ordinateur personnel, ce qui permet d'éviter l'installation d'une interface spécifique dans le châssis de l'ordinateur (carte son de haute qualité). La qualité audio est généralement indépendante de la technologie de bus utilisée.

2.4.3     Sélection des convertisseurs A/N : Le convertisseur A/N est le composant technologique le plus critique des processus de conservation numérique. Au moment de choisir un convertisseur, avant d'entreprendre toute évaluation, l'IASA recommande que la totalité des spécifications soient conformes aux normes de référence décrites ci-dessus. Un convertisseur qui ne respecte pas les spécifications techniques établies par IASA produira des conversions plus qu'inexactes. Conjointement à l'évaluation technique, des tests statistiques d'écoute en aveugle devront être menés sur un petit nombre de convertisseurs pour déterminer leurs capacités et leurs performances. L'ensemble des spécifications et des tests décrits ci-dessus sont rigoureux et complexes, ils sont d'une grande importance pour sélectionner et évaluer les convertisseurs. Parfois, la comparaison des spécifications publiées par les fabricants de matériel relève d'un défit car elles sont souvent incomplètes et quelquefois difficiles à concilier avec les performances des machines qu'elles sont censées représenter. Afin d'optimiser leurs ressources, certains organismes peuvent convenir de se regrouper ou de constituer des panels pour effectuer des tests. Certaines institutions, telles que les bibliothèques et archives nationales, les structures de sciences académiques, peuvent être bien placées pour aider la mise en place de tels tests.

2.5     Cartes son : Les cartes son utilisées dans un ordinateur dédié à la conservation de programmes audio devront avoir une sortie numérique fiable, être dotées d'un dispositif de synchronisation du flux audio numérique de haute qualité, et faire passer le flux de données audio numériques sans provoquer de modification ou d'altération. Puisqu'un convertisseur A/N autonome doit être utilisé, la première fonction d'une carte son pour la conservation de contenus audio est de faire passer un signal numérique par le bus de données de l'ordinateur, bien que la carte puisse également être utilisée pour convertir le signal en mode analogique pour effectuer des contrôles. Il faudra prendre soin de choisir une carte qui accepte le taux d'échantillonnage et la quantification appropriés, qui n'injecte pas de bruit ou autre artefact extérieur. IASA recommande l'utilisation d'une carte son de haute qualité satisfaisant aux spécifications suivantes :

2.5.1    Taux d'échantillonnage : 32 kHz à 192 kHz ± 5%.
2.5.2    Quantification audio numérique : 16-24 bits.
2.5.3    Variation de vitesse : automatique par signal audio entrant ou wordclock (horloge de référence).
2.5.4    Synchronisation : horloge interne, wordclock, entrée audio numérique.
2.5.5    Interface audio : AES/EBU à vitesse élevée selon spécifications AES3.
2.5.6    Jitter admissible et récupération du signal d'entrée jusqu'à 100 ns sans erreur.
2.5.7    Sous-code audio numérique.
2.5.8    Entrées optionnelles de temps codé (time code).
 
2.6     Systèmes informatiques et logiciels de traitement : Les ordinateurs de générations récentes sont assez puissants pour manipuler des fichiers audio volumineux. Une fois entrés dans le domaine numérique, l’intégrité des fichiers audio doit être assurée. Comme indiqué ci-dessus, les phases critiques du processus de conservation concernent la conversion analogique-numérique (qui dépend du convertisseur) et l’entrée des données dans le système via la carte son ou un autre port. Cependant, certains systèmes sectionnent les mots d'une séquence pour la traiter, générant une baisse du débit numérique, tandis que d’autres n'effectuent que des compressions de fichiers, tels que MP3 : aucun n'est acceptable. L'IASA recommande d’utiliser un ordinateur audio professionnel dont la longueur de mot de traitement excède celle du fichier (c’est-à-dire supérieure à 24 bits) et qui n’altère en rien le format du fichier.

2.7     Réduction de données : Dans le monde de l'archivage audio, il est maintenant généralement admis que lorsqu'on sélectionne un format numérique cible, ceux qui effectuent une réduction de données (souvent appelée à tort « compression ») fondée sur le codage perceptuel (codecs avec perte) ne doivent pas être utilisés. Transférer avec ce type de réduction signifierait la perte irrémédiable d’une partie de l’information primaire. De telles réductions de données peuvent conduire à une qualité d'écoute identique ou très proche de celle produite par le signal non compressé (linéaire), du moins pour la première génération, mais l'utilisation ultérieure des signaux ayant fait l'objet de réduction sera strictement limitée concernant des documents d'archives dont l'intégrité a été compromise.

2.8     Formats de fichier :

2.8.1     De nombreux formats de fichiers audio linéaires sont disponibles pour encoder les signaux ; néanmoins, un format largement adopté et répandu dans le milieu audio professionnel aura plus de change d'être utilisé à long terme et offrira une meilleure disponibilité des outils nécessaires pour effectuer des migrations vers de futurs formats de fichiers le moment venu. En raison de la simplicité et de la généralisation du format Pulse Code Modulation (PCM) linéaire (entrelacé pour la stéréo), IASA recommande l’utilisation du format WAVE (extension .wav) développé par Microsoft et IBM, issu de l'extension du format Resource Interchange File Format (RIFF). Les fichiers Wave sont très largement utilisés dans l'industrie audio professionnelle.  

2.8.2    Les fichiers BWF.wav [EBU Tech 3285], extension des fichiers .wav, sont supportés par les technologies audio les plus récentes. Ce format BWF présente l'avantage, à la fois pour les documents d'archives et de production, de permettre l'incorporation des métadonnées dans les en-têtes, partie intégrantes des fichiers. Dans le cadre des scénarios d'échanges et d'archivage de documents les plus courants, cela représente un avantage ; toutefois, le caractère fixe de l'information intégrée peut devenir un handicap pour les systèmes de gestion à la fois de taille importante et sophistiqués (voir discussion chapitre 3 Métadonnées et Ch. 7 Approches à petite échelle des systèmes de stockage numérique). Cette restriction, ainsi que d'autres concernant le format BWF, peut-être surmontée grâce à l'utilisation à minima d'un jeu de données dans BWF, d'autres données étant insérées dans des dispositifs de gestion externe. La norme AES31-2-2006 sur le "Network and file transfer of audio - Audio-File transfer and exchange - File format for transferring digital audio between systems of different type and manufacture" - Transfert du son par réseau et fichiers -Transfert et échanges de fichiers audio - Formats de fichiers pour transférer des données numériques audio entre systèmes de différents types et fabrications " (en langue anglaise [NDT]) est en grande partie compatible avec la norme du format BWF, et il est à espérer que grâce aux futurs développements dans ces domaines, il restera viable. Le format BWF est largement accepté par la communauté des archivistes aussi, gardant bien à l'esprit les réserves énoncées, IASA recommande l'utilisation des fichiers BWF.wav [EBU Tech 3285] à des fins d'archivage.

2.8.3    Le son multipistes, les pistes son film ou vidéo, ou les fichiers audio de longue durée peuvent utiliser le format RF64 [EBU/UER 3306] compatible avec BWF, AES 31 ou bien encore utiliser un fichier wav intégré dans un format d'échange MXF (Media Exchange Format). Ceux-ci étant encore en cours de développement, une approche pragmatique peut consister à créer des fichiers mono BWF de bases temps cohérentes intégrés dans le format tar (tape archive).

2.9     Chaîne audio : Les spécifications de l'ensemble formé par la combinaison de l'équipement de lecture, des câbles, des outils de mixage et de traitement audio devraient égaler ou dépasser celles du son numérique à la valeur d’échantillonnage et de quantification retenue. Les spécifications standards de l’équipement de lecture, de la chaîne audio et du format cible doivent être supérieures à celle du support original.

3: Métadonnées

3.1 Introduction

3.1.1     Les métadonnées sont des données structurées qui améliorent les opérations sur les ressources, telles la conservation, le reformatage, l'analyse, la découverte et l'exploitation. Elles sont les plus efficaces dans un environnement de réseau internet, mais elles demeurent nécessaires pour tout stockage et conservation de documents numériques. Les métadonnées informent l'utilisateur final (personnes et programmes informatisés) sur la manière dont les données doivent être interprétées. Les métadonnées revêtent une importance capitale en matière de compréhension, de cohérence et de bon fonctionnement pour chacune des confrontations avec l'objet archivé quel que soit l'instant de son cycle de vie et avec tout objet associé ou dérivé de celui-ci.

3.1.2     Il peut être utile de désigner les métadonnées par les termes fonctionnels de "informations structurées renseignant une ressource » : « structurées » parce que lisibles par une machine, [aussi bien que par des personnes] ; « renseignant » parce qu’elles supposent une recherche d’un agent sur la ressource en question ; « ressource » car tout objet identifiable peut  avoir des métadonnées qui lui soient associées" (Dempsey 2005). De telles informations structurées (ou  codées) renseignant des ressources (mentionnées également par métadonnées d'instance) peuvent être très simples, comporter un identifiant uniforme de ressource (Uniform Resource Identifier (URI) avec une simple paire de parenthèses angulaires <> pour containeur ou programme wrapper, et un namespace. Habituellement, les représentations peuvent se développer de manière très élaborée et devenir modulaires, comporter de nombreux containeurs emboîtés, plusieurs couches de wrappers, chacun d'entre eux s'appuyant sur un modèle de namespace et assemblés à différentes phases du workflow (flux d'information) pendant une période prolongée. Une personne ne pourrait qu'exceptionnellement créer en une session  les métadonnées d'instance définitives et complètes d'un objet numérique permanent.
    
3.1.3     Quelle que soit la manière dont les nombreuses versions de fichiers audio peuvent être créées au fil du temps, toutes les propriétés significatives des fichiers d'archivage doivent rester inchangées. Le même principe s'applique pour toute métadonnée embarquée (voir paragraphe 3.1.4 ci dessous). Toutefois, les données de n'importe quel objet peuvent être modifiées dans le temps : nouvelles informations disponibles, changement d'avis, modification de la terminologie, décès de contributeurs, expiration ou renégociation des droits. Par conséquent, il est souvent conseillé de bien séparer tout ou partie des fichiers audio des fichiers de métadonnées, d'établir des liaisons entre ceux-ci, d'effectuer des mises à jour des métadonnées chaque fois que des informations et des ressources sont disponibles. Bien que lourde, l'opération d'éditing des métadonnées d'un fichier est possible. Pour les plus grandes collections, elle ne devrait pas s'intensifier si les démarches sont bien adaptées. En conséquence, l'extension dans laquelle les données sont intégrées aussi bien dans les fichiers que dans des systèmes de gestion de données séparées, sera déterminée par la taille de la collection, par le degré de complexité du système considéré et par les capacités du personnel du service d'archives.  

3.1.4     Les métadonnées peuvent être intégrées aux fichiers audio, ce qui constitue une solution acceptable telle que suggérée pour une approche à petite échelle de systèmes de stockage numérique (voir paragraphe 7.4 Métadonnées élémentaires). Le format Broadcast Wave Format (BWF) normalisé par l'Union Européenne de Radiodiffusion (UER /EBU) constitue un exemple d'intégration de métadonnées audio qui permet le stockage d'un nombre limité de données descriptives dans le fichier .wav (voir paragraphe 2.8 Formats de fichiers). Un des avantages du stockage de métadonnées dans le fichier sera d'écarter les risques de perte des liens entre les métadonnées et les contenus  audio numériques. Le format BWF supporte l'acquisition des processus de traitements des métadonnées ainsi que de nombreux outils associés. Il peut en outre accueillir les données et nourrir la partie du format  global BEXT (extension radiodiffusion). Par conséquent, les métadonnées peuvent inclure l'historique de codage, qui est grossièrement défini dans la norme BWF, ce qui permet de renseigner le processus ayant conduit à la création de l'objet audio numérique. Ceci présente des similitudes avec les événements relevés dans les recommandations PREMIS (voir 3.5.2, 3.7.3 et Fig. 1). Lors des opérations de numérisation de sources analogiques, le format global BEXT peut aussi être utilisé pour stocker des informations qualifiant le contenu audio pendant la création d'un objet numérique à partir d'une source numérique, de CD ou DAT par exemple, le format global BEXT peut être utilisé pour enregistrer les erreurs susceptibles de se produire lors du processus d'encodage.

A=<ANALOGUE> Information sur le parcours du signal audio analogique
A=<PCM> Information sur le parcours du signal audio numérique
F=<48000, 44100, etc.> Fréquence d'échantillonnage [Hz]
W=<16,18,20,22,24, etc.> Longueur de mot [bits]
M=<mono, stereo, 2-channel> Mode d'enregistrement
T=<free ASCII-text-string> Texte commentaires
Historique de codage : BWF (http://www.ebu.ch/CMSimages/en/tec_text_r98-1999_tcm6-4709.pdf)

A=ANALOGUE, M=Stereo, T=Studer A820;SN1345;19.05;Reel;AMPEX 406
A=PCM, F=48000, W=24, M=stereo, T=Apogee PSX-100;SN1516;RME DIG196/8 Pro
A=PCM, F=48000, W=24, M=stereo, T=WAV
A=PCM, F=48000, W=24, M=stereo, T=2006-02-20 File Parser brand name
A=PCM, F=48000, W=24, M=stereo, T=File Converter brand name 2006-02-20;08:10:02

Fig. 1 National Library of Australia : interprétation de l'historique de codage de la conversion d'un original sur bande en bobine libre au format BWF utilisant une base de données et des systèmes automatiques.

3.1.5    La Bibliothèque du Congrès (Library of Congress) a réalisé des travaux sur la formalisation et le développement des différents types de données brutes des fichiers BWF. Embedded Metadata and Identifiers for Digital Audio Files and Objects (Métadonnées et identifiants de fichiers et objets audio numériques intégrés) : les recommandations pour les fichiers WAVE et BWF actuels (Recommendations for WAVE and BWF Files Today) constituent la dernière ébauche proposée aux commentaires, http://home.comcast.net/~cfle/AVdocs/Embed_Audio_08103.doc. Le projet AES X098C constitue un autre développement de la documentation des modalités et de la provenance des métadonnées.

3.1.6    Il existe toutefois de nombreux avantages à maintenir la séparation des métadonnées et des contenus en utilisant par exemple une structure standard telle que METS (Metadata Encoding and Transmission Standard voir paragraphe 3-8 Métadonnées structurelles - METS). Il est plus simple de mettre à jour, de maintenir et de corriger des métadonnées dans le cas d'un entrepôt séparé. L'extension des champs de métadonnées réalisée pour incorporer de nouveaux critères, de nouvelles informations, est possible uniquement dans le cas d'un système présentant cette souplesse. Afin de pouvoir partager des informations de différentes manières, un entrepôt séparé est nécessaire ; des métadonnées pourront ainsi être créées et utilisées par un tel système. Pour des collections de plus grande taille, la charge consistant à maintenir les métadonnées uniquement dans les en-têtes des fichiers BWF serait insoutenable. MPEG-7 nécessite la séparation des contenus audio et des métadonnées descriptives, même si les descriptions peuvent être multiplexées avec les contenus en tant que segments alternatifs de données.

3.1.7    Il est possible évidemment d'envelopper un fichier BWF avec des métadonnées encore mieux renseignées, la disponibilité des informations conservées dans BWF est établie mais limitée, cette approche présente l'avantage des deux approches. Un autre exemple d'intégration est donné par les marqueurs (tags) de métadonnées qui doivent être présents dans les fichiers de contrôle d'accès afin que l'utilisateur soit en mesure de vérifier que l'objet téléchargé ou sur le point d'être consulté en mode streaming est bien l'objet repéré et sélectionné. ID3, le marqueur utilisé pour les fichiers MP3 décrivant le contenu de l'information, est lisible et interprété par la plupart des lecteurs, il permet de disposer d'un jeu minimum de métadonnées descriptives. L'encodage METS a été examiné en tant que possible containeur à la fois des métadonnées d'empaquetage et des contenus, même si la taille potentielle de tels documents laisse à penser qu'une telle option n'est guère viable.
       
3.1.8    Pour séparer les métadonnées des contenus (avec redondance possible si ces derniers contiennent un certain nombre de métadonnées), une solution générale se dessine à partir des travaux entrepris par plusieurs universités en relation avec les principales firmes industrielles tels que SUN Microsystems, Hewlett-Packard et IBM. Le concept consiste toujours à stocker la représentation d'une ressource au moyen de deux fichiers regroupés : un fichier comportant les "contenus", l'autre les métadonnées associées à ce contenu. Ce deuxième fichier comprend :
       
3.1.8.1  La liste des identifiants pour chaque motif logique. Il s'agit en fait d’une série d'"alias" relatifs à l'URN et de la représentation localisée de la ressource (URL).

3.1.8.2  Les métadonnées techniques (bits par échantillon / taux d'échantillonnage ; définition  précise du format ; l'ontologie associée éventuellement).

3.1.8.3  Les métadonnées factuelles (Coordonnées GPS / Temps codé universel / Numéro de série des équipements / Opérateur / ...).
    
3.1.8.4  Les métadonnées sémantiques.

3.1.9  En résumé, la plupart des systèmes adoptent une approche pratique conçue avec des métadonnées à la fois incorporées aux fichiers et maintenues à part, établissant des priorités (i.e. ce qui constitue la source primaire d'information) et des protocoles (règles de maintenance des données) afin de préserver l'intégrité des ressources.

3.2 Production

3.2.1  La suite de ce chapitre suppose que dans la plupart des cas, les fichiers audio et les fichiers de métadonnées sont créés et gérés séparément. Dans ce cas, la production des métadonnées implique une logistique - modification des informations, documents et services en ligne à bas coût. Toutefois, les collections de taille réduite ou les services d'archives en première phase de leur développement, peuvent trouver avantage dans l'incorporation des métadonnées dans les fichiers BWF et dans la possibilité d'alimenter sélectivement un sous-ensemble d'informations comme décrit ci-dessous. Si cela est fait convenablement, avec une bonne compréhension des standards et des schémas discutés dans ce chapitre, une telle approche est viable et pourra migrer sur un système entièrement implémenté comme décrit ci-dessous. Même dans le cas d'une décision prise par un service d'archives d'intégrer tout ou partie des métadonnées dans l'en-tête du fichier, ou bien d'assurer séparément la gestion de certaines métadonnées seulement, ce chapitre fournit les informations sur une telle approche. (Voir également le Chapitre 7 Approches à petite échelle des systèmes de stockage numérique).

3.2.2     Jusqu'à une époque récente, les producteurs d'informations concernant les enregistrements travaillaient dans une équipe de catalogage ou une équipe technique et leur production convergeait rarement. Les espaces en réseaux brouillent les délimitations historiques. Il va sans dire que  l’intégration  de la logistique dans un workflow réussi exige en outre l'engagement  de professionnels  qui comprennent les modes de fonctionnement et de connectivité des espaces en réseaux. La production de métadonnées implique donc une collaboration étroite entre techniciens audio, informaticiens et spécialistes des sujets concernés. Elle exige également une gestion attentive pour mettre en œuvre une stratégie claire assurant la durabilité et l'adaptation des flux des tâches à accomplir (workflow) dans le contexte du développement rapide des technologies et des applications associées à ces processus.

3.2.3    Les métadonnées sont comme les intérêts - elles capitalisent au cours du temps. Si les métadonnées ont été crées de manière minutieuse et cohérente, on peut envisager l'utilisation de cet atout pour un nombre pratiquement infini de nouvelles façons de répondre aux besoins de nombreux types d'utilisateurs, par des multi-versions, par des processus d'exploitation des données (data mining). Mais les ressources et les problèmes de conception intellectuelle et technique impliqués dans le développement et la gestion des métadonnées ne sont pas négligeables. Par exemple, certaines questions clef  que  tout gestionnaire de  système de métadonnées doit aborder incluent :
    
3.2.3.1  L'identification  de la structure de métadonnées ou de structures d'extensions à réaliser pour répondre aux besoins des équipes de production, du dépôt lui-même, des utilisateurs ;
      
3.2.3.2  Le choix des caractéristiques essentielles des métadonnées qui doivent lui permettre d’atteindre  son objectif,  et la granularité dont chaque type de métadonnée a besoin. Les métadonnées étant produites pour le long terme, elles feront probablement l'objet d'un compromis systématique entre les coûts de développement et de gestion des métadonnées propres à couvrir le besoin du moment, et la création de métadonnées qui répondent à des demandes futures et peut-être non anticipées.

3.2.3.3  L'assurance que les schémas de métadonnées mis en application sont les plus courants ;

3.2.3.4  L'interopérabilité est un autre facteur ; à l'ère numérique, aucun service d'archives n'est une île. Pour envoyer correctement un contenu à un autre service ou à un autre organisme, il est nécessaire de définir une structure et une syntaxe communes. C'est en arrière plan le principe des formats METS et BWF.

3.2.4    Il convient de prévoir le niveau de complexité dans des environnements réseaux où les responsabilités de gestion des fichiers de données sont partagées. Mais une telle complexité est tout simplement ingérable ; cependant, si l'on s'accroche aux anciennes méthodes de travail remontant aux premiers jours de présence des ordinateurs dans les bibliothèques et les archives, avant que le Web et l'XML n'existent, ainsi que l'exprimait Richard Feynman pour sa discipline, la physique, "vous ne pouvez vous attendre à ce que d'anciens concepts fonctionnent dans un nouveau contexte". Il est nécessaire de définir de nouvelles exigences pour le système et d'estimer quels changements culturels accomplir. Cela permettra alors de disposer d'infrastructures de métadonnées d'archives audiovisuelles viables et évolutives.

3.3 Infrastructure

3.3.1     Nous n'avons pas besoin de norme "discographique" de métadonnées : une résolution pour un domaine spécifique ne constituerait qu'une contrainte impraticable. Il nous faut disposer d'une infrastructure de métadonnées dont plusieurs composantes essentielles restent communes avec d'autres domaines, chacune pouvant être différente localement (sous forme d'un schéma d'extension), et qui puisse être mise en application par n'importe quel service d'archives audiovisuelles. Présentons quelques une des qualités essentielles pouvant aider à définir les exigences structurelles et fonctionnelles :

3.3.1.1  Versatilité : En ce qui concerne les métadonnées elles-mêmes, le système doit être capable de mettre en œuvre les entrées, la fusion, l'indexation, les perfectionnements et l'accès des utilisateurs à celles-ci à partir de différentes sources décrivant différents objets. Le système doit aussi être capable de définir les structures logiques et physiques ; les structures logiques représentant des entités intellectuelles tandis que les structures physiques représentent les médias physiques (ou supports) qui constituent la source des objets numériques. Le système ne doit pas être lié à un schéma particulier de métadonnées : il doit être possible de mixer des schémas, en application des profils (voir 3.9.8) adaptés auxbesoins particuliers des services d'archives sans pour autant compromettre l'interopérabilité. Le défi consiste à élaborer un système pouvant accueillir une telle diversité sans complication inutile pour l'utilisateur peu exigeant, et qui n'empêche pas ceux qui exigent au contraire une plus grande marge de manœuvre de mener des activités plus complexes.

3.3.1.2  Extensibilité : donner la possibilité d'accueillir une large gamme de sujets, de différents types de documents (i.e. images et fichiers texte) et des entités d'activités (authentification Utilisateur, licences d'utilisation, politique d'acquisition, etc.). Faire en sorte que les extensions puissent être développées et appliquées ou bien totalement ignorées sans casser l'ensemble ; en d'autres termes, accepter les expérimentations : les solutions consistant à implémenter des métadonnées relèvent d'une science immature.
    
3.3.1.3  Durabilité : Migration possible, maintenance peu onéreuse, facilité d'utilisation, pertinence à long terme et adaptation selon les objectifs fixés.

3.3.1.4  Modularité : Les systèmes utilisés pour créer ou insérer les métadonnées, les fusionner, les indexer et les exporter devront être de nature modulaire afin qu'il soit possible de remplacer un élément spécifique par un autre sans détruire pour autant l'ensemble.

3.3.1.5  Granularité : La granularité des métadonnées devra être suffisante pour subvenir à toutes les utilisations souhaitées. La granularité des métadonnées peut facilement être insuffisante tandis que dans certains cas, rares, la granularité est trop élevée pour certains usages.
 
3.3.1.6  Liquidité : Ecriture unique, nombreuses utilisations. La liquidité permet l'auto-documentation des objets numériques et de leur représentation au fil du temps ; les métadonnées d'archivage seront plus sollicitées dans de nombreux espaces de réseaux, elles procureront des retours sur investissements d'origine conséquents, en termes de financements et de temps.

3.3.1.7  Ouverture et transparence : Interopérabilité des supports avec d'autres systèmes. Pour répondre aux exigences telles que l'extensibilité, les normes, les protocoles, et les logiciels intégrés devront être aussi ouverts et transparents que possible.

3.3.1.8  Relationnel (hiérarchie / séquence / provenance) : Relations parents - enfants qui doivent être exprimées, enchaînement correct des séquences, ex. les scènes d'un spectacle dramatique, et dérivations. En ce qui concerne les items numériques : être capable de dresser précisément la cartographie et l'instanciation des supports originaux et du contenu intellectuel de leur fichier. Des procédures utiles pour s'assurer de l'authenticité de l'objet archivé (Tennant 2004).
 
3.3.2     Cette recette de la diversité est en soi une forme d'ouverture. Si une norme W3C (World Wide Web Consortium) telle que Extensible Markup Language (XML) (Langage de balisage extensible), langage largement adopté, est sélectionné, cela n'empêche pas des mises en œuvre particulières y compris la combinaison de normes telle que Material Exchange Format (MXF) (Formats d'échange des contenus) et Advance Authoring Format (AAF) (Formats d'édition avancée) de Microsoft.

3.3.3     Sur le plan pratique, bien que MXF soit un format ouvert, l'intégration des métadonnées dans celui-ci s'effectue généralement par un processus propriétaire. Le format MXF présente d'autres avantages pour l'industrie radiophonique, il peut servir à la diffusion professionnelle de programmes en continu (streaming) tandis que d'autres formats containeurs n'acceptent que les téléchargements de fichiers complets. L'utilisation de MXF en tant que conteneur de contenus et de métadonnées pour l'archivage ne devra être acceptée qu'après remplacement de toutes les métadonnées aux formats propriétaire par des formats libres.

3.3.4    On a écrit et dit tant de choses à propos de XML que ce langage pourrait facilement être pris pour une panacée. XML n'est pas une solution en soi, mais une manière d'aborder l'organisation et la réutilisation des contenus. Sa très grande puissance  a résidé dans la combinaison de celui-ci avec une palette impressionnante d'outils et de technologies associées et qui continuent de se développer dans le but de réaliser des économies par la réutilisation et la modification de données. A ce titre, XML est devenu de-facto une norme pour représenter les métadonnées de description des ressources sur internet. La gestion avec XML s'est poursuivie dans l'euphorie pendant une décennie grâce au développement de nombreuses sources libres (open sources) et outils d'éditing XML (Voir 3.6.2).   
 
3.3.5    Bien qu'il soit fait référence dans ce chapitre  à des formats de métadonnées spécifiques utilisés actuellement ou annoncés, cela ne signifie pas pour autant qu'ils aient un caractère normatif. Considérant leurs qualités essentielles (paragraphe 3.3.1), la maintenance technique détaillée, explicite, exhaustive et discrète, la création de données et les changements de politique, avec dates et responsabilités, les futures migrations et les nouvelles versions ne nécessiteront pas de changements substantiels de l'infrastructure de base. Une structure robuste de métadonnées devra être capable d'accueillir de nouveaux formats de métadonnées par la création d'outils spécifiques, tels que des crosswalks (tables de conversion), ou des algorithmes de transcodage efficaces et précis  d’un schéma encodé à un autre. Un certain nombre de crosswalks existent déjà pour des formats tels que MARC, MODS, MPEG-7 Path, SMPTE et Dublin Core. Outre l'utilisation des correspondances crosswalks qui permettent de transformer les métadonnées d'un format à un autre, elles peuvent également être utilisées pour fusionner deux formats de métadonnées ou plus en un troisième, ou bien encore en un jeu d'index consultables. Etant donné un format containeur / transfert bien choisi tel que METS, pratiquement tous les formats tels que MARC-XML, Dublin Core, MODS, SMPTE (etc.), pourront être adaptés. En outre, cette infrastructure ouverte permettra aux services d'archives d'absorber les enregistrements du catalogue, en partie ou en totalité, ceci dans le cadre de leur système légal tout en offrant de nouveaux services tels que la création de métadonnées utilisables pour la collecte - voir OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) (Protocole pour la collecte des métadonnées de l'initiative pour les Archives ouvertes.

3.4 Projet - Ontologies

3.4.1     Ayant satisfait aux plus hauts niveaux d'exigence, une conception viable de métadonnées prendra forme, dans les moindres détails, à partir d'un modèle d'informations ou ontologies1. Différentes ontologies peuvent être justifiées en fonction du nombre d'opérations à effectuer. On recommande le CIDOC's CRM (Conceptual Reference Model http://cidoc.ics.forth.gr/) (Modèle sémantique de référence) pour les institutions relevant du patrimoine culturel (musées, bibliothèques et archives) ; Le modèle FRBR (Functional Requirements for Bibliographic  Record) (Fonctionnalités requises des notices bibliographiques) http://www.loc.gov/cds/FRBR.hml) s'appliquera pour les archives constituées principalement d'enregistrements de spectacles musicaux ou d'œuvres littéraires, son action est renforcée par l'association des règles de catalogage RDA (Resource Description and Access) (Description et accès des ressources) et du groupe de travail DCMI (Dublin Core Metadata Initiative) (Initiative de métadonnées du Dublin Core (IMDC)). L'architecture COA (Contextual Ontology Architecture (Architecture des ontologies contextuelles) http://www.rightcom.com/Portals/O/format_Ontology_for_Media_Rights_Trans...) est adaptée aux objectifs visés lorsque la gestion des droits est primordiale, ainsi en est-il de la norme de gestion des droits du groupe Motion Picture Expert Group, MPEG-21. Le cadre de description des ressources RDF (Resource Description Framework http://www.w3.org/RDF/), qui définit des spécifications versatiles et relativement simples  deviendra une composante du modèle, notamment lors de la création des ressources Web à partir du dépôt d'archives : il pourra à son tour accueillir des applications bien connues telles que RSS (Really Simple Syndication) (Syndication vraiment simple) qui fournissent l'information (syndication). D'autres candidats permettant d'améliorer la manipulation du système et d'interpréter les métadonnées peuvent être découverts dans la "famille" des nouvelles ontologies utilisant le langage OWL (Web Ontology Language) (Langage d'ontologie Web). Les opérations de définition et de lecture des ontologies énoncées dans OWL peuvent être facilement réalisées en utilisant l'outil ouvert "Protégé" de l'Université de Stanford : http://protege.stanford.edu/. OWL peut être utilisé depuis une simple définition de termes jusqu'à une modélisation orientée objet complexe.


Ontologies: Définition W3C : L'ontologie définit la terminologie utilisée pour décrire et représenter un champ de la connaissance. Des personnes, des bases de données, des applications utilisent les ontologies lorsque des domaines d'information doivent être partagés. (On désigne par domaine un sujet spécifique ou bien un secteur de la connaissance tel que la médecine, la fabrication d'outils, les biens immobiliers, la réparation automobile, la gestion financière, etc.). Les ontologies concernent les définitions, utilisables dans un environnement informatique, des concepts fondamentaux et de leurs relations dans un domaine considéré (dans ce cas et de manière plus générale dans ce document, on notera que cette définition s'entend dans l'acception technique des informaticiens programmeurs). Les ontologies codent la connaissance d'un domaine mais aussi de domaines plus vastes. De cette manière, elles rendent la connaissance réutilisable.

3.5 Projet – Ensemble d'éléments

3.5.1     Un ensemble d'éléments de métadonnées prend ensuite sa place dans le concept global. Trois catégories principales ou groupements de métadonnées sont communément décrites ici :

3.5.1.1  Les métadonnées descriptives, utilisées pour découvrir et identifier un objet.
    
3.5.1.2  Les métadonnées de structure utilisées pour afficher et diriger un sujet particulier vers l'utilisateur et pour insérer des informations dans l'organisation interne de cet objet, par exemple une séquence d'événements proposés et leurs relations avec d'autres objets, tels que des images ou des transcriptions d'entretiens.

3.5.1.3  Les métadonnées d'administration, qui représentent l'information de gestion des objets (tels que les namespaces (espaces de nommage) qui acceptent la métadonnée elle même), les dates de création ou de modification de l'objet, les métadonnées techniques (format de fichier du contenu validé, durée, taux d'échantillonnage, etc.), information portant sur les droits et les licences. Cette catégorie comprend l'essentiel des données relatives à la conservation.
 
3.5.2     Quelles que soient les opérations à conduire, chacune de ces trois catégories : descriptive, structurelle et administrative, doit être présente, même si différents sous-ensembles de données peuvent se trouver dans n'importe quel fichier ou programme d'instanciation. Les métadonnées venant appuyer les objectifs de conservation - "informations qui renforcent et documentent les processus de conservation" (PREMIS) - le processus pourra s'enrichir de données à propos de la provenance des objets, leur authenticité, les actions effectuées sur ceux-ci. Les métadonnées de conservation participant au processus de recherche, certaines d'entre-elles ou la totalité se montreront utiles à l'utilisateur final (en garantissant l'authenticité par exemple) ; pourtant, il serait plus important d'élaborer et de renforcer les données descriptives, structurelles et relatives aux licences, de disposer de moyens de transformation des métadonnées brutes en mode de présentation intuitive ou bien de les préparer pour le moissonnage ou pour des interactions d'utilisateurs externes en réseau. Il va sans dire qu'un item introuvable ne pourra ni être conservé, ni être écouté, aussi, plus on intégrera des métadonnées concernant de telles opérations, mieux ce sera.  
    
3.5.3    Chacun de ces trois regroupement de métadonnées pourra être compilé séparément : les métadonnées administratives (technique), par exemple les produits dérivés de la numérisation de masse ; les métadonnées descriptives issues de l'export d'une ancienne base de données ; les métadonnées concernant les droits tels que la liquidation, qui seront complétées, et les licences signées. Les résultats de ces différentes compilations devront être réunis en une simple instance de métadonnées ou bien en un ensemble de fichiers reliés avec indication du statut de conservation. Il sera essentiel de communiquer tous ces éléments de métadonnées au schéma ou au DTD (Document Type Definition) (Définition du type de document). Sinon les métadonnées resteront comme une "grosse goutte", une accumulation de données lisibles pour l'humain mais inintelligibles pour les machines.

3.6 Projet – Codage et schémas

3.6.1 De manière analogue aux signaux audio codés en fichier WAV, dont les spécifications sont décrites et publiées, il est nécessaire de coder le jeu d'éléments : en langage XML, peut-être en combinaison avec RDF, selon la recommandation énoncée ci-dessus. Cette spécification sera précisée dans la première ligne de chaque instance de métadonnée <?xml version="1.0"encoding="UTE-8"?>. Ainsi, acquiert-il par lui-même de l'intelligence : c'est un peu comme dire à des auditeurs que la page du livret du CD qu'ils sont en train de lire est en papier et qu'elle doit être préservée d'une certaine manière. Les étapes suivantes produisent de l'intelligence (souvenons-nous, pour les machines tout autant que pour les personnes) à propos des schémas prévisibles et de la sémantique des données rencontrés dans les fichiers restants. Le reste des en-têtes de fichiers des métadonnées consiste typiquement en une séquence d'espaces de noms (namespaces) attribuée à d'autres normes et schémas (habituellement désignés comme "schéma d'extension") lors de la conception du projet.

<mets:mets xmlns:mets="http://www.loc.gov/standards/mets/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:dc="http://dublincore.org/documents/dces/"
xmlns:xlink="http://www.w3.org/TR/xlink"
xmlns:dcterms="http://dublincore.org/documents/dcmi-terms/"
xmlns:dcmitype="http://purl.org/dc/dcmitype"
xmlns:tel="http://www.theeuropeanlibrary.org/metadatahandbook/telterms.html"
xmlns:mods="http://www.loc.gov/mods"
xmlns:cld="http://www.ukoln.ac.uk/metadata/rslp/schema/"
xmlns:blap="http://labs.bl.uk/metada/blap/terms.html"
xmlns:marcrel="http://www.loc.gov/loc.terms/relators/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#type"
xmlns:blapsi="http://sound.bl.uk/blapsi.xml"xmlsn:namespace-prefix="blapsi">

Fig. 2 : Ensemble des espaces de noms (namespaces) utilisés dans les profils METS de la British Library pour les enregistrements sonores

3.6.2 De telles spécifications intelligentes, en XML, sont appelées schémas XML qui succèdent aux DTDs. Les DTDs sont encore couramment utilisées considérant la relative facilité de leur compilation. Le schéma demeurera dans un fichier avec l'extension .xsd (XML Schema Definition), il possèdera son propre namespace auquel d'autres opérations et implémentations pourront se référer. Pour être compilés, les schémas nécessitent de l'expertise. Heureusement, les outils open source sont disponibles, qui permettent à un système informatique de déduire un schéma d'un fichier XML bien fait. Des outils sont également disponibles pour effectuer la conversion XML en d'autres formats, tel que .pdf ou bien des documents .rtf (Word) en XML. Le schéma peut aussi incorporer des moyens idéalisés pour afficher les données selon des fichiers XLST. Les schémas (et les namespaces) de métadonnées descriptives seront détaillés au paragraphe 3.9 Métadonnées de description - Profils d'application, Dublin Core (DC) ci-dessous.

3.6.3  Pour résumer les relations  présentées ci-dessus, un schéma XML ou DTD décrit une structure XML qui balise le contenu textuel au format d'un fichier codé XML. Le fichier (ou instance) contiendra un ou plusieurs namespaces représentant le schéma étendu de meilleure qualité que la structure XML pourrait déployer.

3.7 Métadonnées d'administration – Métadonnées de conservation

3.7.1 Les informations décrites dans ce paragraphe font partie du regroupement des métadonnées administratives. Celles-ci rassemblent les informations de l'en-tête des fichiers audio  et encodent les  informations d'exploitation nécessaires. De cette manière, le système informatique reconnaît le fichier et la manière dont il doit être utilisé grâce à l'association du fichier d'extension avec un logiciel particulier, et grâce à la lecture de l'information codée dans l'en-tête du fichier. Ces informations doivent aussi être  référencées dans un fichier à part afin de faciliter la gestion et les futurs accès, car les extensions de fichiers constituent, au mieux, des indicateurs ambigus des fonctionnalités du fichier. Les champs qui décrivent cette information explicite, y compris le type et la version, peuvent-être automatiquement extraits des en-têtes du fichier et utilisés pour alimenter les champs du système de gestion des métadonnées. Si un système d'exploitation en cours ou à venir n'a pas la capacité d'activer un fichier .wav ou de lire une instance .xml par exemple, le logiciel ne pourra reconnaître l'extension ni accéder au fichier ou déterminer son type. En explicitant cette information dans l'inscription d'une métadonnée, on permet au futur utilisateur de disposer des données de gestion et d'être en mesure de décoder les données d'information. Les normes , en cours d’élaboration dans l'AES-X098B  et qui seront publiées par l'Audio Engineering Society sous le titre AES57 "AES standard for audio metadata - audio object structures for preservation and restoration" ("Norme AES portant sur les métadonnées audio - structures des objets audio pour la conservation et la restauration" (en anglais (NDT))  codifient cet aspect de la question.

3.7.2 Des registres de format sont disponibles aujourd'hui, bien qu'encore en développement, pour faciliter la catégorisation et la validation des formats de fichiers dans les tâches de pré-chargement : PRONOM (registre technique en ligne, comprend les formats de fichiers, maintenu par TNA (The National Archives, UK), qui peut être utilisé conjointement avec un autre outils de TNA, DROID (Digital Record Object Identification (Identification d'enregistrement numérique d'objets) - qui effectue l'identification automatique de lots de formats de fichiers et de sorties de métadonnées). En provenance des Etats-Unis, Université de Harvard, les outils GDFR (Global Digital Format Registry) (Registre de format numérique global) et JHOVE (JSTOR/Harvard Object Validation Environment identification, validation, and characterization of digital object) (identification de l'environnement, validation et caractérisation des objets numériques) offrent des services comparables permettant la conservation des compilations de métadonnées. Une information précise des formats de fichiers est essentielle pour atteindre l'objectif de conservation à long terme.

3.7.3 Le plus important concerne les aspects de conservation et de transfert relatifs aux fichiers audio, y compris la totalité des paramètres techniques, qui doivent être soigneusement évalués et préservés. Ce qui implique l'ensemble des mesures qui doivent être prises pour assurer la sauvegarde des documents audio tout le long de leur vie. Même si de nombreuses métadonnées discutées ici peuvent être ajoutées sans encombre à une date postérieure, l'enregistrement de la création du fichier audionumérique (et  tout changement apporté à son contenu)  doit être créé au moment où se produit l'événement. Cet historique des métadonnées permet de suivre l'intégrité de l'item audio et, si l'on utilise le format BWF, elles peuvent être enregistrées en tant que partie intégrante du fichier par codage de l'historique dans le bloc BEXT. Cette information constitue une partie essentielle des recommandations formulées à l'adresse des métadonnées de conservation PREMIS. L'expérience montre que les systèmes informatiques sont en mesure de produire d'abondantes données techniques lors du processus de numérisation. Des données qu'il faudra peut-être distiller dans les métadonnées qui doivent être conservées. Des ensembles d'éléments utiles sont proposés dans la série provisoire AudioMD (http://www.loc.gov/rr/mopic/avprot/audioMD_v8.xsd), un schéma d'extension développé par la Library of Congress (Bibliothèque du Congrès), ou bien par le schéma de l'AES audio Object XML qui, au moment d'écrire ces lignes est en révision pour normalisation.      

3.7.4 Dans le cas de la numérisation de collections légales, ces schémas sont utiles, non seulement pour décrire les fichiers numériques, mais également pour décrire l'original physique. Des précautions doivent prises afin d'éviter toute ambiguïté à propos des objets en cours de description dans les métadonnées : il devient nécessaire de décrire les tâches, leurs manifestations originales, les versions numériques subséquentes, mais la capacité de pouvoir distinguer ce qui est décrit dans chaque instance revêt une importance critique. PREMIS réalise la distinction des différentes composantes dans la séquence de changement en les associant avec les événements et en reliant les métadonnées résultantes au cours du temps.

3.8 Métadonnées structurelles - METS

3.8.1    Les médias temporels, très fréquemment de type audiovisuels, sont complexes. Un enregistrement in situ peut être constitué d'une séquence d'événements (sons, danses, rituels) accompagné d'images et de notes de terrain. Un long entretien historique occupant plus d'un fichier .wav peut aussi être accompagné de photographies des intervenants, de transcriptions ou d'analyses linguistiques. Les métadonnées structurelles dressent un inventaire de tous les fichiers pertinents et intelligents des relations externes et internes en y incluant les séquençages préférés ; par exemple les actes et les scènes d'un enregistrement d'opéra. La norme METS (Metadata Encoding and Transmission Standard : Norme de codage et de transmission des métadonnées) version actuelle 1.11, qui comporte des sections  « carte de structure » (structMap) et « groupe de fichiers » (fileGrp) peut faire valoir un bilan positif avéré des applications dans le contexte de l'audiovisuel (voir fig. 3)


Fig. 3 : composantes d'une instance METS avec un jeu possible de relations entre-elles

3.8.2    Composantes d'une instance METS :
3.8.2.1  L'en-tête décrit l'objet METS, celui qui l'a créé, quand, et dans quel but. L'information consignée dans l'en-tête participe à la gestion du fichier METS correspondant.
3.8.2.2  La section des métadonnées descriptives contient l'information décrivant la ressource représentée par l'objet original, ce qui permet de la découvrir.
3.8.2.3  La carte de structure, représentée par les feuillets individuels et les détails, dans l'ordre des fichiers numériques de l'objet disposés selon une hiérarchie dans laquelle on peut naviguer.
3.8.2.4  La section des fichiers de contenu, représentée par des images, une sur cinq, déclare quels fichiers numériques constituent l'objet. Les fichiers peuvent être soit intégrés à l'objet, soit référencés.  
3.8.2.5  La section des métadonnées administratives contient des informations sur les fichiers numériques déclarés dans la section des fichiers de contenu. Cette section se subdivise en :

3.8.2.5.1 Métadonnées techniques, définit les caractéristiques techniques d'un fichier    
3.8.2.5.2 Métadonnées source, précise la source de la capture (par exemple, capture directe     ou reformatée avec transparence 4x5)
3.8.2.5.3 Métadonnées de provenance numérique, précise quelles modifications ont été     appliquées sur un fichier depuis sa naissance   
3.8.2.5.4 Métadonnées portant sur les droits, précise les conditions légales d'accès

3.8.2.6 Les différentes sections des métadonnées techniques, des métadonnées sources, et des métadonnées de provenance numérique fournissant les informations pertinentes de la conservation numérique.
3.8.2.7 Pour satisfaire la complétude, la section comportement, non présentée dans la Fig. 2 ci-dessus, associe des exécutables avec un objet METS. Exemple, un objet METS peut s'appuyer sur une certaine partie du code pour créer une instance à des fins de visualisation, la section comportement  pouvant référencer ce code.   

3.8.3    Il peut être nécessaire de représenter des objets métiers en supplément des métadonnées de structure.

3.8.3.1  Information d'utilisateur (authentification)
3.8.3.2  Droits et licences (manière d'utiliser un objet)
3.8.3.3  Politiques (manière dont un objet a été sélectionné par les archives)
3.8.3.4  Services (acquittement des copies et des droits)
3.8.3.5  Organisations (collaborations, partie prenantes, sources de financement)

3.8.4    Ces éléments peuvent être représentés par des fichiers référencés à une adresse spécifique ou URL. Des annotations explicatives peuvent être fournies dans les métadonnées pour les lectures humaines.

3.9 Métadonnées descriptives – Profils d'application, Dublin Core (DC)

3.9.1    Une grande partie des efforts consacrés aux métadonnées dans le domaine patrimonial ont mis l'accent sur les métadonnées descriptives en tant que ramification du catalogage traditionnel. Toutefois, il est clair qu'une attention excessive dans ce domaine (par exemple raffinement localisé des balises descriptives et vocabulaires contrôlés) aux dépens d'autres considérations décrites ci-dessus provoquera des défauts dans le système. La Fig. 4 met en évidence les diverses interdépendances qu'il convient de mettre en place, ainsi que les balises de métadonnées descriptives qui constituent en quelque sorte un sous-ensemble de tous les éléments en jeu.


Fig. 4 : Métadonnées descriptives simples (Avec l'autorisation de Dempsey, CLIR/DLF primer, 2005)

3.9.2    L'interopérabilité doit être une composante essentielle de toute stratégie concernant les métadonnées : pour un entrepôt d'archives, la conception par une équipe dédiée de systèmes élaborés et indépendants les uns des autres conduira  à une faible productivité, des coûts élevés et une portée minimum. Il en résultera une industrie artisanale de métadonnées incapable de se développer. Les métadonnées descriptives illustrent en effet le cas classique de la maxime de Richard Gabriel 'Worse is better' ('Moins bien, c'est mieux). Comparant deux programmes de langage, l'un élégant mais complexe, l'autre maladroit mais simple, Gabriel prédit avec raison que le langage le plus simple se développera plus rapidement, et qu'ainsi, davantage de personnes seraient amenées à améliorer le langage simple plutôt que le langage complexe. La démonstration d'un tel cas de figure est apportée par la manière dont s'est généralisé le succès de Dublin Core (DC), pourtant considéré initialement par les professionnels  comme une solution improbable du fait de sa très grande simplicité.    

3.9.3    La mission de DCMI (DC Metadata Initiative) a consisté à favoriser la détection des ressources sur internet. Ceci grâce au développement de standards de métadonnées permettant de repérer les ressources dans différents domaines, grâce à la définition de structures assurant l'interopérabilité de sets (regroupements) de métadonnées, et enfin grâce au développement de sets spécifiques d'une communauté ou d'une discipline qui soient en cohérence avec leurs objectifs. Un vocabulaire de quinze éléments seulement est utilisé pour la description des ressources, pour l'ensemble des trois catégories de métadonnées. Aucun élément n'est obligatoire : tous sont reproductibles, même si les intégrateurs peuvent spécifier d'autres profils d'application - voir paragraphe 3.9.8 ci-dessous. L'origine du nom "Dublin" provient de la ville de l'Ohio qui a accueilli en 1995 le groupe de travail ; "core" (cœur) provient du fait que les éléments, de portée générale, génériques, sont utilisables pour décrire un large éventail de ressources. L'utilisation de DC s'est répandue durant plus d'une décennie, les quinze éléments descriptifs ayant été officiellement adoptés dans les normes suivantes : ISO Standard 15836-2003 de février 2003 (février 2009) [ISO 15836 http://dublincore.org/documents/dces/#ISO15836 ] (2009) NISO standard Z39.2007 de Mai 2007 [NISOZ3985 http://dublincore.org/documents/dces/#NIZO3985 ] et IETF RFC 5014 d'Août 2007 [RFC5013 http://dublincore.org/documents/dces/#RFC5013 ].
 
Tableau 1 (ci-dessous) listes des quinze éléments DC avec leurs définitions officielles (abrégé) et suggestions d'interprétation dans un contexte audiovisuel.

Eléments DC Définition DC Interprétation audiovisuelle
Title (Titre) Nom donné à la ressource Titre principal associé à l'enregistrement
Subject (Sujet) Sujet de la ressource Principaux thèmes couverts
Description (Description) Présentation de la ressource Notes explicatives, résumés d'entretiens, descriptions du contexte environnemental ou culturel, liste des contenus
Creator (Créateur) Entité principalement responsable de la réalisation de la ressource Ni l'auteur, ni le compositeur des œuvres enregistrées mais le nom du service d'archivage
Publisher (Editeur) Entité responsable de la mise à disposition de la ressource N'est pas l'éditeur du document original numérisé. Typiquement l'éditeur et le créateur sont les mêmes
Contributor (Contributeur) Entité responsable des contributions au contenu de la ressource Toute personne ou source sonore citée. Nécessite des qualificatifs appropriés tels que le rôle joué (par ex. interprète, personne qui a effectué l'enregistrement)
Date (Date) Moment ou période associée à un événement du cycle de vie de la ressource N'est pas la date d'enregistrement ou de l'original (P) mais une date relative à la ressource elle-même
Type (Type) Nature ou genre du contenu de la ressource Domaine de la ressource, non le genre musical. Ainsi Son : oui, Jazz : non
Format (Format) Format de fichier, medium physique, ou dimensions de la ressource Format de fichier, non du support physique original
Identifier (Identifiant) Référence non ambigüe de la ressource dans un contexte donné Susceptible d'être l'URI du fichier audio
Source (Source) Ressource apparentée dont la ressource décrite est dérivée Référence à une ressource dont la ressource présente est dérivée
Language (Langue) Langue de la ressource Langue de la ressource
Relation (Relation) Ressource apparentée Référence aux objets apparentés
Coverage (Couverture) Périmètre spatio-temporel de la ressource, domaine spatial d'application de la ressource ou juridiction compétente en vertu de laquelle la ressource est pertinente. Ce qu'illustre l'enregistrement, par exemple des particularismes culturels tels que des chants traditionnels ou un dialecte
Rights (Gestion des droits) Information sur les droits associés à la ressource Information sur les titulaires de droits associés à la ressource

Tableau 1 : Les 15 éléments DC

3.9.4    Afin d'inclure des propriétés supplémentaires dans le processus, le nombre d'éléments de DC a été augmenté. Ainsi, un certain nombre d'éléments ajoutés ("termes") serviront à décrire les média basés sur le temps :

Termes DC Définition DC Interprétation audiovisuelle
Alternative (Alternatif) Toute forme de titre utilisée comme substitut ou alternative du titre formel de la ressource Titre alternatif, par ex. un titre traduit, un pseudonyme, un rangement alternatif d'éléments dans un titre générique
Extent (Etendue) Taille ou durée de la ressource Taille et durée d'un titre
Extent Original (Etendue d'origine) Manifestation physique ou numérique de la ressource Taille ou durée de l'enregistrement  de la source d'origine
Spatial (Spatial) Caractéristiques spatiales du contenu intellectuel de la ressource Localisation de l'enregistrement comprenant les coordonnées topographiques compatibles avec les interfaces cartographiques
Temporal (Temporel) Caractéristiques temporelles du contenu intellectuel de la ressource Circonstances dans lesquelles l'enregistrement a été effectué
Created (Créé) Date de création de la ressource Date d'enregistrement et toute autre date importante dans le cycle de vie de l'enregistrement

Tableau 2 Termes (sélection)

3.9.5    Les intégrateurs de DC peuvent faire le choix d'utiliser les quinze éléments soit dans leur ancien dc: variant (par exemple, http://purl.org/dc/elements/1.1/creator) ou dans le dcterms: variant (par exemple, http://purl.org/dc/terms/creator) en fonction des exigences d'applications. Toutefois, au fil du temps, en particulier si RDF fait partie de la stratégie des métadonnées, on s'attend (avec les encouragements de la DCMI) à ce que les intégrateurs utilisent la sémantique plus précise dcterms: properties, ils se conformeront strictement aux bonnes pratiques des métadonnées destinées aux machines de traitement.

3.9.6    Y compris sous cette forme étendue, la granularité de DC peut être insuffisante pour  répondre aux exigences d'archives audiovisuelles spécialisées. L'élément Contributor, par exemple, nécessitera la mention du rôle du contributeur dans l'enregistrement pour éviter, dans ce cas de figure, la confusion entre interprètes et compositeurs ou acteurs et auteurs. Une liste de rôles communs (ou 'relators') ('rapporteurs') a été élaborée pour des agents (MARC relators) par la Library of Congress. Voici deux exemples de la manière dont ils peuvent être implémentés.

<dcterms:contributor>
<marcrel:CMP>Beethoven,Ludwig van, 1770-1827</marcrel:CMP>
<marcrel:PRF>Quatuor Pascal</marcrel:PRF>
</dcterms:contributor>

<dcterms:contributor>
<marcrel:SPK>Greer,Germaine, 1939- (female)</marcrel:SPK>
<marcrel:SPK>McCulloch, Joseph, 1908-1990 (male)</marcrel:SPK>
</dcterms:contributor>

Le premier exemple place une balise 'Beethoven' en tant que compositeur (composer) (CMP) et 'Quatuor Pascal' en tant qu'interprète (performer) (PRF). La deuxième balise place les deux contributeurs, Greer et McCulloch en tant que locuteurs (speakers) (SPK) sans aller jusqu'à déterminer celui qui mène l'interview et celui qui répond aux questions. Cette information devrait être transmise à un autre endroit dans les métadonnées, par exemple dans Description ou Title.

3.9.7    A cet égard, un schéma différent peut-être préférable, ou pourrait être inséré en tant que schéma d'extension supplémentaire (illustration dans la Fig. 2). MODS (Metadata Object Description Schema http://www.loc.gov/standards/mods/) permet, par exemple, d'obtenir une granularité plus importante des noms et des liens avec les fichiers d'autorité, reflet de sa filiation avec la norme MARC :

name
    Subelements
        namePart
          Attribute: type (date, family, given, termsOfAddress)
        displayForm
        affiliation
        role
          roleTerm
            Attributes: type (code, text); authority
            (voir:www.loc.gov/marc/sourcecode/relator/relatorsource.html)
        description
       Attributes: ID; xlink; lang; xml:lang; script; transliteration
       type (enumerated: personal, corporate, conference)
          authority

(voir:www.loc.gov/marc/sourcecode/authorityfile/authorityfilesource.html)    

3.9.8    En utilisant METS, il serait possible d'inclure plus d'un lot (set) de métadonnées descriptives adaptées en vue d'objectifs différents, par exemple un lot Dublin Core (en conformité avec OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)) et un lot MODS plus sophistiqué adapté  à d'autres initiatives, notamment l'échange de fiches codées avec des systèmes MARC. Cette possibilité d'inclure d'autres approches standards constitue l'un des avantages de METS.

3.9.9     DC, sous la gouvernance de la Dublin Core Metadata Initiative (DCMI) poursuit  son développement. D'une part, son efficacité pour la mise en réseau des ressources est renforcée par l'association accrue d'outils sémantiques du web tels que RDF (voir Nilsson et al, DCMI 2008) tandis que, d'autre part, il vise à accroître sa pertinence dans le domaine patrimonial en l'associant de manière formelle avec les recommandations RDA (Resource Description & Access http://www.collectionscanada.gc.ca/jsc/rda.html)  [nom de domaine remplacé par http://www.rda-jsc.org/rda.html en 2009]. Si RDA est considéré comme un successeur opportun des règles de catalogage anglo-américaines, ce développement particulier peut conduire à des implications dans les archives audiovisuelles qui font partie des bibliothèques nationales et universitaires. En ce qui concerne les archives de la radiodiffusion, d'autres développements basés sur DCMI ont atteint une certaine notoriété.  Au moment de rédiger ce document, l'EBU (European Broadcast Union) UER (Union Européenne de Radiodiffusion) complète le développement du jeu de métadonnées EBU Core Metadata Set, tiré de Dublin Core et compatible avec lui.

3.9.10 Le service d'archives peut souhaiter modifier (développer, adapter) l'ensemble des éléments de base (core). De tels ensembles modifiés s'appuyant sur un ou plusieurs schémas d'espace de nom (namespace) existant (MODS et/ou IEEE LOM aussi bien que DC par exemple) sont connus sous le nom de profils d'applications. Tous les éléments d'un profil d'application proviennent de l'extérieur, de schémas d'espaces de noms distincts. Si des programmeurs souhaitent créer de 'nouveaux' éléments non schématisés par ailleurs, par exemple lorsque des rôles de contributeurs d'instance ne sont pas disponibles dans le jeu MARC relators (agents non humains ou autres espèces, machines, environnements), ils doivent créer leur propres schémas d'espaces de noms, et prendre leur responsabilité en 'déclarant' et maintenant ce schéma.

3.9.11 Les profils d'application comprennent une liste d'espaces de noms qui assurent l'administration en même temps que les URL courants (de préférence PURL - URL permanents). Ceux-ci sont recopiés dans chaque instance de métadonnées. Il en résulte une liste de chacun des éléments de données comportant à la fois les valeurs permises et le style de contenu. Elles peuvent faire référence à des règles internes ou additionnelles et à des vocabulaires contrôlés, par exemple des thésaurus de noms et genres d'instruments, des fiches d'autorité de noms personnels et de sujets. Le profil spécifiera aussi les schémas obligatoires d'éléments particuliers telles les dates (AAAA-MM-JJ) et les coordonnées géographiques, de telles représentations standards de localisation et du temps pourront contribuer à l'affichage cartographique et temporel en tant que dispositif de récupération non-textuelle.

Nom ou Terme Titre
Term URI (Terme URI) http://purl.org/dc/elements/1.1/title
Label (Label) Titre
Defined by (Défini par) http://dublincore.org/documents/dcmi-terms/
Source Definition(Définition de la Source) Nom donné à une ressource
BLAPS-S Definition (Définition BLAPS-S) Titre de l'œuvre ou composante de l'œuvre
Source Comments (Commentaires sur la source) Typiquement, un titre est le nom par lequel la source est formellement connue
BLAPS-S Definition (Commentaires BLAPS-S) Si aucun titre n'est disponible il convient d'en donner un à partir de la ressource ou fourni [sans titre]. On suivra les pratiques de catalogage normales pour les titres d'enregistrement dans d'autres langues utilisant un raffinement 'Alternatif'. Pour les données issues du catalogue d'archives sonores, cela revient à donner l'un des domaines de titres suivants dans l'ordre hiérarchique tel que : Titre de l'œuvre (1), Titre de l'item (2), Titre de la collection (3), Titre de du produit (4), Espèces originales (5), Titre de radiodiffusion (6), Titre Séries éditées (7), séries non éditées (8)
Type of term (Type de terme) Elément
Refines (Raffinements)    
Refined by (Raffiné par) Alternative
Has encoding schemes (Schéma encodé par)  
Obligation (Obligation) Obligatoire
Occurrence (Occurence) Non répétable

Fig. 5 : Partie du profil d'application du DC de la British Library pour le son (BLAP-S) :

Espaces de noms utilisés dans ce profil d'application
Termes de métadonnées DCMI : http://dublincore.org/documents/dcmi-terms/
RDF http://www.w3.org/RDF/
Eléments MODS http://www.loc.gov/mods
Termes TEL http://www.theeuropeanlibrary.org/metadatahandbook/telterms.htm
Termes BL http://www.bl.uk/schemas/bibliographic/blterms
MARCREL http://www.loc.gov/loc.terms/relators/

3.9.12  En conséquence, le profil d'application s'incorpore ou s'appuie sur un dictionnaire de données (fichier définissant l'organisation élémentaire de la base de données jusqu'aux champs individuels et types de champs), ou bien sur plusieurs dictionnaires de données, ainsi la maintenance peut-elle être assurée par un seul centre d'archives ou de manière partagée avec une communauté d'archives. Le dictionnaire de données PREMIS (http://www.loc.gov/standards/premis/v3/premis-3-0-final.pdf, version 3 actuellement) se rapportant exclusivement à la conservation, est susceptible d'être utilisé de manière conséquente. Ses nombreux éléments sont dénommés 'Unités sémantiques'. Les métadonnées de conservation  fournissent des renseignements sur la provenance,  l'activité de conservation,  les caractéristiques techniques, et  facilitent la vérification de l'authenticité d'un objet numérique. Le PREMIS Working Group a publié son dictionnaire Data Dictionary for Preservation Metadata en Juin 2005, il recommande de l'utiliser dans tous les entrepôts de conservation quel que soit le type de matériau archivé et quelles que soient les stratégies de conservation employées.   

3.9.13  En définissant les profils d'application et, plus important, en les déclarant, les programmeurs peuvent partager l'information à propos de leurs schémas afin de collaborer, à grande échelle, à des tâches universelles telle que celle de la conservation à long terme.

3.10 Sources de métadonnées

3.10.1  Les services d'archivage ne doivent pas s'attendre à créer elles même  toutes les métadonnées descriptives en partant de zéro (l'ancienne manière). Etant donnée l’imbrication des ressources et  des métadonnées tout au long de leur vie, une telle notion est en fait inopérante.  Pour réduire les coûts et apporter un enrichissement par l'extension des entrées, plusieurs sources de métadonnées sont à considérer, notamment  la catégorie des métadonnées descriptives. On compte trois sources principales : professionnelle, contributive et intentionnelle : elles peuvent être déployées parallèlement.      

3.10.2  Les sources professionnelles, cela signifie qu'elles sont élaborées sur la valeur intangible des bases de données légales, des fichiers d'autorité et des vocabulaires contrôlés valables pour les matériels publiés ou dupliqués. Les bases de données industrielles tout autant que les catalogues d'archives sont concernés. De telles sources, en particulier les catalogues d'archives, sont notoirement incomplets et incapables d'interopérations sans la mise en œuvre de programmes de conversion sophistiqués et de protocoles complexes. Il y a presque autant de standards de données opérationnels dans les industries d'enregistrement et de radiodiffusion ou dans le domaine du patrimoine audiovisuel qu'il y a de bases de données séparées. Le manque de solution universelle pour l'AV, telle que l'ISBN pour l'imprimé, est un obstacle permanent et après des décennies d'efforts en matière discographique, il reste encore des divergences sur ce qui constitue une notice de catalogage : une piste individuelle ou une séquence de pistes réalise-t-elle une unité intellectuelle telle qu'une œuvre musicale constituée de multiples sections ou une œuvre littéraire ? Est-ce-la somme totale des pistes d'un simple support ou d'un ensemble de supports ? En d'autres termes, le support physique est-il l'unité de catalogage ? Manifestement, un organisme qui choisit une définition de plus grande granularité trouvera qu'il est plus facile de réussir l'export de ses données légales dans une infrastructure de métadonnées. Les approches "ceinture et bretelles" de l'export des données tirées de Z39.50 (http://www.loc.gov/z3950/agency/protocol for information retrieval) et SRW/SU (un protocole de recherche et de récupération via les URL standards avec réponse XML standard) permettent d'atteindre un certain niveau de réussite, de même que la capacité des ordinateurs à moissonner les métadonnées à partir des ressources centralisées. Cependant, il faudrait investir de manière plus efficace dans la production partagée des ressources d’identification et de description des noms, des sujets, des emplacements, des périodes et les œuvres.

3.10.3  Par sources contributives il faut comprendre les contenus générés par les utilisateurs. Ces dernières années, un phénomène important s'est manifesté par l'émergence de nombreux sites qui sollicitent, regroupent et exploitent les données contributives des utilisateurs, et qui mobilisent ces données pour classer, recommander et commenter les ressources. Ceci inclus, par exemple, YouTube et LastFM. Ces sites ont une certaine utilité en ce qu'ils révèlent les relations entre personnes, entre personnes et ressources et entre les informations portant sur les ressources elles-mêmes. Les bibliothèques ont commencé à expérimenter ces approches ;  il y a de vrais avantages à tirer par le fait que les utilisateurs peuvent accroître le nombre de métadonnées en provenance de sources professionnelles. Les caractéristiques du soi-disant Web 2.0 qui supporte les contributions et les syndications des utilisateurs, sont devenues de banals systèmes de gestion de contenus disponibles.

3.10.4  Intentionnelle signifie que les données collectées sur des utilisations et des usages peuvent améliorer la découverte des ressources. Le concept est emprunté au secteur commercial comme les recommandations d'Amazon,  basées sur des choix d'achats groupés. Des algorithmes similaires peuvent être utilisés pour classer des objets dans une ressource. Ce type de données est apparu comme un facteur central des sites web à succès, procurant des chemins utiles à travers des volumes intidimidantes d'informations complexes.

3.11 Nécessité de futurs développements

3.11.1  Dans le contexte des travaux et développements récents, les métadonnées restent une science immature, même si ce chapitre démontre qu'un nombre important de blocs substantiels en construction (dictionnaires de données, schémas, ontologies et codages) étaient maintenant en place pour commencer à répondre à l'appétit des chercheurs qui souhaitent accéder plus facilement aux contenus AV, et répondre à l'ambition tenace de notre profession de sauvegarder leur persistance. Pour accélérer les progrès, il sera nécessaire de trouver des terrains communs entre secteurs publiques et commerciaux, et entre les différentes catégories d'archives audiovisuelles, chacune d'entres-elles ayant élaboré ses propres outils et standards.
    
 3.11.2  Un certain succès a été obtenu avec la dérivation automatique  des métadonnées des ressources. Nous avons besoin d'en faire plus, car les processus manuels existant notamment ne s'adaptent pas bien. Par ailleurs, la production de métadonnées ne semble pas acceptable à moins de mieux rentabiliser le processus. "Nous ne devons pas alourdir les dépenses et la complexité, ce qui est la tendance quand les développements passent par de multiples canaux faisant consensus et qui répondent aux impératifs d'une partie seulement de l'environnement de service" (Dempsey : 2005).
 
3.11.3  Le problème de la réconciliation des bases de données, c'est-à-dire la capacité d'un système à comprendre que les items sont sémantiquement identiques bien qu'ils puissent être représentés de différentes manières, reste une question ouverte. Des recherches significatives ont été entreprises pour résoudre ce problème, mais une solution appropriée générale reste à trouver. Cette question est également très importante pour la gestion de la persistance dans OAIS comme le démontre l'exemple suivant. L'expression sémantique indiquant que Wolfgand Amadeus Mozart est le compositeur de la plupart des pièces du Requiem (K. 626) est présentée de manière totalement différente dans le modèle FRBR en comparaison d'une liste de simples relevés DCMI. Pour DCMI, 'Compositeur' est un raffinement de 'contributeur' et 'Mozart' est sa propriété; tandis que dans le modèle FRBR, compositeur est une relation entre une personne physique et un opus. L'utilisation de vocabulaires contrôlés est aussi une manière de s'assurer que W.A. Mozart représente bien la même personne, Mozart.

4: Identificateurs uniques et persistants

4.1 Introduction

4.1.1 Un enregistrement audio numérique stocké sur un système de masse ou sur des supports individuels, doit pouvoir être identifié et récupéré. Un item ne peut être conservé si on ne peut le localiser et le relier au catalogue et au registre de métadonnées qui lui donnent un sens. Chaque item numérique doit être nommé sans ambiguïté de manière unique. Pour garantir l'absence d'ambiguïté et le caractère unique du nommage d'un objet numérique, la première étape d'identification consiste à déterminer ce qui doit être nommé et à quel niveau.
 
4.1.2 Par principe, tout document informatique utilise un système d'identification afin qu'il soit stocké sans provoquer de conflit. Cet identificateur peut être un identificateur public, mais le plus souvent ce n'est pas le cas car, orienté système, il est susceptible de modifications quand le système l'exige. Il est nécessaire de maintenir durablement la capacité de l'identifiant public persistant à accéder à un item,  à le localiser et à le laisser utiliser par ceux qui le souhaitent grâce aux citations et aux liens générés. Il est nécessaire également que cet identifiant joue son rôle vis-à-vis de l'item auquel il se réfère indépendamment de l'endroit où celui-ci est stocké ou du statut du système d'indentification.

4.1.3 Le standard du Cadre de description des ressources : Ressource Description Framework (RDF) est une référence importante pour l'identification d'objets numériques (http://www.w3.org/RDF/). RDF s'appuie sur le concept d'identifications d'objets avec identifiants du Web dénommés URLs (Universal Resource Identifiers : Identificateurs universels de ressource). Les systèmes d'identification sont réalisés grâce à deux mécanismes fondamentaux. Premièrement, le nommage d'un item par la création d'un identifiant à partir d'une sémantique ou d'autres règles d'étiquetage qui relieront l'identifiant à l'item. Dans le standard RDF, de tels identifiants sont dénommés URN (Universal Resource Names : noms universels de ressource). Deuxièmement, l'action du localisateur qui organise le système de localisation de telle manière qu'il soit en mesure de retrouver l'item en instance d'identification. Dans le standard RDF, de tels identifiants sont dénommés URLs (Universal Resource Locator : Localisateur uniforme de ressource).
 
4.1.4 Il existe de nombreux procédés de nommage d'un objet numérique, certains d'entre eux sont spécifiques aux objets audio et audiovisuels, parmi lesquels ceux décrits dans les recommandations techniques EBU / UER R99-1999 "Unique" Source Identifier (USID) : Identificateur source "Unique" utilisé dans le domaine  des <Original Reference>, référence originales du format BWF (Broadcast Wave Format).

4.2 Identificateurs persistants

4.2.1 Sans attendre que les problèmes soulevés par la numérisation n'atteignent un niveau critique, les gestionnaires de bibliothèques, de services d'archives, de collections sonores ont généralement eu tendance à développer des systèmes d'accès aux documents plus ou moins sophistiqués. Ces nombreux systèmes, qui tendent à devenir uniques dans leur propre domaine, peuvent être incorporés dans des procédures de nommage plus générales en ajoutant un nom unique du domaine ou de l'institution. Ce type de structure permet ainsi de bénéficier d'une souplesse maximale pour la gestion de l'identification locale de ses propres ressources, même s'il autorise l'incorporation des identificateurs dans un système global en ajoutant les règles de désignation appropriées. Grâce aux identificateurs persistants, l'utilisateur du contenu peut identifier une œuvre (non un fichier) qui restera une référence immuable de celle-ci, indépendamment des conventions de nommage qui peuvent changer.

4.2.2 Un identificateur persistant (PID : Persistent Identifier) est créé et implémenté de telle manière que les ressources identifiées restent inchangées quel que soit l'emplacement de sa représentation et restent indépendantes du fait que plusieurs copies sont disponibles en différents endroits. Cela signifie que les PID sont des URN (Universal Resource Name).

4.3 Conventions de nommage de fichiers et identificateurs uniques

4.3.1 Des précautions devront être prises pendant les discussions  sur le maintien de la distinction entre l'identificateur persistant qui se réfère à l'œuvre, et les conventions de nommage des fichiers. En fait, de nombreux systèmes peuvent fort bien les mettre en relation l'un avec l'autre. Cette section fournit des recommandations à propos des conventions de nommage de fichiers. Les fichiers gérés dans tout entrepôt peuvent inclure différents types de données, et pas uniquement des données audio. Un identificateur unique (Unique Identifier : UID) identifie une ressource de manière unique. Ceci signifie que l'identificateur peut-être modifié pour des représentations (incarnations, personnifications) de la ressource et que chaque copie de celle-ci aura son propre ID. En conséquence, cela signifie que les UID sont des URL. Pour conduire une telle discussion, les noms de fichiers devront être également considérés comme des identificateurs uniques.     

4.3.2 Afin d'établir des connexions avec un système, en interne ou en externe, l'identificateur unique constitue la clé essentielle permettant de gérer les données audio et de tous leurs fichiers associés, par exemple les copies de master, les copies d'écoute, leurs versions après compression, les fichiers de métadonnées, les listes d'éditions (edit lists), les textes et images associées, les versions de chacun de ces fichiers master et leur dérivés. Par conséquent, à moins que le service d'archives n'utilise un procédé de vidage des identifiants par le système, il est d'importance vitale que la structure de l'identifiant unique soit déterminée de manière logique, qu'elle soit bien comprise par ceux qui doivent l'appliquer, qu'elle puisse être lue par des personnes et des machines. Il est important également d'expliciter les correspondances entre les "familles" de fichiers de données : un commentateur compare cette connexion à un "fil" persistant qui permet aux ressources d'être re-étiquetées ou recousues sur le Web". Parler de "ressource" plutôt que de collections constitue un concept implicite important de ces directives.   

4.3.3 Une manière des plus robustes pour construire un système d'identification révélant ces connexions consiste à l'appuyer sur le concept de Root ID (RID). Le RID est l'identificateur de l'entité. Tous les fichiers et dossiers impliqués dans la représentation de l'entité seront dérivés du RID par l'addition de préfixes ou de suffixes telle que la création d'identificateurs uniques.

4.3.4 Que les identificateurs intègrent de l'intelligence ou non, lorsqu'ils sont générés et lus automatiquement par un système informatique, ils comportent habituellement un code de longueur fixe. Ils offrent les avantages suivants :

4.3.4.1 Ils permettent l'élaboration de règles pour créer de nouveaux identificateurs uniques.
4.3.4.2 Ils garantissent une reconnaissance dépourvue d'ambiguïté par le système (ainsi que pour les utilisateurs au fait des règles).
4.3.4.3 Ils permettent la validation du code ou de ses composantes.
4.3.4.4 Ils apportent leur contribution à la recherche, au tri, aux constatations.

4.3.5 Les mérites relatifs des identificateurs uniques silencieux, intelligents ou expressifs ont fait l'objet de longs débats. La plupart des systèmes attribuent un identificateur silencieux au moment où les données sont sauvées. Ils sont rapidement appliqués, ne nécessitent pas d'intervention humaine, et bénéficient de la garantie de rester uniques. Toutefois, du fait de leur caractère aléatoire et arbitraire, d'autres moyens doivent être trouvés pour préciser la manière dont les fichiers générés lors du cycle de vie d'une ressource numérique sont connectés. Une meilleure manière de procéder passe par l'utilisation d'identifiants intelligents et expressifs.

4.4 Caractéristiques des identifiants

4.4.1 Lors du développement d'un procédé de nommage, on tiendra compte des caractéristiques suivantes :

4.4.1.1 Unicité, le procédé de nommage devra être unique dans le contexte des ressources numériques de l'organisation et, si nécessaire, être globalement unique.

4.4.1.2 Ils devront prendre le parti de la persistance ; une organisation doit s'engager à maintenir l'association entre l'emplacement existant de la ressource et l'identifiant persistant.

4.4.1.3 Un système d'identification sera plus efficace s'il est en mesure de traiter les exigences particulières de différents types de documents ou de collections.

4.4.1.4 Bien que cela ne soit absolument pas critique, ni essentiel vis-à-vis des identificateurs persistants générés automatiquement, un système sera plus efficace s'il est facile à comprendre et à appliquer, s'il se prête bien aux citations courtes et d'utilisation aisée.

4.4.1.5 L'identificateur doit être capable de distinguer les différentes parties d'un item, aussi bien les versions ou les rôles qu'un item numérique peut avoir. Il n'est pas conseillé de se fier à l'extension du fichier pour distinguer une copie de diffusion d'une copie d'archivage : le format peut changer avec le temps, même si le rôle reste le même (Dack 1999).

4.4.1.6 L'identifiant doit permettre le renommage de lots lors de leur entrée dans différents systèmes de gestion de contenus.

5: Extraction du signal des supports originaux

5.1 Introduction

5.1.1 La première phase du processus de numérisation, qui est aussi la plus significative, consiste à récupérer un signal optimum à partir du support original. Par principe, les originaux devront toujours être conservés afin de permettre des lectures ultérieures. Pourtant, chaque transfert devra s'efforcer de réaliser une extraction optimale du signal, ceci pour 2 raisons simples et pratiques. Premièrement, la possible dégradation du support peut compromettre la qualité d'une lecture suivante, voire la rendre impossible. Deuxièmement, l'extraction du signal représente tant d'efforts en ressources humaines et en financement que l'on s'attachera à réaliser une extraction optimale dès la première tentative.

5.2 Reproduction des formats mécaniques historiques et obsolètes

5.2.1 Introduction

5.2.1.1 Les premiers enregistrements audio ont été réalisés à l'aide de moyens mécaniques. Cette approche restera pratiquement la seule méthode viable de capture du son jusqu'au développement des circuits électriques qui ont permis la création d'un nouveau marché avec l'enregistrement magnétique pendant les années 30 et au-delà. L'enregistrement mécanique est caractérisé par la présence d'un sillon continu porteur d'un signal codé pratiqué à la surface d'un support. L'encodage du son monophonique est obtenu soit par la modulation du fond du sillon qui se déplace vers le haut et vers le bas relativement à la surface du disque (enregistrement vertical), ou bien qui se déplace alternativement de gauche à droite (enregistrement latéral). Tous les enregistrements sur cylindre sont verticaux, de même les disques Edison Diamond Disc et certaines productions en laque réalisées par Pathé jusqu'à ce qu'on réalise des disques à gravure latérale à partir de 1927 environ. Pendant un certain temps, des disques de transcription radiophonique ont été gravés verticalement, aux Etats-Unis essentiellement. Les enregistrements à gravure latérale sont les plus répandus ; la plupart des disques à sillon large (parfois dénommés 78t), de transcription radio, et de gravure directe, comportent un sillon latéral, de même les microsillons monophoniques. Ceux-ci seront traités à part dans la section 5.3.

5.2.1.2 Les enregistrements mécaniques sont de type analogique, ainsi nommés car les flancs du sillon sont modulés par le son en une forme d'onde continue. Pratiquement tous les enregistrements mécaniques présentés sont obsolètes dès lors que les industries ayant créé ces produits cessent de les fabriquer. Les premiers enregistrements étaient acoustiques : les ondes sonores, par l'intermédiaire d'un léger diaphragme et d'un burin solidaire à celui-ci sont inscrites directement sur la surface d'enregistrement. Par la suite, les enregistrements mécaniques sont devenus "électriques", utilisant un microphone et un amplificateur pour piloter une tête de gravure. A partir de 1925, pratiquement tous les studios d'enregistrement ont commencé à réaliser des enregistrements électriques.

5.2.1.3  Les premiers enregistrements mécaniques, produits par une industrie en cours de développement, ont peu bénéficié de mesures de normalisation. Les accords existants n'étaient guère respectés dans le contexte du développement de la technologie, du secret dans lequel les fabricants entouraient leurs dernières techniques pour garder l'avantage sur le marché. De cette période, nous héritons d'une disparité considérable de la plupart des caractéristiques de ces produits, pas moins que celles de la taille et de la forme du sillon gravé (voir 5.2.4), de la vitesse d'enregistrement (5.2.5) et de l'égalisation requise (5.2.6). En conséquence, les personnes opérant sur de tels disques doivent acquérir des connaissances spécifiques des conditions historiques et techniques dans lesquelles les enregistrements ont été réalisés. Pour des productions atypiques, il est recommandé de demander conseil auprès de spécialistes, mais aussi de prendre des précautions pour tous les types disques, y compris les plus courants.

5.2.2 Sélection de la meilleure copie

5.2.2.1 L'enregistrement mécanique peut être un enregistrement direct ou bien une reproduction. Dans le premier cas, il s'agit presque toujours d'un document unique, seul enregistrement d'un événement particulier. Cette catégorie comprend les cylindres de cire 2, les disques à gravure directe (connus aussi sous le nom d'acétate), et les enregistrements réalisés par des machines à dicter de bureau (voir 5.2.9). Dans le second cas, les enregistrements dupliqués sont généralement reproduits en exemplaires multiples par pressage ou moulage d'un master original. Les enregistrements directs devront être identifiés et traités à part, avec grande précaution.

5.2.2.2 Les cylindres à gravure directe peuvent être identifiés par leur apparence de cire, leur toucher, ils sont généralement fabriqués à partir de savon métallique doux. Leur couleur typique peut varier du caramel clair au chocolat foncé ou très rarement noir. Les cylindres dupliqués sont réalisés à partir d'une qualité de savon métallique plus dur, ou bien encore d'un manchon de celluloïd recouvrant un noyau de plâtre. Ils ont été fabriqués avec une grande variété de couleurs, sachant que le noir et le bleu ont été les plus fréquemment utilisés. Ces cylindres portent habituellement des informations du programme par un marquage en relief pratiqué sur le bord du cylindre.

5.2.2.3 Le premier format de disques à lecture immédiate est apparu en 1929 environ. Les disques étaient constitués d'un métal tendre dépourvu de revêtement (aluminium le plus souvent, cuivre ou zinc dans certains cas). A la surface de celui-ci, un sillon à débattement latéral est pratiqué par repoussage plutôt que par gravure. Ces disques peuvent être facilement distingués des disques dupliqués en gomme-laque. Comme pour les disques acétate produits ultérieurement, les disques métalliques ont été conçus pour permettre, après fixation de l'enregistrement par repoussage, une lecture immédiate à l'aide d'un gramophone standard de l'époque, aussi de tels enregistrements peuvent-ils globalement être rangés dans la catégorie des disques à sillon large et des 78t/mn. Toutefois,  les ingénieurs chargés du transfert devront s'attendre à des différences, pas seulement dans les profils du sillon.

5.2.2.4 Les disques acétate introduits en 1934 sont le plus souvent décrits comme produits laminés, bien que ce ne soit pas leur méthode de fabrication, ou bien comme des produits en acétate, ce qui en fait ne décrit pas la nature de la surface d'enregistrement. Ces disques sont le plus souvent constitués d'une base (âme) solide et rigide (aluminium ou verre, zinc parfois) recouverte d'une laque de nitrate de cellulose, teintée en noir afin d'améliorer les conditions d'observation durant le  processus de gravure. Rares sont les disques à base de carton. Le comportement de coupe lors de la gravure est contrôlé par l'addition de plastifiants (agents assouplissants), tels que l'huile de castor ou le camphre.

5.2.2.5 Les disques à gravure directe peuvent ressembler aux disques de laque et plus généralement aux vinyles, mais ils peuvent en être distingués de plusieurs manières. Il est souvent possible d'observer le matériau de base (âme) entre les couches de vernis, soit dans la tranche du trou central, soit sur celle du pourtour extérieur. Lorsqu'une étiquette de papier est présente, l'inscription du programme est effectuée de manière manuelle plutôt que imprimée. Sur les disques dépourvus d'étiquette, on observera parfois la présence, près du trou central, d'un ou de plusieurs trous décentrés servant à l'entraînement du disque. Si la laque nitrocellulosique, une âme métallique ou de verre entrent dans la composition de la plupart des disques à gravure directe, on peut rencontrer en pratique une grande variété de matériaux différents, tels que le carton pour support, la gélatine pour la couche d'enregistrement, ou bien encore des disques homogènes.  

5.2.2.6 En raison de leur instabilité, les disques à gravure directe devront être transférés en toute première priorité.

5.2.2.7 Lorsque l'on dispose de plusieurs copies de disques à gravure directe, la sélection de la meilleure version suit habituellement un processus visant à déterminer l'existence de l'exemplaire le plus proche de la source en meilleur état. Dans le cas de production d'enregistrements mécaniques de masse pour laquelle l'existence de copies multiples est habituelle, on appliquera les recommandations ci-dessous pour la sélection de la meilleure copie.

5.2.2.8 La sélection de la meilleure copie des supports mécaniques dupliqués implique une bonne connaissance de la production discographique et de la capacité d'apprécier l'état d'usure et les dégradations du disque pouvant générer des effets audibles sur le signal. Pour identifier précisément l'enregistrement, le fabricant utilise des numéros et des codes, généralement placés entre le sillon de sortie du programme et l'étiquette. De telles indications peuvent aider le technicien qui pourra ainsi déterminer s'il s'agit de disques identiques ou bien de disques correspondant à différentes prises de la même œuvre. Les signes d'usure ou de dégradation du disque seront davantage visibles en lumière réfléchie. Pour obtenir de meilleurs résultats, le technicien recherchera les défauts sous le faisceau d'une lampe à incandescence placée derrière son l'épaule. Les tubes fluorescents ou bien les lampes basse consommation, qui ne produisent pas de lumière suffisamment cohérente pour révéler les défauts d'usure, ne seront pas utilisés. Un microscope stéréoscopique est utile pour évaluer la taille et la forme du sillon, pour examiner l'état d'usure produit par les lectures antérieures. Ces observations facilitent la sélection de la pointe la plus adaptée. L'utilisation d'un microscope stéréoscopique comportant un réticule permet une sélection plus précise et plus objective de la pointe de lecture (Casey et Gordon 2007).


2. Les premiers cylindres de cire commerciaux étaient dupliqués par des procédés mécaniques, les uns après les autres, les interprètes effectuaient souvent plusieurs prises pour réaliser des lots d'enregistrements similaires. Ils seront tous considérés comme exemplaires uniques.

5.2.3 Nettoyage et restauration des supports

5.2.3.1 Les supports gravés peuvent se dégrader par leur utilisation ou par les effets du processus de décomposition naturelle des constituants, phénomène plus ou moins rapide selon les conditions de stockage. Des débris de poussière et dépôts de particules peuvent s'agglutiner dans le sillon et favoriser le développement de moisissures quand les conditions climatiques le permettent. Cette situation est très courante pour les cylindres à gravure directe. De plus, les disques acétate peuvent faire apparaître des traces d'exsudation d'agents plastifiants entrant dans la composition de la couche enduite. Ces traces se présentent sous forme de moisissure blanche ou grise, mais dont la consistance est grasse au toucher. La moisissure, à proprement parler, se présente sous l'apparence d'un duvet ou d'un filament blanc ou gris. Ces 2 phénomènes compromettent les conditions dans lesquelles la tête de lecture peut suivre le sillon avec précision, aussi un nettoyage approprié du support est-il nécessaire.
 
5.2.3.2 La méthode la plus adaptée pour procéder au nettoyage dépendra de la nature et de l'état du substrat. Dans de nombreux cas, les interventions effectuées à l'aide d'un liquide produisent les meilleurs résultats, mais le choix du solvant doit être fait avec précaution ; dans certains cas, il vaut mieux éviter toute utilisation de liquide. Lorsqu'on ne connaît pas de leur composition chimique, on évitera d'utiliser les solutions de nettoyage. Toute décision d'utilisation de solvants ou autres produits de nettoyage devra être prise par le responsable des archives disposant des conseils techniques avisés de restaurateurs ou de chimistes compétents dans les matériaux plastiques. On considérera néanmoins que les disques à gravure directe, les disques de laque, les cylindres de tout type ne devront jamais être en contact avec l'alcool qui présente des risques d'effets corrosifs immédiats. Souvent, les disques de laque contiennent des charges absorbantes qui peuvent se dilater en cas de contact prolongé avec l'humidité. Ils devront être séchés immédiatement après un nettoyage effectué avec un liquide quelconque. Tous les procédés de nettoyage devront éviter le moindre contact avec l'étiquette de papier.

5.2.3.3 L'huile de Castor est fréquemment utilisée comme agent plastifiant dans la production de disques comportant une couche de laque nitrocellulosique. Celle-ci se décompose généralement en acide palmitique et acide stéarique lorsqu'un phénomène d'exsudation en surface se produit. La perte de plastifiant provoque une contraction du revêtement qui se craquèle et se détache du support (pelage). Un phénomène connu sous le nom de délamination. Plusieurs solutions ont été pratiquées avec succès par l'élimination des acides exsudés formés (voir en particulier Paton et al 1977 : Casey et Gordon 2007, p 27). Il a été toutefois observé que, suite au nettoyage, les disques à gravure directe pouvait se dégrader plus rapidement. Il est donc prudent de réaliser sans attendre des copies numériques de disques propres après avoir effectué les opérations de nettoyage. Il faut souligner que l'effet de tous les solvants doit être testé avant usage. Certains disques à gravure directe comportent une couche active de gélatine par exemple, non de nitrate de cellulose. La gélatine, soluble, subirait des dommages immédiats et irréversibles si un traitement avec liquide était appliqué.

5.2.3.4  D'autres média ne se prêtent pas à un nettoyage à l'aide d'un liquide, notamment les disques à gravure directe et les disques en laque qui comportent une feuille de papier ou du carton sous la couche de gravure. De la même façon, les disques à gravure directe dont la couche de surface se fragmente ou se délamine doivent être traités avec le plus grand soin. Les cylindres à gravure directe doivent être nettoyés à sec exclusivement à l'aide d'une brosse souple appliquée le  long du sillon. Toutefois, si la présence de spores de moisissures est suspectée, on prendra le plus grand soin pour réduire la contamination. Des précautions toutes particulières seront prises dans les procédures de nettoyage des moisissures et des spores afin d'éviter des sérieux problèmes de santé. Il est fortement recommandé aux opérateurs de s'enquérir de conseils de professionnels avant de commencer les travaux sur de tels produits contaminés.

5.2.3.5 Lorsqu'on estime que l'utilisation d'agents de nettoyage liquides est appropriée, on prendra les mesures pour que la solution d'une part et le support d'autre part  soient bien à la température de la pièce. On évitera ainsi tout choc thermique préjudiciable au support.

5.2.3.6 Souvent, la méthode qui se montre être la plus efficace et la plus décisive consiste à utiliser une machine de nettoyage dotée d'un système d'aspiration pour éliminer le liquide résiduel dans le sillon, ainsi les machines Keith Monks Loricraft ou bien Nitty Gritty.

5.2.3.7 Les supports particulièrement sales, ou ceux marqués de manière permanente par des dépôts de papier après séchage, peuvent être nettoyés au moyen d'un bain à ultrasons dans lequel le disque (ou un partie du disque) est plongé. La vibration du liquide en contact avec l'objet provoque le détachement des particules de salissure.

5.2.3.8 Au cas où il n'est pas possible d'utiliser un tel équipement, le lavage manuel peut-être effectué au moyen d'une petite brosse rigide. Il est possible d'utiliser l'eau du robinet, mais il conviendra d'effectuer systématiquement un rinçage à l'eau déminéralisée afin d'éliminer tous les restes de contamination.

5.2.3.9  Outre les opérations de nettoyage, d'autres opérations de restauration peuvent être nécessaires. Les disques de laque et les cylindres de tous types sont fragiles et donc exposés à des cassures en cas de mauvaise manipulation. Les disques de gomme laque peuvent se ramollir et se déformer à haute température. La migration des produits plastifiants des disques à gravure directe est à l'origine de la contraction du revêtement alors que le support de métal ou de verre est très stable. Les contraintes générées entre les matériaux provoquent des fragmentations et des détachements de la couche de lecture. La restauration idéale de disques et de cylindres cassés est réalisée sans colle ni adhésifs, qui forment inévitablement un obstacle entre les parties jointes et qui seront audibles, aussi petits soient-ils. De telles procédures sont généralement irréversibles, n'accordant pas de seconde chance. Les procédures de duplication des disques de laque et des cylindres génèrent souvent des contraintes au sein du support. En cas de cassure, les contraintes propres aux différentes parties peuvent produire de légères déformations. Pour minimiser cet effet, les morceaux devront être remis en place et les opérations de transfert effectuées dès que possible après l'incident. Chaque élément d'un support cassé devra être conditionné pour le stockage en évitant tout contact avec les doigts. Le stockage de l'objet cassé simplement reconstitué peut favoriser l'effritement du bord des pièces en contact les unes avec les autres et augmenter les dégradations.       

5.2.3.10 La reconstruction des disques de laque sur une platine est généralement la meilleure solution. On utilise un plateau plus grand que le disque (un disque disponible hors collection peut constituer une solution idéale). Les pièces sont placées dans leur position correcte et maintenues autour de l'axe central à l'aide d'un mastic réutilisable tel que les produits Blu-Tack, U-Tack ou analogues fixés sur le pourtour du disque. Quand les disques sont plus fins dans la zone externe par rapport à la zone centrale, le mastic peut-être utilisé pour relever les bords et les placer à bonne hauteur. Il convient de prendre note de la direction de déplacement de la pointe dans le sillon : lorsque la hauteur des différentes pièces ne peut être parfaitement alignée, il vaut mieux, tant pour la pointe que pour la qualité du résultat du transfert, faire en sorte que la pointe saute vers le bas plutôt que de butter contre l'obstacle représenté par la paroi d'un fragment plus haut.

5.2.3.11  Les cylindres qui ont subi une cassure nette peuvent souvent être restaurés directement sur le mandrin de lecture en utilisant du collant 1/4 pouce (utilisé pour les bandes magnétiques) en forme de pansement. Il conviendra de faire appel à l'aide de spécialistes en cas de cassures plus complexes.

5.2.3.12 Les lamelles détachées de la couche de vernis des disques à gravure directe peuvent être provisoirement remises en place pour permettre une lecture. On utilise pour cela une toute petite quantité de gelée à base de pétrole placée entre la lamelle et le support. Les effets de cette intervention sont susceptibles d'être nocifs à long terme, aussi ces tentatives seront-elles réservées aux disques que l'on estime ne pas pouvoir lire dans d'autres conditions.  

5.2.3.13 Quand il est possible de lire un disque voilé ou tordu, sans avoir à l'aplanir, cette situation peut constituer une situation préférable au vu des risques présentés ci-dessous par la lecture d'un disque aplani. La possibilité de lire un disque déformé peut être améliorée en réduisant la vitesse de rotation du disque. (Voir 5.2.5.4).

5.2.3.14 Les disques en gomme laque peuvent être redressés dans une étuve ventilée de laboratoire (non chez un particulier). Le disque devra être posé sur une plaque de verre trempé préchauffée. Le disque et la plaque de verre doivent impérativement être nettoyés pour prévenir la fusion de la salissure à la surface du disque. Un autre risque peut se présenter par des déformations latérales du disque lorsqu'il durcit en position verticale. Il convient donc de ne pas chauffer le disque plus que nécessaire, pas plus de 42°C, température généralement suffisante (voir Copland 2008, Appendice I).

5.2.3.15 L'opération de redressage de la planéité d'un disque est très utile en ce qu'elle rend possible une lecture qui ne le serait pas autrement. Toutefois, les recherches en cours sur les procédures de remise à plat d'un disque avec la chaleur montrent qu'elles peuvent produire des fréquences subsoniques audibles, même aux très basses fréquences du spectre audible (Enke 2007). Bien que les recherches ne soient pas très convaincantes, il convient d'établir s'il y a lieu de procéder aux opérations de redressement d'un disque. Des conséquences néfastes de ces pratiques ont été analysées pour des disques vinyles et si on décidait d'étendre de telles méthodes aux disques de laque, il faudrait abaisser la température pour diminuer les risques. En tout état de cause, il faudra bien mettre en balance le risque de tels dommages avec la possibilité de lire le disque.     

5.2.3.16  S'il est fortement recommandé de ne pas essayer de redresser de façon permanente les disques à gravure directe (toute tentative étant susceptible d'être vouée à l'échec si ce n'est d'entraîner une dégradation de la surface), dans certains cas, le voile peut être réduit momentanément par serrage du disque ou autre procédé de maintien des bords de celui-ci sur la platine. Un très grand soin doit être apporté, particulièrement avec les disques à couche de vernis qui peuvent être endommagés lorsqu'ils sont soumis à des contraintes. Les disques souples, voilés, peuvent être redressés en les plaçant sur le plateau à aspiration d'une machine à graver, grâce au vide que l'on amène progressivement avec précautions. Tous les traitements physiques devront être entrepris avec beaucoup de soins pour éviter tout dommage.

5.2.3.17 Certains disques dupliqués ont été réalisés avec un trou non parfaitement concentrique. Il est préférable de lire un tel disque sur une platine dont l'axe peut être retiré ou bien en surélevant le disque au-dessus de l'axe en utilisant, par exemple, des disques de rebut ou bien des intercalaires en caoutchouc. Dans ce cas, la hauteur du bras devra être surélevée d'autant. Il est possible de recentrer le trou axial en utilisant un alésoir ou un foret, mais une telle intervention invasive ne peut-être entreprise qu'avec précaution et en aucun cas sur des exemplaires uniques. Altérer l'objet original peut faire perdre l'information secondaire.

5.2.4 Equipement de lecture

5.2.4.1 Les disques gravés sont conçus pour être lus à l'aide d'une pointe et d'une platine. Si les technologies à lecture optique présentent quelques avantages spécifiques qui seront discutés ci-dessous (voir section 5.2.4.14), si leur évolution est telle que la lecture s'effectue à la manière d'un système ne nécessitant pas de contact physique, la meilleure approche et la plus économique actuellement, consiste à extraire le contenu audio à  l'aide d'une pointe convenable. En ce qui concerne les enregistrements à gravure latérale, il est essentiel de disposer d'une panoplie de pointes de différents rayons, de 38 µm (1,5 mil 3) à 102 µm (4mil), avec une attention complémentaire pour les dimensions 76 µm (3 mil) et 65 µm (2,6 mil) correspondant respectivement aux premiers et aux derniers disques électriques. La pointe qui assurera la meilleure lecture possible d'un sillon donné s'ajustera correctement dans celui-ci dans la zone de lecture, évitant les zones usées ou endommagées des parois. Les disques en bon état se prêtent à une reproduction plus précise, moins chargée de bruit de fond lorsqu'ils sont lus avec une pointe de forme elliptique. Les disques en mauvais état apparent peuvent produire de meilleurs résultats avec une pointe de forme conique. La zone usée par des lectures antérieures peut ne concerner qu'une région particulière des flancs du sillon. Choisir une pointe de taille et de forme appropriées permet de lire la région saine des parois sans introduire de distorsions provenant de la région dégradée. Une pointe  de forme tronquée ou autre évitera plus aisément d'atteindre les zones endommagées se trouvant dans le fond du sillon. Des précautions devront être prises pour lire les disques Pathé à gravure latérale car ils ont, de manière typique, une largeur de sillon plus importante ; ils peuvent nécessiter une pointe dont le rayon de courbure est plus grand, ce qui évite de détériorer le fond du sillon.

5.2.4.2 Les platines mono sont disponibles, mais il est plus courant d'utiliser une platine stéréo qui permet de capturer séparément les informations de chaque flanc du sillon. Les cellules à bobine mobile sont souvent très appréciées car leur bonne réponse aux impulsions favorise la séparation du bruit de matière du signal audio. Toutefois, la variété des tailles des pointes correspondant aux cellules à bobine mobile n'est pas aussi étendue que celles des cellules à aimant mobile qui font partie intégrante de la platine, et celles qui doivent être commandées coûtent approximativement quatre fois plus cher. Les platines à aimant mobile sont plus courante, plus robustes, moins coûteuses ; elles sont généralement mieux adaptées au service demandé. Souvent, pour lire des disques de laque, une force d'appui de l'ordre de 30 - 50 mN (3 - 5 g) convient. Une force d'appui inférieure à ces valeurs est recommandée pour les disques à gravure directe. L'utilisation d'une platine stéréo présente l'avantage de pouvoir mémoriser séparément les composantes de chaque voie, ce qui permet, lors d'utilisation ultérieure, de les sélectionner ou de les traiter. A l'écoute, les deux canaux peuvent être combinés en phase pour les enregistrements à gravure latérale, ou hors phase (selon la platine) pour les enregistrements à gravure verticale.

5.2.4.3  Pour les enregistrements à gravure verticale, la sélection d'une pointe adaptée répond à des critères différents de ceux correspondant à un disque à gravure latérale. Plutôt que de choisir une pointe ajustée dans un espace séparant les deux parois du sillon, la lecture des cylindres et autres disques à gravure verticale exige le choix d'une pointe qui s'adaptera au mieux au fond du sillon. Ceci est critique pour les cylindres à gravure directe car, même avec une force d'appui très faible, un mauvais choix de forme de pointe est à l'origine d'une dégradation de la surface. Généralement, on préférera une pointe sphérique, surtout si la surface est endommagée, même si une pointe elliptique permet d'éviter les fréquences générées par l'erreur de piste. Typiquement, pour les cylindres standards (100 sillons/pouce), les tailles de pointes sont comprises entre 230 µm (9 mil) et 300 µm (11,8 mil) et pour les cylindres de 200 sillons/pouce, la taille est comprise entre 115 (4,5 mil) et 150 µm (5,9 mil). Les cylindres doivent être lus avec une pointe dont le rayon de courbure de l'extrémité est légèrement inférieur à celui du fond du sillon. Une pointe tronquée va endommager le sillon car la force d'appui s'exerce davantage sur les bords de celui-ci plutôt que la pointe elle-même, ce qui induit une augmentation de la pression sur ces parties du sillon.

5.2.4.4 Quand vient le moment de prendre des décisions d'équipement, la connaissance du contenu d'une collection donnée servira de guide principal pour définir le type de matériel nécessaire. Différents types de supports demanderont évidemment différents types d'équipements de lecture, mais même pour des supports semblables des besoins d'expertise spécifiques peuvent apparaître. ,  

5.2.4.5 En général, les appareils  historiques ne peuvent être utilisés, essentiellement du fait de leur qualité audio limitée, et, dans le cas des lecteurs de cylindres, du fait d'une force d'appui trop importante en comparaison de celle d'un lecteur moderne. Certains cylindres problématiques ne peuvent être lus avec un lecteur moderne doté d'un asservissement du déplacement de la tête de lecture par la pointe qui suit le sillon. Un tel dispositif s'avère pratiquement incapable d'assurer le suivi de piste de la pointe, de faire en sorte qu'elle racle régulièrement le sillon. Le problème peut-être résolu en utilisant un lecteur moderne à avance fixe ou bien un lecteur historique modifié.

5.2.4.6 Les disques de transcription radio ont un diamètre de 16 pouces. Si de tels supports sont présents dans une collection, il faudra se procurer une platine comportant un plateau tournant et un bras pour des disques de cette taille. Pour les disques standards de 12 pouces, une platine moderne de précision modifiée pour faire varier la vitesse sera nécessaire.

5.2.4.7 Les matrices négatives (ou stampers) servant à la production en masse de disques dupliqués peuvent être jouées si un stylet à double pointe est disponible. Ce type de pointe à double corps se place à califourchon sur la crête du sillon-relief (négatif du sillon gravé) ; il doit être posé soigneusement afin qu'il ne tombe pas entre les crêtes adjacentes. Comme la matrice comporte une spirale inversée par rapport au disque qu'elle va presser, elle devra tourner dans le sens contraire des aiguilles d'une montre, à l'opposé de celui du disque pressé afin de lire le programme du début à la fin. Pour mener correctement cette opération, il faut disposer d'un bras coudé et monté à l'envers. Une solution beaucoup plus simple et tout aussi efficace consiste à lire la matrice dans le sens horaire, depuis la fin jusqu'au début du programme, puis d'inverser l'enregistrement numérisé en utilisant un logiciel d'éditing de haute qualité.

5.2.4.8 Il est extrêmement difficile de se procurer des stylets bi-pointes. Deux catégories sont produites, à savoir : les pointes de faible compliance et les pointes de haute compliance. Le premier type est conçu pour remédier aux défauts de fabrication des matrices métalliques, il n'est pas idéal pour réaliser les transferts d'archivage.  La deuxième catégorie, dont la force d'appui est significativement plus faible, est conçue pour l'extraction des signaux audio plutôt qu'à des modifications physiques du stamper. Son utilisation sera plus appropriée à cette fin.

5.2.4.9 Les platines tourne-disques et les phonographes à cylindre utilisés pour les transferts d'archives doivent être des mécaniques de précision afin de produire une transmission minimale de vibrations parasites à la surface du disque qui se comporte comme un diaphragme récepteur du pickup. Les vibrations basses fréquences, appelées rumble, ont souvent une composante verticale considérable. Pour réduire le rumble généré par des vibrations extérieures, le bâtiment dans lequel l'appareil est placé doit bénéficier de fondations stables, ne transmettant pas les vibrations de structure. La machine de lecture doit avoir une précision de vitesse de rotation d'au moins 0,1 pour cent ; le pleurage et scintillement (pondération DIN 45 507) sera inférieur à 0,01 pour cent, la valeur de rumble non pondéré restera inférieure à 50 dB. L'entraînement du plateau sera effectué par courroie ou bien par un système d'entraînement direct ; les dispositifs à friction ne sont pas recommandés car ils ne permettent pas d'atteindre une précision de vitesse suffisante et un niveau de rumble suffisamment faible.

5.2.4.10 Les câblages électriques d'alimentation secteur, le moteur électrique doivent être isolés pour prévenir l'injection de bruit électrique dans le circuit du phonocapteur. Si nécessaire, des plaques en mu-métal seront utilisées pour blinder le moteur des circuits du capteur. Les câbles de connexion au préamplificateur devront respecter les spécifications d'impédance de charge de la cellule. L'installation devra suivre les pratiques des circuits analogiques dans toutes leurs exigences, les procédures de mise à la terre observées afin qu'aucun bruit ne soit ajouté au signal audio. Toutes les suggestions énumérées ci-dessus et les spécifications devront être évaluées quantitativement en analysant le signal de sortie de disques tests (voir 5.2.8).

5.2.4.11 Les platines tourne-disques et les phonographes à cylindre devront être dotés d'un variateur de vitesse. La possibilité de disposer d'une position demi-vitesse est particulièrement souhaitable (voir 5.2.5.4). Les dispositifs de lecture disposeront, si possible, d'un indicateur de vitesse avec sortie du signal permettant l'inscription automatique de ces métadonnées. Le bras de la platine tourne-disque doit être fixé sur une embase permettant non seulement l'ajustement de la distance de celui-ci par rapport au centre de la platine, mais aussi sa hauteur.  

5.2.4.12 Afin d'être en mesure d'évaluer les équipements et les réglages qui se montreraient les plus appropriés, des comparaisons seront menées entre les différentes options. On procédera à la comparaison simultanée ou en mode A/B des différents fichiers audio préparés à l'aide d'un logiciel d'éditing choisi à cet effet. L'édition et la préparation pour l'écoute de séquences d'enregistrements obtenues avec différents paramétrages permettent des comparaisons répétées en réduisant la subjectivité du processus au minimum.   

5.2.4.13 Une décision devra être prise quant à l'application de la courbe d'égalisation avant la phase de numérisation (voir 5.2.6 Egalisation de lecture). Si nécessaire, on utilisera un préamplificateur permettant d'ajuster n'importe quel type de courbes.

5.2.4.14 Une solution alternative à la lecture par contactd'un phonocapteur consiste à scanner ou photographier à haute résolution toute la surface d’un disque ou d’un cylindre, puis à effectuer une conversion en son. Divers projets ont été développés jusqu'à une phase (quasi-) commerciale (Platine laser ELP ; IRENE de Carl Haber, Vitaliy Fadeyev  et al ; VisualAudio de Ottar Johnsen, Stefano S. Cavaglieri et al ; Sound Archive Project, P.J. Boltryk, J.W.McBride, M. Hill, A.J. Nascè, et C. Maul). Toutefois, toutes les techniques explorées jusqu'ici  rencontrent des limites (résolution optique, traitement d'image, etc.) qui, en conséquence, génèrent une qualité sonore médiocre quand on la compare avec celle obtenue avec des moyens mécaniques habituels. Typiquement, l’extraction de l’information par lecture optique est un procédé intéressant pour  les disques en très mauvais état, pour lesquels les procédés mécaniques de lecture se montrent inopérants, pour lesquels les supports se montrent si fragiles que les procédés de lecture traditionnels provoqueraient des dégradations inacceptables.


3. 1 mil = 0,001" (1/1000 de pouce)

5.2.5 Vitesse

5.2.5.1 Malgré la désignation des disques de laque à sillon large par le vocable "78t", dans bien des cas de tels disques ne sont pas enregistrés rigoureusement à la vitesse 78 t/mn, tout particulièrement ceux qui ont été enregistrés avant le milieu des années 1920. A différentes époques, certaines sociétés d'enregistrement fixaient des vitesses officielles variables, des vitesses qui pouvaient même varier selon l'ingénieur du son et les circonstances pendant la session d'enregistrement. Nous manquons de place ici pour discuter des différentes options, sujet traité par ailleurs de manière détaillée (voir par exemple Copeland 2008, Chapitre 5).

5.2.5.2 Lors des transferts, il est impératif de lire le disque à une vitesse aussi proche que possible de celle de l'enregistrement afin d'extraire les événements sonores d'origine d'une manière aussi fidèle et objective que possible. Toutefois, des décisions subjectives doivent être souvent prises. A cette fin, la connaissance du contenu enregistré ou du contexte de l'enregistrement peut-être utile. La vitesse de lecture choisie devra être documentée dans les métadonnées d'accompagnement. Ceci est particulièrement important lorsqu'un doute subsiste quant à la vitesse réelle d'enregistrement.

5.2.5.3 La vitesse d'enregistrement des cylindres moulés commercialisés s’est normalisée à 160 t/mn vers 1902, même si avant cela Edison (au moins) avait appliqué des standards de vitesse qui n’ont pas perduré (tous inférieurs à 160 t/mm ; voir Copeland 2008, Chapitre 5). Même si de nombreux cylindres à gravure directe ont été enregistrés à 160 t/mn environ, on trouve des exemplaires enregistrés à des vitesses comprises entre 50 et 300 t/mn. En l'absence d'un diapason enregistré sur le cylindre (comme cela a été réalisé par certains preneurs de son de la première époque), il conviendra de régler la vitesse de lecture à l'oreille et de l'indiquer dans la documentation d'accompagnement.

5.2.5.4 Lire un disque ou un cylindre à vitesse réduite peut améliorer la précision de lecture lorsque le support est en mauvais état. Différentes manières de faire peuvent être tentées en fonction du matériel utilisé, mais on veillera tout particulièrement aux conséquences de cette procédure sur le taux d'échantillonnage du fichier numérique lors de la compensation de la vitesse, aussi le taux d'échantillonnage devra-t-il être choisi dans ce but. La lecture à mi-vitesse peut-être la plus simple solution, lorsqu'elle est associée à un taux d'échantillonnage double pour produire des transferts à vitesse corrigée avec un minimum de distorsion provoquée par la conversion du taux d'échantillonnage. Il convient de noter que la lecture à vitesse réduite n'est qu'un moyen, parmi d'autres, de résolution des problèmes de suivi de piste. Il peut-être utile d'essayer d'autres procédures à commencer par le réglage de la force latérale "antiskating" qui évite le saut de la pointe, et améliorer les conditions de suivi de celle-ci dans le sillon.

5.2.5.5 Si les conditions de vitesse réduite peuvent augmenter le niveau de bruit de surface par rapport à celui généré à la vitesse d'origine, elles sont aussi propices à une plus grande efficacité du système de filtrage, numérique ou autre. Lire à vitesse réduite implique que les fréquences sont divisées par deux alors que le temps de montée de l'impulsion indésirable provoquée par les défauts de l'état de surface reste le même et peut donc ainsi être plus facilement discriminé. Toutefois, des dispositifs de filtrage prédictif très élaborés peuvent être moins efficaces pour des vitesses non originales. Les copies à faible vitesse doivent être réalisées sans aucune égalisation, donnée introduite ci-dessous (voir 5.2.6).

5.2.6 Egalisation de lecture

5.2.6.1 L'égalisation est devenue possible avec l'introduction de l'enregistrement électrique ; elle est aussi devenue une nécessité. A l'enregistrement, l'égalisation consiste à accentuer ou à réduire la fréquence du signal, l'opération inverse de réduction ou d'accentuation est ensuite effectuée à la lecture. Contrairement au processus d'enregistrement acoustique, de telles procédures sont devenues possibles avec l'enregistrement électrique grâce aux circuits que comportent les systèmes d'enregistrement et de lecture. L'égalisation est devenue une nécessité car la manière dont le son est représenté sur le disque ne permet pas d'obtenir une échelle dynamique ou une réponse fréquentielle telle que le permet la technologie électrique, il doit être enregistré autrement.

5.2.6.2 Le son peut-être enregistré sur un disque de deux manières : "à vitesse constante" ou "à amplitude constante". Le premier cas s'applique lorsque la vitesse latérale de la  pointe reste constante quelle que soit la fréquence. Un disque acoustique enregistré dans des conditions idéales comporterait une vitesse constante sur toute la surface disponible. En conséquence, l'amplitude du signal serait inversement proportionnelle à la fréquence, ce qui signifie que les hautes fréquences seraient enregistrées avec de faibles amplitudes et les basses fréquences avec de grandes amplitudes. Les différences d'amplitude peuvent être très importantes. Ainsi, le rapport d'amplitude correspondant à des fréquences distantes de 8 octaves atteint 256:1. A basse fréquence, la vitesse constante, qui implique une excursion du sillon excessive, ne peut convenir car elle réduit l'espace d'enregistrement disponible d'une part et  peut provoquer des sauts inter-spires d'autre part.

5.2.6.3 On parle d'amplitude constante, d'autre part, lorsque l’amplitude reste la même quelle que soit la fréquence. Bien qu'elle soit la plus adaptée pour l'enregistrement des basses fréquences, l'amplitude constante ne peut convenir pour les fréquences élevées car la vitesse latérale du stylet à la gravure ou la lecture devient si importante qu'elle introduit des distorsions. Pour surmonter le dilemme provoqué par ces deux approches, les disques enregistrés électriquement sont gravés à amplitude plus ou moins constante aux fréquences basses et à vitesse constante aux fréquences élevées. La transition entre les deux régimes est définie par la fréquence dite de "turnover" (voir tableau 5.2).

5.2.6.4 Grâce à l'évolution des technologies d'enregistrement, des fréquences de plus en plus aiguës peuvent être gravées, mais leur amplitude, de plus en plus réduite, atteint le niveau des irrégularités de surface. De telles fréquences très élevées dont l'amplitude est comparable au bruit de surface, on dit qu'elles ont un rapport signal sur bruit médiocre. Pour surmonter cette difficulté, les fabricants de disques ont commencé à amplifier le signal des fréquences les plus élevées de telle manière qu'elles soient, parfois, enregistrées à amplitude constante. Les fréquences élevées sont enregistrées à vitesse constante jusqu'à un certain seuil au-delà duquel l'enregistrement est effectué à amplitude constante. La transition est appelée Roll-off Turnover HF (voir tableau 5.2). Cette égalisation des fréquences les plus élevées améliore le rapport signal sur bruit, elle est habituellement désignée par le terme de préaccentuation dans la phase d'enregistrement et par le terme de désaccentuation dans la phase de lecture.

5.2.6.5 Les phonolecteurs dynamiques ou magnétiques couramment utilisés sont des transducteurs de vitesse, le signal de sortie peut-être directement branché sur un préamplificateur standard si souhaité. Les systèmes de lecture piézo-électriques et optiques sont des transducteurs d'amplitude. Dans ce cas, une égalisation générale de pente de 6 dB par octave doit être appliquée, la différence entre les modes d'enregistrement à vitesse constante et à amplitude constante suivant cette loi.

5.2.6.6 Le processus d'enregistrement des disques acoustiques n'intègre pas, de manière délibérée, de préaccentuation (et l'on sait pourtant que les ingénieurs maîtrisaient les réglages des différentes phases d'enregistrement). Dans de telles conditions  d'enregistrement, le spectre du disque acoustique fait apparaître des pics de résonance de l'amplitude et des affaiblissements concomitants. Il n'est pas possible d'appliquer une égalisation de compensation standard du fait des résonances dues au pavillon, au diaphragme, et d'autres facteurs mécaniques, ces éléments pouvant varier d'un enregistrement à l'autre, y compris au cours d'une session. Dans ce cas, les enregistrements devront être lus à "plat", c'est-à-dire sans égalisation. Celle-ci devra être appliquée après opérations de transfert.

5.2.6.7 Pour transférer un disque enregistré électriquement, il est nécessaire de décider soit d'appliquer une courbe d'égalisation, soit de réaliser une copie plate. Lorsque la courbe de préaccentuation d'origine est connue avec précision, une égalisation correspondante peut-être appliquée avant transfert à l'aide d'un préamplificateur, ou bien après copie plate avec des moyens numériques. En cas de doute à propos de la courbe d'égalisation qu'il conviendrait d'adopter précisément, on réalisera une copie plate. Les versions numériques peuvent ensuite utiliser les courbes qui sembleraient les plus appropriées pour autant que le processus soit bien documenté, la version plate est conservée en tant que fichier master d'archive. Que l'égalisation soit appliquée ou non pendant le transfert initial, le bruit et la distorsion du signal analogique (depuis la pointe de lecture jusqu'au convertisseur analogique - numérique) doivent impérativement être maintenus au niveau le plus faible.

5.2.6.8 Il est intéressant de noter que la copie plate nécessitera une marge de la plage dynamique supérieure de 20 dB environ à celle correspondant à un transfert effectué avec égalisation. Toutefois, l'échelle dynamique d'un convertisseur numérique-analogique de 24 bits, supérieure même à celle de l'enregistrement original peut, par sa qualité, satisfaire à cette exigence de marge dynamique de 20 dB.  

5.2.6.9 Outre les limitations d'échelle dynamique mentionnées ci-dessus, le transfert d'enregistrements électriques sans désaccentuation présente un inconvénient : la sélection d'une pointe de lecture, essentiellement fondée sur une appréciation auditive sera plus difficile, pour ne pas dire impossible à conduire pendant l'écoute de séquences sonores. Une approche pratiquée par certains services d'archives consiste à appliquer une courbe standard, ou une famille de courbes correspondant à chaque type d'enregistrement pour sélectionner une pointe et effectuer d'autres réglages, puis de réaliser simultanément une copie plate et une copie avec égalisation numérique. Comme la courbe d'égalisation n'est pas toujours connue précisément, la copie plate 4 présente l'avantage d'offrir aux futurs utilisateurs la possibilité d'appliquer des égalisations à volonté, cette approche est préférable.

5.2.6.10  Des débats subsistent pour savoir si les outils de réduction du bruit qui éliminent clics audibles, sifflements etc. sont plus efficaces lorsqu'ils sont utilisés avant ou après application d'une courbe d'égalisation. La réponse variera probablement en fonction du choix spécifique des outils, de la nature des travaux à accomplir, et des événements susceptibles de changer, comme l'évolution continuelle des outils. A cet égard, le point le plus important concerne l'équipement de réduction du bruit, qui, bien que entièrement automatisé et sans possibilité de paramétrage de la part des utilisateurs, utilisera en fin de compte des processus subjectifs et irréversibles, et ainsi ne devra pas être utilisé lors de la création de fichiers de masters d'archives.  

5.2.6.11  Le relevé complet de toutes les décisions prises, du choix des équipements, de la cellule et pointe, du bras et de la courbe d'égalisation utilisée (ou bien absence d'égalisation) doit être enregistré et conservé dans les métadonnées.

5.2.6.12 Présentation des principales courbes d'égalisation en mode lecture.

Courbe d'égalisation disques 78t électriques sillon large Turnover BF 5 Roll-off Turnover HF (-6 dB/octave sauf indication) Roll-off @ 10 kHz
Acoustics 0   0 dB
Brunswick 500 Hz (NAB)   0 dB
Capitol (1942) 400 Hz (AES) 2500 Hz -12 dB
Columbia (1925) 200 Hz (250) †5500 Hz (5200) -7 dB (-8,5)
Columbia (1938) 300 Hz (250) 1590 Hz -16 dB
Columbia (Eng.) 250 Hz   0 dB
Decca (1934) 400 Hz (AES) 2500 Hz -12 dB
Decca FFRR (1949) 250 Hz 3000 Hz* -5 dB
early 78t (mi années 30) 500 Hz (NAB)   0 dB
EMI (1931) 250 Hz   0 dB
HMV (1931) 250 Hz   0 dB
London FFRR (1949) 250 Hz 3000 Hz* -5 dB
Mercury 400 Hz (AES) 2500 Hz -12 dB
MGM 500 Hz (RIAA) 2500 Hz -12 dB
Parlophone 500 Hz (NAB)   0 dB
Victor (1925) 200–500 Hz †5500 Hz (5200) -7 dB (-8,5)
Victor (1938–47) 500 Hz (NAB) †5500 Hz (5200) -7 dB (-8,5)
Victor (1947–52) 500 Hz (NAB) 2120 Hz -12 dB

Tableau 1 Section 5.2 Courbes d'égalisation des disques à sillon large (78t) 6

* Pente de 3 dB/octave. Une pente de 6 dB/octave ne devrait pas être utilisée à ces fréquences, si elle peut fournir une lecture satisfaisante à 10 kHz, l'atténuation roll-off qui débuterait à une fréquence incorrecte (6800 Hz) resterait incorrecte pour toutes les autres fréquences.
† Simple recommandation d'une valeur roll-off permettant d'obtenir un son plus naturel. Le niveau HF amplifié est probablement dû aux pics de résonance du microphone et non aux caractéristiques d'enregistrement.


4. "Plat" désigne généralement le signal non égalisé en sortie d'une cellule à vitesse constante.

5. Pour les définitions de "Turnover" et "Roll-off", voir Tableau 2, Paragraphe 5.3, note en bas de page.

6. Réf : Heinz O. Graumann : Schallplatten-Schneidkennlinien und ihre Entzerruhg, (Caractéristiques d'enregistrement et égalisation des disques Gramophone) Funkschau 1958/Heft 15/705-707. Le tableau ne comporte pas toutes les courbes pour chaque utilisation. D'autres courbes de référence varient légèrement de certaines décrites ici. Les recherches sur ces questions se poursuivent et s'il le souhaite, le lecteur peut les comparer avec d'autres résultats, tels ceux présentés par Powell & Stehle ou Copeland, chapitre 6, etc.

5.2.7 Corrections des erreurs d'alignement du matériel d'enregistrement (de gravure)

5.2.7.1 Dans l'idéal, tout désalignement de l'outil de gravure devrait se retrouver dans celui de la pointe de lecture afin que celle-ci observe au plus près le mouvement du burin pour extraire aussi précisément que possible l'information du sillon. Plusieurs facteurs interviennent dans le désalignement du burin graveur, la plupart d'entre eux restant difficiles à identifier, quantifier et corriger. Toutefois, une erreur d'alignement, la plus courante, est un peu plus facile à identifier et à traiter. Elle survient lorsqu'un burin plat a été monté hors de son axe principal, ce qui provoque un décalage des deux canaux quand on lit le disque avec une pointe elliptique centrée. Si la pointe elliptique ne peut être orientée pour compenser l'angle de coupe (par une mise en place adaptée de la tête de lecture), l'utilisation d'une pointe conique peut contribuer à améliorer les conditions de lecture, avec cependant un possible compromis dans la réponse en haute fréquence. Il est possible également de remédier ultérieurement au décalage grâce à des procédés numériques, le transfert d'archivage étant effectué.

5.2.8 Disques de calibration

5.2.8.1 La calibration d'un dispositif audio consiste à appliquer un signal défini et à mesurer les caractéristiques spectrales du signal correspondant en sortie du système. Un préamplificateur / égaliseur peut-être calibré avec un signal d'entrée constant, de fréquence variable avec adaptation de l'impédance de charge. La mesure est effectuée en traçant (ou en enregistrant) le signal de sortie en fonction de la fréquence. Des dispositifs automatiques sont disponibles. Concrètement, le signal d'entrée provient de la cellule, transducteur qui convertit une énergie mécanique en un signal électrique, aussi avons-nous besoin d'un signal de calibration mécanique. A l'époque de commercialisation des enregistrements mécaniques, les disques tests étaient réalisés pour cela. L'Audio Engineering Society (AES), via son comité de normalisation (Standardisation Committee), a lancé un projet de développement et de publication de plusieurs séries de disques tests, à la fois de disques à sillon large et de microsillons. Le jeu de disques de calibration 78 t/mn "Calibration Disc Set for 78 rpm Coarse Groove Reproducers, AES Cat. N° AES-S001-064" est disponible sur le site de l'AES. http://www.aes.org/publications/standards/calibration.cfm  

5.2.8.2 Lorsque la calibration au moyen de disques tests est réalisée avec une résolution suffisante, la courbe obtenue peut être considérée comme la fonction de transfert du phonocapteur ou de la combinaison phonocapteur-préamplificateur-égaliseur. L'observation de la courbe permet à l'opérateur de détecter de graves déficiences, elle fournit en outre les bases d'un filtre numérique qui peut être appliqué au signal issu du disque mécanique afin qu'il soit indépendant du phonolecteur utilisé (du préampli et de l'égaliseur). Il suffit de s'assurer qu'aucune modification n'a été apportée entre les conditions d'utilisation du disque test et celles des disques mécaniques à  transférer (et dans l'idéal s'assurer que les dispositifs d'enregistrement qui reçoivent les deux types de signaux se comportent bien de la même façon). (Pour plus de détail, voir Brock-Nannestad 2000). 

5.2.9 Dictaphones de bureau

5.2.9.1 Dès leur création, les technologies d'enregistrement du son ont été commercialisées pour des applications de soutien aux tâches de bureau. Trois grandes catégories de dictaphones mécaniques peuvent être définies, à savoir les cylindres, les disques et les rubans (voir 5.4.15 pour les machines à dicter magnétiques).

5.2.9.2 Les cylindres et systèmes d'enregistrement de bureau des débuts sont généralement les mêmes que ceux utilisés pour d'autres applications : les enregistrements sont réalisés sur des cylindres de longueur standard de 105 mm (4 1/8") (voir 5.2.4.3). Cependant, des cylindres conçus spécialement pour des applications de bureau ont été construits pendant de nombreuses année par Columbia (devenu Dictaphone) et Edison, qui ont produit des cylindres d'une longueur d'environ 155 mm (61/8 inch) portant 160 et 150 sillons/pouce respectivement (Klinger 2002). Quelques machines à dicter sur cylindre enregistrés électriquement ont été produites par la suite, mais on sait peu de chose aujourd'hui sur la préaccentuation utilisée.

5.2.9.3 La plupart des formats de disques gravés ont été lancés après la deuxième guerre mondiale, y compris le Voicewriter d'Edison et l'Audograph de Gray. Si de nombreux formats nécessitent des équipements de lecture particuliers, les disques souples de dix sept pouces Voicewriter Edison peuvent être lus sur une platine standard équipée d'un d'adaptateur d'axe US et d'une pointe microsillon. Les vitesses d'enregistrement de ces disques sont généralement inférieures à 33 1/3 t/mn.

5.2.9.4 Au début des années 1940, des formats d'enregistrement de type ruban apparaissent. Il s'agit essentiellement de manchons de plastique souple ajustés sur un dispositif de double mandrin pour l'enregistrement et la lecture. Le plus célèbre de ces dispositifs est peut-être le Dictaphone Dictabelt. La souplesse du manchon permettait de les aplatir pour le stockage et la distribution, un peu comme pour d'autres fournitures de bureau, mais une telle opération provoquait souvent des plis permanents, et donc des difficultés pour l'ingénieur chargé d'effectuer les lectures. On sait qu'une augmentation prudente et progressive de la température du manchon et du dispositif de lecture peut être efficace à cet égard, cependant le succès de cette procédure dépendra, entre autres, de la nature du matériau plastique utilisé. Des lecteurs spéciaux sont indispensables pour lire de tels formats.

5.2.10 Le facteur temps

5.2.10.1 Un transfert complexe peut prendre facilement 20 heures pour produire 3 minutes d'enregistrement sonore (taux de 400:1). La durée moyenne de transfert, qui est de 45 minutes pour 3 minutes de son (taux de 15:1), représente le temps passé pour la recherche des réglages corrects des équipements et le choix de la pointe, sur la base de l'analyse de l'enregistrement qui transmet son époque et son historique de stockage. Certains services d'archives ayant une expérience en la matière avancent que, pour le transfert de cylindres se trouvant dans un état moyen et non cassés, deux personnels techniques (un expert et un assistant) peuvent transférer 100 cylindres par semaine (taux de 16 : 1 environ). Bien entendu, l'expérience acquise améliore à la fois le taux de transfert et l'aptitude et l'estimation du temps requis.   

5.2.10.2 La numérisation peut paraître coûteuse et exigeante considérant les tâches à accomplir, l'équipement nécessaire, l'expertise et les heures-hommes considérables nécessaires pour transférer le son et créer les métadonnées essentielles. Toutefois, ces investissements initiaux en termes d'efforts et de ressources seront compensés par des bénéfices à long terme, des économies dans la bonne gestion de préservation de données de masse qui réduiront fortement les coûts récurrents d'accès, de duplication et de migration. On notera ici le facteur crucial de l'entretien du fonds d'archives qui sera discuté en détail notamment dans le chapitre 6. L'extraction du signal dans sa qualité optimale depuis le support original, tel que défini dans ce chapitre, constitue une composante essentielle de cette stratégie.

5.3. Reproduction d'enregistrements sur microsillon (LP)

5.3.1. Introduction

5.3.1.1 Les microsillons (Long Play - LP) ont fait leur apparition vers 1948, disques vinyles souples pressés, salués pour leur qualité "incassable" en comparaison avec les disques précédents, en laque rigide (facilement cassable).      

5.3.1.2 Le développement du disque vinyle s'accompagne de la normalisation des caractéristiques industrielles. Les sillons étaient gravés à raisons de 300-400 par inch [12-16 par mm] contrairement aux 100 sillons / inch [4 sillons / mm] environ pour les disques de laque, avec un burin graveur de taille et de forme standard monté sur un tour à graver animé d'une vitesse de 331/3 t/mn. Des disques de 17 cm (7 inches), simples (Single) ou maxi (Extended Play) sont lus à 45 t/mn et dans certains cas  à 33 t/mn. Dans des cas exceptionnels, des disques de plus grande dimension ont été réalisés pour être lus à 16 2/3 t/mn afin de contenir un programme de parole d'une durée pouvant atteindre 60 mn par face. Les caractéristiques d'égalisation variaient encore selon les compagnies, (voir Tableau 2 Section 5.3 Tableau d'égalisation des disques microsillon antérieur à 1955). Toutefois, de nombreux préamplis prennent en charge ces différences. Finalement, une entente s'est établie au sein de l'Association RIAA (Record Industry Association of America) sur une courbe qui s'est largement répandue et normalisée dans l'industrie.         

5.3.1.3 La commercialisation des disques stéréophoniques a débuté en 1958 environ, de nombreux enregistrements ont alors été produits dans les 2 versions mono et stéréo. Les 2 flancs sont disposés à angle droit et inclinés à 45° par rapport à la verticale. Le flanc intérieur du sillon comporte l'information du canal gauche, le flanc extérieur comporte l'information correspondant au canal droit, l'enregistrement s'effectuant perpendiculairement à la paroi correspondante. Cette disposition reste la norme, bien que, lors de son lancement, un nombre limité de disques stéréo aient été réalisés avec une technologie combinant composante verticale et latérale, une approche rapidement abandonnée. Les pickups stéréo peuvent être utilisés pour lire aussi bien les disques mono sur stéréo, mais lire un disque stéréo avec un pick-up mono provoquera une sévère dégradation du sillon.

5.3.2 Sélection de la meilleure copie

5.3.2.1 Comme pour les supports mécaniques et autres formats obsolètes (voir Section 5.2.2 Sélection de la meilleure copie), la sélection est d'abord effectuée visuellement, pour la vitesse et pour éviter l'usure. Le personnel devra avoir une bonne connaissance des codes et des identifiants placés par les différentes compagnies tout au bord de l'étiquette. Ils peuvent révéler des versions alternatives plus tardives en matière de prises, remasterings ou de pressages. Lors de la sélection des meilleures copies pour conduire la numérisation, on tiendra compte des coopérations avec d'autres collections.

5.3.2.2 Les espaces de travail doivent bénéficier d'un éclairage parallèle indirect alors que la lumière produite par des tubes fluorescents fixés en hauteur peut masquer les phénomènes d'usure. La qualité de la lumière doit mettre clairement en évidence les zones qui relèvent d'une forte modulation de celles qui relèvent d'une usure. Si on dispose de 2 copies seulement présentant différentes caractéristiques d'usure, il conviendra de les retenir et de les transférer toutes deux.

5.3.3 Nettoyage et restauration des supports

5.3.3.1 Les disques microsillons devront être manipulés avec le plus grand soin, on fera en sorte de ne jamais toucher les sillons avec les doigts. La sueur et autres traces déposées par la peau peuvent produire du bruit par eux-mêmes, mais aussi, attirer et fixer les salissures à la surface du disque, provoquer le développement de moisissures et champignons avec pour conséquence l'augmentation du bruit lors de la lecture. Des gants de coton devront être portés lors de la manipulation des disques. Si l'utilisation de gants n'est pas pratique, les disques devront être retirés (et replacés) de leur pochette de telle manière que l'extrémité des doigts soit placée sur l'étiquette et la base du pouce sur le bord, laissant ainsi la plage libre de tout contact.     

5.3.3.2  La poussière, ennemie de tous les enregistrements sonores, est un problème majeur pour les disques microsillons, ceci pour 2 raisons : la finesse des sillons est telle que la dimension des particules sera du même ordre que celle de la pointe, ce qui provoquera des clics et des tocs. Le caractère électrostatique du vinyle augmente l'attraction de la poussière à la surface du disque. Divers dispositifs commerciaux ont été développés en vue de neutraliser les charges statiques, depuis les brosses à fibres de carbone jusqu'aux "pistolets" piézoélectriques qui "tirent" des charges neutralisantes sur la surface du disque avec un succès tout relatif.

5.3.3.3 La méthode de nettoyage des disques la plus efficace consiste à les laver. Des dispositifs, telle la machine Keith Monks bien connue, déposent un film de produit de nettoyage à la surface du disque, celui-ci sera ensuite éliminé avec les particules fixées dans le sillon à l'aide d'un dispositif d'aspiration se déplaçant sur toute la surface du disque. Une autre méthode consiste à laver le disque, évitant l'étiquette, avec de l'eau déminéralisée additionnée d'un détergent doux ou bien d'un agent mouillant non-ionique tel que le Cétrimide  (n-acétyl chloro pyridine) dilué (1 pour cent) qui possède en outre des propriétés anti fongiques et anti bactériennes. On peut alors brosser le disque à l'aide d'un pinceau à poils doux selon un mouvement circulaire, évitant toujours la zone de l'étiquette, puis rincer une nouvelle fois avec de l'eau distillée. Les dépôts de matière grasse sur les disques vinyles peuvent être éliminés avec de l'alcool isopropylique. Les disques non-vinyle pouvant être attaqués par l'alcool, des précautions devront être prises pour s'assurer que ce solvant ne risque pas de dégrader de tels disques.

5.3.3.4 Lorsque l'on ne dispose pas de leur composition chimique, les solutions de nettoyage ne seront pas utilisées. Toute décision d'utilisation de solvants ou autres produit de nettoyage devra être prise par le responsable des archives avec les conseils techniques avisés de restaurateurs ou de chimistes compétents dans le domaine des matériaux plastiques.

5.3.3.5 Comme pour les supports mécaniques et autres formats obsolètes (voir 5.2.3 Nettoyage et restauration des supports), le nettoyage aux ultra-sons peut montrer une certaine efficacité. Des précautions devront être prises quant à la sélection du solvant, sachant qu'une solution de Cétrimide à 1% dans l'eau distillée peut convenir. Tout contact de l'étiquette avec le liquide étant évité, le disque sera mis en rotation lente jusqu'à ce que l'ensemble de la surface gravée soit mouillée.

5.3.3.6 La méthode la plus efficace pour réduire les effets des salissures, poussières et charges statiques consiste peut-être en une lecture du disque humecté. Par application d'une solution de Cétrimide ou par le contact d'une brosse douce humide placée devant la pointe de lecture. La réduction de défauts tels les clics et les tocs peut bénéficier de manière spectaculaire de la lecture humide, toutefois, cette méthode a pour conséquence une augmentation du bruit de surface lors des lectures suivantes effectuées "à sec". La lecture des disques mouillés avec un liquide contenant de l'alcool n'est pas recommandée car le matériau plastique utilisé pour la tige cantilever porte-pointe peut réagir chimiquement avec celui-ci, ce qui peut engendrer des conséquences fâcheuses.

5.3.3.7 Les interventions de restauration de disques les plus fréquentes concernent la planéité de ceux-ci. L'approche suivante s'applique lorsque le disque est voilé. Un four à thermostat (une étuve de laboratoire convient contrairement à un four domestique qui sera évité) est nécessaire afin de porter à une température de 55°C maximum 2 plaques carrées de verre trempé, poli et très propre de 7 mm d'épaisseur et de 350 mm de côté. Après avoir effectué un nettoyage manuel et séché le disque, celui-ci est posé sur la plaque de verre inférieure préchauffée, la plaque supérieure reste suspendue dans l'étuve. Après 1/2 heure environ, le disque est examiné, il peut avoir retrouvé sa planéité. Dans le cas contraire, l'élasticité est contrôlée pour évaluer l'état de ramollissement et apprécier expérimentalement si l'application de la plaque de verre supérieure peut avoir l'effet escompté. Le sandwich constitué est alors laissé en place pendant 1/2 heure puis la plaque supérieure est soulevée en utilisant des gants. Si le disque est parfaitement plan, le sandwich est retiré de l'étuve, posé sur un support isolant et laissé refroidir. Si la planéité n'est pas satisfaisante, on répétera la procédure en augmentant la température par intervalle de 5°C. Il ne faudra jamais appliquer de force d'aplatissement sans avoir atteint le point de ramollissement.

5.3.3.8 Le processus de redressement de la planéité des disques est utile car il rend possible la lecture de disques qui ne l'étaient pas auparavant ; toutefois, des recherches en cours portant sur les procédures de récupération de la planéité des disques montrent qu'elles peuvent engendrer une augmentation mesurable de fréquences subsoniques, mais aussi dans le domaine des basses fréquences audibles (Enke 2007). Si ces recherches ne sont pas concluantes, ce risque doit tout de même être pris en compte lorsqu'on envisage de procéder à de telles opérations sur un disque. L'analyse des effets produits par la méthode de redressement de la planéité du disque a été effectuée pour les disques vinyles mais la gamme des tests pratiqués est insuffisante et des recherches supplémentaires doivent être conduites. Il convient de mettre en balance le risque de provoquer de tels dommages avec l'avantage de pouvoir lire le disque.

5.3.4 Les équipements de lecture

5.3.4.1 Des platines de lecture optique des disques microsillons sont disponibles, elles devront être étudiées avant de sélectionner un équipement de transfert. Cependant, les phonocapteurs par contact d'une pointe, d'usage courant, appréciés pour leur simplicité sont préférés par la plupart des techniciens. La chaîne de reproduction utilisant des transducteurs par contact comporte tant de variables que la répétabilité stricte d'un transfert est impossible. Le bras de la platine, la cellule, la pointe, la force de tracking, les déformations précédentes du sillon ou son état d'usure, tous ces éléments rendent les conditions de lecture très variables. Dans une certaine mesure, même la température peut modifier les caractéristiques de la combinaison cellule / pointe. Toutefois, lorsque la lecture de microsillons s'inscrit dans les opérations de numérisation, les éléments de haute qualité constituant la chaîne de lecture depuis la pointe jusqu'à l'équipement d'enregistrement assureront les meilleures conditions de capture du son.   

5.3.4.2 Les éléments les plus importants de la chaîne de lecture sont peut-être constitués par la combinaison cellule / pointe. Les cellules à bobine mobile, considérées par certains comme étant les plus sensibles, sont coûteuses et fragiles, ce qui exclut leur utilisation sauf pour un usage domestique mené avec le plus grand soin. Une bonne cellule ayant une compliance élevée, une faible force d'appui (inférieure à 15 mN, valeur généralement désignée 1,5 g), à réluctance variable (aimant mobile) équipée d'une pointe elliptique constitue le choix le plus pratique. La gamme des pointes de lecture devra s'étendre de 25 µm (1 mil), utilisée pour les premiers disques microsillon mono, jusqu'à 15 µm (0,6 mil), et inclure les formes coniques, elliptiques et tronquées afin d'être à même de lire des disques de différentes époques et de différents états.

5.3.4.3 Une attention particulière sera donnée quant au réglage de l'angle vertical d'appui (vertical tracking angle - VTA) du système de lecture qui devrait être identique, dans l'idéal, à celui correspondant aux conditions d'enregistrement. L'angle VTA de lecture recommandé dans les années 1960 était de 15±5°, valeur modifiée en 1972 pour atteindre 20±5°. Il est toutefois impossible de contrôler l'angle VTA d'un disque donnée (à moins d'utiliser un disque test qui permet l'évaluation de la distorsion d'intermodulation d'un signal vertical). A minima, cependant, on prendra soin de régler le bras en position horizontale, parallèle à la surface du disque lorsque la force d'appui appropriée est appliquée. Ce réglage permet de s'assurer de la conformité de l'angle VTA préconisé par le fabricant de la platine. Toute variation nécessaire de position pourra alors être réalisée par abaissement ou soulèvement du bras.
 
5.3.4.4 Un autre angle doit être ajusté, l'angle tangentiel (Tangential tracking angle - TTA). Lorsque l'on utilise un bras à déplacement tangentiel, il faut s'assurer que le système est monté de telle façon que la pointe suit strictement le trajet d'un rayon. Avec un bras pivotant conventionnel, un compromis doit être trouvé pour ajuster la position de la pointe (= longueur effective du bras) à l'aide d'un gabarit, généralement fourni par le fabricant d'équipement de précision.

5.3.4.5 On utilisera un préampli de haute qualité, de faible bruit doté d'une courbe de correction normalisée RIAA. Il permettra aussi d'effectuer des transferts plats sans aucune correction. Dans le cas de transferts d'enregistrements antérieurs à 1955, le préampli devra autoriser différentes égalisation présentées dans le tableau 2 section 5.3. Des représentations graphiques d'égalisation de microsillons d'avant 1955 peuvent être nécessaires. Des préamplificateurs multi-courbes ne sont pas facilement accessibles, il peut être préférable de modifier la sortie d'un préampli standard, ou bien d'appliquer l'égalisation souhaitée par des traitements numériques d'un transfert effectué sans correction (plat).

5.3.4.6 Afin de calibrer la chaîne de reproduction, l'utilisation d'un disque test dont les caractéristiques d'enregistrement correspondent au disque à transférer est essentielle afin d'effectuer un réglage correct de la balance spectrale d'un égaliseur graphique ou paramétrique. Un disque test RIAA de précision peut être utilisé pour calibrer la chaîne pour des disques dont l'égalisation ne suit pas la norme RIAA, si les caractéristiques de la courbe de lecture de celui-ci sont connues. Se procurer un disque test est une opération qui peut s'avérer difficile ; de plus, dans le cas où celui-ci serait disponible, toute marque d'usure ne permettrait pas d'obtenir une courbe de réponse suffisamment précise, particulièrement dans le domaine des fréquences les plus élevées.

5.3.4.7 Le vaste choix d'éléments constituant la chaîne de lecture, proposés dans les années 1960 et 1970 n'est plus possible. Bien que la situation ne soit pas aussi difficile que celle les équipements pour disques 78t, le choix est devenu beaucoup plus restreint aujourd'hui. Relativement peu concernés par les problèmes de dégradation et de détérioration, les contenus des disques microsillon peuvent être inaccessibles si le matériel de lecture adapté vient à manquer. En prévision de l'avenir à moyen terme, il est recommandé de constituer un stock important de pièces de rechange et de consommables ; en outre, il est important de souligner que la durée de vie des pointes et de leurs accessoires n'est pas infinie.

5.3.5 Vitesse

5.3.5.1 L'engagement des sociétés de production en vue de disposer d'une vitesse de rotation normalisée veut répondre au problème soulevé par les premiers enregistrements. Une platine munie d'un stroboscope et d'un variateur manuel de vitesse constitue l'équipement minimum répondant à une normalisation de la lecture des disques. L'utilisation d'un dispositif d'asservissement utilisant un oscillateur à cristal est préférable.

5.3.6 Egalisation en mode lecture

5.3.6.1 La nécessité d'effectuer une égalisation et la manière dont cette procédure s'est développée font l'objet d'une présentation au paragraphe 5.2.6. L'égalisation est également utilisée lors de l'enregistrement sur microsillon, elle a été initialement développée pour atténuer le niveau des fréquences inférieures à 500 Hz environ, valeur qui représente la transition basse-fréquence (BF) en-dessous de laquelle l'enregistrement s'effectue à amplitude constante. L'égalisation effectue également une augmentation du niveau des fréquences supérieures à 2 kHz. Entre 500 Hz et 2 kHz, l'enregistrement est effectué à vitesse constante (voir 5.2.6). L'égalisation pratiquée lors du processus d'enregistrement doit être compensée à la lecture. De nombreuses firmes ont leurs valeurs propres, légèrement variables ; ainsi, pour effectuer une reproduction précise, une égalisation rigoureuse doit être appliquée (voir tableau 1 Section 5.3 ci-dessous).

5.3.6.2 Les disques réalisés à partir de 1950 environ sont conformes à ce qui est aujourd'hui connu sous le nom de courbe RIAA (Recording Industry Association of America), devenue norme  très suivie dans le monde industriel. Les caractéristiques de la courbe de lecture RIAA sont définies par une diminution de niveau de 6 dB / octave de 20 kHz à 500 Hz, un plateau entre 500 Hz et 2,12 kHz (respectivement 318 µs et 75 µs), et une diminution des aigus de 6 dB / octave à partir de 2,12 kHz. Le niveau du plateau est situé à environ -19,3 dB.

5.3.6.3 Courbes d'égalisation de lecture
 

Courbes d'égalisation  par Nom LF Roll-off LF Turnover HF Roll-Turnover (-6 dB/octave, sauf marque) Roll-off @ 10 kHz
AES 50 Hz 400 Hz (375) 2500 Hz -12 dB
FFRR (1949) 40 Hz 250 Hz 3000 Hz* -5 dB
FFRR (1951)   300 Hz (250) 2120 Hz -14 dB
FFRR (1953) 100 Hz 450 Hz (500) 3180 Hz (5200) -11 dB (-8,5)
LP/COL 100 Hz 500 Hz7 1590 Hz -16 dB
NAB   500 Hz 1590 Hz -16 dB
Orthophonic (RCA) 50 Hz 500 Hz 3180 Hz (5200) -11 dB (-8,5)
629   629 Hz (750)    
RIAA 50 Hz 500 Hz8 2500 Hz -13.7 dB

Tableau 1 Section 5.3 Courbes d'égalisation présentées par nom

 

Tableau d'égalisation pour disques microsillon avant-1955 9 LF Roll-off LF Turnover HF Roll-off Turnover
(-6 dB/octave, sauf marque)
Roll-off @ 10 kHz
Audio Fidelity   500 Hz (NAB) 1590 Hz -16 dB
Capitol   400 Hz (AES) 2500 Hz -12 dB
Capitol-Cetra   400 Hz (AES) 2500 Hz -12 dB
Columbia   500 Hz (COL) 1590 Hz -16 dB
Decca   400 Hz (AES) 2500 -12 dB
Decca (avant 11/55) 100 Hz 500 Hz (COL) 1590 Hz (1600) -16 dB
Decca FFRR (1951) pent 3dB   300 Hz (250) 2120 Hz -14 dB
Decca FFRR (1953) pent 3dB   450 Hz (500) 2800 Hz -11 dB(-8,5)
Ducretet-Thomson   450 Hz (500) 2800 Hz -11 dB(-8,5)
EMS   375 Hz 2500 Hz -12 dB
Epic (avant 1954)   500 Hz (COL) 1590 Hz -16 dB
Esoteric   400 Hz (AES) 2500 Hz -12 dB
Folkways   500 Hz (COL) 1590 Hz -16 dB
HMV   500 Hz (COL) 1590 Hz -16 dB
London (jusque LL-846) 100 Hz 450 Hz (500) 2800 Hz -11 dB(-8,5)
London International 100 Hz 450 Hz (500) 2800 Hz -11 dB(-8,5)
Mercury (jusque 10/54)   400 Hz (AES) 2800 Hz -11 dB
MGM   500 Hz (NAB) 2800 Hz -11 dB
RCA Victor (jusque 8/52) 50 Hz 500 Hz (NAB) 2120 Hz -12 dB
Vox (jusque 1954)   500 Hz (COL) 1590 Hz -16 dB
Westminster (avant 1956)
ou
  500 Hz (NAB)
400 Hz (AES)
1590 Hz
2800 Hz
-16 dB
-11 dB

Tableau 2 Section 5.3 Tableau d'égalisation des disques microsillons avant 1955


7. NAB modifiée : moins de basses en dessous de 150 Hz, nécessite un gain de 3 dB environ.

8. RIAA et NAB sont très similaires

9.Cette information provient de plusieurs sources : le tableau "Dial Your Discs" paru dans le magazine High Fidelity au début des années 1950, la compilation de R. Powell présentée sous forme de tableau, publiée dans la revue de l'ARSC, des pochettes de différents disques microsillons de la première époque. "Turnover" (col.3) est la fréquence en dessous de laquelle le niveau des basses est diminué pendant les opérations de mastering, ce qui nécessite une augmentation du niveau correspondant pendant le processus de lecture. Dans le tableau, la fréquence de turnover est accompagnée du nom de la courbe de gravure, indication fournie par la plupart des préamplis les plus anciens ; une liste de ces courbes et de leurs fréquences de turnover sont données en fin de tableau. "Roll-off" (col. 5) représente le niveau de réduction des fréquences aigües, à 10 kHz, que l'on doit exercer pendant la lecture afin de compenser la préaccentuation appliquée lors du mastering. Dans le tableau, la réduction est exprimée en dB.

5.4 Reproduction des bandes magnétiques analogiques

5.4.1 Introduction

5.4.1.1 Les technologies d'enregistrement magnétique ont accompagné chaque phase de développement de l'industrie phonographique qui, devenue populaire après la seconde guerre mondiale, allait connaître la production de masse. Les progrès technologiques firent de la bande  le premier format d'enregistrement des studios professionnels ; et les développements industriels rendirent la bande en bobine libre accessible au marché grand public. Le lancement de la Minicassette Philips en 1963 mit un outil d’enregistrement dans les mains de nombreuses personnes et il devint possible et facile à chacun d'enregistrer tout ce qui lui semblait important. Pratiquement toutes les archives sonores et bibliothèques comprennent des enregistrements sur bandes magnétiques analogiques, et PRESTO (Wright et Williams 2001) estime que les collections à travers le monde représentent quelques 100 millions d'heures d'enregistrement sur bandes analogiques, estimation que ne contredit pas l'enquête de l'IASA  sur les supports en péril (Boston, 2003). Depuis les années 1970, les responsables d'archives sonores recommandent la bande 1/4 pouce comme support d’archivage privilégié et, en dépit de leur bruit de fond caractéristique  et de l’imminence de leur dégradation chimique, certains les considèrent aujourd'hui comme un support stable. Cependant, l'arrêt programmé/imminent de la production industrielle des bandes analogiques et de leurs systèmes de lecture exige de prendre immédiatement les mesures  nécessaires au transfert de ces vastes fonds d’histoire culturelle sur un système de gestion plus viable.

5.4.1.2 Les premières bandes magnétiques ont été produites et commercialisées en Allemagne en 1935, mais c'est le marché américain qui en a assuré la popularité et la normalisation de son format après 1947. Les premières bandes ont été réalisées avec un substrat d'acétate de cellulose, procédé qui a perduré jusqu'à l'introduction du polyester (polyéthylène téréphtalate PET, commercialisé sous le nom de Mylar). Les fabricants ont produit à la fois des bandes acétate et PET comportant un liant acétate, progressivement remplacé par un liant généralement en polyester uréthane à partir de la fin des années 1960. Le fabricant BASF  a produit des bandes en PVC  du milieu des années 1940 jusqu'en 1972, tout en introduisant sa propre gamme de polyester à partir de la fin des années 1950. Si le PVC fut initialement le domaine réservé de la société allemande BASF,  3M a aussi produit des bandes PVC à partir de 1960 environ ; Scotch 311. Rares sont les bandes à support papier, elles datent de la fin des années 1940 au début des années 1950. Les bandes en cassettes ont toujours été réalisées avec du polyester. En 1939, le pigment magnétique utilisé est constitué de ϒFe2O3 appelé oxyde le plus souvent, et même si des évolutions ont été apportées notamment dans la dimension des particules, leur forme, leur dopage, améliorant ainsi les performances des bandes, réduisant le bruit, cette formulation est restée pratiquement inchangée pour toutes les bandes et les cassettes de type I. Les cassettes de type II comportent des particules CrO2 ou bien Fe3O4 dopé cobalt, celles de type III (que l'on rencontre rarement) sont constituées d'une double couche ϒFe2O3 et CrO2, le type IV enfin correspond à des pigments de métal (fer pur).

5.4.1.3 Le liant, c'est-à-dire L'ensemble des constituants qui assurent la liaison des particules magnétiques avec le substrat, est souvent identifié comme l'élément de la bande qui se montre être le plus susceptible de dégradation chimique. Cela est particulièrement vrai pour les bandes à liant polyester uréthane dont le substrat est le plus souvent en PET depuis les années 1970, même si AGFA et BASF, puis Emtec qui leur succèdera utilisent un liant à base de PVC pour la fabrication de nombreuses bandes destinées aux studios d'enregistrement et stations de radiodiffusion, notamment la 468.

5.4.2 Sélection de la meilleure copie

5.4.2.1 Généralement, les supports enregistrables tels que les bandes magnétiques ne donnent pas lieu à des copies multiples pour une génération donnée. A l'exception de la cassette, le son enregistré sur les bandes audio n'a été que rarement dupliqué, aussi les responsables d'archives sonores doivent-ils faire des choix parmi les générations. En règle générale,  il conviendrait de sélectionner en guise de meilleure version, la toute première copie - originale - en vue de constituer l'exemplaire de conservation. Seulement, la bande originale peut avoir subi des dégradations physiques ou chimiques, telle que l'hydrolyse, aussi une bande dupliquée dans les règles de l'art avant une telle dégradation peut-elle être préférable. Une bande montre rarement des signes visibles de détérioration ou de dommages aussi, lorsque des copies multiples d'un item existent, la meilleure approche consiste à dérouler soigneusement la bobine puis à l'écouter pour identifier la meilleure version.

5.4.2.2 Il convient également de prendre les décisions qui assureront la sélection de la copie la plus appropriée, la plus complète. Question primordiale lorsque les bandes sont issues d'un processus de production séquentiel tel que le mastering audio, ou bien dans le cas de la production du son d'un film cinématographique ou d'une vidéo.

5.4.3 Nettoyage et restauration du support

5.4.3.1 Nettoyage de la bande : les bandes sales ou contaminées devraient être débarrassées de toute poussière ou particules à l'aide d'une brosse souple et d'une légère aspiration avant enroulement. Les bobines déformées peuvent endommager sérieusement les bandes, surtout lorsque le mode d'enroulement rapide est enclenché, ces bobines devront donc être remplacées avant toute nouvelle action. La bande devrait être soigneusement enroulée en la guidant correctement pour la préserver de tout dommage. Si nécessaire, elle pourra ensuite être enroulée sur une machine de nettoyage équipée d'un chiffon doux ou d'un tissu qui ne peluche pas. Pratique qui peut être bénéfique seulement après traitement  de l'hydrolyse (voir ci-dessous). Sur certaines machines de nettoyage ou de restauration, la surface de la bande passe sur un biseau ou une lame afin d'en débarrasser l'oxyde. De telles machines, développées pour le recyclage de bandes enregistrées, ne sont pas recommandées pour l'archivage. Une attention toute particulière devrait être accordée aux cassettes encrassées que des machines réputées, à double cabestan, peuvent endommager pendant leur lecture. Si la tension de bande n'est pas correctement contrôlée, une boucle peut se former entre les cabestans.

5.4.3.2 Collants et amorces : de nombreuses bandes comportent des collants suite aux opérations d'éditing, ou de mise en place d'amorces. Ces collants peuvent créer des défaillances quand ils deviennent secs, ou bien lorsque la couche adhésive s'écoule. Les premiers peuvent être remplacés. Mais l'écoulement pose un problème plus sérieux. La colle peut s'étendre aux couches adjacentes et favoriser la dissolution du liant de celles-ci. Elle peut aussi provoquer l'adhésion des spires entre elles et ainsi accroître les fluctuations de vitesse. L'adhésif résiduel ancien peut-être retiré en utilisant un solvant qui ne dégrade pas le liant. Le mazout léger hautement purifié peut constituer un solvant convenable, il sera appliqué avec un coton-tige ou un tissu qui ne peluche pas. Il est conseillé d'appliquer la quantité juste nécessaire, pas plus que celle d'un coton-tige.  Comme pour tous les solvants, un test doit être préalablement effectué avec une petite quantité de produit sur une partie non utilisée de la bande. La bande traitée doit être laissée déroulée pendant quelques minutes pour parfaire les conditions d'évaporation. L'évaporation peut être accélérée par un courant d'air. Il est parfois nécessaire de remplacer ou d'ajouter une bande amorce pour être en mesure de lire la bande dans sa totalité.
 
5.4.3.3 L'hydrolyse (Sticky Shed Syndrome) : Lors de leur relecture, de nombreuses bandes réalisées à partir des années 1970 présentent des effets de dégradation du liant. Le phénomène qui rend la bande collante, souvent décrit par l'expression "sticky shed syndrome", résulte principalement d'une réaction chimique d'hydrolyse 10. Il se manifeste par des dépôts poisseux marron ou d'aspect laiteux sur les têtes et les guides fixes qui s'accompagnent de crissements et, plus généralement, d'une baisse de la qualité audio.

5.4.3.4 Les traitements suivants présentent quelques approches de réduction de la dégradation du liant :
    
5.4.3.4.1 Température ambiante et faible humidité ; L'hydrolyse implique le fractionnement d'une liaison chimique par introduction d'eau. Si une recombinaison irréversible n'a pas été provoquée par la suite, les réactions hydrolytiques seront réversibles par un simple processus d'élimination de l'eau. Ceci peut être réalisé en plaçant les bandes dans une enceinte approchant une humidité relative de 0% (HR) pendant de longues durées, atteignant plusieurs semaines. Une légère augmentation de la température peut accélérer la réaction. Les tests ont montré qu'un tel traitement, pourtant efficace dans certains cas, ne permettait pas de remédier entièrement à toutes les formes de dégradations d'une bande (Bradley 1995).

5.4.3.4.2 Rembobinage à chaud. Parfois, dans le cas de bandes sévèrement dégradées, les spires adhèrent entre elles ; un bobinage incontrôlé peut provoquer des détériorations. Dans ce cas, si l'étuvage ne peut être pratiqué, il peut être possible d'appliquer de l'air chaud directement sur la bande, sur la zone où se sont produit des collages. Et ensuite de commencer l'opération de débobinage à une vitesse contrôlée de 10-50 mm par minute. 
    
5.4.3.4.3 Température élevée, faible humidité : Une approche fréquemment adoptée dans le traitement de bandes ayant subi l'hydrolyse consiste à chauffer la bande dans une enceinte climatique portée à 50°C et 0%HR pendant 8-12 heures environ. La température de 50°C est probablement égale ou supérieure à la température de transition vitreuse 11 du liant de la bande, mais sur le long terme, les modifications qu'une telle opération peut apporter sur les caractéristiques physiques de la bande revenue aux conditions ambiantes sont incertaines. Toutefois, à court terme, ce traitement peut avoir des effets électroacoustiques favorables en procurant à la bande les conditions initiales de lecture. Les bandes devront être réenroulées plusieurs fois pour réduire les effets d'empreinte provoqués par l'élévation de température (voir 5.4.1.3.3).
    
5.4.3.4.4 Cette dernière procédure, qui offre une chance de réussite élevée, ne doit pas être menée à l'aide d'un four domestique. Ceux-ci ne disposent pas d'un contrôle de température suffisant, aussi peut-on dépasser les limites de sécurité. En outre, le régulateur thermostatique de tels fours oscille de part et d'autre de la température affichée, ce qui peut porter préjudice à la bande. Un four à micro-ondes ne devra jamais être utilisé car certaines zones localisées de la bande qui peuvent être portées à très haute température seront dégradées et ainsi leurs caractéristiques magnétiques. Il est préférable d'utiliser une étuve de laboratoire ou tout autre dispositif produisant une température basse stable. Des températures plus élevées ne devront jamais être utilisées car elles engendreraient des déformations de la bande.

5.4.3.5 L'exposition de bandes à des températures élevées et contrôlées, selon la procédure décrite ci-dessus, ne doit être entreprise qu'en cas d'absolue nécessité et pratiquée avec de grandes précautions.  

5.4.3.6 La restauration peut n'être que temporaire, le temps de lire les bandes pour les transférer. Un témoignage rapporte que le nombre de bandes hydrolysées nécessitant des traitements plus longs est en augmentation.


10. Hydrolyse : décomposition chimique produite par apport d'eau ; ou bien réaction chimique dans laquelle l'eau réagit avec l'un des composés pour produire d'autres composés.
11. Température de transition vitreuse : Température à laquelle le matériau adhésif perd sa souplesse, devient dur, rigide, comme du verre.

5.4.4 Equipement de lecture : machines à bande professionnelles

5.4.4.1 Durant des décennies, l'enregistrement et l'archivage audio se sont appuyés de manière fondamentale sur les bandes magnétiques en bobine libre, aussi l'arrêt programmé de fabrication des enregistreurs / lecteurs provoque-t-il une crise majeure au sein de la communauté archivistique du son. De rares magnétophones à bande sont encore disponibles tel Otari qui continue la fabrication d'une seule machine qui peut être qualifiée de modèle milieu de gamme de 3ème génération en comparaison de leur première gamme, et Nagra Kudelski, qui inscrit encore à son catalogue deux magnétophones analogiques portables 12.  Toutes les machines ne répondent pas aux spécifications de lecture requises (voir ci-dessous), aussi les responsables d'archives doivent-ils en vérifier les caractéristiques avant de procéder à un achat. Une autre solution consistera à se procurer du matériel d'occasion et à le remettre en état en mettant à profit l'importance du marché des magnétophones à bobines libres haut de gamme. On recommande que seules les machines les plus répandues soient retenues afin de faciliter l'acquisition de pièces détachées et les opérations de maintenance. Les caractéristiques d'une machine à bande adaptée aux services d'archives comprennent les éléments suivants :

5.4.4.2 Vitesse de lecture des bandes à bobine libre : Les vitesses normalisées sont les suivantes : 30 ips (76,2 cm/s), 15 ips (38,1 cm/s), 7½ ips (19,05 cm/s), 3¾ ips (9,525 cm/s), 17/8 ips (4,76 cm/s), et 15/16 ips (2,38 cm/s). La nécessité de disposer de ces différentes vitesses dépendra de la composition de chaque collection. Aucune machine ne fonctionne pour les 6 vitesses, mais il est possible de les couvrir toutes avec deux machines.

5.4.4.3  Les équipements d'enregistrement sur bande 1/4 pouce mono et stéréo se présentent selon 3 configurations de pistes ; pleine piste, 1/2 piste et 1/4 de piste. Des variations peuvent se produire entre la largeur de piste rencontrée et la largeur normalisée. Une bande lue à l'aide d'une tête dont la largeur est inférieure à celle de la piste effectivement enregistrée présentera une altération des basses fréquences par le phénomène connu d'effet de bord, qui réduit le rapport signal sur bruit par rapport à sa valeur nominale. Ainsi, une piste enregistrée de 2,775 mm de largeur lue avec une tête stéréo de 2 mm produira une perte de rapport signal sur bruit de 2 dB environ. L'effet de bord atteint +1 dB environ à 63 Hz à 19,05 cm/s (7½ ips) (McKnight 2001). Une bande lue à l'aide d'une tête plus large que la piste effectivement enregistrée présentera un rapport signal sur bruit légèrement affaibli ; il peut se produire un sifflement ou un signal depuis les pistes adjacentes. "Passer de 1,9 mm à 2,1 mm correspond à une augmentation de niveau de 1 dB pour ces largeurs de tête ; et lorsqu'on passe de 1,9 mm à 2,8 mm, cela correspondant  à une augmentation de 3,3 dB pour de telles largeurs." (McKnight 2001). En pratique, ces compromis sont souvent acceptables pour des petites variations de largeur de piste qui ne produisent pas de signal indésirable (on notera que les zones de la bande préalablement effacées et non enregistrées peuvent générer des niveaux de bruit plus importants). Si certaines machines peuvent comporter des têtes de lecture 1/2 piste et 1/4 piste, il peut-être nécessaire de disposer de plusieurs machines pour répondre à ces standards.

full track head configuration

  A B
IEC1 94-1
(avant1985)
6,3 mm,
(0,248 pouce)
6,3 mm,
(0,248 pouce)
NAB 1965 6,3 mm,
(0,248 pouce)
6,05 mm
(0,238 pouce)
IEC 94-6
1985
6,3 mm
(0,248 pouce)
5,9 mm
(0,232 pouce)

Fig.1, paragraphe 5.4 configuration et dimensions d'une tête pleine piste


two track and half track head configurationtwo track and half track head configuration

  A Largeur maximum enregistrée13 B C
Ampex 6,3 mm,
(0,248 pouce)
6,05 mm
(0,238 pouce)
1,9 mm
(0,075 pouce)
2,14 mm
(0,084 pouce)
IEC 94-6
1985 2 pistes
6,3 mm,
(0,248 pouce)
5,9 mm
(0,232 pouce)
1,95 mm
(0,077 pouce)
2,00 mm
(0,079 pouce)
IEC home stereo (avant 1985) 6,3 mm,
(0,248 pouce)
6,3 mm,
(0,248 pouce)
2,0 mm
(0,079 pouce)
2,25 mm
(0,089 pouce)
NAB 1965 6,3 mm,
(0,248 pouce)
6,05 mm
(0,238 pouce)
2,1 mm
(0,082 pouce)
1,85 mm
(0,073 pouce)
IEC-1 Time code
DIN mono demi-piste
6,3 mm,
(0,248 pouce)
6,3 mm,
(0,248 pouce)
2,3 mm
(0,091 pouce)
1,65 mm
(0,065 pouce)
IEC 94-6
1985 Stéréo
6,3 mm,
(0,248 pouce)
5,9 mm
(0,232 pouce)
2,58 mm
(0,102 pouce)
0,75 mm
(0,03 pouce)
IEC-1 Stéréo (pre 1985)
Mono demi-piste
6,3 mm,
(0,248 pouce)
6,3 mm,
(0,248 pouce)
2,775 mm
(0,108 pouce)
0,75 mm
(0,03 pouce)
IEC
½ pouce
12,6 mm
(0,496 pouce)
  5,0 mm
(0,197 pouce)
2,5 mm
(0,098 pouce)

Fig. 2 paragraphe 5.4 configuration et dimensions de têtes deux pistes et demi piste.


quarter track head configuration

  A B C
IEC1
NAB
6,3 mm,
(0,248 pouce)
1 mm
(0,039 pouce)
0,75 mm
(0,029 pouce)

Fig.3 paragraphe 5.4 configuration et dimensions d'une tête quart de piste.


Stereo Cassette head configuration

  A B C
IEC
Philips
3,81 mm,
(0,15 pouce)
0,6 mm
(0,02 pouce)
0,3 mm
(0,012 pouce)

Fig.4 paragraphe 5.4 configuration et dimensions d'une tête Cassette stéréo.

 


Mono Cassette head configuration

  A B
ANSI
Philips
3,81 mm,
(0,15 pouce)
1,5 mm
(0,06 pouce)

Fig.5 paragraphe 5.4 configuration et dimensions d'une tête Cassette mono.

 

5.4.4.4 Les spécifications des dimensions normalisées des têtes sont différentes en Europe et aux Etats-Unis. Au commencement, la Commission électrotechnique internationale (CEI), référence des fabricants européens, décrivait la bande à partir de l'axe central et la distance inter pistes, tandis que les normes américaines décrivaient la largeur des pistes en partant d'un bord. La largeur de la bande elle-même a changé au cours du temps, d'un quart de pouce à l'origine elle est passée à 6,25 mm ± 0,05 mm (0,246 ± 0.002 pouce) puis à 6,3 mm ± 0,05 mm (0,248 ± 0.002 pouce). La CEI définit la largeur d'enregistrement pleine piste de la manière suivante "Piste unique sur toute la largeur de la bande". (CEI 94 1968 : II), tandis que les normes américaines définissent une largeur de la piste enregistrée légèrement inférieure à celle de la bande de 0.246 pouce, soit 0.238 pouce avec une tolérance de +0.010 -0.004 pouce (solution pragmatique au problème d'usure des têtes dont la "rainure" agrandit la taille de toutes les pistes). La CEI a modifié la dimension de la largeur pleine piste pour la porter à 5,9 mm (0.232 pouce). La pluralité des largeurs de pistes présentées dans les fig. 1 à 5 témoigne d'une normalisation très relative. (Eargle 1995, Benson 1988, CEI 94-1 1968, 1981, CEI 94-6 1985, NAB 1965, McKnight 2011, Hess 2001).

5.4.4.5  Les effets produits par la lecture effectuée avec des têtes inadaptées sont discutés au paragraphe 5.4.4.3 ci-dessus. Il est important de tenter l'évaluation de la largeur de tête avec laquelle les bandes originales ont été enregistrées afin d'être en mesure de lire celles-ci avec la machine disponible la plus appropriée. Les bandes 1/2" et 1" deux pistes sont généralement enregistrées en configuration 1/2 piste à l'aide d'équipements professionnels afin d'obtenir une très bonne qualité audio analogique. Le même type d'équipement normalisé est exigé pour la lecture, ainsi qu'une grande attention pour les normes d'enregistrement / lecture dans leur détail.

5.4.4.6 Pour assurer toute la précision de lecture des bandes d'enregistrements multipistes, depuis la bande 1/4 pouce standard jusqu'à la bande 2 pouces professionnelle, on apportera tout le soin nécessaire aux opérations. Si le time code a été enregistré à part, il devra être extrait et encodé dans l'enregistrement de telle manière qu'il puisse être utilisé ultérieurement pour la synchronisation (voir 2.8 pour les formats de fichiers).

5.4.4.7 Les magnétophones devront être capable de lire des signaux avec une réponse  fréquentielle qui s'étend de 30 Hz à 10 kHz ± 1 dB, et de 10 kHz à 20 kHz + 1, -2 dB.

5.4.4.8 L'égalisation d'une machine de lecture à bande devra pouvoir être réglée sur des standards NAB ou CEI, avec la possibilité de commuter de l'une à l'autre sans devoir effectuer de réalignement.

5.4.4.9 Les fluctuations de pleurage et de scintillement non pondérées sont inférieures à 0,05% à 38,1cm/s, 0,08% à 19,05 cm/s avec un écart moyen relatif à la vitesse absolue inférieur à 0,1%.

5.4.4.10 Une machine professionnelle d'archivage devra également bénéficier d'un mécanisme de défilement délicat afin de ne pas risquer d'endommager la bande pendant les opérations de lecture. Le succès des opérations effectuées sur nombre de machines professionnelles de première génération ou un peu plus tardive dépendait des caractéristiques de robustesse des bandes de l'époque. De telles machines peuvent endommager les bandes les plus anciennes, les bandes longue durée, ou bien encore les bandes minces utilisées pour des enregistrements sur le terrain.


12. Nagra ne commercialise plus d'enregistreur à bande.

13. Largeur enregistrée maximale prenant en référence la largeur mesurée à partir du bord extérieur des pistes (voir paragraphe 5.4.4.4)

5.4.5 Equipement de lecture : appareils à cassette professionnels

5.4.5.1 Les lecteurs de cassette professionnels ne sont plus disponibles. Dans un marché d'occasion de ce type d'appareil, réduit par rapport à celui des machines à bande, la difficulté est grande de trouver des équipements appropriés. Ceci représente un problème critique pour de nombreux services d'archives sonores dont les collections comportent une quantité considérable de cassettes enregistrées. La recherche, l'acquisition de lecteurs de cassettes devraient être des actions prioritaires pour toute collection comprenant des cassettes. Les différences qui distinguent les machines professionnelles des machines grand public, en dehors des spécifications de lecture, portent sur la solidité mécanique, la possibilité d'ajuster les caractéristiques de lecture, l'azimut et la balance des sorties audio. De nombreuses machines de haute qualité pour audiophiles comportent certaines des caractéristiques mentionnées ci-dessus. Les lecteurs de cassettes adaptés aux archives comportent :

5.4.5.2 Une vitesse de lecture de 4,76 cm/s (1 7/8 ips) (on notera que les vitesses de 15/16 ips et 3 ¾ ips  peuvent aussi être utilisées pour lire des cassettes spéciales).

5.4.5.3 Une fluctuation de vitesse meilleure que 0,3%. Un pleurage et scintillement pondérés inférieurs à 0,1%.

5.4.5.4  Une réponse fréquentielle de 30 Hz à 20 kHz +2, -3 dB.

5.4.5.5 La possibilité de lire les cassettes de type I, II et IV (si nécessaire).

5.4.5.6 En mode lecture, la plupart des magnétocassettes permettent la sélection automatique de l'égalisation grâce aux trous ou encoches pratiquées au dos du boîtier qui déterminent le type de bande. Certains lecteurs ne peuvent reconnaître les encoches mais disposent d'un commutateur que l'opérateur peut utiliser  pour sélectionner l'égalisation correcte. Les bandes de type III peuvent poser un problème lorsqu'elles sont insérées dans des cassettes de type I alors qu'elles doivent être lues avec une courbe d'égalisation correspondant au type II. Lorsqu'aucune option correspondant au type III n'est présente sur l'appareil de lecture, il peut être nécessaire d'utiliser une console permettant d'ajuster la bonne égalisation ou bien de transférer la bande dans un boîtier de type II. (Voir section 5.4.12.5 Boîtiers).

5.4.6 Maintenance

5.4.6.1 Tous les équipements nécessitent une maintenance régulière pour rester en bon état de fonctionnement. Mais, étant donné la fin de production des équipements analogiques de lecture, il est nécessaire de planifier l'acquisition de pièces de rechange car les fabricants maintiendront la production de celles-ci seulement pour une durée limitée, voire très limitée.

5.4.7 Alignement (égalisation)

5.4.7.1 Les équipements analogiques nécessitent un alignement régulier afin d'assurer, dans la continuité, un fonctionnement respectant les spécifications. On recommande que les têtes et le chemin de défilement soient minutieusement nettoyés toutes les 4 heures, plus fréquemment lorsque cela est nécessaire, appliquant sur toutes les pièces métalliques un liquide adapté tel que l'alcool isopropylique. Les galets presseurs en caoutchouc devront être nettoyés à l'aide de cotons-tiges secs ou, si nécessaire, humectés avec de l'eau. Les galets presseurs en caoutchouc d'origine ou très anciens peuvent progressivement devenir friables s'ils sont nettoyés avec de l'alcool, ce qui augmente les phénomènes de pleurage et de scintillement. Les galets presseurs de nouvelle génération, en polyuréthane de couleur vert foncé généralement, peuvent se dissoudre lors des opérations de nettoyage à l'alcool. Les têtes et le chemin de défilement de la bande doivent être démagnétisés toutes les 8 heures de fonctionnement, l'alignement du chemin de défilement et des mécanismes de lecture devront être vérifiés toutes les 30 heures, l'équipement devra faire l'objet, quant à lui, d'un alignement total et d'un contrôle tous les 6 mois.

5.4.7.2 Alors que les machines et les bandes sont en fin de production, il devient difficile de se procurer les bandes tests, impossible même pour certaines d'entre-elles. Il incombe à l'archiviste de faire l'acquisition d'une quantité suffisante de bandes test en bobine libre et en cassette pour assurer le transfert de leur collection.

5.4.8 Vitesse

5.4.8.1 Même si les corrections de vitesse sont possibles aussi dans un environnement numérique, il vaut mieux éviter de telles corrections numériques et choisir soigneusement la vitesse de lecture lors du premier processus de transfert, en documentant la vitesse choisie et la justification. Il est très probable que la vitesse des magnétophones soit incorrecte à cause de l'alignement défectueux ou médiocre ou bien, dans certains cas, en raison de l'instabilité de l'alimentation électrique. En conséquence, aucune vitesse ne devra être prise pour acquise.

5.4.9 Machines sans cabestan et vitesses non linéaires

5.4.9.1 Quelques machines de première génération, conçues sans cabestan ni galets presseurs de contrôle, présentent, dans ce cas, une vitesse régulièrement croissante. Si de telles bandes sont lues sur une machine standard à vitesse constante, le diapason du signal résultant va décroître pendant toute la durée de la lecture. Pour lire correctement la bande, la vitesse doit pouvoir être modifiée de la même manière que celle de l'enregistrement. Des magnétophones parmi les plus récents, tels que ceux fabriqués par Nagra ou Lyrec, intègrent une commande externe de la tension électrique qui permet à l'opérateur de piloter les variations de vitesse correspondant aux conditions originales de défilement. Certaines machines de dernière génération, tel que la série A800 de Studer, comportent un microprocesseur autorisant la programmation du contrôle de la vitesse, d'autres, telles que Lyrec Frida permettent le contrôle de la vitesse grâce à un environnement MIDI. Toutefois, il faudra se méfier de l'hypothèse selon laquelle la vitesse augmente de manière linéaire. En ce qui concerne les premières machines dépourvues de cabestan, réalisées à prix avantageux, la vitesse variait en fonction du degré de remplissage de la bobine. L'augmentation de la vitesse est souvent moins importante en début ou en fin de bande lorsque l'une ou l'autre des bobines se remplit, aussi la représentation graphique de la vitesse de lecture en fonction du temps est-elle loin d'être linéaire.

5.4.10 Egalisation de lecture

5.4.10.1 Dans la plupart des formats audio analogiques, la représentation fréquentielle de la réponse du signal est délibérément non linéaire. Une lecture correcte exige une égalisation appropriée de la réponse fréquentielle.

5.4.10.2 Les normes d'égalisation de lecture des bandes magnétiques analogiques les plus courantes sont présentées ci-dessous (Tableau I paragraphe 5.4). On notera que les courbes d'égalisation ont évoluées au cours du temps. Les normes utilisées actuellement sont précisées dans le tableau, avec leur date de lancement. Les enregistrements antérieurs devront être lus en appliquant les normes historiques respectives ; des circuits additionnels simples peuvent être utilisés à cette fin. On tiendra compte du chevauchement des normes anciennes et nouvelles lorsque des décisions doivent être prises pour les bandes enregistrées pendant les périodes de transition. Auparavant, de nombreux standards existaient.  
 

30 ips, 76 cm/s CEI2
AES
(1981) standard actuel 17,5 μs
30 ips, 76 cm/s CCIR
CEI1
DIN
(1953–1966)
(1968)
(1962)
35 μs
15 ips. 38 cm/s CEI1
CCIR
DIN
BS
(1968) standard actuel
(1953)
(1962)
35 μs
15 ips. 38 cm/s NAB
EIA
(1953) standard actuel
1963
3180 μs 50 μs
7½ ips, 19 cm/s CEI1
DIN(studio)
CCIR
(1968) standard actuel
1965
1966
70 μs
7½ ips, 19 cm/s CEI2
NAB
DIN(domestique)
EIA
RIAA
(1965) standard actuel
(1966)
(1963)
(1968)
3180 μs 50 μs
7½ ips, 19 cm/s Ampex (domestique)
EIA (proposed)
(1967) 50 μs
7½ ips, 19 cm/s CCIR
IEC
DIN
BS
(Jusqu'en 1966)
(Jusqu'en 1968)
(Jusqu'en 1965)
100 μs
3¾ ips 9.5 cm/s CEI2
NAB
RIAA
(1968) standard actuel
(1965)
(1968)
3180 μs 90 μs
3¾ ips 9.5 cm/s DIN (1962) 3180 μs 120 μs
3¾ ips 9.5 cm/s DIN (1955–1961) 200 μs
3¾ ips 9.5 cm/s Ampex (domestique)
EIA (proposé)
(1967) 100 μs
3¾ ips 9.5 cm/s IEC (1962–1968) 3180 μs 140 μs
3¾ ips 9.5 cm/s Ampex (1953–1958) 3180 μs 200 μs
17/8 ips 4.75 cm/s IEC
DIN
(1971) standard actuel
(1971)
3180 μs 120 μs
17/8 ips 4.75 cm/s IEC
DIN
RIAA
(1968–1971)
(1966–1971)
(1968)
1590 μs 120 μs
17/8 ips 4.75 cm/s
cassette
CEI Type I 1974 standard actuel 3180 μs 120 μs
17/8 ips 4.75 cm/s
cassette
DIN Type I (1968–1974) 1590 μs 120 μs
17/8 ips 4.75 cm/s
cassette
Type II et IV (1970) standard actuel 3180 μs 70 μs
15/16 ips 2.38 cm/s non défini      

          
Tableau I Paragraphe 5.4 Normes d'égalisation courante de lecture de bandes audio analogiques 14

5.4.10.3 Aux vitesses 38 cm/s et 19 cm/s, le choix d'égalisation de lecture des bandes en bobine libre doit être fait, y compris celles enregistrées plus récemment selon les normes en vigueur. Pour ces deux vitesses, les plus pratiquées, il faut prendre soin de choisir correctement l'égalisation de lecture afin de s'assurer qu'elle correspond bien à celle d'enregistrement. Outre les normes mentionnées dans le tableau I paragraphe 5.4, d'autres normes plus courantes, peu nombreuses, sont proposées afin  d'améliorer les performances, mais elles s'écartent des normes largement acceptées. Pour la vitesse 38 cm/s, les magnétophones Nagra disposent d'une option d'égalisation spéciale dénommée NagraMaster. La version américaine de NagraMaster a des constantes de temps de 3150 et 13,5 µs, la version européenne quant à elle correspond à des constantes de temps de l'infini (∞) et de 13 µs. Ampex utilise l'égalisation "Ampex Master Equalization" (AME), également pour la vitesse 38 cm/s, mais, officiellement, seulement pour des bandes 1/2 pouce sur des machines de mastering lancées en 1958 et commercialisées pendant les années suivantes (MRL 2001). Des enregistreurs de communication et certains appareils portables grand public semi-professionnels pouvaient opérer à la très faible vitesse de 2,38 cm/s (15/16 ips). Toutefois, aucune norme d'échange n'a été définie pour ce type de bandes aussi chaque égalisation devrait-elle répondre aux conventions propriétaires.


14. Note, CEI se réfère à la norme CEI 60094-1 4ème édition, 1981, NAB à la norme NAB des bandes en bobines libres 1965 (CEI 2), ou la norme des cassettes, 1973. DIN se réfère à DIN 45 513-3 ou 45 513-4, AES à AES-1971 et BS à British Standard BS 1568. Nos remerciements à Friedrich Engel, Richard L. Hess et Jay McKnight pour leur générosité en ayant fourni les informations sur l'égalisation des bandes.

5.4.11 Réduction de bruit

5.4.11.1 Le signal enregistré sur une bande peut être encodé de manière à masquer le bruit propre au support. Un procédé connu sous le nom de réduction de bruit. Si la bande a été encodée pendant l'enregistrement, elle doit être décodée en utilisant le même type de décodage correctement aligné. Les systèmes de réduction de bruit les plus utilisés comprennent les modèles suivants : Dolby A et Dolby SR (professionnels), Dolby B et Dolby C (grand public), dbx type I (professionnel) et II (grand public) bien que peu utilisé, et TelCom.

5.4.11.2 Pour optimiser un système de réduction de bruit, l'alignement des caractéristiques d'enregistrement et de lecture d'un magnétophone est critique, ainsi, les bandes enregistrées de manière professionnelle comportent-elles souvent des signaux de référence. Le niveau de sortie ainsi que la réponse fréquentielle peuvent altérer la réponse du système de décodage, aussi faut-il souligner que le système de réduction de bruit utilisé à l'enregistrement, CEI ou NAB, doit être correctement appliqué à la lecture. Les réducteurs de bruit Dolby B et Dolby C sont habituellement compris dans la plupart des lecteurs de cassettes professionnels parmi les plus récents. Les signaux d'alignement ne sont pas utilisés pour de tels systèmes de réduction de bruit dont l'efficacité se montre moins convaincante que celle des systèmes professionnels.

5.4.11.3 Il est possible de transférer directement le son d'une bande encodée et de reporter ultérieurement les opérations de décodage, mais dans ce cas, le réglage des multiples paramètres d'alignement peut combiner les imperfections et compromettre la qualité du décodage. Il est préférable de procéder au décodage pendant le transfert.

 5.4.11.4 Sauf indications particulières, il est difficile d'estimer si une cassette a été encodée ou non avec un système de réduction de bruit. De manière analogue à la question de l'égalisation, l'absence de documentation peut conduire l'opérateur à prendre des décisions lors de l'écoute du document. Une lecture effectuée dans de bonnes conditions se caractérise par un niveau régulier du bruit de fond alors que les fluctuations de ce niveau indiquent un réglage incorrect. Un analyseur de spectre peut être utile. En l'absence de décision, la copie des cassettes devra être conduite sur le mode "plat".

5.4.12 Corrections des erreurs d'alignement provoquées par l'enregistrement

5.4.12.1 Les défauts d'alignement des équipements d'enregistrement provoquent des imperfections qui peuvent prendre de nombreuses formes. De nombreux défauts ne peuvent être corrigés, ou difficilement, toutefois, certains d'entre-eux peuvent être détectés objectivement et traités. Il est impératif de prendre des mesures de compensation dans le processus de lecture du document original concerné car aucune correction telle que celles présentées ne sera possible après transfert du signal sur un autre support.

5.4.12.2 Azimut et alignement du chemin de défilement : un alignement incorrect de la tête d'enregistrement de la machine d'enregistrement originale signifie qu'à la lecture, le signal extrait présentera une réduction de la réponse des hautes fréquences ainsi que, dans le cas d'une bande 2 pistes ou plus, une altération de phase entre les canaux. L'ajustement de l'angle de la tête de lecture pour que celle-ci soit dans le même plan que l'état magnétique de la bande est appelé ajustement d'azimut, un réglage simple de celui-ci peut améliorer de manière significative la qualité et l'intelligibilité du signal récupéré. La formation du personnel pour cette action ne présente pas de difficulté particulière ; une bonne écoute binaurale constitue tout l'équipement technologique nécessaire. Un phasemètre de précision ou un oscilloscope aidera l'ajustement des bandes convenablement enregistrées en mono ; ils peuvent cependant, être trompeur pour des bandes enregistrées à l'aide d’un magnétophone bon marché, grand public. Dans ce cas, il conviendra de s'appuyer sur l'appréciation auditive des hautes fréquences. Un programme d'analyse spectrographique en temps réel peut être utilisé en permanence ou par intermittence. Pour tout transfert de bandes magnétiques, l'ajustement d'azimut doit être une opération de routine.

5.4.12.3 Les systèmes de traitement numériques peuvent corriger les déphasages du signal (souvent décrits par la correction d'azimut), toutefois, de telles procédures ne permettent par de récupérer les hautes fréquences perdues. Les ajustements d'azimut doivent être pratiqués dès le commencement du transfert de la bande originale.

5.4.12.4 L'alignement vertical des têtes d'un enregistreur original peut présenter un obstacle à la bonne reproduction d'un signal. C’est le cas particulièrement pour des enregistrements réalisés à partir de matériel amateur ou grand public. Afin d'obtenir une représentation visuelle de l'alignement des pistes sur la bande enregistrée, la procédure suivante devra être respectée : protéger des sections de bandes enregistrées à l'aide d'une feuille très mince de Mylar ou autre matériau similaire transparent. De la poudre ou une suspension de matériau ferromagnétique formée de particules inférieures à 3 µm est projetée sur la feuille transparente. Les propriétés magnétiques d'une section enregistrée de la bande permettent ainsi de visualiser les pistes. Un marquage soigneux de séries de lignes calibrées sur la feuille transparente favorisera la détection d'erreurs d'alignement. De tels ajustements sont moins fréquents que les réglages d'azimut mais,  s'ils doivent être entrepris, l'équipement de lecture devra être recalibré par un technicien qualifié. Toutes les précautions devront être prises pour éviter la présence de poudre résiduelle sur la bande qui pourrait endommager les têtes lors de la lecture.

5.4.12.5 Boîtiers cassettes : Les boîtiers dans lesquelles les bandes bon marché sont insérées peuvent être à l'origine de bourrage de bande, ils peuvent générer des phénomènes de pleurage et de scintillement. Dans ce cas, il est souvent intéressant de transférer la bande dans un boîtier de haute qualité, à vis, afin de bénéficier des bonnes caractéristiques des galets, du patin assurant la pression et des feuilles de glissement.

5.4.12.6 Pleurage, scintillement et variations périodiques de la vitesse : il n'est pratiquement pas possible de réduire les variations périodiques du signal enregistré. Aussi est-il impératif de contrôler, d'aligner, d'entretenir avec prudence et minutie les machines de lecture, ceci afin d'éliminer différentes causes d'altération de la vitesse. Grâce à l'élaboration de convertisseurs A/N et de composants haute résolution, il semblerait possible de récupérer le signal de prémagnétisation haute fréquence depuis la bande magnétique analogique pendant le transfert pour effectuer les correction de pleurage et de scintillement. Toutefois, de nombreuses difficultés doivent être surmontées pour y parvenir, dont le manque de dispositif permettant d'extraire de tels signaux haute fréquence et la fiabilité toute relative du signal de prémagnétisation. Il est peu probable qu'une telle procédure, longue et  complexe, qui ne suscite guère de progrès substantiels, puisse être mise en œuvre, et si tel était le cas, elle le serait pour un nombre limité de bandes, produites dans des circonstances particulières.

5.4.13 Suppression d'artefacts du signal dus au stockage

5.4.13.1 Dans la plupart des cas, avant d'entreprendre les opérations de numérisation, il est préférable de minimiser les défauts du signal produits pendant le stockage. A propos de l'enregistrement magnétique analogique linéaire, par exemple, l'effet d'empreinte est un phénomène redouté bien connu. La réduction de ce signal indésirable peut être entreprise seulement sur la bande originale.

5.4.13.2 Effet d'empreinte 15: L'effet d'empreinte est un transfert involontaire du champ magnétique d'une spire d'une bande analogique sur une autre spire de la bobine. Il se manifeste par des pré et des post échos du signal principal. L'intensité du signal de copie est fonction de la longueur d'onde, de l'épaisseur des couches de la bande, mais essentiellement de la coercivité 16 des particules de la couche magnétique. Presque tous les effets de copie se produisent immédiatement après enregistrement et enroulement de la bande en bobine. L'accroissement de l'effet d'empreinte diminue avec le temps. Ultérieurement, des augmentations significatives du phénomène se produisent seulement par des changements de température. Quand la bande est stocké couche d'oxyde face au centre du noyau, cas le plus courant, l'effet de copie produit sur la spire extérieure à la spire portant le signal principal est plus intense que celui produit sur la spire située côté centre du noyau. En conséquence, il a été souvent recommandé de conserver les bandes "pieds dehors" ; dans ce cas, les post échos plus intenses que les pré-échos, sont moins perceptibles. Les normes d'enregistrement radiophoniques allemandes spécifient que les bandes devront être enroulées oxyde vers l'extérieur ; dans ce cas, le raisonnement inverse s'applique, les bandes seront donc archivées "tête devant".

5.4.13.3 Les signaux produits par l'effet d'empreinte peuvent être réduits en procédant au déroulement de la bobine avant lecture, ceci grâce au "phénomène de magnétostriction". Des essais systématiques ont montré qu'il était toutefois judicieux de rembobiner la bande au moins trois fois pour obtenir un résultat probant (Réf. Schüller 1980). Dans le cas où le signal d'empreinte de niveau très élevé ne réagit pas au procédé de rembobinage, certaines machines permettent l'application d'un signal de prémagnétisation 17 de faible intensité pendant la lecture de la bande. Cette opération peut annuler l'état magnétique des particules de faible coercivité, réduisant ainsi l'effet de copie. Mais elle peut aussi avoir un effet sur le signal principal, en particulier en cas de "surexposition", aussi cette méthode ne doit-elle être utilisée qu'en dernier recours et avec le plus grand soin.

5.4.13.4 La réduction de l'effet d'empreinte sur la bande originale ne pourra plus faire l'objet de traitement par la suite. Une fois copié, le signal d'empreinte fait partie intégrante du signal souhaité.

5.4.13.5 Syndrome du vinaigre et bande acétate cassante : En vieillissant, les bandes acétate deviennent cassantes, ce qui peut rendre la lecture du ruban délicate compte tenu des risques de rupture. Cette fragilité provient d'un processus de dégradation chimique qui se manifeste lorsque les liaisons moléculaires des composés acétate se rompent et libèrent de l'acide acétique à l'origine de l'odeur caractéristique de vinaigre. Les bandes acétate cassées peuvent être raboutées avec un collant sans aucune perte ou dégradation du signal car, grâce à leur fragilité, elles ne subissent aucune élongation. Toutefois, les bandes cassantes sont sujettes à une grande variété de déformations qui perturbent le contact tête-bande indispensable à l'extraction optimale du signal. Si le principe de re-plastification peut sembler avantageux, un tel processus n'est pas encore disponible. Il convient de prévenir les archivistes des processus chimiques qui, dans certains cas, peuvent non seulement compromettre la survie de la bande, mais aussi contaminer le matériel de lecture et ainsi d'autres bandes utilisées sur ces machines. Au lieu de cela, il est recommandé de lire de telles bandes à l'aide d'une machine récente permettant une tension plus faible du ruban. Ceci constitue un compromis acceptable entre les précautions à prendre avec des bandes fragiles et l'application d'une tension suffisante pour obtenir le meilleur contact tête-bande possible.

5.4.13.6 Mémoire de forme de la bande : Des bandes polyester ou en PVC enroulées et entreposées dans de mauvaises conditions peuvent aussi subir des déformations. Souvent, le ruban mémorise une telle déformation qui compromet le contact tête-bande, ce qui réduit la qualité du signal. Des enroulements répétés suivis de phases de repos peuvent atténuer le phénomène.


15. Ou effet de copie.

16. Coercivité ; valeur de l'intensité du champ magnétique nécessaire pour annuler la magnétisation d'un matériau ferromagnétique porté à saturation.

17. Prémagnétisation ; signal de haute fréquence appliqué avec le signal audio pendant l'enregistrement afin de réduire le bruit de bande. Inventé par Weber en 1940.

5.4.14 Enregistrements sur fil

5.4.14.1 Si le principe de l'enregistrement sur fil a bien été démontré à la toute fin du 19ème siècle, et plusieurs modèles de machines à dicter prototypes réalisés dans les années 1920 et 1930 (voir 5.4.15 ci dessous), l'enregistreur à fil ne rencontrera pourtant un succès populaire qu'à partir de 1947 environ.

5.4.14.2 La vitesse des enregistreurs à fil n'étant pas normalisée, elle variait d'un fabricant à l'autre, et même, selon les circonstances, d'un modèle à l'autre. Après 1947, toutefois, la plupart des fabricants se sont ralliés à la vitesse standard de 24 ips (61 cm/s) et à la taille de la bobine de 2¾ pouces (7cm). Les enregistreurs à fil ne comportaient pas de cabestan, aussi la vitesse changeait-elle à mesure que la bobine réceptrice se remplissait. La dimension de la bobine réceptrice est déterminante pour assurer une lecture correcte du fil, elle est le plus souvent liée à une machine spécifique du fabricant. La bobine réceptrice est généralement une pièce fixe de la machine. La plus grande popularité de l'enregistreur à fil se situe entre le milieu des années 1940 jusqu'au début des années 1950, période qui coïncide avec le développement et le lancement de l'enregistreur à bande, dont la technologie avancée rendit rapidement l'enregistreur à fil obsolète. Même à sa grande époque, l'enregistrement à fil reste surtout réservé à l'usage du grand public, même si certains exemplaires ont été produits à des fins commerciales.  

5.4.14.3 Bien que l'enregistrement sur fil soit rapidement tombé en disgrâce, les bobines sont restées, quant à elles, disponibles jusque dans les années 1960 dans des boutiques spécialisés. Les dimensions des premières bobines étaient grandes en comparaison des modèles 7 cm dont l'usage devait se généraliser. Certains fils datant surtout du début de l'histoire de l'enregistrement, étaient faits en acier au carbone plaqué ou enduit, et peuvent aujourd'hui être corrodés et difficiles à lire. Cependant, de nombreux fils se trouvent en excellent état. Réalisés en acier inoxydable avec 18 % de nickel et 8 % de chrome, ils ne se sont pas corrodés.

5.4.14.4 Le principe des appareils d'enregistrement sur fil est relativement simple, aussi la fabrication d'une machine de lecture est-elle possible. Toutefois, la complexité du système qui doit effectuer un enroulement et une lecture corrects du fil sans enchevêtrement ni cassure nous oriente vers l'utilisation d'une machine originale, mais il est intéressant de noter que certains experts ont modifié des machines à bande pour lire des fils. En cas d'utilisation de machines originales, il est recommandé de réviser les circuits électroniques audio afin d'obtenir les meilleures performances, ou, de préférence, remplacer ceux-ci par des circuits comportant des composants électroniques modernes (Morton 1998, King : n.d.)

5.4.15 Formats des machines à dicter de bureau

5.4.15.1 Durant les décennies qui ont suivi la seconde guerre mondiale, de nombreux formats de machines à dicter de bureau apparaissent. Leur conception répond aux contraintes des bureaux qui diffèrent des autres conditions d'environnements d'enregistrement audio : taille et poids réduits, facilité d'utilisation et vitesse variable sont les éléments prioritaires, généralement au détriment de la qualité. De manière générale, les systèmes à dicter peuvent être classés en formats à bande et formats sans bande.

5.4.15.2 Dans ce contexte, la bande comprend différentes formes : fils (voir 5.4.14 ci-dessus), bobines, cassettes. Certains modèles peuvent être relus directement en utilisant des équipements standards (sachant que des bobines de cassettes hors standard peuvent être transférées dans des coques standards pour être relues) tandis que d'autres formats ne peuvent l'être qu'avec des appareils de format spécifique. Si on a le choix, deux approches sont possibles. L'une implique l'utilisation d'équipements standards, de spécifications précises, de maintenance relativement aisée, mais dont la compatibilité peut être incorrecte en ce qui concerne la largeur de bande, la configuration de tête, la vitesse de lecture, l'égalisation, la réduction de bruit, etc. L'autre approche assure une plus grande compatibilité entre support et lecteur, mais certainement au prix de spécifications peu précises et d'une maintenance ésotérique des équipements originaux aux formats particuliers. Les formats à bande peuvent être subdivisés : vitesse linéaire et vitesse non linéaire. La première catégorie présente moins de problèmes lorsque la lecture est effectuée à l'aide d'équipements conventionnels ; les bandes de la deuxième catégorie peuvent être également lues dans de telles conditions, mais des ajustements de la vitesse seront nécessaires (voir 5.4.9).

5.4.15.3 Les formats hors bandes comprennent un nombre surprenant de supports : disques, rubans, tambours et feuilles, tous revêtus d'une couche magnétique enregistrée et lue au moyen de têtes similaires, dans leur principe, à celles de la bande. Avec un minimum d'expertise, du temps, et donc des financements, il est possible de fabriquer des appareils pour certains de ces formats, comprenant des composants plus courants de lecteurs à bande. Dans de nombreux cas toutefois, il peut être plus pratique de localiser une machine de lecture originale ou de contacter un spécialiste disposant du matériel permettant de réaliser les prestations.

5.4.16 Le facteur temps (ratio temporel)

5.4.126.1 Le temps nécessaire à la copie des enregistrements sonores est extrêmement variable, il dépend directement de la nature et du statut des supports originaux. L'opération de lecture réelle du support ne représente qu'une partie du processus de transfert qui comprend le rembobinage, l'évaluation, les réglages et la documentation. Un document même bien documenté, sur bande analogique de bonne qualité d'une durée de 1 heure demandera qu’on y consacre en moyenne deux fois plus de temps pour mener à bien son transfert sur support numérique. Au milieu des années 1990, le groupe de travail des archives de la radio ARD (Arbeitsgemeinschaft der Rundfunkanstalten Deutschlands) a considéré qu'il s'agissait d'une estimation optimiste, postulant un ratio de transfert de 3 (1 opérateur, 3 heures de travail pour 1 heure d'enregistrement) pour réaliser le transfert d'archives typiques de leur station radio. Les bandes qui présentent un défaut, qui nécessitent rénovation ou restauration, une évaluation, l'addition de métadonnées, prendront davantage de temps pour que soient menées à bien les opérations de conservation, de transfert et d'entretien.

5.4.17 Détection automatique du signal, chargement automatique (avantage et inconvénient)

5.4.17.1 Il est recommandé de pratiquer l'écoute active systématique de toutes les bandes lorsque les transferts de conservation sont entrepris. Cependant, pour répondre à la quantité brute du contenu des enregistrements qui doivent être transférés et conservés, les fabricants de système d'archivage numériques ont développé des méthodes de contrôle automatique et de détection de défauts de signaux pour rendre possible des transferts sans surveillance. Les gains de temps sont manifestes car un opérateur peut entreprendre simultanément plusieurs transferts. Les systèmes eux-mêmes semblent atteindre leur meilleur rendement sur des collections dont le contenu est en grande partie homogène, enregistré dans de bonnes conditions et sur des supports stables pouvant être traités de manière identique. Il est dès lors bien naturel que les systèmes de chargement automatique de masse les plus satisfaisants aient été développés ou implémentés par les services d'archives de radiodiffusion qui possèdent des contenus de qualité en grande partie homogène, de vastes collections et des ressource suffisantes pour construire, gérer et entretenir de tels systèmes. Pour les enregistrements nécessitant des traitements individuels, ce qui est généralement le cas de la plupart des collections patrimoniales et de recherche, les bénéfices que l'on peut attendre d'un système automatique ne sont pas aussi grands.

5.5 Reproduction des supports magnétiques numériques

5.5.1 Introduction

5.5.1.1 Dans les conditions optimales, les bandes numériques peuvent générer des copies identiques au signal enregistré ; toutefois, toute erreur incorrigible se manifestant lors des opérations de lecture sera enregistrée de manière permanente dans la nouvelle copie, ou bien encore, produira des interpolations inutiles qui se retrouveront inscrites dans les données d'archives ; aucune de ces conséquences n'est souhaitable. L'optimisation de la procédure de transfert est à même d'assurer la transmission des données dans l'état le plus proche de l'information se trouvant sur le support d'origine. Par principe général, il est stipulé que les originaux devront toujours être conservés afin que des consultations ultérieures restent possibles ; pour autant, et pour deux raisons simples et concrètes, tout transfert devra assurer une extraction optimale des données à partir de la meilleure copie- source. Premièrement, le support original peut se détériorer, empêchant toute future lecture de produire une qualité équivalente, voire la rendre impossible ; deuxièmement, les durées d'extraction du signal sont telles que les conditions économiques imposent l'optimisation dès la première opération.

5.5.1.2 Les bandes magnétiques, supports d'information numérique, ont été utilisées dans l'industrie de l'informatique depuis les années 1960, mais leur utilisation en tant que support audio numérique ne s'est banalisée qu'au début des années 1980. Dans un premier temps, les systèmes associant un dispositif d'encodage des données audio et un enregistreur de celles-ci sur une bande vidéo ont été utilisés pour réaliser des enregistrements deux pistes ou bien des bandes master de production de Compact Discs (CD). Techniquement parlant, de nombreux supports de ce type sont anciens, aussi les enregistrements doivent être transférés d'urgence sur des supports de stockage plus stables.

5.5.1.3 Tout transfert de données numériques audio doit respecter la recommandation essentielle suivante : le processus doit être entièrement effectué dans le domaine numérique sans recourir à la moindre conversion analogique. Pratique relativement simple pour les technologies les plus récentes qui comportent les interfaces normalisées d'échange de données audio telles que AES/EBU ou S/PDIF. Les technologies des premières générations peuvent nécessiter des modifications pour atteindre ces conditions idéales.

5.5.2 Sélection de la meilleure copie

5.5.2.1 Contrairement aux copies d'enregistrements audio analogiques, qui produisent d'inévitables pertes de qualité provoquées lors du passage d'une génération à la suivante, les processus d'enregistrements numériques peuvent avoir différents degrés de qualités depuis les copies dégradées du fait du ré-échantillonnage ou de conversion standard, jusqu'aux "clones" identiques qui peuvent même prétendre à une meilleure qualité que l'original (grâce aux corrections d'erreurs). Pour choisir la meilleure source, des appréciations doivent être fournies à propos des standards audio tels que l'échantillonnage,  le taux de quantification, ainsi que d'autres spécifications incluant les métadonnées intégrées. En outre, la qualité des données de copies stockées qui peut s'être dégradées au fil du temps doit être évaluée par des mesures objectives. En règle générale, la source d'une copie doit être choisie en fonction de l'absence d'erreurs produites lors de la lecture, ou d'un minimum d'erreurs.     
 
5.5.2.2 Enregistrements uniques : Les enregistrements originaux : multisessions, enregistrements sur le terrain, bandes contenant les informations de service, enregistrements au studio-domicile (home recordings), bandes son de film ou vidéo, bandes master, toutes ces sources peuvent  contenir des documents sonores totalement ou partiellement uniques. Le matériel sonore inédit peut-être plus ou moins exploité en comparaison du produit finalisé édité, selon l'usage des enregistrements archivés.  Le responsable de la collection doit faire les choix qui garantissent la sélection de la version la plus complète et la plus appropriée.   Les enregistrements réellement uniques ne font l'objet d'aucun choix de la part de l'archiviste. Lorsqu'il n’y a qu’une seule version d'un document sonore  au sein d'une collection, il est important de savoir si un autre exemplaire existe   ailleurs. Il est possible d'épargner du temps et des problèmes si d'autres copies existent, de meilleure qualité ou bien de format plus pratique.     

5.5.2.3 Enregistrements avec copies multiples : Les principes de conservation stipulent que les copies d'une bande numérique doivent être, dans l'idéal, des répliques parfaites du contenu d'un media avec toutes les métadonnées enregistrées sur le document numérique original. Toute copie numérique conforme à cette recommandation constitue une source valable pour effectuer la migration de  l’essence vers de nouveaux systèmes numériques de conservation.

5.5.2.4 En pratique, les conversions standards, les ré-échantillonnages, les corrections d'erreurs ou d'interpolation 18 peuvent provoquer des pertes de données ou produire des distorsions sur les copies.  Les dégradations dues au temps  affectent la qualité des enregistrements originaux et des copies  successives. En conséquence, les copies peuvent être différentes en fonction de l'enregistrement source choisi. Les coûts peuvent aussi varier en fonction du format physique ou de l'état du matériel source.

5.5.2.5 Déterminer la meilleure copie-source implique  tenir compte des normes d'enregistrement utilisées pour réaliser les copies, de la qualité des équipements, des processus utilisés, des conditions physiques et de la qualité des données des copies disponibles. Dans l'idéal, cette information est documentée et facilement disponible. Dans le cas contraire, les décisions seront prises sur la connaissance des intentions et de l'histoire des différentes copies.

5.5.2.6 Duplications sur supports semblables : dans ce contexte, la meilleure source sera celle dont la copie comportera les données de meilleure qualité. Habituellement, le premier choix se porte sur la copie numérique à l'identique la plus récente. Les premières générations de copie numérique à l'identique peuvent constituer une alternative si les versions plus récentes ne sont pas satisfaisantes du fait de dégradation ou de mauvaises conditions de réalisation.   

5.5.2.7 Copies différentiées par les supports ou les standards : Les processus de production ou de conservation peuvent conduire à la constitution de copies multiples sur bandes numériques de différents formats. La meilleure source devra être identique aux standards de l'original, avoir la meilleure qualité possible et être enregistrée dans le format qui soit le plus pratique pour la duplication. Un avis est demandé lorsque l'une de ces conditions ne peut être respectée.

5.5.2.8 Vis-à-vis des exemplaires numériques issus d'enregistrements analogiques encore existants, l'option d'une nouvelle numérisation peut-être retenue lorsque les copies numériques disponibles ont été réalisées dans un standard inférieur, lorsque leur qualité ou leur état motive une telle décision.


18. Le masquage d'erreurs ou l'interpolation correspond à une estimation du signal original lorsque la corruption de données ne permet pas la reconstruction fidèle du signal.

5.5.3 Nettoyage, restauration des supports

5.5.3.1 Par leur composition et leur fabrication, les bandes magnétiques numériques sont similaires aux autres types de bandes, elles connaissent les mêmes problèmes physiques et chimiques. Les bandes numériques peuvent atteindre de fortes densités grâce à l'utilisation de bandes fines, à la taille réduite des pistes magnétiques, et à la réduction permanente de la taille des domaines magnétiques écrits et lus. En conséquence, des dégradations ou contaminations même mineures peuvent avoir un impact considérable sur les conditions de récupération du signal. Toute détérioration, dommage  ou contamination se manifeste par une augmentation des erreurs. Les problèmes de restauration des supports, les techniques employées sont analogues pour toutes les bandes magnétiques, mais le substrat, le liant et les matériaux magnétiques étant sujets à des développements incessants, toute procédure de restauration devra être testée et validée spécifiquement pour chaque média.

5.5.3.2 Les machines de nettoyage du commerce, disponibles pour les bandes magnétiques en bobines libres et pour la plupart des formats de bandes vidéo numériques couramment utilisées se montrent efficaces pour les bandes peu dégradées ou contaminées. Le nettoyage effectué à l'aide d'un aspirateur ou d’une brosse peut être prescrit pour les bandes fortement dégradées ou très fragiles ; mais il exige des précautions pour éviter la détérioration des bandes fragiles et des mécanismes complexes des cassettes. Potentiellement, tous les procédés de nettoyage peuvent provoquer des dommages, aussi doivent-ils être appliqués avec une attention toute particulière.

5.5.3.3 Des dispositifs mécaniques peuvent faciliter la manipulation des bandes et des boîtiers de cassettes. Ils sont commercialisés pour certains formats. Pour d'autres formats, ils peuvent être fabriqués dans des ateliers de mécaniques modestement équipés.

5.5.3.4 Les bandes  numériques dont le liant est constitué de polyester uréthane peuvent potentiellement pâtir du phénomène d'hydrolyse, de manière comparable aux bandes magnétiques analogiques. Toute action de rénovation des bandes magnétiques numériques nécessite des procédures de contrôles sévères ; les tentatives se feront uniquement dans des étuves climatiques ou dans des chambre à vide 19 (voir section 5.4.3 Nettoyage et restauration des supports). Opération qui peut-être des plus critiques pour des enregistrements numériques réalisés sur bandes généralement des plus minces insérées dans des boîtiers cassettes aux mécanismes complexes.

5.5.3.5 La dégradation des bandes magnétiques peut-être minimisée par l'adoption de conditions de stockage appropriées. Les normes de stockage à long terme des bandes magnétiques numériques sont généralement plus strictes que celles préconisées pour les bandes analogiques du fait de leur plus grande fragilité et du risque plus élevé de perte de données auquel les exposent des dégradations ou contaminations même légères. Des conditions de température ou d'humidité supérieures aux recommandations favoriseront la dégradation chimique. Les cycles de température et d'humidité produisent la dilatation et la contraction de la bande, phénomènes qui peuvent endommager le substrat. La poussière ou d'autres agents de contamination parvenant à se déposer à la surface de la bande, peuvent générer des pertes de données et présenter en outre le risque de provoquer des dégradations physiques pendant la lecture.  

5.5.3.6 Après nettoyage et / ou rénovation ou bien avant d'effectuer une opération de duplication, il peut être conseillé d'effectuer la mesure des taux d'erreurs des bandes magnétiques numériques. L'organisation des données et le type de correction d'erreurs utilisé dépendent du format de la bande. Pour les DAT par exemple, le processus de correction d'erreurs utilise deux codes Reed-Solomon  organisés selon un système croisé, horizontalement C2 et verticalement C1. En outre, une valeur est assignée à chaque bloc de données : octet de parité. Le nombre d'erreurs de parité par bloc est dénommé : erreurs CRC ou bien parfois : taux d'erreurs par bloc. Le sous-code des bandes DAT (Digital Audio Tape) est également sujet à des erreurs. Les mesures d'erreurs devront inclure, pour le moins :

5.5.3.6.1 Erreurs C2 et C1.
5.5.3.6.2 CRC ou Taux d'erreurs par bloc.
5.5.3.6.3 Erreurs salves (à partir de C1)
5.5.3.6.4 Correction SUBC1

5.5.3.7 Si la moindre mesure d'erreurs révèle un blocage d'échantillon, une interpolation ou un niveau d'erreur produisant un mute, la bande devra être nettoyée et le chemin de défilement contrôlé. Si, après nettoyage et rénovation, une erreur ou plus dépassent ces limites, on se référera au paragraphe 5.6.3 "Sélection de la meilleure copie". (Première partie).

5.5.3.8 Très peu de systèmes de mesure d'erreurs de bandes DAT ou autres supports magnétiques sont disponibles. Néanmoins, tout transfert devra inclure la mesure d'erreurs détectées par le circuit de correction d'erreurs de la machine de lecture, cette information devant être enregistrée dans les métadonnées des fichiers audio produits.


19. Les chambres à vide diminuent la pression de l'air, elles permettent de mieux contrôler la teneur en humidité.

5.5.4 Equipement de lecture

5.5.4.1 Les équipements de lecture doivent être conformes à tous les paramètres spécifiques d'un format donné. La plupart des formats de bandes numériques sont propriétaires et on compte seulement un ou deux fabricants de matériel convenable. Les équipements de dernière génération sont préférables, mais pour les formats numériques anciens ou obsolètes, il n'est d'autre choix que de se procurer des machines d'occasion.

5.5.4.2 Les enregistrements haute densité sur R-DAT (Rotary Head Digital Audio Tape) ont permis d'autres types d'applications que l'enregistrement du son. Le format DDS (Digital Data Storage), issu de la technologie DAT, a été développé par Hewlett-Packard et Sony en 1989 pour effectuer le stockage de données informatiques. L'augmentation régulière des données dans leur état d'intégrité première a suscité le développement de techniques d'extraction du signal des bandes DAT audio. Différents types de logiciels sont disponibles pour extraire les données audio et les fichiers ID de la bande séparément. Des logiciels dédiés d'extraction de données peuvent également générer des fichiers de métadonnées pour chaque programme, ils comprennent l'horloge, les positions ID de début et de fin, les durées, la taille des fichiers, les propriétés audio, etc. De plus, le format DDS permet la capture des contenus audio à vitesse double.

5.5.4.3 Néanmoins, des questions importantes telles que l'incompatibilité des formats (par exemple les différents modes de longue durée, les enregistrements haute résolution, l'extraction du time code etc.), le contrôle de l'intégrité des données, les manipulations de préaccentuation et particulièrement l'ensemble des questions concernant les problèmes mécaniques et de tracking ne sont pas encore résolues par de tels systèmes ce qui, par conséquent, nécessitera des traitements au cas par cas.

5.5.5 Caractéristiques des systèmes ordinaires : appareils à cassettes

5.5.5.1 Les R-DAT (DAT dans le langage courant) constituent le seul système utilisant un format de cassette développé de manière spécifique pour les enregistrements audio numériques. Les bandes DAT ont été largement utilisées sur le terrain et dans les studios d'enregistrement, pour la radio et l'archivage. Les équipements neufs ne sont pratiquement plus disponibles. Les machines DAT professionnelles constituent une solution, mais elles présentent des problèmes de maintenance, la fourniture de pièces détachées n'étant plus assurée.

5.5.5.2 Certains enregistreurs de dernière génération fonctionnent en dehors des spécifications, ce qui autorise des enregistrements haute résolution à 96 kHz et 24 bits (à double vitesse), l'insertion du Time Code (SMPTE) avec d'autres appareils, ou le codage Super Bit Mapping, qui utilise un principe psycho-acoustique et l'analyse par bandes critiques, procédé permettant de rendre maximal la qualité sonore de signaux codés sur 16 bits. Les enregistrements effectués sur 20 bits sont quantifiés sur 16 bits en utilisant un filtre d'erreurs adaptatif  à rétroaction. Ce filtre définit la forme de l'erreur de quantification dans un spectre optimal, il est déterminé par une fonction de masquage à court terme et par les caractéristiques isosoniques du signal d'entrée. Grâce à ces techniques, la qualité perceptive du son quantifié sur 20 bits est disponible sur un enregistreur DAT 16 bits. La qualité dans sa plénitude ne peut être atteinte que pour les signaux de fréquences inférieures à 5-10 kHz. Le Super bit mapping ne nécessite pas l'installation de décodeur particulier dans le lecteur.     
 

 

Mode d'enregistrement / lecture

Bande pré-enregistrée
(Lecteur seule)
Standard Standard Option 1 Option
2
Option 3 Piste normale Piste large
Nombre de canaux 2 2 2 2 4 2 2
Taux d'échantillonnage
(kHz)
48 44,1 32 32 32 44,1
Nombre de bits de quantification 16 (linéaire) 16 (linéaire) 16 (linéaire) 12 (non-linéaire) 12 (non-linéaire) 16 (linéaire)
Densité linéaire d'enregistrement(KBPI) 61,0 61,0 61,1
Densité surfacique d'enregistrement (MBPI2) 114 114 76
Taux de transmission (MBPS) 2,46 2,46 2,46 1,23 2,46 2,46
Capacité sous-code (KBPS) 273,1 273,1 273,1 136,5 273,1 273,1  
Modulation Conversion 8–10
Correction Double Reed-Solomon
Tracking Zone fragmentée ATF
Taille cassette (mm) 73 x 54 x 10,5
Durée enregistrement* (min) 120 120 120 240 120 120 80
Largeur bande (mm) 3,81
Type de bande Particules métalliques Oxyde
Epaisseur bande (μm) 13±1μ
Vitesse bande (mm/s) 8,15 8,15 8,15 4,075 8,15 8,15 12,225
Largeur piste (μm) 13,591 13,591 20,41 (piste large)
Angle de piste 6°22’59”5   6°23’29”4
Tambour standard Ø 30 mm Enroulement 90°    
Vitesse rotation tambour (r.p.mn.) 2000 1000 2000 2000  
Vitesse relative (m/s) 3,133 1,567 3,129 3,133 3,129
Azimut tête ±20°

Tableau 1 Paragraphe 5.5. Spécifications des différents modes d'enregistrement / lecture des DAT pour les bandes vierges et pré-enregistrées.

5.5.5.3 Le système à Cassette Philips DCC (Digital Compact Cassette) a été introduit (sans succès) auprès du grand public, il offrait une compatibilité limitée avec les Minicassettes analogiques en n'autorisant que la lecture de celles-ci. Le format DCC est maintenant obsolète.

Format Variantes Type de support Pistes audio et de données Standards Audionumé riques supportés Interface
DAT ou R-DAT Le Timecode ne fait pas partie des normes R-DAT mais peut-être implément é dans les sous-codes. Certaines cassettes DAT pré-enregistré es utilisent des bandes ME. Cassette
avec bande
3,81mm
à particules
métalliques.
Stéréo.
Les Subcodes comportent
des marqueurs
normalisés
plus des bits utilisateurs
pour des extensions
propriétaires.
16 bit PCM @ 32, 44,1 et 48 kHz AES-422
sur  machine
profession
nelle SP-DIF
standard
DCC   Cassette avec bande CrO2 3,81 Stéréo, métadonnées standards supportant un minimum de données
descriptives
PCM compression
PASC (réduction
taux 4:1)
 
Formats
Vidéo - voir
tableau 4
         

Tableau 2 Paragraphe 5.5 Cassettes audionumériques

5.5.6 Caractéristiques des systèmes ordinaires : formats de bandes à bobines libres

5.5.6.1 SONY et Mitsubishi ont  produit chacun des systèmes numériques à bandes en bobines libres pour le marché des studios d'enregistrement,  et NAGRA a produit un format quatre pistes, le NAGRA-D.

5.5.6.2 Le système DASH de Sony/Studer (Digital Audio Stationary Head - Tête stationnaire audio numérique) présente de nombreuses variantes à partir des formats communs de l'enregistrement des pistes numériques sur bandes. DASH-I propose 8 pistes numériques sur bande 1/4 pouce et 24 pistes numériques sur bande 1/2 pouce, DASH-II propose 16 pistes numériques sur bande 1/4 pouce et 48 pistes numériques sur bande 1/2 pouce. Les formats Twin DASH, couramment utilisés pour les enregistrements numériques stéréo sur bande 1/4 pouce, utilisent deux fois plus de pistes de données pour chaque canal audio ; ceci permet d'augmenter la capacité de correction d'erreurs au point de pouvoir utiliser des collants pour l'éditing. Les formats à basse vitesse doublent la durée d'enregistrement par répartition de chacun des canaux audio sur les multiples pistes de données, une disposition qui réduit de moitié le nombre de pistes audio disponibles.

5.5.6.3 Nagra assure le suivi du NAGRA-D, Sony le DASH et Mitsubishi Pro-Digi, des formats qui ne sont plus fabriqués. Ces formats sont / étaient conçus pour un usage professionnel haut de gamme, ce qui en a rendu la maintenance extrêmement coûteuse

Format Variantes Type de support Pistes audio et de données Standards Audionumériques supportés Interface
DASH Trois vitesses F (Fast/rapide)
M (Medium/moyenne)
S (Slow/lente)
Bande ¼” ou ½” Jusqu'à 48 pistes audio plus piste de contrôle 16 bits à 32 kHz, 44,1 kHz ou 48 kHz AES/EBU SDIF-2 interface MADI
  DASH-I (simple densité) et DASH-II
(double densité)
       
  Deux largeurs de
bande Q (quart de pouce) et H (demi-pouce)
       
Mitsubishi Pro Digi Stéréo Bande ¼”   32 kHz, 44,1 kHz ou 48 kHz. 20 bits ou 16 bits (avec redondance renforcée pour faciliter l'éditing ciseaux à 38 cm/s 16 bits (redondance normale) à 19 cm/s. AES/EBU interface propriétaire
multi-canal
  16 pistes Bande ½”   32 kHz, 44,1 kHz ou 48 kHz. 16 bits  
  32 pistes Bande 1”   32 kHz, 44,1 kHz ou 48 kHz. 16 bits  
NAGRA-D   ¼” MP 4 pistes audio. Métadonnées renforcées incluant
la TOC et l'enregistrement d'erreurs intégré.
4 pistes jusqu'à 24 bits 48 kHz. 2 pistes à 24 bits 96 kHz. AES/EBU

Tableau 3 Paragraphe 5.5 Formats bobines libres

5.5.7 Caractéristiques des systèmes ordinaires : Formats liés aux bandes vidéo

5.5.7.1 Il existe deux variantes dans cette catégorie : les systèmes utilisant les cassettes vidéo standard VCR avec encodage des données numériques audio au standard du signal vidéo, et les systèmes utilisant les bandes vidéo en tant que support de stockage de signaux audio numériques avec formats propriétaires.

5.5.7.2 Pour sa part, Sony a produit une gamme de formats utilisant les systèmes VCR pour assurer le stockage de données large bande. Par la suite, Alesis a introduit le système ADAT utilisant des vidéocassettes S-VHS de grande capacité pour le stockage de données audionumériques dans un format propriétaire, et Tascam le système DTRS avec la vidéocassette Hi8.

5.5.7.3 les formats faisant appel aux enregistreurs vidéo étaient réalisés sur la base de dispositifs qui incorporaient les convertisseurs A-D et D-A, les contrôles audio avec indicateurs, et les traitements logiciels nécessaires à l'encodage du flux de données dans la forme d'onde vidéo. Les systèmes professionnels Sony ont été réalisés de manière spécifique pour l'audionumérique dans le standard NTSC (525/60) noir et blanc sur machine VCR U-Matic. Les séries de systèmes semi-professionnels PCM-F1, 501 et 701 fonctionnaient dans les meilleures conditions avec les enregistreurs Sony Betamax, tout en étant généralement compatibles avec des formats Beta et VHS. Ces séries de machines supportaient les standards PAL, NTSC et SECAM.

5.5.7.4 La copie d'enregistrements effectués sur VCR nécessite un modèle VCR du bon standard, ainsi que l'interface propriétaire correspondante. Des systèmes à compatibilité ascendante existent habituellement dans les séries indiquées, aussi l'achat d'un équipement de dernière génération devrait-il faciliter la lecture du plus grand nombre d'enregistrements sources. Certains adaptateurs PCM d'appareils au format vidéo ne disposent que d'un seul convertisseur A/D pour les deux voies stéréo, un délai se produit alors entre les deux canaux. A la lecture des bandes, lors de l'extraction des données audio, le retard du dispositif de traitement du signal devra être corrigé numériquement. Les transferts ne doivent être réalisés qu'avec des équipements possédant une sortie numérique.

5.5.7.5 Certains enregistreurs numériques de première génération ont réalisé des encodages dont les fréquences d'échantillonnage sont devenues singulières avec le temps, 44,056 kHz par exemple (voir tableau 4 Paragraphe 5.5). Il est recommandé de stocker les fichiers résultant de la duplication au même niveau d'encodage que celui dans lequel ils ont été créés. Des précautions devront être prises afin de s'assurer que les systèmes automatiques ne confondent pas la fréquence d'échantillonnage réelle (i.e. un flux audio de 44,056 kHz peut-être reconnu comme étant de 44,1 kHz, ce qui altèrera le diapason et la vitesse de l'enregistrement original). Un deuxième fichier à taux d'échantillonnage courant peut être créé pour les utilisateurs en utilisant un logiciel de conversion approprié. Néanmoins, le fichier original devra être gardé en mémoire.

5.5.7.6 Certains accessoires de systèmes d'enregistrement VCR grand public peuvent apporter des extensions fonctionnelles complémentaires qui améliorent le contrôle du signal, des erreurs, et permettent l'insertion d'entrées et sorties professionnelles.

5.5.7.7 Les systèmes VCR sont obsolètes, aussi conviendra-t-il d'acquérir les équipements nécessaires sur le marché d'occasion.

Format Variantes Type de support Pistes audio et de données Standards Audionumériques supportés Interface
EIAJ Sony PCM-F1 PCM-501 et systèmes PCM-701 Signal Vidéo : PAL, NTSC ou SECAM possibles VCR grand public, habituellement Betamax ou VHS. Rares exemples de bande vidéo en bobine libre ½ pouce Audio stéréo Standard 14 bits, le hardware Sony permet l'échantillonnage (correction moindre d'erreurs) 44,056 kHz pour système NTSC, 44,1 kHz pour système PAL sur 16 bits Entrée et sortie ligne analogique standard. Entrée/sortie (I/O) numérique possible avec équipement complémentaire
Sony PCM1600 PCM1610  PCM1630   U-Matic - noir et blanc 525/60 (NTSC) Audio stéréo plus codes PQ Compact Disc Timecode sur piste audio linéaire U-Matic 16 bits 44,1 kHz Système propriétaire Sony. Canaux Audionumériques séparés Gauche et Droite plus mot-horloge.
DTRS (1991)   Format propriétaire sur cassettes vidéo Hi8   16 bits 48 kHz Enregistrement optionnel 20 bits sur certains systèmes SP-DIF ou AES/ EBU
ADAT (1993)   Système propriétaire sur cassettes S-VHS     SP-DIF ou AES/ EBU

Tableau 4 Paragraphe 5.5 Enregistrement Audio numérique sur bande vidéo - Systèmes courants

5.5.8 Optimisation lecture

5.5.8.1 L'identification précise du format et des caractéristiques détaillée de la source sonore est essentielle pour assurer une reproduction optimale, opération rendue complexe par la variété des formats dont les caractéristiques physiques apparemment semblables ne rendent pas compte des différents standards d'enregistrement. Les machines devront être régulièrement nettoyées et alignées pour obtenir le meilleur signal dupliqué. Chaque paramètre contrôlé par un opérateur, par exemple la désaccentuation, devra être réglé en relation avec l'enregistrement original. Pour les formats VCR, le tracking vidéo peut nécessiter un ajustement afin d'obtenir le signal de meilleure qualité ; la compensation de drop-out du signal doit-être désactivée.

5.5.9 Corrections des erreurs provoquées par un alignement défectueux du matériel d'enregistrement

5.5.9.1 Les défauts d'alignement du matériel provoquent des imperfections d'enregistrement, qui peuvent prendre des formes différentes. Si de nombreuses imperfections ne peuvent être corrigées ou difficilement, un petit nombre d'entre-elles peuvent être automatiquement détectées et corrigées. Il est impératif de prendre les mesures de compensation dans le processus de lecture des documents originaux concernés car aucune amélioration ne sera possible après transfert du signal sur un autre support.

5.5.9.2 L'ajustement des équipements de lecture des bandes magnétiques numériques visant à remédier à l'alignement défectueux des enregistrements exige un personnel et un équipement de niveau d'expertise technique élevé. L'alignement des têtes tournantes avec le chemin de bande peut-être effectué sur la plupart des machines professionnelles. Pour les enregistrements sur DAT notamment, ceci peut permettre une amélioration significative des corrections ou élimination d'erreurs, et rendre audible des bandes apparemment irrécupérables. Toutefois, de tels réglages exigent des équipements spécialisés et des actions que seuls des personnels formés pourront entreprendre. Une fois les transferts terminés, les équipements devront être réglés dans les conditions nominales par des techniciens de service de maintenance formés.

5.5.10 Elimination d'artefacts du signal dus aux conditions de stockage

5.5.10.1 Dans la plupart des cas, il est préférable de minimiser l'importance des défauts dus aux conditions de stockage avant d'entreprendre le transfert numérique. Les bandes numériques devront être ré-embobinées périodiquement si possible, et dans tous les cas, ré-embobinées systématiquement avant lecture. Le ré-enroulement diminue les tensions mécaniques qui peuvent endommager le substrat de la bande ou réduire les performances durant la lecture. Les bandes numériques en bobines libres laissées enroulées dans un état irrégulier pendant une longue période peuvent présenter des déformations, en particulier des bords, origine possible d'erreurs pendant la lecture. Pour réduire les distorsions dans le bobinage, de telles bandes doivent être ré-enroulées à faible vitesse et laissées en l'état pendant plusieurs mois, ce qui peut contribuer à la réduction des erreurs lors de la lecture. Les cassettes peuvent être affectées de manière semblable, mais l'amélioration du bobinage produite par la réduction de la vitesse d'enroulement ne sera pas aussi efficace dans ce cas.

5.5.10.2 Les champs magnétiques ne diminuent pas de manière mesurable pendant une durée qui serait susceptible d'affecter les performances lors de la lecture. Pour les bandes analogiques, la proximité des pistes ou des couches adjacentes ne produit pas de phénomène d'auto-effacement, et dans le cas peu probable où un tel événement surviendrait pour des bandes numériques anciennes, les conséquences sont rarement critiques : les erreurs mesurées ne dépassent pas les limites. Une certaine perte de signal peut être mesurée pour les bandes d'enregistrement audionumérique vidéo les plus anciennes. Dans de telles circonstances, la faible coercivité des particules magnétiques et la longueur d'onde effective de l'enregistrement numérique de l'information inscrite sur la bande par une tête tournante contribuent à rendre ces conditions possibles, du moins en théorie. L'appareil de lecture peut ainsi rencontrer des difficultés pour suivre la piste (tracking) de l'information inscrite sur la bande. Excepté pour les toutes premières bandes vidéo, les formulations font appel à des particules dont la coercivité est beaucoup plus forte, ce qui, en combinaison avec des systèmes perfectionnés de correction d'erreurs, écarte en grande partie ce type de problème. De toute façon, l'attention portée à la propreté des têtes de la machine de lecture et à celle de la bande optimisera les conditions de lecture, comme le soin apporté à l'ajustement du chemin de défilement de la bande.

5.5.10.3 Des bandes sévèrement dégradées peuvent être récupérées à l'aide de techniques qui relèvent de disciplines scientifiques et d'ingénieries exigeant un niveau élevé de compétences spécifiques. (Voir Ross et Gow 1999). La gestion de collections de bandes numériques devrait viser à assurer la constitution de copies avant que des erreurs incorrigibles ne deviennent un problème, ce qui limiterait en grande partie l'option de restauration de bandes numériques.

5.5.11 Ratio du temps de transfert

5.5.11.1 Le temps nécessaire pour mener à bien la copie des enregistrements audio est très variable, il est largement dépendant de la nature et du statut du support original.

5.5.11.2 Le temps passé à la préparation des opérations varie en fonction des conditions de la source de la copie. La fixation de la durée dépend des caractéristiques des installations et des formats utilisés. Le transfert du signal est généralement un peu plus long que la durée effective de chaque séquence enregistrée, et le temps pris pour la gestion des métadonnées et des matériels dépendra des caractéristiques du système d'archivage utilisé. La plupart des bandes audio d'enregistrement numérique ne permettent pas le téléchargement des données à une vitesse supérieure au temps réel, à l'exception des modèles mentionnés ci-dessus. Toutefois, les systèmes de capture dotés d'instruments de contrôle précis des niveaux d'erreurs et d'alerte lorsque les limites fixées sont franchies permettent de déclencher simultanément plusieurs systèmes de transfert.

5.6 Reproduction des disques optiques (CD et DVD)

5.6.1 Introduction

5.6.1.1 Depuis leur lancement en 1982, les disques optiques préenregistrés ont pris une position dominante dans la technologie de diffusion des enregistrements audio. Les disques optiques enregistrables, dont les premiers exemplaires ont été produits à la fin des années 19801, ont progressivement joué un rôle considérable dans la distribution et le stockage des documents sonores non édités. Commercialisé dans un premier temps comme un support permanent, il est devenu clair que la durée de vie d'usage du disque optique n'étant pas infinie, des mesures devaient être prises pour  préserver leur contenu. Ceci est particulièrement vrai pour les disques enregistrables qui, non seulement sont moins fiables que leur équivalent mais sont ont aussi plus de chance de détenir des enregistrements uniques. A moins d'être enregistrés et gérés dans des conditions bien  spécifiées (voir section 6.6 Disques optiques : CD/DVD enregistrables), les disques optiques enregistrables constituent des supports de collection à haut risque. Ce paragraphe du guide  traite de méthodes rigoureuses et efficaces de recopies de disques CD et DVD vers des systèmes de stockage plus pérennes. CD est l'abréviation de Compact Disc ; dans un premier temps, DVD signifiait Digital Vidéo Disc, puis Digital Versatile Disc, mais le sigle est actuellement utilisé sans se référer à un terme particulier.

5.6.1.2 La famille des CD Audio inclut, dans le format CD-DA : les CD édités, les CD-R et CD-RW, tous étant caractérisés par une résolution numérique de 16 bits, une fréquence d'échantillonnage de 44,1 kHz et une longueur d'onde du rayon laser de lecture de 780 nm. Les DVD Audio incluent les SACD et les DVD-A. Les formats de données tels que les fichiers .wav et BWF peuvent être enregistrés comme fichier de CD-ROM et DVD-ROM. Les supports DVD sont caractérisés par un laser bleu de longueur d'onde de 350 à 450 nm environ pour réaliser le glass master et de 635-650 nm pour la lecture, les DVD+R (650 nm), DVD-R (à la fois pour authoring (635 nm)). Les Blu-Ray (BD) constituent un format vidéo haute définition et un format de données sur un disque de 12 cm de diamètre comme le DVD et le CD. Utilisant un laser bleu de longueur d'onde de 405 nm, les BD peuvent stocker 25 GB par couche.

5.6.1.3 Ecriture, réécriture, effacement et accessibilité

5.6.1.3.1 CD et DVD (CD-A, DVD-A, CD-ROM et DVD-ROM) sont des disques préenregistrés (pressés et moulés) destinés à la seule lecture. Ils ne sont ni enregistrables, ni effaçables.
5.6.1.3.2 CD-R, DVD-R et DVD+R à base de colorant sont enregistrables (une seule fois) mais ne peuvent être effacés.
5.6.1.3.3 CD-RW, DVD-RW et DVD+RW sont des disques à changement de phase, réinscriptibles de manière répétée, ce qui permet l'effacement de données précédemment enregistrées et l'enregistrement de nouvelles données au même endroit.
5.6.1.3.4 Les DVD-RAM sont des disques à changement de phase, réenregistrables et formatés pour permettre des accès aléatoires à la manière des disques durs d'ordinateurs.

5.6.1.4 Le tableau ci-dessous (tableau 1 paragraphe 5.6) fournit une liste des différents types de CD et DVD  disponibles dans le commerce.

Disque Type Capacité
stockage
Laser
Longueur
d'onde
écriture
Laser
Longueur
d'onde
lecteure
Usage type
CD-ROM, CD-A, CD-V Lecture seule 650 MB 780 nm 780 nm Disponible dans le commerce
CD-R (SS) Écriture unique 650 MB 780 nm 780 nm Enregistrement musique, données, fichiers, applications
CD-R (SS) Écriture unique 700 MB 780 nm 780 nm
CD-RW (SS) Réinscriptible 650 MB 780 nm 780 nm Données informatiques, enregistrements, fichiers, applications
CD-RW (SS) Réinscriptible 700 MB 780 nm 780 nm
DVD-ROM, DVD-A,
DVD-V: SS/SL
SS/DL
DS/SL
DS/DL
Lecture seule 4,7 GB
8,54 GB
9,4 GB
17,08GB
650 nm 650 nm Films, jeux interactifs, programmes, applications
DVD-R(G) Écriture unique 4,7 GB 650 nm 650 nm Usage général : enregistrement vidéo à l'unité et archivage de
données
DVD-R(A)
SL
DL
Écriture unique 3,95 or 4,7 GB
8,5GB
635 nm 650 nm Authoring/Usage professionnel, enregistrement vidéo et editing
DVD+R SL
DL
Écriture unique 4,7 GB
8,5 GB
650 nm 650 nm Usage général : enregistrement vidéo à l'unité et archivage de données
DVD-RW Réinscriptible 4,7 GB 650 nm 650 nm Usage général : enregistrement vidéo et sauvegarde PC
DVD+RW Réinscriptible 4,7 GB 650 nm 650 nm Usage général : enregistrement vidéo et editing, stockage de données et sauvegarde PC
DVD-RAM
SS
DS
Réinscriptible 2,6 or 4,7
GB
5,2 or 9,4
GB
650 nm 650 nm Données informatiques: Stockage en entrepôt pour mise à jour, sauvegardes
HD-DVD –R SL
DL
Écriture unique 15 GB
30 GB
405 nm 405 nm Données et vidéo haute définition
HD-DVD –R W SL
DL
Réinscriptible 15 GB
30 GB
405 nm 405 nm Données et vidéo haute définition
BD-R SL
DL
Écriture unique 25 GB
50 GB
405 nm 405 nm Données et vidéo haute définition
BD-RE SL
DL
Réinscriptible 25 GB
50 GB
405 nm 405 nm Données et vidéo haute définition

Tableau 1 Paragraphe 5.6 Types de disques CD/DVD disponibles dans le commerce
SS=Single-sided : Monoface, SL=Single layer : Simple couche, DS=Double-sided : Double face, DL=Dual layer : Double couche

5.6.1.5 Dans les conditions optimales, les disques numériques peuvent produire une copie exacte du signal enregistré. Toutefois, pour certains enregistrements audio, toute erreur non corrigée pendant le processus de lecture sera enregistrée de manière permanente dans la nouvelle copie, ou bien, parfois, des interpolations inutiles seront incorporées dans les données archivées. Aucune de ces manifestations n'est souhaitable. L'optimisation de la procédure de transfert doit assurer l'équivalence la plus proche possible de l'information détenue par le support source. On retiendra comme principe général que les originaux devront toujours être conservés pour permettre de futures consultations, néanmoins, pour deux raisons simples et pratiques, tout transfert doit s'efforcer d'extraire le signal optimal de la meilleure source parmi les copies. Premièrement, les originaux peuvent se détériorer et, en conséquence, dégrader la qualité d'une lecture ultérieure ou, peut-être, rendre celle-ci impossible ; deuxièmement, la durée des extractions est telle que les contraintes financières exigent leur optimisation dès la première tentative.


1. Le premier système CD-R, Yamaha PDS (Programmable Disc System) a été lancé en 1988

5.6.2 Normes

5.6.2.1 Normes des disques compacts : Les normes correspondant aux CD ont été élaborées à l'origine par les sociétés Philips et Sony. Les normes sont désignées par une couleur, la première prenant le nom de Livre rouge CD Audio : Philips-Sony Red Book CD Digital Audio, une norme qui inclut le CD graphique (CD Graphics), le CD graphique amélioré (CD (extended) Graphics), le CD-TEXT, le CD-MIDI, le CD Single (8 cm), le CD Maxi-single (12 cm) et le CDV (12 cm). Les normes du livre jaune (Yellow Book) décrivent le CD comme support de données, celles du livre vert (Green Book) décrivent le CD-I, qui supporte des données interactives ; le livre bleu (Blue Book) définit le CD multimedia amélioré  (Enhanced (multimedia) CD) et enfin le livre blanc (White Book) fournit les spécifications du CD-V (vidéo). Le livre orange (Orange Book) contient les normes de disques CD enregistrables et réinscriptibles (décrit plus en détail dans le chapitre 6). Les normes sous forme de livres de couleur, soumises à certaines restrictions, peuvent être commandées en ligne sur le site de Philips à l'adresse http://www.licensing.philips.com/. Elles sont principalement destinées aux fabricants. Il est possible de se procurer les normes ISO décrivant les CDs auprès de l'Organisation Internationale de normalisation (ISO : International Standards Organisation), Secrétariat central à l'adresse : http://www.iso.org/. IEC 908 : 1987, Compact Disc Digital Audio System (CD-DA) (n.b. la norme IEC 908 : 1987 et le livre rouge de Philips - Sony sont fondamentalement équivalents), ISO 9660 : 1988, Volume and File Structure (CD-ROM) (ECMA-119) et ISO/IEC 10149 : 1995, Read-Only 120 mm Optical Data Discs (CD-ROM) (ECMA-130).

5.6.2.2 Normes DVD : La gamme des normes ISO concernant les DVD est étendue. Néanmoins, comme pour les CD, plusieurs versions d'entre-elles sont propriétaires. Elles suivent une appellation alphabétique : la norme fondamentale de DVD-ROM de données est spécifiée dans le livre A, le DVD vidéo dans le livre B, Le DVD-Audio dans le livre C, le DVD-R dans le livre D et le DVD-RW dans le livre E. Les normes ISO sont mises en vente par l'Organisation Internationale de normalisation (ISO), Secrétariat central à l'adresse  http://www.iso.org/ ISO 7779 : 1999/Amd : 2003 Noise measurement specification for CD/DVD-ROM drives. ISO/IEC 16448 : 2002 Information technology -- 120 mm DVD -- Read-only disc et ISO/IEC 16449 : 2002 Information technology -- 80 mm DVD -- Read-only disc.

5.6.3 Sélection de la meilleure copie

5.6.3.1 Contrairement à la duplication des enregistrements audio analogiques qui implique une perte inévitable de qualité d'une génération à la suivante, la duplication des enregistrements numériques peut avoir des résultats variables, depuis l'état dégradé de copies suite aux ré-échantillonnages ou aux conversions ordinaires, jusqu'aux "clones" absolument identiques qui peuvent parfois être considérés comme étant de meilleure qualité que l'original (par l'action des corrections d'erreurs). Pour choisir la copie-source de meilleure qualité, on devra prendre en compte les références audio telles que la fréquence d'échantillonnage, le taux de quantification ainsi que d'autres spécifications comprenant toute forme de métadonnées intégrées. La qualité des données des copies stockées peut se dégrader avec le temps, ce qui doit être évalué par des mesures objectives. Si une copie unique, et en mauvais état physique existe dans une collection, il peut être prudent de prendre contact avec d'autres services d'archives audio pour essayer de trouver une copie de la même séquence en meilleur état.

5.6.3.2 En règle générale, une copie-source doit être sélectionnée en fonction de l'absence d'erreurs pendant sa lecture, ou pour tout le moins, un minimum d'erreurs. Les disques pressés sont plus stables que les disques enregistrables, ils devraient leur être normalement préférés, si un choix est possible. Les conditions physiques peuvent fournir une indication de qualité, toutefois, la seule méthode sûre de sélection d'un disque exempt d'erreurs consiste à effectuer régulièrement, pendant le processus de transfert, un contrôle d'erreurs avec production d'un rapport. Même avec les contrôles d'erreurs et leurs comptes rendus, l'extraction du signal de meilleure qualité reste problématique par le manque de standards des moyens de lecture, aussi différents lecteurs peuvent-ils produire différents résultats à partir d'un même disque (voir 8.1.5 Disques optiques - Normes). Pour tout transfert numérique-numérique, un rapport d'erreurs doit être édité et incorporé aux métadonnées administratives du fichier numérique archivé, avec les mentions du lecteur utilisé.

5.6.4 Compatibilité de la lecture

5.6.4.1 La variété des standards de lecture et la manière dont ils peuvent être encodés rend nécessaire la sélection d'équipements de bonne qualité. Il est plus que probable, par exemple, que les lecteurs autonomes de CD grand public ne liront que les disques CD-Audio et ses variantes, tandis que le drive de CD-ROM d'un ordinateur pourra lire tous les formats s'il est pourvu des logiciels corrects de description des contenus. Les disques DVD ne peuvent être lus que par des drives ou lecteurs CD, alors que de nombreux drives DVD sont compatibles avec les CD.

5.6.4.2 Les tableaux ci-dessous présentent les compatibilités entre certains drives et les médias
 

Types de disque Drive CD-ROM Drive CD-RW ou CD-R/RW Drive CD-R
Lecture Ecriture Lecture Ecriture Lecture Ecriture
CD-ROM Oui Non Oui Non Oui Non
CD-R Oui Non Oui Oui Oui Oui
CD-RW Oui Non Oui Oui Oui Non

Tableau 2 Paragraphe 5.6 Compatibilité gravure-lecture ; CD

 

Types de disque Lecteur
DVD de salon
Lecture seule
Drive
DVD-­‐ROM
Lecture
seule
(ordinateur)
Drive
DVD-­‐R
(G)
Graveurs
Général-­R
Drive
DVD-­‐R
(A)
Graveurs
Authoring-­R
Drive
DVD-­RW
Graveurs
-­ RW,
Général-­R
Drive
DVD+R
W/+R
Graveurs
+RW, +R
Drive
DVD-­RAM
Graveurs
RAM
DVD-ROM Non Non Non Non Non Non Non
DVD-R(A) Non Non Non Oui Non Non Non
DVD-R(G) Non Non Oui Non Oui Non Non
DVD-RW Non Non Non Non Oui Non Non
DVD+RW Non Non Non Non Non Oui Non
DVD+R Non Non Non Non Non Oui Non
DVD-RAM Non Non Non Non Non Non Oui
CD-ROM Non Non Non Non Non Non Non
CD-R Non Non Oui Non Oui Oui Non
CD-RW Non Non Non Non Oui Oui Non

Tableau 3 Paragraphe 5.6 Compatibilité ; DVD (Mode écriture)

 

Types de disque Lecteur
DVD de salon
Lecture seule
Drive
DVD-­‐ROM
Lecture
seule
(ordinateur)
Drive
DVD-­‐R
(G)
Graveurs
Général-­R
DDrive
DVD-­‐R
(A)
Graveurs
Authoring-­R
Drive
DVD-­RW
Graveurs
-­ RW,
Général-­R
Drive
DVD+R
W/+R
Graveurs
+RW, +R
Drive
DVD-­RAM
Graveurs
RAM
DVD-ROM Non en général Oui Oui Oui Oui Oui Oui
DVD-R(A) Généralement En général Oui Oui Oui Oui Oui
DVD-R(G) Généralement En général Oui Oui Oui Oui Oui
DVD-RW Parfois En général Non Oui Oui En général En général
DVD+RW Parfois En général En général En général En général Oui En général
DVD+R Parfois En général En général En général En général Oui En général
DVD-RAM Rarement Rarement Non Non Non Non Oui
CD-ROM Selon Oui Oui Non Oui Oui En général
CD-R Habituellement Oui Oui Non Oui Oui En général
CD-RW Habituellement Oui Oui Non Oui Oui En général
DVD-Audio
DVD-Video
Tous les drives DVD devraient lire les DVD-Audio ou les DVD-Vidéo si un logiciel DVD-Audio ou DVD-Vidéo est bien installé dans l'ordinateur. Les drives DVD-RAM sont incertains.

Tableau 4 Paragraphe 5.6 Compatibilité DVD (Mode lecture)

5.6.5 Nettoyage, restauration des supports

5.6.5.1 Les CD ou DVD ne nécessitent pas d'opérations de nettoyage régulier lorsqu'ils sont manipulés avec soin, mais toute contamination de surface devra être éliminée avant de procéder à leur lecture ou bien pendant la préparation en vue du stockage. Il est important, durant le nettoyage, d'éviter tout dommage de la surface. La contamination par des particules comme la poussière peut provoquer des rayures lors d'un essuyage ; par ailleurs, l'utilisation de solvants agressifs peut dissoudre et ainsi affecter la transparence du substrat en polycarbonate.

5.6.5.2 Pour éliminer la poussière, on pourra utiliser une soufflette ou un jet d'air comprimé propre ; pour des contaminations plus conséquentes, on rincera le disque avec de l'eau distillée ou de l'eau telle que celle utilisée pour le nettoyage de lentilles. Cependant, des précautions devront être prises vis-à-vis de l'inscription pour de nombreux disques CD-R dont l'encre est soluble dans l'eau. On utilisera un coton doux ou de la peau de chamois pour l'essuyage final du disc. Il faut veiller à ne jamais essuyer le disque dans la circonférence, mais toujours radialement depuis le centre vers l'extérieur ; ceci évite le risque de rayures concentriques qui endommagent des zones importantes de données séquentielles. On évitera l'utilisation de serviettes papier ou de tout accessoires de nettoyage abrasif sur les disques optiques. Pour des contaminations sévères, l'alcool isopropylique peut être utilisé si nécessaire.

5.6.5.3 Il est préférable qu'aucune intervention de  restauration physique, de polissage ne soit entreprise sur les disques optiques d'archive car elles entraîneraient des altérations irréversibles de ceux-ci. Toutefois, si la surface du disque (face lecture) présente des rayures provoquant des niveaux d'erreurs élevés, des actions de idem tendant à rétablir le disque dans un état de lecture possible peuvent être permises à des fins de transfert. Des dispositifs de polissage en milieu humide peuvent être utilisés à condition que des tests portant sur les effets des restaurations soient effectués sur des supports de référence avant de les mettre en œuvre. Les actions entreprises consistent à pratiquer des tests sur des disques ordinaires, à réaliser le processus de restauration puis à reconduire des tests pour évaluer l'efficacité des traitements de restauration (pour des détails supplémentaires, consulter ISO 18925 : 2002, AES 28-1997, ou ANSI/NAPM IT9.21 et ISP 18927 : 2002 / AES 38-2000). Bien que des tests préliminaires de polissage en milieu liquide s'avèrent acceptables, l'enlèvement de matière à la surface du disque fait hésiter les archivistes de documents sonores à accepter une telle approche. De plus, le polissage en milieu liquide est efficace seulement pour les petites rayures : les disques dont les rayures profondes infligées délibérément avec, par exemple, un couteau ou des ciseaux, ne pourront guère être rendus lisibles au moyen d'un tel polissage. Les dommages occasionnés sur la face imprimée ne peuvent bénéficier d'aucune méthode de réparation décrite.

5.6.5.4 Avant et après le nettoyage et / ou opération de réparation et avant duplication des CD et DVD, il peut être conseillé de pratiquer, avant toute chose, des mesures de taux d'erreurs, pour le moins :

5.6.5.4.1 Erreurs en salve dans une trame (Frame burst errors - FBE) ou Longueur d'erreurs en salve (BERL)
5.6.5.4.2 Taux d'erreurs bloc (Block error rate - BLER)
5.6.5.4.3 Erreurs corrigibles avant interpolation (E11, E21) et après interpolation (E12, E22)
5.6.5.4.4 Erreurs incorrigibles (E32)
    
Et de préférence :
5.6.5.4.5 Bruit radial et signaux d'erreurs de suivi de piste (tracking - RN)
5.6.5.4.6 Signaux de haute fréquence (HF)
5.6.5.4.7 Dropouts (DO)
5.6.5.4.8 Erreurs de focalisation (PLAN)

5.6.5.5 Un grand nombre de systèmes de mesures de CD et de DVD, de sophistication, de précision et de coûts variables, sont disponibles. Néanmoins, un testeur fiable constitue un équipement essentiel d'une collection de disques pour déterminer si les limites critiques de taux d'erreurs sont franchies. (cf. 8.1.5 Optical Discs - Standards (Disques optiques - Normes) et 8.1.11 Testing Equipment (Equipement de tests). Après nettoyage et remise en état, si un ou plusieurs taux d'erreurs dépassent ces limites, voir 5.6.3 "Sélection de la meilleure copie".

5.6.6 Equipement de lecture

5.6.6.1 Deux approches fondamentalement différentes de la duplication des sources sur CD audio et DVD se présentent : la lecture traditionnelle avec l'équipement de reproduction au format spécifique ; ou l'extraction numérique audio (digital audio extraction, DAE) qui fait appel à des lecteurs d'usage général CD-ROM ou DVD-ROM, communément désignés par "ripping" (découpage) ou "grabbing" (saisie). Le principal avantage de la capture de données ou méthode de découpage est le gain de vitesse.  Si la reproduction traditionnelle implique des transferts en temps réel, la capture de données ou mode "découpage" utilisant des lecteurs grande vitesse permet d'effectuer aisément des transferts des données audio en dix fois moins de temps.

5.6.6.2 Extraction audio numérique : Le principal inconvénient du mode d'extraction audio numérique concerne la prise en charge des erreurs. Le logiciel de découpage le plus simple n'a aucune capacité de correction d'erreurs. Des systèmes plus élaborés peuvent effectuer des tentatives d'organisation des erreurs, mais ils ne disposent pas des fonctionnalités d'implémentation complètes de détection, de correction et de masquage d'erreurs nécessaires pour assurer des transferts fidèles ; ils sont intégrés dans des équipements de format spécifique. Les systèmes haut de gamme promettent une  idem d'erreurs équivalente à une approche de format spécifique ; pourtant, peu d'entre-eux ont été précisément implémentés.

5.6.6.3 La reproduction à des taux nettement plus élevés que le temps réel est souhaitable car  cela réduit les ressources requises par le transfert des documents audio vers le système d'archivage cible. Lorsque le système d'extraction audio numérique peut être automatisé, cela présente l'avantage de libérer des ressources en personnel au profit des tâches intensives de conversion numérique des documents analogiques. Les systèmes automatisés peuvent être utilisés s'ils ne portent aucune atteinte à la fidélité. En fait, les systèmes les plus perfectionnés présentent moins de risques de produire des données incohérentes qui affecteraient les métadonnées notamment, mais ils peuvent malgré tout impacter le contenu lui-même.

5.6.6.4 La reproduction des données numériques audio devrait toujours être accompagnée d'un système de détection précis d'erreurs et de reconnaissance décrivant et identifiant le type et le nombre d'erreurs spécifique du CD, associant ces éléments aux métadonnées spécifiques du fichier audio. Disposition encore plus critique lorsque des processus automatiques, plus rapides que le temps réel, sont mis en œuvre pour l'acquisition des données audio.

5.6.6.5  La reproduction d’un CD audio est un processus dont le succès, ou peu s’en faut, dépend d’une décision quelque peu subjective. Contrairement au transfert des fichiers de données audio, cette décision peut être prise en considérant seulement le protocole d'erreurs. Les formats de données, tels que .wav ou BWF peuvent être contrôlés objectivement par comparaison bit-à-bit entre anciens et nouveaux fichiers. Le CD audio n'est pas constitué de fichiers numériques, mais d'un flux codé de données audio, une différence significative quand il s'agit d'assurer l'intégrité des documents audio.

5.6.6.6 Les systèmes apportant une garantie de détection et de reconnaissance des erreurs, dotés d'un protocole à grande vitesse de lecture pouvant atteindre 12 fois le temps réel sont disponibles sur le marché, ils répondent généralement au marché spécifique de l'archivage.

5.6.6.7 L'exigence minimale d'un système d'extraction audio numérique à des fins d'archivage porte sur la détection et l'alerte des opérateurs vis-à-vis de toute manifestation d'erreurs audio numérique.

5.6.6.8 Approche d'un format de lecture spécifique : Afin de transférer un CD encodé au format CD-A, un lecteur de salon doit être utilisé. Il est nécessaire d'utiliser un lecteur avec sortie numérique afin d'injecter le flux audionumérique via l'entrée numérique d'une carte son. On préférera l'interface standard AES/EBU pour assurer le transfert du flux audio numérique. L'interface SPDIF peut conduire aux mêmes résultats si on utilise des câbles plus courts. Toute conversion entre AES/EBU et SPDIF nécessite l'harmonisation des différences entre les deux standards, notamment les utilisations différentes des bits de statut qui déclenchent les fonctions d'accentuation et de copyright (Rumsey et Watkinson 1993). Cette approche en temps réel présente l'inconvénient de prendre beaucoup de temps et de ne pas permettre l'inscription des erreurs corrigées détectées dans les métadonnées.

5.6.6.9 Les cartes son connectées aux CD audio doivent s'adapter aux deux canaux 16 bits 44,1 kHz. Les équipements de lecture doivent correspondre à la qualité du marché. Des précautions doivent être prises pour éviter les vibrations du lecteur afin d'assurer une fiabilité maximum de l'extraction des données.

5.6.6.10 Le lecteur de CD doit être en bon état de fonctionnement. En particulier, la puissance du rayon laser qui devra obligatoirement rester optimale. La lentille du bloc optique devra être nettoyée de temps en temps. Des appareils combinant radio et lecteur/enregistreur de disques ne peuvent être utilisés. Il est déconseillé d'utiliser des films de protections (appelés CDfenders / DVDfenders) car ils peuvent se détacher du disque et endommager le lecteur 2.


2. CDs aus dem Kühlschrank, Funkschau no.23, 1994, p.36-39. L'amélioration de l'aptitude à la lecture des CD et DVD par refroidissement dans un réfrigérateur est si minime que, bien que démontré théoriquement (mathématiquement), elle n'a jamais été montrée dans la pratique.

5.6.7 Problèmes des DVD-Audio (DVD-A)

5.6.7.1 Les DVD audio comportent 6 canaux audio 24 bits 96 kHz, et/ou deux canaux 24 bits 193 kHz ; toutefois, les sorties numériques de la plupart des lecteurs DVD sont limitées à la résolution de 16 bits 48 kHz pour contrôler les risques de piraterie. LE DVD forum a sélectionné IEEE 1394 (firewire) pour interface du DVD Audio, utilisant le protocole "Audio and Music Data Transmission Protocol" (A&M Protocole) (http://www.dvdforum.com/images/guideline1394V09R0_20011009c.pdf).

5.6.7.2 Le décodage des formats compressés tels que MLP peut être effectué par le lecteur ou lors d'une étape ultérieure de traitement. Les disques peuvent comporter différentes versions : avec ajouts de signaux d'ambiance combinés avec la stéréo, avec des pistes alternatives, accompagnement vidéo, etc., ce qui implique une décision politique considérant toutes les versions collectées ou bien, au contraire, décider d'une alternative à des fins d'archivage. Il est important également, que le personnel des archives soit informé que les disques hybrides, tels que ceux enregistrés conformément au standard du Blue Book / Enhanced CDs, puissent contenir d'autres formes de données. Les graphiques ou données textuelles peuvent constituer des composantes critiques de l'œuvre, aussi convient-il d'en assurer l'acquisition et la conservation.

5.6.8 Problèmes du Super Audio CD (SACD)

5.6.8.1 Le format SACD est basé sur la technique Direct Stream Digital (DSD), procédé d'échantillonnage sur un bit à la fréquence 2,8 MHz non directement compatible avec le PCM linéaire. Au moment d'écrire ces lignes, l'intégration de ce type de signal dans un système d'archivage audio connaît des restrictions, la plupart des lecteurs SACD ne comprennent pas de sortie de flux bitstream SACD ou de sortie signal haute qualité PCM délivré par le flux bitstream. Sony dispose de sa propre interface I-Link firewire. D'autres fabricants ont commercialisé des interfaces propriétaires pouvant prendre en main SACD dans son format natif, mais il n'existe pas d'interface numérique standard de ce format en mesure d'être largement accepté. Les promesses de la mise en œuvre d'un protocole adapté de transmission du SACD par l'interface firewire IEEE 1394 peuvent ne jamais aboutir.

5.6.8.2 Les stations développées pour le mastering SACD permettent l'entrée, la sortie, le traitement des signaux DSD (http://www.merging.com/). On notera que, même pour les traitements basiques, tels que l'ajustement de gain des flux DSD ou SACD, l'approche des traitements informatiques est totalement différente du fait de l'utilisation d'algorithmes différent du PCM. En conséquence, la restauration et l'utilisation de signaux audio encodés à un tel format seront limitées à moins de les convertir en PCM.

5.6.9 Ratio de temps de transfert

5.6.9.1 La durée d'insertion des données audio à partir d'un disque optique, effectuée en temps réel, avoisine un facteur deux par heure de programme. Les approches DAE peuvent réduire cette proportion d'un facteur 10 ; un système juke box chargé de 60 CD et davantage peut effectuer l'opération en quelques heures sans intervention humaine hormis le chargement initial. Une durée supplémentaire doit-être ajoutée pour la sélection des meilleures copies, pour la recopie en cas d'erreurs inacceptables, ainsi que pour la gestion des fichiers et des données.

5.6.10 Minidisc

5.6.10.1 Le MiniDisc original (MiniDisk, MD) est apparu sous deux formes : disque dupliqué en masse, fonctionnant selon les principes du disque optique, et disque enregistrable, réenregistrable en fait, constitué d'un matériau d'enregistrement magnéto-optique (voir section 8.2 disques magnéto-optiques). Les deux sous-formats peuvent être lus par les mêmes lecteurs. Les disques, d'un diamètre de 2,5 pouces (64 mm), sont insérés dans un boîtier (caddie). L'enregistrement des MiniDisc utilise le codage Adaptative Transform Acoustic Coding (ATRAC), un algorithme de réduction de débit élaboré sur le codage perceptuel. Bien que très développés (au moins dans les dernières versions d'ATRAC), les formats de réduction de données éliminent de manière définitive ce qui serait capturé par un format non réducteur, et créent également des artefacts tant dans le domaine temporel que spectral. De tels artefacts peuvent produire des erreurs d'interprétation concernant les composantes spectrales aussi bien que les composantes temporelles, particulièrement lors de l'analyse du signal au moyen d'outils spectraux. Les artefacts dus aux codecs de réduction de données ne peuvent faire l'objet de nouveaux calculs ou de compensations après la phase de traitement, car ils dépendent du niveau, de la dynamique et du spectre du signal original. ATRAC est un format propriétaire qui comporte de nombreuses versions et variations, aussi lorsqu'un objectif d'archivage est envisagé, il est conseillé de ré-encoder les fichiers d'enregistrement comprimés en formats de fichiers tels que .wav.

5.6.10.2 De nombreux lecteurs de MiniDiscs sont dotés d'une sortie numérique produisant un flux de données "pseudolinéaires". Les fichiers résultants devront respecter les spécifications présentées dans le chapitre 2, principes fondamentaux du numérique et être stockés conformément aux recommandations énoncées. Les métadonnées concernant l'origine de tels signaux sont impératives, les formats pseudolinéaires ne pourraient être distingués des formats enregistrés sans réduction de données. Il conviendra d'enregistrer cette information dans l'historique d'un fichier BWF, ou de mentionner l'historique des modifications selon les recommandations PREMIS (voir chapitre 3 Métadonnées).

5.6.10.3 En 2004, le Hi-MD est commercialisé, il intègre des changements du hardware qui, avec les nouveaux media, peut enregistrer jusqu'à 1 GB de données audio. Avec le Hi-MD, il était possible d'enregistrer plusieurs heures de signaux audio compressés mais, plus important, ce format était également capable d'enregistrer des signaux PCM linéaires. A des fins d'archivage, ces enregistrements devront être traités comme les signaux CD et le flux de données, transféré vers les fichiers compatibles avec un système de stockage. L'extraction directe de données audio depuis un HD-MD à haut débit nécessite l'utilisation de logiciels spécifiques propriétaires, dont certains sont disponibles sur des sites de fabricants. Il est conseillé d'acheter immédiatement des équipements de lecture dédiés et les logiciels car le support des fabricants ne peut être garanti dans la durée.20

5.6.10.4 L'utilisation du MiniDisc comme enregistreur n'est pas recommandé (voir section 5.7 Technologies d'enregistrement sur le terrain et approches d'archivage).


20. Sony a annoncé l'arrêt de fabrication des MiniDisc en mars 2013.

5.7 Technologies d'enregistrement sur le terrain et approches d'archivage

5.7.1 Introduction

5.7.1.1 De nombreuses collections ont été constituées grâce à des campagnes d'enregistrements effectués sur le terrain, et peut-être aussi avec des acquisitions et des transferts de conservation d'enregistrements historiques effectués selon des formats et des systèmes d'archivage stables. Ces enregistrements de terrain peuvent servir à la constitution de collections d'histoire orale, à l'élaboration de programmes d'événements traditionnels et culturels, ils peuvent concerner des sources d'enregistrements d'environnement sonore et de la faune, ou bien encore relever de collections de radiodiffusion. Quel que soit le contenu des enregistrements destinés à être conservés durablement dans des collections d'archives, il est plus efficace de prendre les décisions relatives à la durée de vie au moment de planifier tout enregistrement. En effet, opter pour des formats et des technologies inappropriés peut limiter sévèrement la durée de vie et l'usage des documents sonores.

5.7.1.2 L'enregistrement sur le terrain peut être entrepris en divers endroits et situations, il peut concerner toutes formes de sources sonores : humaines, technologiques, les plantes ou les animaux, l'environnement lui-même. Des enregistrements peuvent avoir pour objet la saisie du contexte acoustique comprenant le son désiré, qui peut-être isolé de l'environnement, ou bien, dans le cas contraire, bénéficier des technologies permettant de minimiser la composante environnementale enregistrée. Les enregistrements peuvent être réalisés en chaises longues dans des grandes villes, sous les vérandas de bungalows éloignés, en l'absence de toute technologie et de service. Les cas sont pratiquement illimités, aussi ce chapitre portant sur la technologie d'enregistrement in situ ne cherche-t-il pas à discuter dans le détail des différentes disciplines spécifiques impliquées. Il répond plutôt à la simple question : "Comment allez vous réaliser le meilleur enregistrement sonore in situ pour assurer son archivage à long terme ?"

5.7.1.3 Cette section se place entre les chapitres portant sur l'extraction du signal et les chapitres traitant des technologies de stockage. Elle aborde ici la création du contenu sonore numérique et son intégration dans des systèmes de stockage dont il sera question dans les chapitres suivants.

5.7.2 Normes d'enregistrement sur le terrain

5.7.2.1 Les mêmes normes techniques d'enregistrement s'appliquent aux enregistrements sur le terrain et aux transferts pour archivage ; c'est-à-dire qu'ils doivent être captés et stockés dans des conditions d'usages générales, dans des formats de fichiers audio linéaires, .wav ou BWF.wav généralement ; ils doivent être créés à des taux d'échantillonnages souhaitables, au moins 48 kHz, mais selon les objectifs, à des taux plus élevés, 96 kHz ou bien dans certaines circonstances, 192 kHz ou plus. Il est conseillé de réaliser les enregistrements à 24 bits. Des taux inférieurs ne reflèteront pas l'échelle dynamique de la production sonore enregistrée dans son environnement, ils pourront abaisser le niveau du signal, c'est-à-dire sa qualité.

5.7.2.2 Quelle que soit la résolution choisie, il est conseillé de réaliser l'enregistrement natif dans un format standard. Cette disposition permettra d'effectuer des transferts d'archive sans altération de celui-ci et simplifiera les processus d'archivage. L'utilisation du format BWF facilite la collecte de métadonnées indispensables au cycle de vie de l'information numérique archivée.

5.7.2.3 La réduction de données (dites compressées dans le langage courant) par l'encodage MP3 ou ATRAC par exemple génère des enregistrements qui ne correspondent pas aux formats d'archives. Les formats de données compressées, bien que très développés, non seulement négligent de manière irrémédiable la récupération de données, ce qui ne serait pas le cas avec des formats non compressés, mais créent également des artefacts aussi bien dans le domaine temporel que spectral. De tels artefacts peuvent conduire à des erreurs d'interprétation des composantes spectrales et temporelles, surtout lorsque l'on pratique l'analyse du signal au moyen d'outils de représentation fréquentielle. Les artefacts résultants des codages de réduction de données ne peuvent être recalculés ou compensés lors d'un traitement a posteriori car ils dépendent du niveau, de la dynamique et de la composition spectrale du signal original. A des fins d'archivage, il est conseillé de ré-encoder les fichiers d'enregistrement dont les formats sont compressés en fichiers .wav (de même pour le Minidisc et les codecs avec perte de première génération (voir 5.6.10 Minidisc). Même si cette procédure ne remplace pas des données manquantes, elle réduit davantage la dépendance vis-à-vis des codecs.

5.7.3 Sélection des équipements d'enregistrement

5.7.3.1 La décision d'utiliser un équipement particulier d'enregistrement dépend de nombreux facteurs. Toutefois, un nombre important de problèmes techniques communs à toutes les situations d'enregistrement peuvent être regroupés en trois parties : compatibilité des archives, qualité audio, fiabilité.

5.7.3.2 Compatibilité des archives

5.7.3.2.1 Le choix du format d'enregistrement dans le domaine numérique a un impact durable et irréversible  sur la vie des archives : ainsi les formats de compression avec perte peuvent-ils restreindre certaines utilisations. Pour cette raison, le dispositif d'enregistrement doit être choisi en fonction du format assurant la compatibilité des archives. La technologie actuelle offre la possibilité d'enregistrer directement, dans un format élémentaire, des fichiers à l'aide d'un dispositif équipé d'un disque dur ou à d'une mémoire statique. De tels systèmes offrent habituellement le choix entre plusieurs formats d'enregistrement en mode linéaire ou compressé. La sélection de .wav ou BWF.wav est recommandée. Les formats bruts ou propriétaires seront évités car ils devront être, dans bien des cas, transférés en .wav ou BWF.wav via un logiciel propriétaire pour constituer des archives à long terme. En accord avec les recommandations archivistiques, les formats d'enregistrement avec compression ne doivent pas être utilisés.

5.7.3.2.2 Un microordinateur portable convenablement équipé constitue une solution alternative aux enregistreurs portables dédiés. En ajoutant un pré-ampli microphonique et un convertisseur analogique - numérique de haute qualité (voir Section 2.4 Convertisseurs analogique - numérique (A/N)), le son peut être enregistré directement sur l'ordinateur portable en utilisant un des nombreux logiciels d'enregistrement disponibles. Les recommandations énoncées à propos des formats de fichiers s'appliquent ici également : il est généralement préférable d'enregistrer directement dans le format d'archivage. Cette solution est pratique, mais la consommation élevée d'énergie électrique, le bruit acoustique pouvant être généré et le manque de discrétion réservent ces pratiques à quelques cas de figures seulement.

5.7.3.2.3 Les ordinateurs portables, ainsi que de nombreux dispositifs d'enregistrements nomades peuvent-être configurés de telle manière que l'enregistrement soit effectué simultanément sur un disque externe. Cette stratégie de sécurité renforcée est évoquée au paragraphe 5.7.5.1 (Transfert et sauvegarde du contenu initial).

5.7.3.3 Qualité audio

5.7.3.3.1 La qualité audio doit être sélectionnée en fonction des recommandations du chapitre 2 en matière d'archives : Clés du numérique - Principes. Les exigences vis-à-vis de la qualité des enregistrements s'appliquent aux contenus de tous types. Contrairement aux opinions répandues, les enregistrements de voix parlée doivent bénéficier tout autant de la résolution élevée adoptée pour les enregistrements musicaux. On peut argumenter le fait que la dynamique de la parole dans son environnement exige davantage de la technologie d'enregistrement que de nombreuses autres formes musicales. En outre, si des analyses fines du signal sont demandées, la plus haute qualité sera nécessaire.

5.7.3.4 Microphones

5.7.3.4.1 La discussion ci-dessous à propos des microphones se limite aux questions relatives à la création d'archives sonores. On pourrait en dire beaucoup plus à propos de ces microphones qui sont, par essence, utilisés dans la partie la plus créative et manipulable du processus, aussi est-il recommandé que tout preneur de son sur le terrain soit familiarisé avec l'utilisation de ces outils.

5.7.3.4.2 L'utilisation de microphones séparés de l'enregistreur est recommandée dans la plupart des situations d'enregistrement. Ceci minimise le bruit inhérent au système capturé par des microphones intégrés et évite le bruit de manipulation de l'enregistreur en fonctionnement. La qualité des microphones doit être suffisante pour répondre aux besoins de l'enregistrement mais aussi aux spécifications du dispositif d'enregistrement, en particulier le rapport signal sur bruit (rapport S/B). Pour être en mesure de capter toute l'échelle dynamique possible, et donc enregistrer sur 24 bits, l'utilisation de microphones externes de bonne qualité dotés d'un préamplificateur convenable est nécessaire alors que la plupart des équipements d'enregistrement et des microphones de moindre qualité compromettraient ce point crucial.

5.7.3.4.3 Dans certaines situations d'enregistrement, les caractéristiques d'emplacement associées avec les événements sont importantes. Pour recueillir de telles informations, il est nécessaire d'utiliser une paire de microphones externes déployés selon des dispositions normalisées (voir Section 5.7.4.3 ci-dessous). Une disposition normalisée de microphones fournira des caractéristiques sonores stéréophoniques compréhensibles tandis que les microphones fixes internes qui équipent de nombreux dispositifs, ne correspondent pas généralement à une disposition normalisée et  ne peuvent, en outre, être manipulés. Le microphone à condensateur sont les plus sensibles, et sont généralement préférés pour les meilleurs résultats d'enregistrement qu'ils proposent. Ces microphones nécessitent une alimentation fantôme qui est généralement fournie avec un système d'enregistrement professionnel, (commutable dans l'idéal), mais ils peuvent aussi être alimentés par des batteries externes ou bien à partir du secteur. Les microphones à condensateur risquent d'être endommagés dans des conditions d'utilisation difficiles aussi peut-il être préférable de faire des compromis sur la sensibilité et d'utiliser des microphones plus robustes tels que les microphones dynamiques dans certaines situations. Les microphones à condensateur sont aussi très coûteux ; mais de très bons résultats peuvent être obtenus grâce aux microphones à électret de la plus haute qualité. Ceux-ci comportent une capsule chargée de manière permanente, mais ils peuvent aussi fonctionner sur une plus longue durée lorsqu'ils sont équipés d'une petite pile. Les enregistrements effectués à l'extérieur à l'aide de microphone à condensateur ou à électret, nécessitent un dispositif anti-vent. L'utilisation incorrecte, improvisée de bonnette anti-vent risque de se faire au détriment des caractéristiques d'enregistrement, elle peut altérer la directivité des microphones, rendre l'enregistrement moins réaliste. L'utilisateur doit être informé de tels risques lorsqu'il choisit d'utiliser une bonnette anti-vent).       

5.7.3.5 Fiabilité

5.7.3.5.1 Les équipements non fiables peuvent potentiellement être à l'origine de la perte d'information pour des enregistrements réalisés, ou tomber en panne juste au moment de son utilisation. Pour minimiser les risques de défaillance, les dispositifs d'enregistrements devront être choisis sur des critères de fiabilité maximum. Les appareils grand public bon marché sont, dans de nombreux cas, fragiles et de qualité insuffisante ; ils peuvent être facilement détériorés, ils ne doivent pas être utilisés sur le terrain sans avoir été au préalable soigneusement testés. Outre leur plus grande robustesse, les appareils professionnels comportent des circuits et interfaces plus fiables, des entrées microphoniques symétriques permettant le branchement de câbles de grande longueur, et des connecteurs professionnels plus fiables. Même s'il est plus probable que les équipements à faible coût soient davantage sujets aux dégradations et aux pannes, le prix constitue seulement un indicateur de fiabilité, aussi tout l'équipement devra-t-il être testé soigneusement avant utilisation sur le terrain.

5.7.3.6 Test et maintenance

5.7.3.6.1 Quel que soit leur coût ou leur qualité, les équipements d'enregistrement devront être systématiquement et régulièrement testés, leur maintenance assurée  pour bénéficier d'un fonctionnent fiable et précis, notamment dans les conditions de terrain. L'intégrité du système d'enregistrement devra être testée en particulier s'il a subi une chute ou s'il a été transporté dans des conditions non conventionnelles. La réponse fréquentielle des microphones devra être régulièrement mesurée afin de s'assurer de leur bon fonctionnement. La protection vis-à-vis de la poussière ou de l'humidité est essentielle pour maintenir les équipements dans de bonnes conditions de fonctionnement. Des vérifications régulières et le nettoyage des dispositifs, y compris des connecteurs et autres surfaces constituent des opérations vitales pour maintenir la fiabilité des appareils d'enregistrement. Les équipements devront pouvoir s'acclimater aux changements environnementaux, en particulier lorsqu'ils sont déplacés depuis un espace froid et sec, tel la soute d'un avion cargo, dans une atmosphère chaude et humide. Tous les résultats de tests devront être conservés pour permettre un suivi des conditions de maintenance des équipements de terrain et anticiper les changements de pièces qui se montreraient nécessaires.

5.7.3.7 Autres considérations concernant les matériels d'enregistrement sur le terrain

5.7.3.7.1 Si les spécifications et caractéristiques techniques participent à la détermination de la qualité et de la fiabilité des dispositifs d'enregistrement, d'autres éléments d'ordre pratique peuvent influencer leur choix selon les circonstances d'enregistrement envisagées. Des facteurs de décision importants comprennent : une durée d'enregistrement suffisante avec alimentation sur batterie ; une conception robuste et compréhensible ; une manipulation aisée ; un matériel de taille réduite, léger mais robuste. L'éclairage des cadrans de contrôle est essentiel pour enregistrer dans l'obscurité mais il consomme davantage d'énergie électrique. Selon les circonstances d'enregistrement, une décision doit-être prise en faveur des supports amovibles (carte mémoire flash ou SD par exemple) ou bien d'un disque dur permettant une stratégie de sécurité adaptée (voir Section 5.7.5 Transfert et sauvegarde des données sur le terrain). Dans l'idéal, le dispositif devra permettre un transfert et une duplication rapides et simples des données, et être extrêmement discret (ce dernier point réduit l'intrusion visuelle pendant l'enregistrement et contribue également à limiter les risques de vol).

5.7.4 Approche de l'enregistrement

5.7.4.1 Le but dans lequel l’enregistrement est effectué et les règles propres à la discipline dont il relève orientent l'approche des opérations sur de nombreux aspects : techniques microphoniques et autres. Cependant,  les pratiques d’enregistrement partagent un certain nombre de préoccupations communes.

5.7.4.2 Généralement, les enregistrements de terrain rendent compte, par la fixation du son ou de la documentation associée, d'une situation donnée. Dans ces circonstances, la dynamique originale dans laquelle se déroule l'action devrait être respectée dans l'enregistrement. Le réglage du niveau d'entrée audio doit s'appuyer sur le signal désiré, et non sur celui du bruit de fond ambiant, aussi les ajustements en cours d'enregistrement devront-ils être effectués judicieusement, voire pas du tout. L'utilisation de la fonction de contrôle automatique de gain n'est pas recommandée, ces pratiques falsifient en quelque sorte la dynamique originale par l'augmentation du niveau des séquences de faible intensité (et donc celui du bruit) et par l'atténuation de la dynamique du signal souhaité. Aussi, l'utilisation du moindre limiteur pendant l'enregistrement devra-t-elle être conduite avec précaution. Un limiteur bien ajusté pourra sauver un enregistrement lorsqu'un son intense surgit brusquement, alors qu'il n'aura absolument aucune incidence sur les autres séquences enregistrées, n'étant pas déclenché par une augmentation brutale de niveau. En revanche, un limiteur mal réglé peut donner l'illusion d'un niveau de modulation correct alors que le microphone lui-même peut être porté à saturation. Chaque fois qu'il est possible, le réglage manuel du niveau est préférable, et tout limiteur, bien ajusté pour ne pas agir sur les signaux normaux, ne sera activé qu'après réglage du niveau optimal.

5.7.4.3 Lorsqu'on effectue l'enregistrement d'un événement noyé dans un bruit ambiant, on a intérêt à utiliser un dispositif microphonique stéréo. De nombreuses approches sont possibles mais nous ne présenterons ici, et brièvement, que des exemples de couples quasi-coïncidents tels le couple ORTF (Office de Radiodiffusion Télévision Française), la paire croisée XY, la paire parallèle AB et le procédé MS (Mid-Side).

5.7.4.4 Le couple ORTF semble être le plus couramment utilisé lorsqu'on doit réaliser l'analyse et l'évaluation des propriétés de l'enregistrement. Dans ce cas, les capsules des microphones sont distantes de 16 cm et forment un angle de 110°. Quand on fait l'analyse d'un enregistrement ORTF avec un casque, on constate l'augmentation de la capacité mentale de localiser le son désiré dans un environnement bruité : phénomène appelé effet "cocktail party". Cette disposition des microphones transmet, lors de l'écoute binaurale au casque, une information supplémentaire qui facilite l'identification des événements recherchés noyés dans un champ sonore bruyant. En outre, en reprenant les spécifications de l'ORTF, la configuration du couple peut aisément être réinstallée de manière standard.

5.7.4.5 Les paires croisées standard XY sont disposées de telle manière que les capsules des microphones soient le plus proche possible et forment un angle d'au moins 90° entre-elles. Dans l'idéal, l'intensité de l'énergie sonore portant l'information est enregistrée sans différence de phase. Cette technique permet une bonne reproduction de l'enregistrement  sur haut-parleurs, mais elle ne propose pas une meilleure séparation de l'information comparativement aux autres techniques. La paire parallèle AB utilise deux microphones omnidirectionnels en parallèle, distants de 50 cm environ. Cette technique est plébiscitée lorsque les conditions acoustiques sont excellentes,  mais elle produit rarement de  bons résultats dans des environnement très bruyants. Des problèmes d'annulation de phase peuvent se produire lors de la sommation mono des deux canaux.

5.7.4.6 Le procédé MS (Mid-Side) fait appel à un microphone bidirectionnel bien positionné par rapport à la source sonore, et à un microphone cardioïde (parfois un microphone omnidirectionnel) pointé vers la source. Les deux signaux enregistrés peuvent alors être repris pour produire un enregistrement compatible mono / stéréo (M+S, M-S). Lorsque l'enregistrement a été réalisé avec les informations MS, le signal peut être modifié par la suite, et ainsi assurer le contrôle de l'ouverture apparente des microphones.

5.7.4.7 Dans certaines situations, lorsque la nature exacte de l'événement à enregistrer est inconnue, il peut-être avantageux d'utiliser des microphones directionnels amovibles, des dispositifs faisant appel à des microphones multiples et des moyens d'enregistrement multipistes. Pour les entretiens (interviews), on peut utiliser deux microphones orientés vers chaque participant, conditions tout à fait acceptables. Dans de nombreux cas, les microphones cravates se montrent moins utiles car ils captent les bruits de fond provenant des mouvements des personnes, leur respiration, leurs vêtements, leurs bijoux. Ils n'apportent que peu, voire aucun de ces éléments concernant les conditions environnementales qui sont souvent une partie intégrante et intéressante du cadre d'enregistrement.

5.7.4.8 La technologie du microphone contribue à la qualité des séquences enregistrées et la très brève évocation de celle-ci constitue un simple recueil de leurs capacités. Il est recommandé de rapprocher les objectifs concernant la réalisation d'enregistrements sur le terrain avec toutes les possibilités offertes par les meilleures techniques microphoniques avant de réaliser des enregistrements importants.

5.7.5 Transfert et sauvegardes des contenus audio sur site

5.7.5.1 Les enregistrements sur le terrain restent vulnérables : à moins de réaliser des copies de sauvegarde, la perte de données risque de se produire. Une seconde copie des enregistrements réalisés sur site devra être réalisée simultanément avec l'enregistrement ou sitôt après la fin de la session.  Différentes situations et tâches à accomplir impliquent diverses approches, mais les actions devront toujours offrir la meilleure stratégie de sauvegarde.

5.7.5.2 Les enregistreurs à disque dur et cartes mémoire offrent une base technologique d'enregistrement des fichiers sur de tels supports. L'enregistrement est généralement éliminé de l'un de ces media après transfert du fichier sur un autre environnement de stockage. Il est clair que les nouvelles technologies constituent un domaine à risque qui doit être géré avec précaution afin d'éviter toute perte de l'information sonore souhaitée. Le support d'enregistrement doit être considéré, aussi longtemps que possible, comme le support original. Il doit être effacé seulement après s'être bien assuré que le transfert des données dans le système d'archivage a été effectué correctement. Dans le cas d'une campagne d'enregistrement conséquente, lorsque de grandes quantités de données ne peuvent être immédiatement archivées, des opérations de duplication et de stockage des copies doivent être engagées sur le terrain. Avec les enregistreurs à carte flash ou SD, il peut être utile de se procurer des cartes supplémentaires pour conserver les enregistrements jusqu'à ce qu'ils soient transférés sur un système de stockage plus pérenne. Avec les enregistreurs sur disque dur ou les ordinateurs portables, des systèmes de stockage sur disque dur externe peuvent être utilisés pour réaliser des copies de sauvegarde jusqu'à ce que les données soient effectivement transférées.

5.7.5.3 En pratique, certains dispositifs permettent l'utilisation en parallèle de disques durs et de cartes mémoires, ou bien encore l'enregistrement en parallèle sur disque dur. Ceci constitue un avantage,  car le dispositif d'enregistrement permet ainsi d'effectuer une copie automatique de sécurité hors du système d'enregistrement, processus qui doit être appliqué dès que possible. Par ailleurs, des copies de sécurité peuvent être effectuées sur place manuellement, sur disques durs externes, sur ordinateurs portables, ou pour le moins sur des enregistreurs de CD / DVD.

5.7.5.4 Certains dispositifs créent automatiquement des noms de fichiers quand un nouveau support de stockage est inséré (numérotation générée automatiquement avec le même nom de fichier sur chacun des nouveaux supports), ainsi le processus de copie doit-il être mené avec précautions pour s'assurer que les noms identiques sur différents supports soient correctement associés aux métadonnées / aux notes prises in situ etc. Dans le pire des cas,  il peut arriver qu’on efface accidentellement des fichiers de même nom, aussi une structure soigneusement étudiée et une stratégie de nommage sont-elles nécessaires. Il est recommandé de renommer les fichiers après copie, ce qui évite toute nouvelle modification ou manipulation des fichiers originaux.

5.7.6 Description des métadonnées et des collections

5.7.6.1 L'absence de métadonnées décrivant l'enregistrement de terrain, son contexte et les droits associés, limite sévèrement l'intérêt de l'enregistrement. L'absence de métadonnées (y compris les métadonnées de conservation) peut avoir de sérieuses conséquences, non seulement pour l'intégration des enregistrements dans un système de base de données, mais aussi pour la gestion ultérieure des archives et leur diffusion. Cette donnée est si importante que l'absence de celle-ci peut amener les gestionnaires à refuser le contenu. Il faut compter aussi avec les informations critiques d'ordre technique relatives  à la conservation, bien nécessaires lors de l'acquisition des enregistrements réalisés sur le terrain, et qui doivent être recueillies au moment de l'enregistrement et incorporées au document archivé. Elles comprennent :

5.7.6.1.1 Le dispositif d'enregistrement : marque, modèle, numéro, description des ajustements dynamiques effectués au cours de la prise de son, les niveaux le format d'enregistrement, l'encodage (qui n'est pas recommandé mais si les circonstances exigent qu’on y procède, il doit être documenté).

5.7.6.1.2 Microphones : type de microphone / diagramme polaire, information concernant leur disposition, distance, application particulière (tel microphone cravate, technique analytique avec microphones multiples etc.).

5.7.6.1.3 Utilisation d'accessoires supplémentaires tels que bonnette anti-vent, etc. description de la situation dans la pièce, etc.

5.7.6.1.4 Support : type, spécifications du support original (carte flash, disque etc.) ou disque dur.

5.7.6.1.5 Source d'alimentation électrique : batteries, secteur (50 ou 60 Hz alternatif, conditions d'instabilité, fluctuation du secteur, etc.

5.7.7 Métadonnées et outils de terrain

5.7.7.1 Les enregistrements effectués sur le terrain sont réalisés en relation avec d'autres enregistrements, autres événements, différents objectifs poursuivis et différents contenus sonores. Les communautés de chercheurs se développent en vue de disposer des outils d'acquisition de données et métadonnées intégrées qui permettant de documenter, de relier les objets sonores les uns avec les autres, et de préciser les circonstances de leur création : lieu, heure. Entre-temps, différents outils répondant aux critères spécifiques des métadonnées ont été réalisés dans le cadre de projets internationaux. Ces outils concernent la collection pratiquement complète de métadonnées, ils permettent de réaliser des transferts pour faciliter l'élaboration d'un système de bases de données et garantir la mise à disposition de données précises à de futurs chercheurs. Au moment de la rédaction de ces lignes, le développement de tels outils et de tels concepts se trouve être dans une première phase, ils tendent aussi à prendre en compte les données d'une discipline spécifique, thème qui ne sera pas discuté ici. Toutefois, il est important de souligner que toutes les données techniques décrites ci-dessus doivent être prises en compte pour les futurs systèmes de gestion et d'accès. On gardera à l'esprit que toutes les données acquises devront souscrire à la compatibilité de transfert vers le système d'archivage final. Jusqu'à la mise en œuvre de normes en la matière, il est recommandé d'utiliser les caractères UNICODE et le format XML.

5.7.7.2 Si les métadonnées sont recueillies manuellement, sans faire appel aux outils d'acquisition tels que ceux mentionnés précédemment, on recommande l'utilisation d'un format pouvant être facilement transféré dans les structures de bases de données courantes. Dans d'autres cas, des institutions et services d'archives fournissent leurs outils propres que l'on devra mettre en œuvre sur le terrain dans la mesure du possible.

5.7.8 Le facteur temps

5.7.8.1 Le temps nécessaire pour enregistrer un événement important ou un entretien peut être long. Le temps pris pour conserver un enregistrement effectué sur le terrain peut-être réduit à la simple durée d'acquisition des données et des métadonnées si les conditions de prise de son et de saisie ont été bien conçues. Si le système est manuel, il est fort probable que nombre de précieuses informations seront perdues à la suite d'erreurs humaines ou par manque des ressources nécessaires à la prise en charge de ce long mais indispensable travail d’archivage.

6: Formats et systèmes cibles de pérennisation

6.1.1 Introduction

6.1.1.1 L'information présentée ci-dessous à propos de la gestion, du stockage à long terme, de la pérennisation des documents sonores numérisés et codés, s'appuie sur le postulat qu'il n'existe pas de support de stockage pérenne, et que l'on ne prévoit pas qu’il en existe dans un futur proche. Aussi, les responsables d'archives sonores numériques doivent-ils planifier l'organisation de la conservation et des systèmes de stockage en fonction de l'évolution des processus, des changements inévitables des formats, des supports et autres technologies impliquées. Les services d’archives n’ont pas de contrôle ni guère d’influence sur la rapidité des développements technologiques ni sur les formes qu’ils prennent. L'objectif premier de la préservation numérique est donc de réaliser des systèmes durables plutôt que des supports permanents.

6.1.1.2 Le choix d'un système technologique de stockage dépend de nombreux facteurs dont le coût n'est qu'un élément parmi d'autres. Si le type de technologie choisi pour assurer la conservation d'une collection peut différer en fonction de circonstances propres à l'institution ou à la collection elle-même, les principes de base esquissés ici s'appliquent quelle que soit la manière d'aborder la gestion et d'assurer le stockage à long terme des documents audio numériques.

6.1.2 Stockage de données ou de documents audio spécifiques

6.1.2.1 Pour gérer efficacement un document sonore numérique et le maintenir en état, il est nécessaire de le transformer dans un format normalisé. Les formats de données sont des fichiers types, tels que .wav, BWF ou AIFF, reconnus par des systèmes informatiques. Ces fichiers, contrairement aux supports spécifiques audio, définissent les limites de leur propre contenu, ils sont généralement encodé de telle manière que toute perte de données soit détectée et corrigée par le système hôte. IASA recommande l'utilisation du format BWF tel que défini dans le paragraphe 2.8 Fichiers de Formats.

6.1.2.2 Les anciens formats spécifiques d'enregistrement audio incluent les formats DAT (Digital Audio Tape) et CD-A (Compact Disc - Digital Audio). Le format DAT, très utilisé pour les enregistrements audio à distance ou sur le terrain à 16 bits, 48 kHz est maintenant obsolète. L'IASA recommande que tout enregistrement important effectué sur DAT soit transféré sur un système de stockage plus fiable et en conformité avec les conseils dispensés dans le paragraphe 5.5 Reproduction des supports numériques magnétiques.

6.1.2.3 Le disque compact enregistrable peut être utilisé pour enregistrer le son seul (CD-A ou CD-DA) ou bien différents formats de données (CD-ROM). Dans le format CD-DA, l'enregistrement audio numérique encodé ressemble à un flux audio et ne présente donc pas les avantages des fichiers fermés tels qu'ils peuvent être enregistrés sur un disque formaté CD-ROM. Dans ce dernier cas, il n'est pas possible d'enregistrer autant de données sur le même espace disque. L'IASA ne recommande pas d'enregistrer les programmes audio au format CD-A an tant que format cible de conservation. L'utilisation des disques CD enregistrables pris pour format cible sous quelque forme que ce soit ferait prendre des risques considérables, risques soulignés dans le Chapitre 8 Disques optiques : CD/DVD Enregistrables. La baisse des prix et l'augmentation de la fiabilité de la gestion des données et des systèmes de stockage rendent inutiles ou pour le moins antiéconomique la prise en compte des supports spécifiques de stockage, tels les CD-R.

6.1.3 Principes de conservation du numérique

6.1.3.1 Principe des systèmes de stockage de masse (Digital Mass Storage Systems (DMSS))

6.1.3.2 Les informations communiquées ci-dessous sont très directement liées aux aspects pratiques des Stratégies de protection des données issues des directives de l'UNESCO pour la Conservation du patrimoine numérique. Elles ont seulement été modifiées pour prendre en compte les systèmes de sauvegardes non automatiques ainsi que la conservation préoccupante des formats audio numériques simples. Le paragraphe est inséré avec l'aimable autorisation de l'auteur (Webb 2003 : 16.13).

6.1.4 Aspects pratiques des stratégies de protection des données

6.1.4.1 Pour gérer le stockage de données à long terme, on dispose d’un ensemble de stratégies relativement bien normalisées. La plupart d'entre-elles  font l’hypothèse que ce n’est pas le support en soi  qui a besoin d'être conservé, mais seulement les données. Ce qui  suit comprend, en partie, ces stratégies.

6.1.4.2 Affectation des responsabilités : la gestion du stockage et de la sauvegarde des données doit être confiée à un responsable clairement identifié. C’est une responsabilité technique qui requiert  un ensemble de savoirs et compétences propres aux domaines mais qui requiert aussi  des compétences en gestion. Pour toutes les collections, le stockage et la protection des données nécessitent des ressources dédiées, une planification appropriée et la maîtrise de ces stratégies. Les collections de très petite taille doivent pouvoir bénéficier de l'expertise nécessaire et des services d'une personnalité responsable se consacrant à cette tâche.   

6.1.4.3 Infrastructures techniques appropriées pour réaliser la tâche : les données doivent être stockées et gérées à l'aide de systèmes et de supports adaptés. Des systèmes de gestion numérique ou de stockage d'objets numériques répondant  aux exigences des programmes de conservation des données audio sont disponibles ; certaines approches seront discutées ci-dessous. Une fois les exigences déterminées, elles devront être minutieusement discutées avec des fournisseurs potentiels. Parmi les systèmes et supports répondant aux différents besoins, ceux qui seront choisis dans les programmes de conservation devront correspondre aux attentes.    

6.1.4.4  L'ensemble des systèmes devront avoir les capacités adéquates, y compris :

6.1.4.5 Une capacité de stockage suffisante : La capacité de stockage peut être augmentée au fil du temps, mais le système doit être en mesure de gérer le volume de données estimé pendant son cycle de vie.  

6.1.4.6 Une aptitude fondamentale : le système doit être capable de dupliquer les données à la demande sans perte et de transférer celles-ci, sans perte, vers des supports nouveaux ou réinitialisés.

6.1.4.7 Une fiabilité démontrée ainsi qu'une assistance permettant de traiter rapidement les problèmes.

6.1.4.8 La possibilité de ranger les noms de fichiers selon une disposition adaptée à l'architecture du stockage. Le système de stockage s'articule autour d'objets nommés. Les systèmes utilisent différentes architectures pour organiser les objets. Ceci peut imposer des contraintes sur la manière de nommer les objets pour le stockage ; l'organisation des disques par exemple, peut imposer une structure hiérarchisée du répertoire des noms existants différente de celle utilisée pour les bandes magnétiques. Le système doit permettre, de préférence, d'assurer une cartographie des noms de fichiers imposés par le système et les identifiants existants.

6.1.4.9 La capacité de gérer le stockage des données redondantes. Les supports numériques ont un taux de défaillance faible, mais significatif, aussi des copies de fichiers sont-elles nécessaires à toutes les étapes, et tout particulièrement dans la phase finale du stockage.    

6.1.4.10 Le Contrôle d'erreurs. La plupart des ordinateurs dédiés au stockage comportent un contrôle automatique d'erreurs. Les documents audio et audiovisuels doivent être conservés pendant de longues périodes, avec, souvent, un très faible taux d'utilisation. Le système doit être en mesure de détecter des modifications, des pertes de données et de déclencher les actions appropriées. Pour le moins, les stratégies en place doivent alerter les responsables de collections sur des problèmes potentiels, leur laissant le temps suffisant pour permettre une action appropriée.  

6.1.4.11 Les infrastructures techniques doivent également incorporer les moyens de stockage des métadonnées et assurer des liaisons fiables entre métadonnées pour stocker des objets numériques. Souvent, les opérations de grande ampleur révèlent des insuffisances : elles nécessitent la mise en place de systèmes de gestion des objets numériques liés lorsqu'ils sont en direction de, et non liés lorsqu'ils sont en provenance du système de stockage de masse. Il s'agit de faire face à la variété des processus impliqués, et de permettre le changement de métadonnées et d'interfaces sans avoir à changer le système de stockage de masse.

6.1.5 Philosophie de la durabilité du système

6.1.5.1 Toutes les technologies, aussi bien les machines que les logiciels, les formats ou les normes, changeront à la longue, sous la pression des marchés, des exigences de performances, des nouveaux besoins ou attentes. Le devoir de l'archiviste audio en charge de la maintenance numérique et des contenus audio numérisés est de traverser ces changements technologiques de telle manière que le contenu de ces collections soit maintenu dans un état fiable et une forme authentique pour les utilisateurs actuels et à venir, dans les meilleures conditions économiques possibles.

6.1.6 Planification à long terme

6.1.6.1 La planification à long terme des archives audio comporte plus d'éléments que les simples normes techniques d'un système de stockage de données. Certes, les problèmes d'ordre technique doivent être soigneusement résolus, mais il n'en demeure pas moins que les aspects sociaux et économiques de fonctionnement des systèmes de stockage numérique sont vitaux pour assurer l'accès des contenus de manière permanente. La planification à long terme devrait prendre en considération les éléments suivants :

6.1.6.2 La durabilité des données brutes : il s'agit d'assurer la conservation du flux des mots binaires dans leur bon ordre et leur ordre logique. Les données dans un système de stockage doivent revenir dans le système sans subir aucun changement ou corruption. On notera que l'expertise des systèmes informatiques consiste à identifier les risques importants encourus lors des opérations de maintenance et de rafraîchissement de données. Une bonne gestion des opérations et une bonne conception de l'approche du SI peut assurer des résultats satisfaisants.

6.1.6.3 Formats et possibilité de lecture : Les données sont utiles dans un service d'archives sonores seulement si elles peuvent être ensuite traduites en son. Le choix approprié du format de fichier apporte la garantie aux futurs services d'archives de pouvoir lire le contenu des fichiers, ou d'être capable d'acquérir la technologie pour effectuer la migration des fichiers dans un nouveau format. Ne pas incorporer d'algorithme de compression avec perte dans ce format évitera d'altérer le contenu audio original lors des processus de transformations.  

6.1.6.4 Métadonnées, identification et accès à long terme : tous les fichiers audionumériques doivent pouvoir être identifiés et récupérés afin d'utiliser l'enregistrement audio et d'en estimer la valeur.

6.1.6.5 Economie des archives sonores : on s'intéresse ici aux conditions de viabilité des institutions qui subventionnent les systèmes de stockage de données, les entrepôts ainsi que les personnes qui possèdent, gèrent ou tirent des bénéfices des documents sonores archivés. Les dépenses consacrées à l'entretien d'une collection de documents sonores sont continues, elles doivent être planifiées. Un budget réaliste doit être planifié pour assurer la conservation des collections sur le long terme. Le coût de présentation et de gestion des collections est aussi permanent. La conservation du numérique est autant affaire d'économie que de technique. La viabilité des tâches à engager exige une source de financement fiable, condition fondamentale qui doit être satisfaite pour assurer, même à modeste niveau, la durabilité des contenus numériques, pour que les entrepôts, les éléments technologiques et les systèmes soient maintenus en état aussi longtemps que nécessaire.

6.1.6.6 Alternatives en matière de stockage, de gestion, de conservation : l'environnement économique et technique peut-être volatile, aussi est-il recommandé que des accords soient passés entre les services d'archives et les institutions pour définir le stockage des données  comme archives de dernier recours. Ceci nécessite un  accord global sur les formats de fichiers et l'organisation des données aussi bien que sur  les aspects sociaux et techniques de la gestion des contenus.

6.1.6.7 Outils, logiciels et planification à long terme : il ne s'agit pas de conserver le matériel informatique, les logiciels et les systèmes en tant que tels, mais plus simplement de faire jouer à ces outils leur rôle  en matière de conservation des contenus. Le logiciel de gestions d'archives D-Space par exemple, ne prétend pas être une solution de conservation, mais être seulement utile pour "permettre aux institutions dotées d'une certaine compétence, de garder en mémoire les informations et de proposer leurs services à cet égard", (DSpace, Michael J. Bass et al. 2002). Le logiciel d'archivage en soi est un outil, au même titre que les différentes composantes conçues pour faciliter les opérations, simplifier les procédures, automatiser et valider le moissonnage des métadonnées. La planification à long terme implique la capacité  à pouvoir changer de système ou bien  à effectuer des mises à jour sans compromettre l’intégrité des  contenus.

6.1.7 Définition de l'objet numérique

6.1.7.1 Le fichier audio ne constitue qu'une partie de l'information à conserver. Le modèle de référence d'un système ouvert d'archivage d'information (Open Archival Information System (OAIS)) identifie quatre parties qui décrivent un objet numérique par un paquet d'informations. Cela comprend les informations du contenu et les informations décrivant les conditions de conservation, regroupées avec l'ensemble des informations, et qui peuvent être découvertes grâce à l'information de description.


Concepts et relations d'un paquet d'information

6.1.7.2  Si l'information peut-être répartie dans tout le système, il convient de se souvenir que le concept du regroupement par paquets implique l'information audio elle-même, la possibilité de relire ce document audio, de connaître sa provenance, de le décrire et de le retrouver. D'étroites relations peuvent exister entre les fichiers audio d'une collection ; ces relations sont importantes pour l'usage des documents  et doivent donc être préservées.

6.1.8 Le Système Ouvert pour l'Archivage d'Informations (Open Archival Information System(OAIS))

6.1.8.1  Le modèle de référence d'un système ouvert pour l'archivage d'information (OAIS) est un modèle conceptuel très largement adopté dans le domaine des entrepôts de données numériques et des systèmes d'archivage.  Le modèle de référence OAIS propose un langage commun et une structure conceptuelle que les spécialistes en matière de bibliothèque numérique et de conservation peuvent partager. La structure a été adoptée au titre d'une norme internationale, ISO 14721 : 2003. Malgré quelques réserves à propos d'imperfections minimes, l'élaboration des architectures d'archivage répondant aux catégories de fonctions définies par l'OAIS est essentielle au développement de systèmes de stockage modulaires assurant l'interopérabilité des échanges des contenus. Dans ce guide, les paragraphes qui suivent adoptent les principales dispositions du modèle de référence OAIS en vue d'appuyer les opérations d'analyse des logiciels disponibles et   d’élaborer des recommandations dans le cadre des développements qui doivent être effectués.       

6.1.8.2 Un système d'archivage numérique doit pouvoir exécuter un nombre fini de fonctions afin d'assurer, de manière fiable et durable, les services pour lesquels il est conçu. Dans le Modèle de Référence OAIS, les entités suivantes sont définies : l'entrée, l'accès, l'administration, la gestion de données, la planification de la pérennisation, le stockage des archives.

6.1.8.3 Le modèles OAIS définit également la structure des différents paquets d'informations nécessaires à la gestion des données à un moment donné du cycle de vie de l'objet numérique. On distingue le paquet d'informations à verser (Submission Information Package (SIP)), le paquet d'informations diffusé (Dissemination Information Package (DIP)), et le paquet d'informations archivé (Archival Information Package (AIP)). Un paquet représente : le lot de données, les métadonnées pertinentes et les informations de description d'un objet particulier. Cet objet est conceptualisé dans le sens où les contenus des paquets peuvent être dispersés dans le système ou réduits à un seul objet numérique. L'OAIS définit un paquet d'informations en tant que contenu d'information associé aux informations de description des conditions nécessaires à la pérennisation des contenus.

6.1.8.4 Le SIP est un paquet d'informations versé au système par l'entité d'entrée. Il contient les données à stocker ainsi que toutes les métadonnées nécessaires relatives à l'objet. Le SIP accepté par le système sert à la création d'un AIP.

6.1.8.5 L'AIP est un paquet d'informations stocké et conservé dans le système. C'est le Paquet d'informations stocké, conservé et entretenu par le système.

6.1.8.6 Le DIP est le paquet d'informations créé pour diffuser le contenu numérique. Ce système remplit trois rôles. Le premier concerne l'accès : ce DIP devra donc être réalisé sous une forme pratique et compréhensible pour l'utilisateur. Le second rôle a pour objectif de répartir les risques grâce à des échanges. Une institution d'archivage peut préférer partager le contenu de ses collections avec d'autres établissements comparables, ou bien avec une organisation d'archivage. Dans ce cas, le DIP devra contenir toutes les métadonnées pertinentes nécessaires. Le troisième rôle concerne la distribution des contenus à des services d'archives, en dernier ressort. Le scénario d'un service d'archives ou d'une institution qui ne serait plus en mesure d'entretenir ses collections n'est pas difficile à imaginer. Un DIP normalisé pour répondre à une telle situation permettrait à d'autres systèmes, d'architecture similaire, de recueillir la charge avec une intervention manuelle minimum.

6.1.9 Dépôts numériques fiables (Trusted Digital Repositories (TDR)) et responsabilité institutionnelle

6.1.9.1 Les spécifications techniques de l'environnement d'archivage numérique jouent un rôle important pour garantir aux chercheurs du futur l'accès des contenus numériques. Condition non suffisante, toutefois, pour atteindre un tel objectif. Les institutions qui ont la charge de collections d'archives numériques doivent être en mesure d'assurer la responsabilité de la bonne gestion et de la préservation des contenus qu'ils gèrent. En 2002, le groupe des bibliothèques de recherche (Research Libraries Group (RLG)) et le Centre des bibliothèques connectées (Online Computer Library Center (OCLC)) ont publié conjointement le document Trusted Digital Repositories (TDR) : Attributes and Responsabilities : Dépôts numériques fiables : attributs et responsabilités "décrivant le cadre des attributs et les responsabilités d'entrepôts fiables et durables" requis pour que le service d'archives assure une conservation des informations numériques permanente ou pour une période indéfinie".

6.1.9.2 Ces attributs comprennent : la conformité au modèle de référence OAIS, la viabilité organisationnelle, le financement durable, la bonne adéquation technique et procédurale, la sécurité du système et une politique en place apportant toutes les garanties sur la manière dont la gestion et la conservation des données sont traitées.

6.1.9.3 L'instanciation pratique de ce qui vient d'être énoncé fait l'objet d'un document désigné par "Trustworthy Repositories Audit and Certification (TRAC) : Criteria and Checklist" :  Audit et certification d'entrepôts fiables : Critères et liste de contrôle" (2007). Une institution d'archives utilisant ce document peut évaluer si ses pratiques, ses approches, la technologie en place ou en cours de planification, conviennent pour mener à bien la conservation permanente de l'information numérique dont elle a la responsabilité.

6.1.9.4 La liste de contrôle (checklist) couvre trois domaines principaux : l'infrastructure organisationnelle ; la gestion des objets numériques et la technologie ; les infrastructures techniques et la sécurité.

6.1.9.5 L'infrastructure organisationnelle fournit une série de contrôles sur la gouvernance et la viabilité du dispositif, sur l’organisation de la structure et du personnel, la responsabilité procédurale et le cadre politique, les financements, et la prise en compte des licences, du passif. Le paragraphe consacré à la gestion des objets numériques s'intéresse à l'acquisition des contenus, à la création d'un paquet archivable, à la planification de la pérennité, à la planification et au stockage de données d'archives, au management de l'information et au contrôle des accès. La troisième partie de cette liste audite l'infrastructure du système, l'utilisation de technologies adaptées aux tâches et au système, et enfin la sécurité de l'institution.

6.1.9.6 La terminologie utilisée dans le document "Trustworthy Repositories Audit and Certification : Criteria and Checklist" (TRAC) :  Audit et certification d'entrepôts fiables : Critères et liste de contrôle" est choisie pour traiter des archives numériques au sens le plus large, aussi le document peut-il paraître parfois un peu opaque aux archivistes du son. Néanmoins, les questions examinées et expérimentées ici sont d'une importance capitale pour la planification et la gestion des archives audio numériques. Il est fortement recommandé aux archivistes d'utiliser la liste de contrôle pour évaluer l'aptitude d'une institution à assurer la gestion d'une collection numérique, ou bien encore pour identifier les points faibles de la stratégie de conservation d'une collection numérique donnée.

6.1.10 Archives audio et responsabilité technique

6.1.10.1 Une institution donnée peut-être responsable de la gestion d'une collection ou d'un ensemble d'items sonores, mais elle ne suivra pas nécessairement les principes d'une institution qui prend en compte la totalité de la responsabilité d'un système d'archivage numérique. Au lieu de cela, une institution peut constituer une partie d'un système d'archivage partagé, ou bien elle peut se rapprocher d'un prestataire tiers qui archive ses documents dans des conditions plus conformes  aux normes.

6.1.10.2 Le stockage partagé de données tel qu'il a été proposé et développé pour le web par l'université de Stanford sous le nom de LOCKSS (Lots of Copies Keep Stuff Safe : Beaucoup de copies rendent la marchandise sécurisée), procède par de nombreuses duplications des données réparties sur le web. Le système gère les données en réseau ; les risques de perte de données sont réduits car l'information peut être retrouvée en de nombreux endroits. Un tel dispositif ne convient pas pour les documents d'accès restreint ou soumis au copyright dont la diffusion est interdite. Le développement et la gestion d'un tel système nécessitent l'assistance d'une institution.

6.1.10.3 Une institution peut réaliser qu'elle n'a pas la capacité technique pour entreprendre le développement et la gestion d'un système d'archives numériques. Dans ce cas, elle peut établir des relations avec un organisme tiers. Celui-ci peut être une autre institution d'archives où seront versées et stockées les collections, ou bien un prestataire qui commercialisera les services de stockage des supports et de gestion des contenus.   

6.1.10.4 L'information est ici communiquée comme si l'institution avait l'intention d'assurer elle même les opérations de conservation. Toutefois, si l'on considère une des alternatives mentionnées ci-dessus, cette information permettra tout de même de déterminer si cette approche est fiable et valide.

6.1.11 Logiciel d'entrepôt numérique, gestion de données et systèmes de conservation

6.1.11.1 Le logiciel d'entrepôt numérique assure généralement la gestion du stockage et de l'accès du contenu numérique. Il devrait incorporer les systèmes d'indexations et de métadonnées, ainsi que les différents outils permettant de retrouver et de décrire les contenus.

6.1.11.2 La gestion des données porte sur les flux d'octets ou sur les données qui incombent au système. Elle peut inclure les procédures de sauvegarde, les copies multiples et les modifications.

6.1.11.3 Les processus de conservation qui assurent l'accessibilité à long terme des contenus permettent d'en préserver le sens, de documenter et d'entretenir les tâches effectuées par le système de gestion de données. Ces trois phases sont indispensables pour assurer la pérennisation des contenus.

6.2 L’ingestion

6.2.1 Paquet d'informations à verser (SIP)

6.2.1.1 Le SIP est un paquet d'informations transmis système de dépôt et stockage numérique pour ingestion (par l’entité des entrées). Le SIP comprend les données audio à stocker ainsi que toutes les métadonnées relatives à l'objet et à ses contenus. L’ingestion, dans le modèle OAIS, désigne le processus d'acceptation des contenus et des métadonnées afférentes (SIP), le processus de vérification des fichiers, d'extraction des données pertinentes et de préparation des AIP pour le stockage. Ce processus apporte la garantie que les paquets d'informations archivés (AIPs) et leur description s'inscrivent bien dans le modèle OAIS.

6.2.1.2 Un système d'entrepôt de données numériques et de conservation devrait être en mesure d'accueillir et de valider un fichier audio. La validation est un processus qui apporte la garantie de conformité normative des fichiers acceptés dans le système de stockage. On peut rencontrer des difficultés pour utiliser ultérieurement des fichiers non normalisés lorsque les dispositifs de lecture d'époque ne sont plus disponibles. Des outils permettent la validation automatique des formats de fichiers, et un certain nombre de solutions open source, comme JHOVE (JSTOR/Harvard Object Validation Environment), sont disponibles et en cours de développement.

6.2.2 Formats

6.2.2.1 L'IASA recommande l'utilisation de fichiers .wav, ou BWF.wav de préférence (EBU tech 3285). La différence entre ces deux formats consiste en la présence, dans la trame du format BWF, d'en-têtes qui peuvent être utilisés pour organiser et gérer les métadonnées. Les métadonnées BWF conviennent pour de nombreuses applications, mais dans le cas de situations et d'échanges complexes, il est nécessaire de disposer d'un paquet plus compréhensible ; et en de telles circonstances, on utilisera souvent la norme de codage et de transmission de métadonnées METS (Metadata Encoding and Transmission Standard). Le schéma METS est une norme d'encodage de métadonnées descriptives, administratives, et structurelle des objets détenus par les bibliothèques numériques, exprimé sous forme XML (eXtensive Markup Language), langage de balisage extensible. Un ensemble METS, qui comporte les métadonnées et les contenus, est souvent utilisé comme norme d'échange entre bibliothèques numériques.

6.2.2.2 Le format MXF (Material eXchange Format) est un format conteneur destiné aux professionnels des média vidéo et audio numériques ; il est défini par un jeu de normes SMPTE. MXF a été adopté surtout par la communauté des archivistes vidéo, bien qu'il soit capable de gérer aussi les archives audio. Ainsi en est-il du format METS, qui est essentiellement un ensemble de métadonnées qui couvrent le contenu, c'est-à-dire l'audio dans ce cas. Ces deux formats sont très utiles pour la gestion des contenus et informations associées, ainsi que pour les échanges entre services d'archives et dépôts.

6.2.2.3 Le format du SIP dépendra du système, de la taille et du degré de perfectionnement du projet. Il est tout à fait possible de constituer un service d'archives viable constitué de fichiers .wav, avec introduction manuelle de la plupart des métadonnées nécessaires, et de conduire l'acquisition des données techniques nécessaires lors de la phase d’ingestion dans le système. Ceci, toutefois ne concerne que les plus petites collections. Pour les grandes collections dont les processus de numérisation sont effectués à l'extérieur, à distance, les grands volumes de fichiers doivent bénéficier d'une entité d'entrée et de systèmes d'échange de données élaborés afin d'assurer une ingestion correcte des contenus dans le système de stockage. Un logiciel de production et de vérification génère beaucoup de données sous format de fichiers XML normalisés pouvant être utilisés à des fins de conservation. Par exemple, l'outil d'extraction de données (Metadata Extractor tool) développé par la Bibliothèque nationale de Nouvelle Zélande en langage Java, effectue l'extraction des métadonnées de conservation des objets numériques et la production de celle-ci dans un format normalisé (XML).

6.2.3 Métadonnées de conservation

6.2.3.1 Les métadonnées nécessaires à la gestion du processus de conservation dans l'étape d'entrée représentent toute l'information dont on dispose sur la création de l'objet audionumérique ainsi que sur les modifications de formats intervenues avant la phase d'entrée dans le système. De cette manière, la connaissance de l'origine technique de l'objet est conservée, ce qui permet de tracer le parcours de l'item entre sa forme présente et sa forme d'origine, à partir de laquelle il a été créé pour permettre sa traçabilité.

6.2.3.2 Le format BWF suit les recommandations non obligatoires du guide "Format for Coding History field in Broadcast Wave Format : format de codage dans le champ CodingHistory du format pour la radiodiffusion BWF" http://www.ebu.ch/CMSimages/en/tec_text_r98-1999_tmc7-4709.pdf qui décrit la manière dont les modifications apportées aux fichiers peuvent être formulées. L'utilisation du code libre texte ASCII permet de décrire les équipements techniques ou les logiciels ayant servi à la création de l'objet numérique audio.

6.3 Stockage des archives

6.3.1 Paquet d'informations archivé (AIP)

6.3.1.1 La définition de l'expression Stockage des Archives dans l'OAIS comprend les services et les fonctions nécessaires au stockage du paquet d'informations archivé (AIP). Le stockage des archives comprend la gestion des données, il inclut en outre divers processus tels que la sélection des médias à stocker, le transfert de l'AIP au système, la sécurité et la validité des données, la sauvegarde et la restauration des données, et enfin la duplication de l'AIP sur de nouveaux supports.

6.3.1.2 L'AIP, tel que défini dans le modèle de référence OAIS (CCSDS 650.0-B-1, Modèle de référence pour un Système ouvert d'archivage d'information (OAIS)), est un paquet d'information utilisé pour transmettre des objets d'archivage vers un système d'archivage numérique, pour stocker les objets dans le système, et pour transmettre les objets à partir du système. Un AIP contient à la fois les métadonnées qui décrivent la structure et la représentation du contenu archivé, et le contenu en tant que tel. Il se compose de multiples fichiers de données qui détiennent une entité de paquetage soit logique soit physique. L'implémentation du SIP peut varier d'un établissement d'archives à un autre; Elle définit toutefois un containeur qui contient toutes les informations nécessaires à la pérennisation et à l'accès des archives. Les métadonnées du modèle OAIS s'appuient sur les spécifications METS.

6.3.1.3 D'un point de vue physique, l'AIP comprend trois parties ; les métadonnées, l'information de représentation et l'information d'empaquetage, toutes constituées d'un ou plusieurs fichiers (voir 6.1.7 Définition de l'objet numérique). L'information d'empaquetage peut-être considérée comme une information d'enveloppe qui encapsule les métadonnées et les composantes du contenu.

6.3.2 Bases du stockage des archives

6.3.2.1 Le stockage des archives fournit les moyens de stocker, de préserver et de permettre l'accès au contenu archivé. Dans des petits systèmes, le processus de stockage peut être indépendant et opéré manuellement. Pour les systèmes de plus grande taille, les opérations de stockage sont généralement exécutées conjointement avec les applications de catalogage, avec les systèmes de gestion, de récupération de l'information et de contrôle des accès pour pouvoir gérer le contenu des archives et disposer d'une voie d'accès à ceux-ci.

6.3.2.2 Le stockage des archives doit être connecté aux équipements qui effectuent les entrées et procèdent à la création des documents destinés à être archivés, qui doivent fournir une interface sûre et fiable utilisable pour importer les données au système de stockage.

6.3.2.3 Un système de stockage des contenus d'archives doit être fiable, ceci de plusieurs manières : il doit être en état de fonctionner sans aucune interruption significative, être capable d'informer le système ou l'utilisateur de la réussite ou non de l'importation des contenus, et ainsi de pouvoir supprimer la copie entrée du fichier d'archives lors de l'importation si nécessaire. L'entité Stockage des Archives doit également être capable de préserver durablement les contenus qu'elle gère et les protéger de tous types de défaillances et de sinistres.

6.3.2.4 Un système de Stockage d'Archives doit être réalisé conformément aux attentes de l'exploitant ; il doit être correctement dimensionné pour répondre aux services attendus, pour gérer quotidiennement les fonctions requises. En outre, l'entité Stockage des Archives doit permettre l'accès contrôlé des contenus à des utilisateurs disposant des autorisations ou des droits d'accès.

6.3.3 Système de stockage en masse (Digital Mass Storage Systems (DMSS))

6.3.3.1 Un système de stockage en masse se réfère à un système d'information (SI) conçu et réalisé pour stocker et assurer la maintenance de grands volumes de donnée pour une période définie ou indéfinie. De tels systèmes peuvent prendre de nombreuses formes ; un DMSS de base comprendra un ordinateur personnel de capacité suffisamment importante et dont le mode de catalogage permet de garder trace du traitement des documents. Un système DMSS plus complexe comprendra un disque dur et / ou une unité de bandes magnétiques avec un ensemble d'ordinateurs contrôlant l'entité de stockage. Un système DMSS peut aussi se composer de nombreux niveaux de stockage aux caractéristiques diverses : une connexion haut débit (Fibre Channel (FC)) avec une unité de drive disque dur externe en guise de mémoire cache de données dont le temps d'accès est critique, tandis qu'un dispositif de disques durs moins coûteux peut être utilisé pour recueillir les documents dont le temps d'accès est moins critique, et enfin on pourra envisager le stockage sur bandes magnétiques, dispositif externe le plus économique.

6.3.3.2 Lorsque de nombreuses technologies de stockage sont mobilisées pour constituer une entité fonctionnelle de grande taille, un système de stockage hiérarchique des données (Hierarchical Storage Management (HSM)) est généralement déployé pour harmoniser le fonctionnement de ces différentes technologies. Des systèmes de taille encore plus importante peuvent aussi être répartis géographiquement afin d'améliorer les performances et la tolérance aux défaillances.

6.3.4 Types de bandes de données et introduction des formats

6.3.4.1 Dans ce qui suit, on évoque brièvement certains des principaux formats de bandes et systèmes automatiques utilisés pour le stockage de contenus audiovisuels numérisés. Dans un système DMSS, les bandes sont utilisées uniquement en association avec d'autres composants. Il est prudent de commencer cette présentation en comparant les différents formats de bandes, en retenant bien qu'aucun support n'est durable et que, toutes choses restant égales par ailleurs, ils ne seront viables que le temps de disponibilité du système dans lequel ils seront incorporés.

6.3.5 Performance des bandes de données

6.3.5.1 Le format géométrique et les dimensions conditionnent les performances. La vitesse de transfert des données, un des aspects des performances, dépend directement du nombre de pistes inscrites et lues simultanément, mais aussi de la vitesse relative tête-bande, de la densité linéaire et du codage. De même, une dimension réduite, un boîtier plus léger augmentent la cadence des mouvements dans le robot. La densité des données résulte :

    6.3.5.1.1 des compromis longueur et épaisseur de la bande
    6.3.5.1.2 de la largeur des pistes et de leur pas
    6.3.5.1.3 de la densité linéaire des données réparties sur chacune des pistes

6.3.6 Revêtements des bandes

6.3.6.1 Il existe deux types principaux de revêtement : à particules et à évaporation. La couche des premières bandes de données était constituée de particules d'oxyde métallique similaires aux bandes vidéo, tandis que les bandes plus récentes utilisent des particules métalliques (Metal Particules (MP)). Des particules de fer pur avec céramiques inertes et oxydes passivés sont dispersées dans des liants polymères appliqués uniformément sur un film polyester PET ou PEN ou autre substrat de bonne stabilité dimensionnelle et résistant à la traction. Certaines bandes de densité les plus élevées actuellement sur le marché utilisent un revêtement à métal évaporé tel que des alliages de cobalt ou d'autres matériaux similaires à ceux utilisés pour les disques durs. Cette technologie permet de disposer de matériaux magnétiques de plus grande pureté et de réaliser des couches encore plus minces. La plupart des bandes à métal évaporé (Metal Evaporated (ME)) comportent une couche polymère de protection similaire au liant des bandes MP. Les formulations les plus récentes comprennent également une couche de protection céramique. Certaines bandes ME de la première époque deviennent défectueuses par délamination après un usage intensif (Osaki 1993 : 11).

6.3.7 Modèles de boîtiers

6.3.7.1 Deux types de boîtiers sont utilisés principalement : les cassettes à deux axes (parfois appelées coplanaires [NDT]), pour lesquelles le temps d'accès peut être plus rapide, et les cartouches à axe unique (parfois appelées monoplanaires [NDT]) qui offrent une plus grande capacité pour un encombrement donné.

6.3.7.2 Les cassettes à deux axes comprennent :
    3,81 mm, essentiellement DDS [dérivée de DAT]
    QIC [quarter-inch cartridge] cartouche quart de pouce et TRAVAN
    Formats 8 mm, y compris Exabyte et AIT
    DFT
    Storagetek 9840    

6.3.7.3 Les cassettes à un axe comprennent :
    IBM MTC et formats Magstar tels que 3590, 3592 et TS1120
    Quantum S-DLT et DLT-S4
    LTO Ultrium [100, 200, 400 & 800 GB]
    Storagetek 9940 et T 10000
    Sony S-AIT    

6.3.7.4 En matière d'archivage pérenne, aucun modèle ne l'emporte sur un autre, la durée de vie dépend d'un ensemble de détails spécifiques à chaque format. Par exemple, certains modèles de cartouches 1/2 pouce à axe unique disposent de guides de grand diamètre dans le boîtier qui réduisent le frottement au minimum et assurent un guidage précis de la bande. On a l'expérience de problèmes de blocage de l'amorce dans le mécanisme d'anciennes cartouches à axe unique, même si leur fiabilité a été améliorée pour des modèles plus récents. Certaines cassettes à deux axes peuvent-être pré-positionnées en milieu de bande pour réduire au minimum le temps nécessaire pour atteindre n'importe quel fichier. Cette pratique va à l'encontre de celles habituellement adoptées pour les archives audiovisuelles qui consistent à enrouler soigneusement la bande jusqu'à son extrémité avant stockage afin que l'amorce seule soit exposée aux mécanismes de fixation. Mais généralement les bandes ne sont pas incorporées dans un boîtier hermétique qui les protégerait à l'instar des disques durs.

6.3.8 Bandes à lecture longitudinale et hélicoïdale

6.3.8.1 Les données peuvent être écrites ou lues à l'aide d'une tête fixe, procédé généralement décrit par le terme linéaire, ou bien avec un dispositif de tête tournante ou hélicoïdale. Les bandes linéaires présentent un tracé de piste en serpentin, on a estimé que ces mouvements de va-et-vient pouvaient user la bande ou encore produire un effet de lustrage. En principe, les bandes actuelles sont conçues pour supporter un grand nombre d'allers retours ; toutefois, il reste plus prudent de donner accès à des contenus fréquemment utilisés à partir d’un disque dur. Les bandes, sujettes aux phénomènes de décomposition chimique par hydrolyse ou autre réaction, glisseront mieux sur les pièces immobiles du chemin de défilement à des vitesses de 1 à 2 m/s ou davantage, vitesses typiques pour les têtes fixes ou formats linéaires. La vitesse relative tête-bande est plus élevée avec les têtes tournantes ou format hélicoïdal, un phénomène de coussin d'air se créé entre la surface de la bande et les têtes, mais la vitesse relative entre la bande et les pièces de guidage fixes étant beaucoup plus faible, un encrassement se produit fréquemment.

6.3.9 Mémoire auxiliaire et dispositifs d'accès

6.3.9.1 Les formats tels qu'AIT comportent une carte mémoire "Mémoire intégrée à la cassette" (Memory in Cassette (MIC)) qui stocke les informations relatives au positionnement des fichiers, procédé analogue à la Table des contenus (Table of Content (TOC)) des disques compacts qui permet une localisation rapide des données. Les cassettes DFT utilisent une mémoire rf (Radio Frequency Identification (RFID)).

6.3.10 Obsolescence des formats et cycles technologiques

6.3.10.1  C’est le propre du stockage de données que d’être en progrès et développement constants, ce qui signifie que les évolutions, et l’obsolescence qui les accompagne, sont inévitables.  Une gestion réaliste des contenus à long terme doit accepter cette situation, intégrer l'évolution continuelle par la mise à niveau des matériels et des médias. Si le noyau de l'infrastructure,  comme les câblages de transmission des données ou les espaces de rangement, peut rester fonctionnel pendant dix ou vingt ans, chaque driver, chaque support a une durée de vie beaucoup plus courte. La projection du développement des principaux formats de bandes de données implique la mise à jour de la feuille de route tous les 18 mois à 2 ans. La rétrocompatibilité des systèmes en mode lecture uniquement est parfois assurée pour une à deux générations de supports d’une même famille. En conséquence, une génération donnée de lecteurs de bandes et de supports peut-être opérationnelle pendant seulement 4 à 6 ans, durée au terme de laquelle il est essentiel de migrer les données et de changer de système 21. Qui plus est, le coût de maintenance des matériels de stockage  de masse tend à augmenter sensiblement quand l'ancienneté du système dépasse la période de garantie. Dans ce cas, on peut difficilement acquérir des pièces détachées neuves pour les bibliothèques de bandes ou les lecteurs, pour ne citer que ces exemples. Un résumé de feuilles de route prévisionnelles est présenté ci-dessous. De nombreux formats  sont compatibles en lecture seule, avec au moins une génération antérieure.
 

Familie 1ère Génération 2ème Génération 3ème Génération 4ème Génération 5ème Génération 6ème Génération
Quantum SDLT SDLT220 110GBytes SDLT320 160GBytes SDLT600 300GBytes DLT-S4 800GBytes    
IBM     3592 2004 300GB 40MB/s TS1120 2006 700GB 104MB/s    
Sun - Storagetek   9940B 2002 200GB 30MB/s T10000 2006 500GB 120MB/s T10000B-2008 ITB 120MB/s    
LTO LTO-1 2001 100GB 20MB/s LTO-2 2003 200GB 40MB/s LTO-3 2004 400GB 80MB/s LTO-4 2007 800GB 120MB/s LTO-5 no date (2009+) 1.6TB 180MB/s (estimé) LTO-6 no date (2011+) 3.2TB 270MB/s (estimé)
Sony S-AIT S-AIT 2003 500 GB 30MB/s S-AIT2 2006 800 GB 45MB/s        
Sony AIT     AIT-3 2003 100 GB 12MB/s AIT-4 2005 200 GB 24MB/s    

Tableau 1 paragraphe 6.3 Projection de la feuille de route des bandes de données


21. Ceci implique un certain gaspillage et une pression environnementale qui dépasse le champ de notre discussion purement technique, mais en réalité, une grande bibliothèque détenant des bandes anciennes consomme davantage de polymères, c'est-à-dire une plus grande quantité de produits d'origine pétrochimique qu'un nouveau système haute densité utilisant des lecteurs et robots plus efficaces au plan énergétique et qui, par la même occasion, occupera moins d'espace construit.

6.3.11 Récupération automatisée ou manuelle des données

6.3.11.1 Pour des opérations à petite échelle, il est possible de sauvegarder les données d'une petite station avec un lecteur de bande, puis de placer manuellement la cartouche enregistrée sur une étagère pour un stockage traditionnel. Pour les systèmes en réseau de taille réduite également, on peut effectuer des sauvegardes manuelles des données archivées (voir aussi Chapitre 7 Approches des systèmes de stockage à petite échelle). Les mêmes conseils prodigués à propos des conditions d'environnement de stockage s'appliquent également aux autres types de bandes magnétiques ; dans ce cas il ne peut être que bénéfique de bien veiller à réduire au maximum la présence de poussière, particules et agents polluants. Pour des opérations de plus grande échelle, notamment dans les pays où le coût du travail est élevé et les budgets d'équipement plutôt favorables, un certain niveau d'automatisation est d'ordinaire souhaitable car plus économique que les systèmes exclusivement manuels. Le niveau d'automatisation dépend de l'ampleur et de l'importance des tâches à accomplir, du type d'accès du contenu, des ressources.

6.3.11.2 Bibliothèques de bandes à autochargeurs et robotisées : après les simples drives lecteurs, on évoquera les petits systèmes équipés d'un automate de chargement, d'un lecteur unique (parfois double), de cassettes en rangée simple ou en carrousel qui seront chargées au moment des opérations de sauvegarde. La principale différence entre les autochargeurs et les robots des grandes bibliothèques  se trouve dans le mode de lecture :  les bandes enregistrées ne sont pas identifiées par un logiciel de sauvegarde dans une base de données centrale permettant la récupération automatique des données. Au contraire, Les tâches  de recherche, de récupération et de chargement des fichiers individuels incombent encore à un opérateur.  Tous ce que font ces systèmes à chargement automatique, c’est de permettre, comme leur nom l'indique, l'écriture ou la lecture séquentielle  d’un lot de bandes afin de surmonter les limitations d'échelle des  supports de données individuels, et de se passer de la présence d'un opérateur pour effectuer le chargement de la bande suivante lors d'un long processus de sauvegarde.

6.3.11.3 En contraste, même les plus petites bibliothèques automatisées sont programmées pour se comporter comme un simple système autonome de stockage. La localisation de fichiers individuels sur différentes bandes est transparente pour l'utilisateur, le contrôleur garde la trace de l'adresse des fichiers sur chaque bande, ainsi que la localisation physique des bandes dans la bibliothèque. Si les bandes sont retirées ou rechargées, le système du robot scanne à nouveau l’emplacement de la bande pour mettre à jour son inventaire à l'aide des métadonnées détenues dans le code à barres, ou bien par identification rf des étiquettes ou des puces mémoires que comportent certains boîtiers.

6.3.11.4 Les bibliothèques de bandes de grande taille présentent quelques avantages en comparaison des plus petites bibliothèques. Elles peuvent être conçues pour accueillir des informations redondantes et les distribuer : les temps d'arrêt peuvent-être minimisés et les chargements lecture / écriture répartis sur plusieurs systèmes similaires. Les bibliothèques de grande taille peuvent aussi être utilisées en tant que système polyvalent. Elles peuvent, par exemple, effectuer les opérations de maintenance des sauvegardes d'une société de service informatique tout en assurant la gestion des archives sonores et audiovisuelles dans leur totalité.       

6.3.11.5 Les bandes de données en bobine libre ou en cartouche utilisées dans les systèmes robotisés bénéficient des systèmes de codes à barres, d'étiquettes rf ou autres dispositifs d'identification. Ces systèmes de reconnaissance optique ou électromagnétique se conjuguent parfois avec un codage MIC afin de disposer d'informations supplémentaires ID de la bande et des contenus. Certains formats incorporent un système ID global de codes à barres, aussi une bande utilisée dans une bibliothèque robotisée peut-elle être reconnue par un autre système de bibliothèque.

6.3.11.6 Logiciels de sauvegarde et de migrations, calendrier : des confusions et incompréhensions se manifestent dans le milieu des technologies de l'information (IT) et dans la communauté de l'archivage des données à long terme. On relève deux idées fausses très répandues dans l'opinion. La première, que l'archivage est un processus qui consiste à déplacer des supports peu utilisés, d’un système coûteux composé de disques durs de stockage en réseau  vers un dispositif local non connecté (offline), sur étagère, moins coûteux mais qui, inaccessible, ne permettra jamais la récupération des données ; la deuxième, que la sauvegarde est une opération de routine quotidienne ou hebdomadaire de duplication de la totalité des données stockées dans le système.

6.3.11.7 A propos de la première idée fausse, certains documents sonores parmi les plus importants et les plus précieux peuvent  effectivement ne pas être utilisés pendant des mois, voire des années, mais, pour autant, leur survie doit être garantie sans concession. De même pour la seconde idée fausse, si des règles appropriées sont mises en œuvre, il n'est pas nécessaire de dupliquer chaque jour ou chaque semaine une quantité importante de données alors qu'une faible proportion d'entre-elles est actualisée. En pratique, si un processus strict de duplication des données sur différents média placés en des lieux différents est essentiel pour minimiser les risques de défaillance technologiques et assurer la récupération de données en     cas de sinistre, les caractéristiques particulières d'un patrimoine numérique nécessitent des procédures qui différent des opérations de routine utilisées dans le domaine des technologies de l'information (IT).  

6.3.11.8 Les systèmes HSM (Hierarchical Storage Management) conventionnels peuvent être optimisés pour effectuer régulièrement les sauvegardes de tous les documents et déplacer les contenus les plus rarement utilisés vers des emplacements inaccessibles. Des systèmes plus élaborés peuvent être configurés en fonction des règles de gestion et des pratiques des services d'archives de différentes tailles, pour lesquels plusieurs niveaux d'accès peuvent être proposés. Une institution de taille moyenne peut emmagasiner 100 GB de données audio chaque semaine ou 1 TB de programmes vidéo. Il est clair qu'il faut réaliser des copies dès l'entrée de documents précieux dans le système et préserver l'accessibilité des contenus fréquemment utilisés.

6.3.11.9 Certaines fonctions de base de logiciels de gestion d'archives optimisent les ressources et les composantes matérielles du système tout en régulant le trafic et en ne provoquant qu'un retard minimum pour les utilisateurs. Les logiciels HSM permettent de définir les critères de migration des fichiers, d'un disque en ligne vers une bande, critères tels que : ancienneté du document, volume de données atteint, localisation dans tel ou tel sous-dossier, ou bien encore espace restant disponible sur le disque dur (lignes de niveau supérieur et inférieur).

6.3.11.10 Typiquement, lorsqu'on produit des fichiers haute résolution et leur copie d'accès basse résolution, la version haute résolution réalisée pour la conservation des documents et les transmissions radiophoniques devra être migrée sur bandes afin de libérer de l'espace sur les disques durs, plus coûteux. Un équilibre est nécessaire pour maintenir la disponibilité  des informations tout en optimisant l'utilisation des lecteurs de bandes et des médias. Si l'on doit accéder aux bandes de manière très fréquente, les chargements et déchargements de celles-ci, les opérations d'enroulement et de remise en route répétées auront pour conséquence la dégradation des performances du système. Les systèmes de gestion de contenus plus élaborés comportent des niveaux inférieurs de gestion du stockage, de sorte que  les utilisateurs ont une conscience moindre des fichiers individuels et composants qui soutiennent le système.

6.3.12 Sélection et contrôle des bandes de données

6.3.12.1 Pour tout système de conservation, il est important, non seulement de disposer de copies de sauvegarde et d'exemplaires redondants pour pallier les défaillances des média et des matériels, mais aussi, et de manière vitale, de pratiquer l'analyse des performances des éléments essentiels du système. Des logiciels, tels que SCSI-Tools permettent une interrogation bas niveau de chacun des drives et dispositifs en réseau afin de déterminer si les performances des médias et des appareils sont optimales. Les bandes LTO disposent d'une interface de contrôle des données, mais cette fonctionnalité est rarement utilisée alors qu'elle le serait de manière avantageuse pour les systèmes d'archivage. Certains systèmes HSM sont capables d'effectuer des contrôles réguliers de la qualité des documents stockés. De tels systèmes contrôlent les taux d'erreurs lorsque les utilisateurs accèdent aux contenus ou les lisent, ou bien sans aucune intervention lorsqu'une bande n'a pas été utilisée pendant un certain temps.

6.3.13 Coûts

6.3.13.1 Typiquement, le coût de stockage sur bande se répartit sur quatre postes : la bande elle-même : approvisionnement et remplacement de l'exemplaire de base, bandes de sauvegarde, ceci tous les 3 à 5 ans ; les lecteurs de bande : approvisionnement et remplacement tous les 1 à 5 ans, avec assistance technique ; l'achat et la maintenance de bibliothèques robotisées pour un cycle de vie de 10 ans, et enfin les logiciels : achat, intégration/développement et maintenance.

6.3.13.2 Dans un système manuel, l'archivage sur étagères est moins coûteux, seulement l'espace nécessaire pour le personnel est plus important, et les tâches de recherches manuelles et de vérification se montrent plus onéreuses. Dans un système robotisé, une grande partie des coûts en ressources humaines est compensée par les frais d'équipements et de logiciels. Les grandes bibliothèques de bandes robotisées peuvent être acquises de manière modulaire pour répartir les coûts sur plusieurs années au fur et à mesure que le fonds d’archive s’accroît. Selon la durée de vie d'une bibliothèque de bandes robotisée, ses équipements tels que les lecteurs - enregistreurs seront remplacées par de nouveaux dispositifs tous les trois à cinq ans. Si un fonds d'archives est consulté en permanence, la durée de vie des lecteurs - enregistreurs peut-être écourtée, une année seulement ou moins. Des bandes et lecteurs plus anciens peuvent être réservés en surnombre si nécessaire. Si la croissance d'un service d'archives est lente, la génération actuelle de bandes et lecteurs ainsi que la génération suivante peuvent coexister dans une bandothèque le temps de migrer les contenus vers la nouvelle génération de médias ou de technologie. Si la taille du service d'archives augmente de manière régulière, il peut-être préférable, au plan économique, de créer une bibliothèque de bandes de dimension exactement nécessaire au stockage de données archivées pendant la durée de vie de la technologie en cours, puis de faire l'acquisition d'un nouveau système de capacité plus importante pour accueillir les documents issus de la nouvelle génération technologique ainsi que les contenus provenant de la migration de documents plus anciens. Cette approche est également nécessaire si ancienne et nouvelle technologie ne peuvent coexister dans la même unité.

6.3.13.3 Conserver au moins une copie redondante hors site ou géographiquement éloignée est une bonne pratique. Un rayon de 20 à 50 km est généralement indiqué vis-à-vis des risques naturels ou d'origine humaine, il permet de récupérer manuellement les données en quelques heures. Pour diminuer d'autres risques, les copies supplémentaires devront être réalisées sur différents lots ou des sources différentes de média, ou bien encore faire appel à différentes technologies. Certaines bandes de données proviennent d'un seul fabricant, aussi les risques d'être confronté à un seul mode de défaillance augmentent-ils. Trois copies des données sont plus sûres que deux, et malgré l'augmentation du coût des supports, les dépenses dues aux équipements et aux logiciels ne seront que légèrement supérieurs à celles de la première copie.

6.3.14 Disques durs (Hard Disk Drives (HDD)) Introduction

6.3.14.1 Les disques durs (HDD) ont été utilisés en temps que mémoire primaire et mémoire de stockage des ordinateurs depuis le lancement par IBM du modèle 3340 en 1973. Son surnom "le Winchester" provient de l'appellation 30/30 correspondant à ses 30 GB de mémoire fixe et ses 30 GB de mémoire amovible, expression répandue chez les professionnels qui reprenait le nom du célèbre fusil. La fiabilité des disques durs devait être démontrée grâce à la conception innovante des têtes de ce modèle. La réduction de la taille, les développements de la conception de la tête et du disque ont largement contribué à augmenter la fiabilité des disques durs et à produire des modèles robustes d'usage courant de nos jours.

6.3.14.2 les gestionnaires de systèmes de données, responsables de la maintenance des informations, ont considéré que les disques durs n'étaient pas suffisamment fiables pour n'utiliser qu'une seule copie d'un item, mais que les copies multiples de disques étaient trop coûteuses, et qu’ en conséquence, il convenait d'utiliser des systèmes multidisques, plus fiables. Les données sur HDD ont donc été dupliquées plusieurs fois sur des bandes pour assurer leur sauvegarde. Comme indiqué ci-dessus (6.1.4 Aspects pratiques des stratégies de protection des données et 7.6 stockage d'archives), tous les systèmes de données devront réaliser des copies multiples séparées de la totalité des données. Les experts ont tendance à penser que le système de données le plus fiable est constitué de HDD en baie, renforcés par des copies multiples sur bandes ; pour autant, la diminution continue des coûts et l'augmentation de la fiabilité rendent possible le concept de la duplication à l'identique des données sur disques séparés. Le principe de la duplication multi- supports demeure, alors que le stockage sur disque unique constitue un risque.

6.3.15 Fiabilité

6.3.15.1 Les pertes de données consécutives à la défaillance de disques et de crashes de têtes ont rendu la plupart des professionnels de systèmes informatiques méfiants à l'égard des HDD ; toutefois les fabricants annoncent des taux annuels de défaillance inférieurs à un pourcent pour un période de fonctionnement de 40 000 heures (Plend 2003). Les drives très fiables peuvent même prétendre à une durée de vie opérationnelle plus longue, celle-ci étant définie par la durée moyenne séparant deux avaries ("mean time between failure"). Bien que les HDD soient indépendants, scellés dans un boîtier, ainsi protégés des dommages, la plupart des défaillances se produisent de deux manières contradictoires : par l'usure résultant d'une utilisation prolongée, ou bien par des mises sous tension- hors tension successives. Le dilemme est de choisir entre laisser le disque en activité, ce qui augmente l'usure, ou bien allumer-éteindre le système, pratique qui accroît les risques de défaillance.

6.3.16 Description des systèmes, complexité et coûts

6.3.16.1 Comme il a été noté dans le chapitre 2 - Clés du numérique-Principes, la puissance des dernières générations d'ordinateurs permet la manipulation de gros fichiers audio. Toutes les générations récentes d'ordinateurs incorporent des disques durs de vitesse et de capacités acceptables, ils offrent la possibilité de brancher un HDD externe via un port USB, Firewire ou SCSI. La complexité des systèmes, le niveau d'expertise nécessaire pour les utiliser ne sont guère plus importants que dans le cas des ordinateurs portables.

6.3.16.2 Lorsque de très grandes quantités de contenus audio et audiovisuels doivent, pour des raisons d'accès et de stockage, être stockées sur HDD, les disques sont généralement intégrés dans un dispositif RAID (Redondant Array of Inexpensive (or Independant) Disks - Regroupement redondant de disques indépendants). Le système RAID augmente la fiabilité des disques durs ainsi que la vitesse totale d'accès en traitant les disques groupés comme un seul disque de grande taille. Si un disque tombe en panne, il peut-être remplacé et toutes les données de ce disque reconstruites à partir des données réparties sur les autres disques de l'ensemble. Le niveau des défaillances tolérées par le système et la vitesse de récupération des données perdues déterminent les niveaux du système RAID. Le RAID n'est pas un outil de préservation des données, mais un moyen de maintenir l'accès à celles-ci malgré les défaillances inévitables des disques. Le niveau RAID adapté à une installation donnée, les conditions de duplication des mémoires du contrôleur, sont indépendantes des circonstances et de la fréquence des duplications de données. Un système RAID nécessite d'activer tous les disques groupés dès qu'un élément d'un disque est sollicité. Tous les disques RAID contenant des contenus d'archives aussi bien que des données numériques, doivent faire l'objet d'au moins une duplication sur d'autres supports.

Capacité Capacité
native
bande
(GB)
Nb
de
bandes
Nb
lecteurs
recommandées
Nb
maximum
lecteurs
Prix du
système
(€)
Prix
de la
bande
(€)
Prix
du
lecteur
(€)
Coût
par
GB
(€)
10 TB 800 13 2 4 20 480 97 7 625 2,05
50 TB 800 63 4 16 56 800 97 10 175 1,14
100 TB 800 125 8 16 134 050 97 12 725 1,34
200 TB 800 250 12 16 205 350 97 12 725 1,03
500 TB 800 625 18 56 446 938 97 15 975 0,89
1000 TB 800 1250 36 88 864 517 97 15 975 0,86
2000 TB 800 2500 72 176 1 687 690 97 15 975 0,84

Tableau 2 Paragraphe 6.3 : coûts d'investissement d'un système de stockage sur LTO-4

 

Capacité Maintenance
HW An 1
(€)
Maintenance
SW An 1
(€)
Maintenance
HW An 2
(€)
Maintenance
SW An 2
(€)
Maintenance
HW An 3
(€)
Maintenance
SW An 3
(€)
Maintenance
HW An 4
(€)
Maintenance
SW An 4
(€)
Maintenance
HW An 5
(€)
Maintenance
SW An 5
(€)
10 TB 2 420 n/a 2 420 n/a 2 420 n/a 2 514 n/a 2 514 n/a
50 TB 3 454 n/a 4 958 n/a 4 958 n/a 4 958 n/a 4 958 n/a
100 TB 11 808 490 13 817 490 13 817 490 13 817 490 13 817 490
200 TB 15 787 582 19 323 582 19 323 582 19 323 582 19 323 582
500 TB 27 380 1 068 34 111 1 068 34 111 1 068 34 111 1 068 34 111 1 068
1000 TB 47 542 2 115 66 734 2 115 66 734 2 115 66 734 2 115 66 734 2 115
2000 TB 99 272 4 221 99 272 4 221 99 272 4 221 99 272 4 221 99 272 4 221

HW Hardware : équipement
SW Software : logiciels

Tableau 3 Paragraphe 6.3 : coûts annuels de maintenance d'un système de stockage sur LTO-4

Notes à propos des tableaux :

  • Prix moyens établis à partir de tarifs de plusieurs distributeurs. Le prix effectif est généralement inférieur
  • Les prix indiqués correspondent à une capacité brute. Pour les sauvegardes, prévoir au moins une quantité double de bandes
  • Les prix de la colonne du système incluent le prix des bandes et des lecteurs pour la capacité correspondante, ils ne tiennent pas compte du système HSM, équipement et logiciels
  • Les tableaux indiquent seulement les coûts d'investissement et les frais de maintenance facturés par un prestataire. Il faut ajouter les dépenses d'électricité, de climatisation de la salle des machines, de gestion, etc. dans les calculs pour chaque cas. Les coûts d'électricité et de climatisation des systèmes de stockage sur bandes peuvent représenter 10 % des dépenses sur une période de 5 ans.

 

Capacité Technilogie du Drive Capacité du Drive (GB) Nb drives Prix du
système
(€)
Prix
du
Drive
(€)
Coût
par
GB
(€)
5 TB SATA 500–1000 5–10 11 884 1 000 2,38
10 TB SATA 750–1000 10–14 19 997 1 000 2,00
50 TB SATA/FATA 1000 50 124 334 1 800 2,49
100 TB SATA/FATA 1000 100 230 914 1 800 2,31
200 TB SATA/FATA 1000 200 456 942 1 800 2,28
500 TB SATA/FATA 1000 500 1 202 726 1 900 2,41
1000 TB SATA/FATA 1000 1000 2 566 513 1 900 2,57
2000 TB SATA/FATA 1000 2000 4 782 584 1 900 2,39

Tableau 4 Paragraphe 6.3 : coûts d'investissement d'un système de stockage sur HDD

 

Capacité Maintenance
HW An 1
(€)
Maintenance
SW An 1
(€)
Maintenance
HW An 2
(€)
Maintenance
SW An 2
(€)
Maintenance
HW An 3
(€)
Maintenance
SW An 3
(€)
Maintenance
HW An 4
(€)
Maintenance
SW An 4
(€)
Maintenance
HW An 5
(€)
Maintenance
SW An 5
(€)
5 TB 826 750 826 750 826 750 1.845 750 1.845 750
10 TB 1.206 1.125 1.206 1.125 1.206 1.125 2.600 1.125 2.600 1.125
50 TB 5.822 6.125 5.822 6.125 5.822 6.125 12.365 6.125 12.365 6.125
100 TB 10.514 8.500 10.514 8.500 10.514 8.500 22.391 8.500 22.391 8.500
200 TB 21.724 12.750 21.724 12.750 21.724 12.750 44.956 12.750 44.956 12.750
500 TB 57.061 37.250 57.061 37.250 130.394 37.250 130.394 37.250 130.394 37.250
1000 TB 130.203 66.250 130.203 66.250 263.537 66.250 263.537 66.250 263.537 66.250
2000 TB 223.778 124.250 223.778 124.250 477.121 124.250 477.121 124.250 477.121 124.250

Tableau 5 Paragraphe 6.3 : coûts annuels de maintenance d'un système de stockage sur HDD

6.3.17 Stockage sur un seul disque

6.3.17.1 Le nombre de disques RAID peut être augmenté dans les limites du système, tandis que le nombre de disques individuels n'a pas de limite, il suffit d'ajouter des drives. Depuis le lancement des HDD IBM 3340, la capacité de stockage a rapidement augmenté, de manière exponentielle pratiquement, tandis que les prix baissaient. De tels changements ajoutés à l'augmentation de la fiabilité, ont amené certains à penser que le HDD pouvait être utilisé à la fois comme système primaire de stockage et comme copie de sauvegarde. Cette approche rencontre en fait trois difficultés. Premièrement, l'estimation de la durée de vie des disques durs sur la base de durée d'utilisation, du nombre d'heures en opération : Il n'existe pas de tests de durée de vie de HDD peu utilisés. Deuxièmement, disposer de données sur différents médias est avantageux, les risques de défaillance étant répartis, mais, cette approche doit être considérée avec beaucoup de prudence. Enfin, il n'est pas possible de contrôler l'état de disques posés sur une étagère sans les faire fonctionner à intervalles réguliers et donc compromettre l'avantage acquis par leur l'inactivité (voir section 6.3.18 ci-dessous, Contrôle des médias disques durs). Utiliser différents types de supports (bandes et disques durs) reste la meilleure option. Les disques durs devront être implémentés dans un système intégré.

6.3.18 Systèmes de stockage sur disques durs

6.3.18 Systèmes de stockage sur disques durs

6.3.18.1 Les systèmes de stockage sur disques durs sont centralisés afin d'en optimiser l'utilisation et d'offrir de grandes capacités et / ou des performances élevées. Ces systèmes sont utilisés avec des serveurs afin d'épargner une partie ou la totalité des capacités de stockage des disques durs. Ce type de système est fréquemment utilisé pour des environnements de stockage d'archives de moyenne ou de grande taille. Un système peut aussi être constitué d'un dispositif d'archivage centralisé partagé avec un certain nombre d'ordinateurs. La taille d'un système peut varier de 1 téraoctet à plusieurs pétaoctets. On tiendra compte du fait que les performances d'un système de stockage peuvent varier de manière significative en fonction de la configuration choisie, et qu'il est essentiel de planifier soigneusement, et par anticipation, les véritables exigences d'un système : il faudra faire appel à  des professionnels qualifiés  pour configurer la structure de stockage et les interfaces du système  afin de produire le meilleur retour sur investissement.

6.3.18.2 Les systèmes de stockage sur disques durs centralisés sont conçus pour offrir une meilleure protection contre les erreurs que les disques indépendants. Ces systèmes proposent plusieurs niveaux de protection RAID, leurs composants  peuvent être redondants afin d'éviter les points singuliers de défaillances, et les systèmes  peuvent être dispersés localement ou géographiquement  pour protéger  des documents  de grande valeur  contre certaines défaillances et sinistres.   

6.3.18.3 Les liaisons entre système de stockage et ordinateurs dédiés jouent un rôle important quant aux performances du dispositif. De manière générale, deux méthodes sont utilisées : NAS (Network Attached Storage : périphérique de stockage orienté réseau) et SAN (Storage Area Network : réseau de stockage). Les périphériques NAS utilisent les connexions conventionnelles des systèmes d'information telles Ethernet pour véhiculer les données entre ordinateur et système de stockage, tandis que les systèmes SAN adoptent des connexions selon le protocole Fibre Channel. Les systèmes NAS peuvent opérer à des cadences de 100 Mbits/s, 1 Gbit/s et 10 Gbits/s tandis que les systèmes SAN atteignent 2 Gbits/s ou 4 Gbits/s. Les deux technologies disposent de feuilles de route bien établies, aussi peut-on compter sur une évolution des performances à venir. Généralement, la technologie SAN, plus performante grâce à sa conception spécifique, est préférée pour  les environnements les plus exigeants. Par exemple, la taille de blocs entrées/sorties (I/O) peut-être contrôlée plus efficacement dans l'environnement SAN tandis que les protocoles réseaux ont tendance à forcer les systèmes NAS à utiliser des tailles de blocs I/O beaucoup plus petits. Economiquement parlant, la technologie NAS est meilleur marché que la technologie SAN.

6.3.19 Durée de vie des disques durs

6.3.19.1 Comme indiqué ci-dessus, on estime la durée de vie des disques durs (HDD) commercialisés actuellement à 40 000 heures. Les pratiques commerciales correspondent typiquement à un taux de renouvellement de 5 ans. Certains perfectionnements apportés aux modèles les plus récents : roulements de broche en milieu fluide avec billes en céramique, lubrification de la surface des plateaux, permettent de prolonger quelque peu la durée de vie des HDD. Cependant nous ne disposons pas de tests fiables de la durée de vie de HDD inactifs, il serait judicieux de planifier le remplacement des disques d'un tel dispositif dans les 5 ans.

6.3.20 Contrôle des supports disques durs

6.3.20.1 L'indication de défaillance imminente d'un disque peut être produite par l'augmentation du nombre de blocs erronés de données. Typiquement, les derniers modèles de disques, même neufs, présentent des blocs erronés, la plupart des systèmes réagissent en réassignant l'adresse des blocs défectueux. Toutefois, l'augmentation du nombre de blocs défectueux peut être un indicateur du début de défaillance du disque. Des logiciels signalant l'augmentation de blocs de données erronées sont disponibles, ils mesurent aussi d'autres caractéristiques physiques susceptibles d'indiquer des problèmes de disque.

6.3.21 Technologies HDD

6.3.21.1 On compte quatre méthodes principales pour connecter des disques durs et d'autres périphériques aux ordinateurs : USB (Universal Serial Bus), IEEE 1394 (Firewire), SCSI (Small Computer System) et SATA/ATA (Serial Advanced Technology Attachment/AT Attachement). Chaque système présente un avantage particulier dans certaines situations. USB et Firewire sont prévus en tant que bus tout usage pour relier un PC à un HDD, à une caméra vidéo numérique ou bien à un lecteur MP3. SCSI et SATA/ATA sont principalement utilisés pour connecter des drives disques durs avec un ordinateur ou un système de stockage sur disques.

6.3.21.2 L'interface SCSI et ses successeurs SAS (Serial Attached SCSI) permettent des vitesses d'écriture et de lecture plus rapides, elles facilitent l'accès à un plus grand nombre de drives que SATA/ATA ne le permettait. Les disques SCSI peuvent accepter de multiples commandes à la fois sur un bus SCSI, ils n'ont pas à supporter les files d'attente comme SATA/ATA. Les drives SATA/ATA sont comparativement moins coûteux. La vitesse d'accès en mode lecture est pratiquement la même ; dans un contexte audio, aucune interface particulière ne limitera les opérations d'une station audio numérique (digital audio workstation (DAW)). Les différences de performances des drives SCSI/SAS et SATA doivent être prises en compte dans le cadre des systèmes centralisés de stockage sur disques à usage intensif.

6.3.21.3 Les drives Fibre Channel (FC) SCSI/SAS répondent principalement aux exigences des entreprises ou des systèmes d'administration tandis que les drives SATA, moins coûteux, visent davantage le marché des particuliers ; toutefois, on observe une utilisation croissante de ces derniers qui offrent des capacités de stockage plus économiques pour les entreprises et les systèmes d'administration. Dans ces centres de stockage, la décision d'adopter la technologie (FC) SCSI/SAS ou SATA dépend de la charge effective du système. Si un système assure l'archivage de contenu de petite ou de moyenne taille, et qu’on n’a pas besoin d’y accéder fréquemment, une solution SATA peut-être tout à fait suffisante. La décision finale doit être argumentée sur des exigences clairement établies et négociée avec un des fournisseurs de solutions de stockage.

6.3.21.4 Les disques avec interface USB ou Firewire peuvent servir au transfert des contenus d'un environnement à une autre mais, peu fiables, difficiles à contrôler, faciles à perdre, ils ne devront pas être utilisés pour l'archivage, même si les prix peuvent paraître très intéressants.

6.3.21.5 Le type d'interface ne fournit pas d'indication suffisante sur la fiabilité et les performances d'un drive ou d'un système de stockage, aussi l'acquéreur doit-il être bien informé à propos des différentes possibilités d'exploitation et des paramètres de configuration d'un système. Il semble bien que les drives les plus fiables soient associés aux interfaces FC SCSI/SAS. Toutefois, les disques HDD n'étant pas fiables dans la durée, toutes les données audio devront donc être sauvegardées sur des bandes adaptées (voir 6.3.5 Performances des bandes de données). (Pour plus de détails, voir Anderson, Dykes and Riedel 2003).

6.3.21.6 Une technologie de stockage est en train d'émerger, et elle pourrait atteindre une position proéminente dans un futur proche. Le stockage sur mémoire à semi-conducteurs sous la forme de mémoires flash est en train de se développer comme alternative aux disques durs amovibles, et il est déjà utilisé comme alternative aux disques HDD des PC portables. Certains constructeurs de systèmes de stockage ont introduit des drives flash dans leur produit d'entrée et de milieu de gamme, et projettent de les introduire également dans leurs systèmes haut de gamme. Même si le stockage sur mémoire flash doit encore relever certains défis en matière de fiabilité pour constituer une solution viable aux besoins de stockage de la communauté des archivistes : son prix par gigaoctet devient compétitif, il est plus respectueux de l'environnement car moins gourmand en énergie, et il ne comporte pas de pièces mobiles, ce qui pourrait signifier une plus longue durée de vie des unités de stockage. Une durée de vie d'une unité de stockage de dix ans au lieu de cinq ans pourrait se traduire pour un service d’archives par une réduction des coûts d'investissement et de gestion, la migration vers le système de technologie suivante pouvant être supprimée. En termes de performance de lecture et d'écriture, le stockage sur mémoire flash est déjà comparable à la technologie des disques HDD.

6.3.22 Hierarchical Storage Management (HSM) (Systèmes permettant le stockage hiérarchique des données (HSM))

6.3.22.1 Les fonctions de stockage des archives de l'OAIS intègrent la notion de stockage hiérarchique des données (HSM) dans le modèle conceptuel. A l'époque où l'OAIS a été élaboré, on ne pouvait envisager de gérer autrement de grandes quantités de données à prix abordable. La question pratique qui motive la mise en œuvre d'un système HSM est posée par le coût des différents médias de stockage, par exemple le coût élevé des disques de stockage en regard de celui, moins élevé, des bandes magnétiques. Dans cette situation, le système HSM fournit un simple entrepôt virtuel d'informations, alors, qu'en réalité, les copies peuvent être réparties sur de nombreux types de supports en fonction de leur usage et de la vitesse d'accès qu'ils proposent.

6.3.22.2 Néanmoins, le prix des disques durs ayant diminué plus rapidement que celui des bandes, ils se rejoignent. En conséquence, l'utilisation du système HSM devient un choix d'implémentation réaliste. Dans ces conditions, un système de stockage qui détient toutes les données sur disques durs, la totalité de ces données étant également stockées sur un certain nombre de bandes, constitue une proposition abordable notamment pour les systèmes de stockage atteignant une capacité de 50 téraoctets (en augmentation chaque année). Pour les stockages numériques de plus petite taille, un système HSM fonctionnel dans sa totalité n'est pas nécessaire, on envisagera plutôt un système bien plus simple, capable de gérer et conserver les informations sur l’emplacement des copies ainsi que l’âge et les différentes versions des documents, et de dupliquer sur disque et bande magnétique la totalité des données stockées.

6.3.22.3 Pour les systèmes de stockage de moyenne et de grande taille, le recours au système HSM reste et continue de rester une composante parmi les plus onéreuses des systèmes de stockage numérique.

6.3.23 Logiciels de gestion des fichiers des plus petits systèmes

6.3.23.1 L'objectif des logiciels de gestion de fichiers des systèmes dont la totalité de l’archive est dupliquée sur disques durs et bandes, consiste à garder la traçabilité de la localisation, des conditions de création, de la fidélité et de l'ancienneté des copies sur bandes. Ces fonctionnalités fondamentales de sauvegarde constituent une alternative moins coûteuse au système HSM classique et peuvent, au moins en théorie pour les petits systèmes, être plus fiables. Toutefois, les grands systèmes HSM représentent un marché conséquent qui suscite, en matière de recherche et développement dans ce domaine, le soutien de firmes industrielles. Les logiciels de gestion de fichiers de petite taille sont en cours d'élaboration dans la communauté des développeurs de logiciels open source. De tels systèmes font partie des trois applications NAS open source les plus populaires : FreeNAS, Openfiler et NASLite, ainsi que Advanced Maryland Automatic Network Disk Archiver (AMANDA). Comme pour toutes les solutions open source, la responsabilité revient à l'utilisateur de tester la pertinence et la fiabilité de ces systèmes ; sans développements supplémentaires, cette publication ne fera pas de recommandations spécifiques.

6.3.24 Vérifications et récupération de données

6.3.24.1 Grâce à certains logiciels commerciaux, les erreurs de lecture/écriture sur bande peuvent être rapportées automatiquement pendant le processus de sauvegarde et de vérification. Cette fonction est normalement implémentée avec un contrôle de redondance cyclique, une technologie utilisant les checksums (sommes de contrôle) de données qui détecte les erreurs dues aux transmissions ou au stockage. On recommande d'implémenter les fonctions de contrôle d'erreurs dans tout système d'archivage. Il est difficile d'implémenter les contrôles d'erreurs dans l'open source, leur capacité dépendant des spécificités du matériel informatique. Un lecteur autonome de cartouches LTO est commercialisé avec le logiciel de contrôle d'erreurs "Veritape" de MPTapes, Inc. et récemment, Fuji Magnetics a annoncé le contrôle de cassettes LTO avec le Chip Reader Diagnostics System, livré avec un logiciel.

6.3.25 Intégrité et Checksums

6.3.25.1 Le checksum est une valeur calculée pour vérifier qu'aucune donnée stockée, transmise et dupliquée ne comporte d'erreurs. La valeur est calculée selon un algorithme approprié puis transmise ou stockée avec les données. Par la suite, quand on accède à une donnée, un nouveau checksum est calculé et comparé à celui de l'original et si les valeurs concordent, aucune erreur n'est déclarée. L'utilisation d'algorithmes de checksums, dont Il existe de nombreux types et de nombreuses versions, est recommandée sous une forme normalisée pour effectuer la détection des erreurs accidentelles ou intentionnelles des fichiers archivés.

6.3.25.2 Les versions cryptées sont les seules offrant une protection avérée des données vis-à-vis des dégradations intentionnelles de données, alors que même les plus simples d’entre-elles sont en danger On a récemment montré qu'il y avait différentes façons de créer des bits dépourvus de signification permettant d'effectuer des calculs à la manière d'un checksum MD5 donné. Une intrusion de provenance externe ou interne peut ainsi remplacer une partie du contenu numérique avec des données dépourvues de signification sans que cette attaque ne soit signalée par le dispositif de contrôle jusqu'à l'activation des fichiers. MD5, encore utile à des fins de transmission, ne comporte que 124 bits et ne doit pas être utilisé à des fins de sécurité. SHA-1, autre algorithme de cryptage, menace d'être déclassé, il a déjà été montré qu'il pouvait théoriquement être mis en défaut. SHA-1 a une longueur de 160 bits; SHA-2, similaire aux algorithmes SHA-1, est proposé dans les versions 224, 256, 384 et 512 bits. L'accroissement régulier de la puissance de calcul peut compromettre, à long terme, le dispositif de checksum.

6.3.25.3 Même avec de tels compromis, le décompte de checksums reste une approche viable de détections d'erreurs accidentelles ; s'il est incorporé dans un dépôt numérique sûr, il sera en mesure de découvrir des dégradations de fichiers intentionnelles dans des scénarios à faible risque. Néanmoins, lorsque des risques existent, et peut-être lorsqu'ils n'existent pas, le contrôle des checksum et de leur viabilité doit faire partie de la planification des opérations de conservation.

6.4 Planification de la pérennisation des données

6.4.1 Introduction

6.4.1.1 Une fois entreprise la conversion des contenus audio dans un format adapté au stockage des données dans un système, comme défini ci-dessus, il convient ensuite d'être en mesure d'assurer de manière continue la conservation de ces contenus. Dans le chapitre 6.3 Stockage des Archives, les problèmes posés par la gestion des flux des données sont décrits : la structure logique des données numériques encodées doit rester inchangée pendant tout le processus de stockage.

6.4.1.2 On considère également un autre aspect de la conservation des informations numérisées : être toujours assuré de pouvoir accéder aux contenus encodés dans de tels fichiers. Le modèle OAIS désigne cette fonction "planification de la pérennisation", qu'il décrit comme "les services et fonctionnalités de contrôle de l'environnement... il fournit des recommandations pour assurer que l'information stockée... reste durablement accessible à la communauté d'utilisateurs, même si l'environnement informatique original est devenu obsolète" (OAIS 2002:4.2).

6.4.1.3 Planifier la conservation, c’est connaître les données techniques propres à son entrepôt, identifier les futures orientations de la conservation et déterminer à quel moment les opérations de conservation, par exemple la migration des formats, doivent être effectuées.

6.4.2 Les futures voies du numérique

6.4.2.1 Quand un format de fichier devient obsolète et compromet l'accès au contenu du fait de l'absence de logiciel approprié, deux approches fondamentales peuvent être pratiquées : la migration ou l'émulation. Dans le cas de la migration, le fichier est modifié, ou migré vers un nouveau format de telle manière que le contenu puisse être reconnu et rendu accessible à l'aide d'un logiciel disponible au moment donné. Dans le cas de l'émulation, ce sont les conditions d'accès ou le logiciel d'exploitation d'époque qui sont modifiés, élaborés pour ouvrir et lire le fichier audio dont le format est obsolète, sur un nouveau système qui n'aurait pas été en mesure d'ouvrir le contenu sans ces interventions.

6.4.2.2 Nos connaissances actuelles nous conduisent à penser que pour les fichiers simples, tels que les fichiers audio non compressés, la migration est une approche préférable, mais ce n'est pas une certitude et toutes les manières de traiter le stockage numérique, tous les systèmes devront pouvoir s'adapter pour constituer une réponse dans un environnement variable. Les métadonnées relatives à la conservation, décrites dans les recommandations PREMIS ou dans le document BWF/AES31-2-2006 contribuent à de telles approches, de même que les normes développées dans l'AES-X098B publiées par l'Audio Engineering Society sous la référence AES57 "AES standard for audio metadata - audio object structures for preservation and restoration" - Structures objet audio pour la conservation et la restauration". L'université de Harvard développe des outils qui pourront être utiles aux personnes impliquées dans les activités de développement open source.

6.4.2.3 Cet aspect de la conservation numérique constitue l'argument essentiel en faveur d'une conformité absolue au format normalisé décrit. Les investissements importants des industries de l'audio et de l'informatique en matière de normalisation de formats audio (.wav) signifient que les exigences d'outils logiciels professionnels capables d'accéder durablement au contenu vont aider les services d'archives sonores chargés de garantir l'accès à leurs collections. De plus, les investissements importants consacrés à un format unique vont contribuer à assurer une continuité de plus longue durée de celui-ci, aussi longtemps que l'industrie acceptera de garder un ancien format sans bénéfices significatifs.

6.4.3 Facteurs de motivation et calendrier

6.4.3.1 Si un choix judicieux de format normalisé et le suivi des pratiques industrielles retardent cette éventualité, un jour viendra où il sera nécessaire d'entreprendre différents types d'actions de conservation indispensables au maintien des conditions d'accès des contenus audio stockés. Le problème, pour les archivistes de fonds sonores concernés par les contenus numériques, sera de déterminer à quel moment entreprendre cette étape et quelle action mener précisément.

6.4.3.2 De nombreuses initiatives sont entreprises pour apporter des réponses. Ainsi le Registre unifié des formats numériques (Global Digital Format Registry (GDFR http://hul.harvard.edu/gdfr/), élaboré pour appuyer "l'utilisation effective, l'échange, et la conservation de tous les contenus numérisés". D'autres services fournissent des recommandations sur les formats appropriés, tels ceux proposés par la Bibliothèque du Congrès (Library of Congress (US)) ou les Archives nationales du Royaume Uni (The National Archives (UK)).

6.4.3.3 Pour entreprendre des actions de conservation, les archivistes de collections sonores trouvent des facteurs de motivation lorsqu'ils apprennent qu'un nouveau logiciel ne supportera plus l'ancien, que les industriels choisissent un nouveau format. L'annonce des changements provient d'experts au fait de la technologie, des données industrielles et des marchés, aussi les archivistes de collections sonores seraient-ils bien avisés de tenir compte des recommandations prodiguées par des organismes comme indiqué ci-dessus.

6.4.3.4 Les logiciels et services en cours de développement, par exemple le système de notification automatique de l'obsolescence (Automatic Obsolescence Notification System (AONS)) apporteront des conseils aux gestionnaires de collection sur les actions à mener lorsque des changements du marché se produisent (https://wiki.nla.gov.au/display/APSR/AONS+II+Documentation). L'implémentation de tels services sera menée en parallèle avec le développement du GDFR.

6.5 Gestion des données et administration

6.5.1.1 Dans le modèle OAIS, la Gestion des données est l'entité qui assure les services et les fonctions d'enrichissement, de conservation et d'accès à la fois à l'information de description, qui identifie et documente les fonds d'archives, et aux données administratives utilisées pour gérer les archives ; en d'autres termes, c’est le catalogue des contenus et le relevé statistique des contenus.

6.5.1.2 Dans le modèle OAIS, L'Administration est l'entité qui assure les services et les fonctions de gestion de la configuration du système, des opérations de contrôle, de service rendu, de la mise à jour des informations archivées. L'Administration est responsable également des processus de gestion tels que les autorisations d'accès négociées avec les producteurs, l'audit des soumissions, le contrôle physique des accès, la réalisation et la mise à jour des normes d'archivage.

6.5.1.3 La gestion et l'administration d'un dépôt numérique et d'un système d'archivage pourvoit aux services permettant la durabilité du système et la pérennité des contenus de celui-ci. Il est nécessaire que le système de stockage d'archives numériques incorpore les moyens d'interrogation pour obtenir les résultats à partir de l'ensemble des documents (état des lieux), les statistiques d'usage, les relevés des contenus, y compris la volumétrie et autres informations nécessaires d'ordre technique et administratives. La gestion et l'administration des données ont une importance essentielle pour entretenir un système d'archives car leurs fonctionnalités apportent la garantie, en ce qui concerne les fichiers conservés et accessibles, qu'ils seront effectivement bien retrouvés et identifiés.

6.5.1.4 C’est dans cette entité du système de stockage numérique et pérennisation que les contrôles d'accès aux contenus, ou contrôles de sécurité, sont implémentés. De nombreux systèmes logiciels d'entrepôt incorporent des approches d'implémentation des politiques qui sont stockées et gérées par le système. Il est important de reconnaître que les informations concernant la gestion des droits, tels les contenus audio eux-mêmes, vont durer plus longtemps que le système qui les stocke, aussi doivent-il être transférables sur tout système de conservation et de stockage de remplacement. L'information encodée en XACML (eXtensible Access Control Markup Language - langage de balisage extensible de contrôle d'accès), par exemple, est un exécutable encore plus universel transférable dans d'autres systèmes. XACML est un langage de politiques de contrôle d'accès par notification implémenté en XML, c'est aussi un modèle de traitement décrivant comment interpréter les politiques. XACML est en charge du groupe de normalisation OASIS (http://www.oaisis-open-org/committees/tc_home.php?wg_abbrev=xacml).

6.5.1.5 Quand un système de conservation numérique est sélectionné, programmé et installé, un test des plus critiques consiste à déterminer si l'administration du système proposé correspond bien aux capacités de l'institution hôte. L'aptitude et l'étendue des fonctions d'un système a souvent un rapport avec la complexité de son usage et de son installation. Un système qui ne peut être correctement géré et entretenu fait encourir des risques importants au contenu qu'il administre. Par conséquent, il est important que la gestion d'un système tienne compte de l'expertise technique disponible nécessaire pour assister son fonctionnement.

6.6 Accès

6.6.1 Introduction

6.6.1.1 Le modèle de référence OAIS définit "l'Accès" comme une entité qui "assure les services et fonctions qui aident l'utilisateur à déterminer si une fonction existe ou non dans un OAIS, à trouver sa description, son emplacement, et à demander et recevoir des produits d'information. " En d'autres termes, l'entité Accès comporte les mécanismes et les processus par lesquels les contenus sont retrouvés et récupérés. IASA-TC 03 "Sauvegarde du Patrimoine sonore : Ethique, Principes et stratégie de conservation" fait le point sur "le but premier d'une archive qui est de garantir l'accès permanent à l'information stockée". La pérennité des contenus est une condition préalable à l'accès des contenus de manière durable, ce qui constitue la finalité d'un service d'archives bien géré.

6.6.1.2 Dans sa forme la plus simple, l'accès est la possibilité de trouver l'emplacement du contenu; et en réponse à une requête autorisée, de pouvoir le retrouver et l'écouter, ou bien, aussi longtemps que les droits associés à l'œuvre le permettent, effectuer une copie qu'il est possible d'emporter. Dans l'environnement numérique connecté, l'accès peut être fourni à distance. L'accès, toutefois, est plus qu'une simple capacité à délivrer un item. Le moindre système d'archives de réalisation technique peut fournir un fichier audio sur requête, mais un véritable système d'accès offre des possibilités de découvertes et de recherches, il est doté de mécanismes de distribution, il permet des interactions et des négociations concernant les contenus. Ce qui donne à la notion d’accès une nouvelle dimension, au-delà de la seule question de l’accès à distance. Dans ces nouveaux services fondés sur un modèle de récupération, l'entité Accès devrait être considérée comme un espace de dialogue entre le fournisseur et l'utilisateur navigateur.

6.6.2 Intégrité dans des environnements d'accès en ligne et hors ligne

6.6.2.1 Avant que les environnements connectés n’offrent la possibilité d’accéder aux documents à distance, leur authenticité ou intégrité était établie par des individus, dans les salles de lectures, sur les postes d’écoute des institutions détentrices de collections. Les contenus étaient fournis par les personnels des institutions dont la réputation garantissait l'intégrité du document. Les originaux pouvaient être ressortis pour examen si la qualité des copies était mise en doute.

6.6.2.2 Les environnements en ligne reposent encore, dans une certaine mesure, sur la confiance accordée à l'institution détentrice des collections, même si un item véritablement original ne sera jamais communiqué en ligne et qu’un risque demeure, au sein des collections et des réseaux de distribution, de falsification indétectable ou de corruption accidentelle. , Pour éviter de telles situations, il existe différents systèmes qui attestent mathématiquement de l'authenticité ou bien de l'intégrité de l'item ou de l'œuvre.

6.6.2.3 Etablir l’authenticité, c’est lier le document et la source qui l’a généré. L'institution, fiable, qui créé les contenus, atteste des processus et émet un certificat, document qu'une tierce personne peut utiliser comme garantie d'authenticité. Il existe différents systèmes, viables, et qui fonctionnent sur ce principe.

6.6.2.4 La notion d'intégrité intervient lorsque l'on souhaite savoir si un item a été endommagé ou manipulé. Les checksums représentent la manière la plus courante de traiter la question de l'intégrité, ce sont des outils précieux tant pour les archives que pour les réseaux (voir 6.3.25 Intégrité et Checksums). Toutefois, comme discuté au paragraphe 6.3.23, les checksums sont faillibles et leur utilisation nécessite une surveillance de la part des services d'archives les plus performants.

6.6.3 Normes et Métadonnées de description

6.6.3.1 Des métadonnées détaillées, adaptées, organisées, constituent la clé pour améliorer le signalement et, de fait, l’accès au document. Le chapitre 3, Métadonnées, leur consacre de nombreuses pages et décrit leurs différentes formes : on s’y réfèrera pour développer un système de communication des documents. Un système de communication ambitieux, qui utilise par exemple des interfaces de représentation cartographique ou des historiques, fonctionnera seulement si des métadonnées, sous forme structurée et organisée, sont bien disponibles.

6.6.3.2 La manière la plus économique de gérer et de créer les métadonnées appropriées est de s’assurer que les exigences requises pour toutes les composantes du système de communication ont été définies avant l’ingestion du contenu De cette manière, l'étape de création des métadonnées peut-être réalisée dans le flux des opérations de pré-entrée et d'entrée. Le coût de création d'un jeu minimum de métadonnées comme discuté dans le paragraphe 7.4, correspond à la tâche supplémentaire qu'il faut consacrer pour ajouter et structurer des métadonnées dans un système qui existe déjà.

6.6.4 Formats et Paquets d'information diffusés (Formats and Dissemination Information Packages (DIP))

6.6.4.1 On appelle Paquet d'informations diffusé (DIP) le Paquet d'informations reçu par l'utilisateur en réponse à une requête de contenu ou à un ordre. Le système de communication devra aussi être en mesure de fournir le jeu de résultats ou le rapport issu de la requête. .

6.6.4.2 Les développeurs d'internet et de "l'industrie" des accès ont élaboré des systèmes de diffusion basés, naturellement, sur des formats adéquats. Les formats de diffusion ne conviennent pas pour la conservation et, généralement, les formats de conservation ne conviennent pas pour la diffusion. Afin de faciliter la diffusion, des copies d'accès séparées sont créées, soit par un processus de routine, soit "à la demande" en réponse à une requête. Le contenu peut être transféré sous forme de flux continu (streaming), soit téléchargé dans un format de diffusion compressé. La qualité du format de diffusion est généralement proportionnelle à la bande passante souhaitée, et les responsables de collections doivent décider du type de format de diffusion en se basant sur les exigences des utilisateurs et sur les capacités de l'infrastructure de diffusion. Quick Time et Real Media sont des formats streaming éprouvés et populaires, et MP3 (MPEG 1 Layer 3) un format téléchargeable apprécié par le public qui peut également être communiqué en flux continu. Il n'y a pas d'exigence particulière à choisir uniquement ces formats, et de nombreux systèmes de diffusion de collections offrent à l’utilisateur un large choix de formats.

6.6.4.3 Pour certains types de documents, il peut être nécessaire de créer deux fichiers masters Wav : un exemplaire de conservation ou master d'archive qui reproduit exactement le format et les conditions de l'original, et un deuxième exemplaire, master de diffusion qui peut être traité de manière à améliorer la qualité audio. Le second master permettra, comme requis, la création d'une copie de dissémination. On s'attend à ce que les formats de distribution continuent de changer et d'évoluer à plus grande vitesse que les formats des masters.

6.6.5 Systèmes de recherche et d'échanges de données

6.6.5.1 L'étendue du domaine dans lequel un contenu peut être retrouvé fixe la limite de la procédure. Afin de s'assurer d'un large usage, il est nécessaire de présenter les contenus de différentes manières.

6.6.5.2 Les banques de données à distance peuvent être consultées au moyen du protocole Z39.50, protocole client-serveur de recherche et de consultation de l'information. Z39.50 est largement utilisé dans les bibliothèques et le secteur des établissements d'enseignement supérieur, son existence est antérieure à celle du web. Etant donnée son extension, il est conseillé d'établir une compatibilité client-serveur Z39.50 sur les bases de données. Toutefois, ce protocole va bientôt être remplacé dans l'environnement web par le protocole SRU/SRW (Search/Retrieval via un URL et Search/Retrieval Web service respectivement). SRU, normalisé et fondé sur XML, est un protocole pour les requêtes de recherche sur Internet et qui utilise le langage CQL (Contextual Query Language), une syntaxe normalisée pour formuler les interrogations (http://www.loc.gov/standards/sru/). SRW est un service web qui fournit une interface SOAP pour les demandeurs, établie en partenariat avec SRU. Différents projets open source supportent les protocoles SRU/SRW en relation avec les logiciels importants d'entrepôts open source tels que DSPACE et FEDORA.

6.6.5.3 L'OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting : Protocole pour la collecte des métadonnées de l'initiative pour les Archives ouvertes) est un mécanisme assurant l'interopérabilité des entrepôts. Les entrepôts présentent des métadonnées structurées via des OAI-PMH, agrégées et utilisées lorsque des interrogations sur les contenus se manifestent. Les nœuds OAI-PMH peuvent être incorporés aux entrepôts courants. Le protocole OAI-ORE (Object Reuse and Exchange) est très important pour la communauté des archives sonores et audiovisuelles, il répond à la nécessité de traiter des objets d'information synchronisés avec l'architecture du Web. Il permet d'effectuer la description et l'échange des agrégations des ressources du Web. "Ces agrégations, parfois nommées objets numériques combinés, peuvent associer les ressources distribuées avec différents types de médias tels texte, images, données et vidéo". http://wwwopenarchives.org/.

6.6.5.4 Pour rendre opérationnel un environnement en réseau perfectionné, il est nécessaire de disposer de métadonnées et de contenus interopérables. Pour cela il faut être en mesure de partager certaines connaissances des attributs incorporés, un mode d'organisation général pour opérer dans différents cadres, et partager un ensemble de protocoles d'échanges de contenus. La meilleure manière d'y parvenir, comme toujours dans un environnement numérique, est de se conformer aux normes, aux schémas, aux cadres et aux protocoles recommandés, et d'éviter toute solution propriétaire.

6.6.6 Droits et autorisations

6.6.6.1 Il est important de noter que tout accès est soumis aux droits établis pour chaque item et à l'autorisation des détenteurs à utiliser le contenu. Différentes approches de gestion des droits se présentent, à commencer par l'application d'une "empreinte" sur le document, la gestion des autorisations d'accès individuelles, la séparation physique de l'environnement de stockage. Le système d'implantation spécifique des droits dépendra du type de contenu, de l'infrastructure technique ainsi que des ayants-droit et de la communauté des usagers, mais il n’appartient pas à cet ouvrage d’en définir ou décrire une approche particulière.

7: Approches à petite échelle des systèmes de stockage numérique

7.1 Introduction

7.1.1.1 Il est possible de réaliser des systèmes de stockage numérique de taille modeste et qui répondent aux contraintes de services d'archives de petites collections ne disposant que de budgets restreints. Jusqu'à une période récente, seuls les grands établissements d'archives sonores disposant de moyens relativement importants étaient en mesure de procéder à la numérisation à grande échelle de leur fonds et de les stocker sur des systèmes dits de stockage de masse associant disques durs et bandes magnétiques. Ces systèmes dédiés aux dispositifs d'archivage audio et audiovisuels avaient tendance à s'agrandir et à devenir coûteux. Ces dernières années, de nombreux services d'archives sonores nationales, des grandes bibliothèques ont, avec l'université et le secteur de l'enseignement supérieur, initié et soutenu le développement de standards ouverts et logiciels open source pour l’archivage numérique. De tels systèmes constituent une ossature, un modèle pour l'archivage numérique sous toutes ses formes. Les services d'archives sonores peuvent en tirer bénéfice lorsqu'ils mettent en œuvre ces systèmes et prennent à leur compte les connaissances spécifiques de notre discipline.

7.1.1.2 Alors que les solutions open source et autres logiciels à bas coût apparaissent sur le marché, le prix des bandes de données baisse, ainsi que celui des disques durs (HDD), et plus rapidement encore. Aujourd'hui, on peut entreprendre l’archivage numérique sur un mode beaucoup plus professionnel que celui consistant à utiliser des supports cibles unitaires à risques tels que les disques optiques enregistrables CD et DVD.

7.1.1.3 Ce chapitre des Recommandations décrit la manière dont un entrepôt numérique de petite taille peut être mis en place et géré tout en répondant aux exigences de l'OAIS. Le chapitre 6, Formats et systèmes cibles de pérennisation contient de nouveaux éléments pertinents relatifs à ce chapitre, tout comme les chapitres 3 Métadonnées et 4 Identificateurs uniques et persistants.

7.2 Approches de l'archivage numérique à petite échelle

7.2.1. Financements et savoir-faire techniques

7.2.1.1 Il est tout à fait possible de réaliser un système d'archivage numérique pérenne à coût abordable, mais on ne saurait le mener à bien sans un minimum de connaissances techniques et des ressources récurrentes. Malgré la modestie des moyens, le système reste durable. Quelle que soit la simplicité ou la robustesse d'un système, il doit être bien géré et entretenu et devra pouvoir être remplacé à un moment ou un autre, sans quoi on risque d’en perdre le contenu.

7.2.1.2 "La conservation numérique représente un enjeu important, tant sur le plan technique qu'économique. La réponse aux exigences de la conservation commence par la fiabilité des financements qui, même à niveau modeste, doivent assurer la pérennité des contenus numériques, des entrepôts, de la maintenance des technologies et des systèmes, aussi longtemps que nécessaire. Le financement récurrent n'est pas le seul utilisé par les nombreuses organisations qui mettent en place des collections numériques, nombre d'entre-elles s'efforcent d'obtenir des subventions ponctuelles ; Il est en effet nécessaire d'élaborer des plans de financement pour assurer la durabilité des équipements numériques répondant aux exigences spécifiques des différentes catégories de contenus, mais encore aux conditions d'accessibilité et de durabilité" (Bradley 2004).

7.2.1.3 Le système avec ses éléments hardware et logiciels nécessite, de manière inévitable et incontournable, une maintenance et une gestion qui exigent tout à la fois des compétences techniques et des financements dédiés. Toute initiative de constitution et gestion d'archives audio numériques, devra proposer une stratégie incluant non seulement une planification du financement des opérations de maintenance et de remplacement des matériels, mais encore une liste des risques induits par la perte des expertises techniques et comment les affronter.

7.2.2. Stratégies alternatives

7.2.2.1 S'ils n'ont pas la possibilité de disposer de moyens suffisants pour gérer les risques décrits ci-dessus, les services d'archives peuvent décider de poursuivre la conservation et la numérisation de leurs collections avec des partenaires. Un service peut décider de répartir les risques de plusieurs manières : former un partenariat local afin de distribuer les contenus dans plusieurs collections liées ; établir des relations avec un établissement disposant de moyens importants ; faire appel à un prestataire de services spécialisé dans le domaine de l'archivage (voir paragraphe 6.1.6 Planification à long terme).

7.2.2.2 Pour bénéficier des avantages correspondant à chacune des approches décrites, il serait nécessaire de contracter un accord définissant les types de données et de contenus échangés entre partenaires, et la forme qu'ils pourraient prendre. Cet accord devrait être défini avant même que la nécessité d'en bénéficier ne se manifeste. Un accord concernant l'échange de paquets doit prendre en compte toutes informations pertinentes nécessaires pour que le service d'archives puisse poursuivre les tâches entreprises. Ces informations comprennent les données servant à reconstituer l'objet sonore dans sa forme d'archivage, mais aussi les métadonnées techniques, les métadonnées descriptives, les métadonnées structurelles, les métadonnées relatives aux droits, et les métadonnées créées pour enregistrer la provenance et l'historique des modifications. Il est nécessaire de regrouper ces informations sous une forme normalisée afin que l'on puisse les utiliser pour reconstituer l'archive si les données sont perdues, ou bien encore pour permettre à un autre service d'archives de reprendre la gestion des contenus si l'on juge que c'est nécessaire.

7.2.2.3 Les outils permettant de réaliser de tels profils existent, ils utilisent, par exemple la norme d'encodage et de transmission des métadonnées METS (Metadata Encoding and Transmission Standards), une approche très répandue réalisée pour les bibliothèques. L'accord est essentiel pour assurer le succès de telle ou telle stratégie. Que ce soit dans le cas du contrôle à distance de la duplication des contenus ou bien d'une coopération de services d'archives, l'accord s'appuyant sur la normalisation des processus et des échanges constitue la stratégie de conservation la plus efficace du fait de la répartition des risques de défaillance, des risques de catastrophe d'origine naturelle ou humaine, ou bien simplement par manque de ressources aux moments critiques du cycle de vie de l'objet audio numérique.

7.3 Description du système

7.3.1.1 Le paragraphe 6.1.4 Aspects pratiques des stratégies de protection des données, fait état de la nécessité de traiter les catégories définies dans le modèle de référence d'un Système ouvert d'archivage d'information (OAIS, ISO 14721 : 2003). A ce stade, les questions posées à propos des grandes et des petites collections sont essentielles en vue de développer des systèmes de stockage modulaires permettant l'interopérabilité des échanges des contenus. Pour les systèmes de taille réduite, le paragraphe qui suit adopte les principales composantes fonctionnelles du modèle de référence OAIS en vue d'aider l'analyse des logiciels disponibles et d'élaborer les recommandations pour les développements nécessaires. Il s'agit des entités : entrée, accès, administration, gestion des données, planification de la pérennisation, et stockage des archives.

7.3.1.2 Le système décrit comporte plusieurs formes de logiciels d'entrepôts assurant la gestion des contenus, au moins un ensemble de métadonnées et un dispositif informatique, le tout avec un certain nombre de recommandations sur les approches manuelles de gestion de l'intégrité des données. Le paragraphe consacré au matériel informatique présente brièvement deux cas de mise en œuvre de systèmes de taille réduite : un seul opérateur effectue les opérations de numérisation sur un dispositif de stockage unique ; situation dans laquelle plusieurs opérateurs doivent avoir accès au système d'archivage. Tous les systèmes sont sensés être en conformité avec tous les autres composants mentionnés dans le guide, convertisseurs analogique/numérique et cartes son appropriées, stations audionumériques (DAW, digital audio workstations) et dispositifs de lecture convenables.

7.3.1.3 Les informations suivantes décrivent des systèmes et des logiciels pouvant répondre aux exigences de collections de taille réduite, et qu'une institution ou une petite structure peut assumer entièrement. Il est important de reconnaître que les approches décrites ci-dessous ne doivent pas être entreprises pour une seule collection. Il est possible de trouver des partenaires et des fournisseurs commerciaux qui pourraient prendre en charge certaines ou l'ensemble des tâches décrites. Il est important de reconnaître aussi que toutes ces tâches qui constituent un ensemble de mesures de conservation et de stockage doivent être entreprises par une personne qui aura à charge de les gérer localement ou de manière partagée.

7.3.2. Logiciels de dépôt numérique

7.3.2.1 Un logiciel d'entrepôt numérique bien conçu se chargera de satisfaire un certain nombre de fonctions identifiées dans le modèles OAIS. Les logiciels proviennent soit d'entreprises commerciales soit de développements open source. Les logiciels commercialisés se doivent de fonctionner correctement, ils sont toutefois plus onéreux et rendent l'utilisateur captif de systèmes propriétaires, une situation à laquelle il est difficile d'échapper. Les principaux avantages des logiciels open source tiennent à leur qualité de logiciels libres, au fait que les développeurs inscrivent leurs travaux dans des normes ouvertes et des structures qui permettent l'extraction des contenus lors des futures mises à jour. Ils ont pour inconvénient, malgré l'assistance de la communauté open source, d'être maintenus sous la responsabilité de l'utilisateur. Toutefois, il est possible de trouver des prestataires pouvant apporter des solutions open source.

7.3.2.2 La plupart de ces systèmes logiciels d'entrepôt numérique sont à même d'assurer les tâches d'identification des accès, d'administration, de gestion des données et de certains aspects des entrées. Au moment d'écrire ce document, le planning des tâches de conservation et de stockage des archives n'est généralement pas pris en compte par un logiciel d'entrepôt, tout d'abord pour des raisons technologiques ou de format spécifique, à cause du matériel informatique ensuite. Ces éléments seront discutés dans les paragraphes ci-dessous.

7.3.2.3 Deux types de logiciels open source seront brièvement décrits, mais étant donnés les développements continuels, les réclamations et commentaires mentionnés ci-dessous devront être examinés au vu des derniers états fournis. Les logiciels décrits sont DSpace et FEDORA.

7.3.2.4 La plateforme de dépôt numérique DSpace est très populaire et très largement utilisée dans les domaines de l'enseignement supérieur et de la recherche, bien que la connaissance qu'en ont les musées et le secteur patrimonial soit limitée, mais se développe. Une des raisons de la popularité de DSpace provient de sa relative facilité d'installation et de maintenance et du fait que son interface utilisateur soit prête à l’emploi, elle qui intègre la gestion des données et les fonctions d'accès dans l'architecture du système. DSpace bénéficie de la très importante communauté internationale de développeurs qui l'on fait évoluer ; de nouvelles caractéristiques doivent être constamment ajoutées.

7.3.2.5 L'une des forces de DSpace provient de l'ensemble des fonctionnalités intégrées permettant aux utilisateurs de réaliser rapidement un entrepôt, puis d'ajouter de nouveaux items à la collection. Cette force, toutefois, est aussi l'une de ses principales faiblesses, car DSpace a évolué pour devenir un logiciel d'application monolithique, une base de code complexe, éléments qui introduisent potentiellement une mise à l'échelle et des restrictions pour des utilisateurs de grandes institutions. Ceci ne pose pas de problème pour la plupart des collections de petite ou de moyenne taille, et ne constitue probablement pas non plus un problème pour les collections de documents audionumériques. DSpace utilise actuellement une version qualifiée du schéma Dublin Core issue du profil d'application du groupe de travail Dublin Core des bibliothèques (Dublin Core Libraries Working Group Application Profile (LAP)).

7.3.2.6 FEDORA (Flexible Extensible Digital Object and Repository Structure - structure d'objet numérique flexible extensible et de dépôt numérique) est un système d'entrepôt numérique de plus en plus populaire, conçu sur la base d'une architecture logicielle capable d'accueillir un large éventail de services comprenant ceux de la conservation. En comparaison de l'adoption rapide de DSpace, celle de FEDORA a été plus lente du fait de l'absence d'interfaces utilisateurs dédiées et d'accès directement opérationnels. Les fournisseurs de logiciels commerciaux et open source web frontaux pour FEDORA sont nombreux.

7.3.2.7 La puissance de FEDORA provient essentiellement de son architecture flexible et évolutive. L'expérience des institutions ayant adopté FEDORA montre que celui-ci peut évoluer et s'adapter également aux collections de grande taille, et qu'il est encore suffisamment souple pour accueillir le stockage des items numériques de toute sorte et assurer la gestion de leurs relations complexes. On peut apporter quelques limites aux caractéristiques de FEDORA, qui reste interopérable avec d'autres applications logicielles et systèmes. Il peut-être configuré pour supporter pratiquement tous les profils de métadonnées de caractéristiques d'entrées METS. Le principal inconvénient de FEDORA provient du niveau élevé d'expertise de développement requis pour contribuer à son évolution, un logiciel qui n'est pas facilement installé et ne bénéficie pas d'implémentation "prête-à-servir" (Bradley, Lei et Blackall).

7.3.2.8 Des outils ont été développés pour migrer les contenus depuis DSpace vers FEDORA et vice-versa, ce qui élimine théoriquement toute future difficulté de compatibilité et favorise le partage et l'accueil d'autres flux de travaux (workflow) (voir http://www.aps.edu.au/currentprojects/index.htm).

7.4 Métadonnées élémentaires

7.4.1.1 Le chapitre 3 Métadonnées souligne les grandes lignes des exigences d'une collection en matière de documentation et d'administration. Comme cela a été indiqué, les métadonnées constituent l'élément central du cycle de vie d'un objet audionumérique, aussi, consacrer une attention rigoureuse à la description de chacun des aspects d'une collection constitue une étape de la plus grande importance quant à sa conservation. Un état détaillé de l'ensemble des aspects techniques, des procédures, des provenances et des éléments descriptifs disponibles est vital pour mener à bien un processus de conservation. Toutefois, il faut reconnaître que la préservation physique des collections audio est impérative et qu'elle peut fréquemment prendre le pas sur le développement d'un système de gestion des métadonnées ou la mise en œuvre d'une politique. Les recommandations suivantes, tout à fait élémentaires,  se veulent un premier pas, une liste des données indispensables à la gestion d’un fichier ou qu’il est indispensable de capturer sous peine de les perdre :

7.4.1.1.1 Un identificateur unique : il devra être structuré,  explicite, d'une lecture compréhensible et strictement unique. Un tel identificateur peut également être utilisé pour relier les objets entre eux tels que : les fichiers master, de conservation et les copies de diffusion, les enregistrements de métadonnées, les séries, etc. Un système sophistiqué peut gérer tout cela grâce aux métadonnées.

7.4.1.1.2 Description : Description d'une séquence sonore. Un petit texte identifiera simplement le contenu du fichier audio.

7.4.1.1.3 Données techniques : Format, fréquence d'échantillonnage, débit, taille du fichier. Bien que cette information puisse être recueillie plus tard, l'inscrire dans une partie explicite de l'enregistrement permet de gérer et de planifier la conservation de la collection dans de bonnes conditions.

7.4.1.1.4 Codage de l'historique : dans le format BWF, un certain nombre de lignes d'informations décrivent l'item original ainsi que les procédés et la technologie utilisés pour créer le fichier numérique à archiver. (Voir aussi 3.1.4 Métadonnées).

7.4.1.1.5 Processus de détection d'erreurs : Toutes les données d'erreurs collectées par le système de transfert décrivent les défaillances du processus de transfert (par exemple les manifestations d'erreurs incorrigibles lors des transferts de CD ou DAT).  

7.4.1.2  Information décrite par l'identifiant unique. La description et les données techniques peuvent être enregistrées dans les structures Dublin Core ou dans les en-têtes BWF. L'historique des codages et les procédures de détection d'erreurs pourront être enregistrés dans les blocs BeXT des en-têtes BWF ou bien dans les documents encodés XML correspondants. La date et, si nécessaire, la durée de transfert devront être enregistrées dans l'en-tête BWF ; la date et, si nécessaire, la durée de la prise en charge dans l'entrepôt devront être enregistrées dans le système de gestion des métadonnées de l'entrepôt. Dans certaines circonstances, les informations d'horodatage qui relient les multiples composantes d'un enregistrement seront obligatoires. On conseille généralement d'inclure l'heure et la date pour chaque événement  ou objet numérique.

7.5 Planification de la conservation

7.5.1.1 La planification de la conservation, comme cela a été discuté, c’est la planification et la préparation qui vont permettre à l'objet audionumérique de rester accessible à long terme, même si l'environnement informatique de stockage et d'accès devient obsolète. Planifier la conservation d’une petite collection dont on ne souhaite que la conservation des objets audio numériques qui la constituent est une tâche relativement simple. Les métadonnées énumérées ci-dessus nous informent sur les décisions prises en matière de conservation, en éclairant les relations entre l'original et sa copie de conservation dans l'entrepôt numérique. L'information technique facilite l'élaboration de la planification ; on a choisi le format BWF comme format de conservation pour retarder au maximum le moment où une migration de format sera nécessaire. A charge aux gestionnaires de collections et aux conservateurs d'entretenir une bonne connaissance des modifications susceptibles de se produire dans le domaine de l'archivage numérique, en établissant des contacts avec des associations comme l'IASA.

7.6 Stockage des archives

7.6.1.1 Techniquement parlant, le système de stockage des archives se situe en aval de l'entrepôt, il incorpore une suite de sous-tâches telles que : sélection des média de stockage, transfert du paquet d'informations archivé (AIP) au système de stockage, sécurité des données et validation, sauvegarde et restauration des données, et reproduction de l'AIP sur un nouveau média.  

7.6.1.2 Les principes de base du stockage des archives peuvent être résumés comme suit :

7.6.1.2.1  Il faut disposer de plusieurs copies. Le système doit être en mesure de prendre en charge un certain nombre de duplicatas du même item.

7.6.1.2.2  Les copies doivent être éloignées du système principal ou original, et éloignées les unes les autres. Plus la distance entre les copies physiques est grande, plus la sécurité est renforcée en cas de  sinistre.

7.6.1.2.3  Les copies devront être réalisées sur différents types de media. Si toutes les copies faisaient appel à un seul type de support, disque dur par exemple, le risque qu'un mécanisme singulier de défaillance entraîne la destruction de  toutes les copies serait important. Le risque est réparti lorsqu'on utilise différents types de support. Les informaticiens utilisent généralement les bandes de données pour réaliser la deuxième copie (et les suivantes).

7.6.1.3 Les coûts les plus importants des systèmes d'archivage des données ne proviennent pas des équipements hardware, mais du système HSM (Hierarchical Storage Management). Les fonctions de stockage des archives OAIS s'insèrent dans la notion HSM du modèle conceptuel. A l'époque de la rédaction de l'OAIS, la situation était telle que l'on ne pouvait  envisager gérer autrement de grandes quantités de données. L'utilisation pratique du système HSM se justifie par les différences de coûts des médias de stockage. Par exemple, le prix élevé du stockage sur disque en regard du coût moins onéreux du stockage sur bande. Dans cette situation, HSM offre un magasin unique d'informations, alors qu'en réalité, les copies peuvent être réparties sur un grand nombre de supports différents en fonction des utilisations et les vitesses d'accès.

7.6.1.4 Toutefois, le prix des disques ayant baissé plus rapidement que celui des bandes, ils atteignent des niveaux équivalents. En conséquence, l'utilisation du système HSM devient un choix d'implémentation. Dans ces conditions, un système de stockage comportera toutes les données sur des disques durs en ligne ; les données étant également stockées sur bandes, de telles dispositions sont tout à fait acceptables, notamment pour les collections d'archives sonores de petite et de moyenne  dimension. Dans cette configuration, un système HSM dans toutes ses fonctionnalités n'est pas nécessaire, les fonctions exigées peuvent être remplacées par un système plus simple qui gère  et assure la maintenance des copies sur site, le vieillissement des média et les versions (Bradley, Lei et Blackall 2007).

7.7 Dispositions pratiques des matériels informatiques (Hardware)

7.7.1.1 Les informations suivantes décrivent la manière dont un système opérationnel peut être implémenté. Comme il a déjà été discuté ci-dessus, on se place dans l'hypothèse selon laquelle toutes les archives audio sont stockées sur disques durs et sont en totalité dupliquées en mode miroir sur bande telle que LTO.

7.7.2 Disques durs

7.7.2.1 Une approche courante et abordable de stockage sur disque dur consiste à connecter l'unité de stockage avec un cluster de disques durs (HDD hard disc drive) organisés en système RAID (voir section 6.3.14 Disques durs (Hard Disc Drives)). Le RAID niveau 1 est un peu plus performant que deux disques en miroir (mirroring) ; deux copies des données sont placées sur différents dispositifs hardware physiques ; si l'un des disques tombe en panne, les données sont disponibles sur l'autre drive. Les niveaux RAID plus élevés (2 à 5) implémentent des systèmes de redondance et de contrôle de parité de plus en plus complexes qui assurent le maintien de l'intégrité. Le niveau le plus élevé d'un ensemble RAID réalise le même niveau de sécurité que le niveau 1, ou mirroring, mais avec une moindre perte d'espace de stockage. RAID 5, par exemple, peut subir une perte de 25 % (moins selon l'implémentation), à comparer avec les 50 % de RAID I. Des jeux de disques sophistiqués sont largement disponibles.

7.7.3 Sauvegarde sur bandes

7.7.3.1 Aucun composant élémentaire d'un système numérique ne peut-être considéré comme fiable : on ne rend un système fiable qu’en réalisant à chaque étape de multiples copies redondantes. La composante finale d'une chaîne de stockage qui est aussi la plus importante, est constituée par les bandes de données. Dans un passé récent, les bandes LTO ont conquis leur popularité à cet égard (voir paragraphe  6.3.12 Sélection et contrôle des bandes de données). Cependant, d'autres formats de bandes peuvent convenir selon les circonstances.

7.7.3.2 Toutes les données enregistrées sur disques de stockage devront être dupliquées sur un support convenable. Au moins deux jeux de bandes de données devront être produits et être stockés physiquement en différents endroits.  Il n'est pas exceptionnel que le deuxième jeu soit nécessaire pour restaurer des données, aussi de nombreuses archives réalisent-elles trois jeux de copies, deux gardés à proximité du système pour faciliter les accès, le troisième étant stocké à distance pour assurer sa protection physique si un  sinistre se produisait. Habituellement on fait en sorte que les jeux de bandes séparées soient réalisés avec des produits différents, chacun d'entre eux provenant d'un même lot de fabrication et achetés en une fois. Ceci facilitera les opérations de contrôle qualité et les mesures de sauvegarde lorsqu'un défaut se manifestera  sur un lot donné. Un logiciel de gestion des volumes approprié viendra en aide lors des processus de sauvegarde et de récupération, en particulier si le système comporte plusieurs dispositifs de stockage.    

7.7.3.3 Le contrôle d'erreurs est difficile à implémenter dans des solutions open source et low-tech (technologie rudimentaire) car leur efficacité est liée à des logiciels spécifiques. Cependant, une alternative possible au low-tech pour tester les erreurs est décrite dans le paragraphe suivant. Le logiciel de gestion des données possède un catalogue (avec une imprimante jointe). Le disque dur (en configuration RAID) contient un jeu complet de données. Toutes les données sont copiées sur des bandes identiques. Il existe au moins deux copies. Lorsque les données sont copiées sur une bande, un identificateur unique est imprimé sur une étiquette (lisible par le personnel) fixée sur la bande. Le même identificateur peut-être enregistré sur l'amorce de la bande. Le système de gestion des données peut-être organisé pour que l'utilisateur soit en mesure d'insérer rapidement la bande identifiée par le système. Plutôt que de contrôler les erreurs produites par la bande, le système pourra  comparer le contenu de la bande avec celui du disque. Le disque dur peut vérifier l'authenticité de ses propres données, il est informé de toute défaillance par auto-contrôle. Si le système de vérification de la bande tombe en panne, il produira une nouvelle bande à partir du disque dur. Supposons un volume de stockage de 20 téraoctets, le système vérifiera deux bandes par jour, chaque bande et ses duplicatas pourront être vérifiées trois fois par an. Dans le cas où une défaillance du disque nécessiterait son remplacement par une bande, on disposerait de deux bandes contrôlées dans les quatre mois qui précèdent. Le risque de voir les bandes et le disque dur tomber en panne simultanément reste très faible.

7.7.4 Systèmes de stockage avec un ou plusieurs opérateurs

7.7.4.1 Le système d'archivage le plus simple consisterait à connecter un dispositif RAID contenant les seules données audio à la station audionumérique principale (digital audio workstation (DAW)). Une telle configuration ne pourrait être mise en œuvre que par des institutions disposant d'un opérateur en charge des procédures de numérisation. Pour réussir une telle approche, il est nécessaire de bien structurer le plan de numérisation et de dédier au système un ensemble de disques afin que les tâches puissent être menées en continu, sans interruption conséquente. On assure ainsi le déclenchement des copies des disques HDD rattachés au DAW sur bandes chaque fois que le support cible se remplit.

7.7.4.2 Si les tâches de numérisation sont entreprises par deux opérateurs travaillant sur deux postes de travail, il faut pouvoir accéder à des drives en mode partagé ou indépendant. Pour réaliser le partage de telles ressources, il faut attribuer à un ordinateur le rôle de serveur, le configurer pour pouvoir piloter les drives, et mettre en œuvre les moyens de partage à l'aide d'une connexion simple. Une telle approche de partage entre deux opérateurs est relativement facile à     réaliser, même si elle exige des ententes sur les procédures afin d'éviter des conflits. Une organisation logique des données et le strict respect des procédures de nommage sont indispensables pour les petits systèmes de stockage gérés manuellement.  

7.7.4.3 Si un système de la taille décrite a été mis en place, il peut être plus avantageux d'établir un partenariat avec une institution d'archives plus importante, ou bien de passer un contrat de service avec un prestataire spécialisé dans les opérations de stockage. Cependant, l'approche décrite ci-dessus reste possible.

7.7.5 Systèmes de stockage avec opérateurs multiples

7.7.5.1 Lorsque le nombre de connexions est supérieur à deux, un système d'archivage et de sauvegarde en réseau doit être mis en œuvre. Un tel dispositif en réseau permet à de nombreux utilisateurs d'accéder aux données conformément aux règles établies par le système de gestion des données.  Les petits réseaux sont relativement courants, et leur mise en œuvre, avec juste le niveau de connaissances nécessaires, est aisée et abordable. Des quantités raisonnables d'archives peuvent être traitées grâce à un dispositif de stockage de niveau entreprise. On peut distinguer trois grandes catégories en matière de technologies de stockage et d'équipement : le stockage à connexion directe ou DAS (direct-attached storage), le stockage en réseau ou NAS (Network-attached storage), et le réseau de stockage ou SAN (storage area network). Le système NAS est plus performant et évolutif que le système DAS, il est moins coûteux et de configuration plus simple que le système SAN. Considérant le rapport coût / bénéfice, la technologie NAS constitue la technologie évolutive la plus intéressante d'un point de vue économique, pour des systèmes de taille dont nous discutons dans ce chapitre.

7.7.5.2 La plupart des dispositifs à bas-coût NAS présentent une bande passante restreinte en comparaison de systèmes plus coûteux et de temps d'accès plus court ; ils présentent aussi un nombre d'accès simultanés plus limité. Ceci ne présente pas de difficulté particulière pour les plus petites collections, ainsi en est-il des conditions requises pour les accès simultanés, peu contraignantes, en particulier lorsque des copies de master sont proposées en consultation dans des formats dérivés de MP3.

7.7.5.3 Un système de stockage de petite taille en réseau pourra comprendre un serveur de type PC-portable connecté à un système de stockage en réseau. Le NAS devra pouvoir accueillir des disques durs assemblés en grappe RAID. Un système NAS de faible coût devra disposer d'une capacité de stockage sur disques comprise entre 0,5 et 20 téraoctets (on notera que la capacité de stockage des disques en configuration RAID est réduite, inférieure à celle correspondant à la taille annoncée pour les disques bruts. Les plateformes audionumériques (DAW) sont connectées via un commutateur Ethernet ou dispositif équivalent qui, lorsqu'il est correctement configuré, a pour effet de séparer l'unité de stockage du réseau local LAN (Local area network), ce qui renforce la sécurité de la structure de stockage. Les données sur disques durs HDD devront être sauvegardées sur bandes de données.

7.8 Les risques

7.8.1.1 Les systèmes automatiques de stockage peuvent être configurés en vue d'effectuer des copies systématiques, de rafraîchir les données, et de rejeter les bandes devenues illisibles. Les systèmes de stockage de grands volumes de données bénéficient d'une conception de niveau professionnel, ils fonctionnent grâce aux infrastructures des organisations qui peuvent prendre en charge toutes les mesures afin de garantir la sécurité des données. Avec des systèmes manuels de sauvegarde et de récupération des données, le danger de perte des données du fait de leur association avec des dispositifs de numérisation manuels ou semi automatiques prenant des décisions de manière autonome ne doit pas être surestimé. La responsabilité d'assurer la validité et l'accessibilité des données audio incombe à des personnes qui doivent mettre en place des contrôles de routine des bandes. Cette situation est tout particulièrement pénalisée par le fait que la plupart des institutions relevant de la recherche et de la culture manquent notoirement de moyens financiers.   

7.8.1.2 La conception de tels systèmes, qui laissent apparaître de fortes redondances, nous incite à garder à l'esprit le fait que les composants et les supports numériques peuvent tomber en panne  à tout moment, et ceci, sans le moindre avertissement. Par conséquent, il est impératif de constituer au moins deux copies d'archives en mode linéaire à chaque étape du processus de numérisation et du stockage qui lui succède. Toute imperfection conduira inévitablement à la perte d'une quantité plus ou moins importante de données ; néanmoins, si des stratégies adaptées ont bien été mises en place, les conséquences ne seront pas fatales, grâce aux copies redondantes. Considérant la durée conséquente des opérations de transferts destinées à éviter les pertes inéluctables dues aux anciens documents, tous les efforts doivent être faits pour ne pas devoir re-numériser les documents, une situation qui résulterait d'une architecture incohérente sur le plan de la sécurité ou de négligences dans l'approche pratique.     

7.8.2 Complexité du système

7.8.2.1 Une fois implémentés et installés, les systèmes de stockage de données sont relativement faciles à utiliser et à maintenir en état. Cependant, que ce soit pour réaliser les phases initiales d'implémentation, pour résoudre les problèmes lorsqu'ils se déclarent, pour effectuer les mises à jour, l'intervention d'un personnel spécialisé en informatique est fortement recommandée, ce qui présente l'avantage, par exemple, de réduire les risques inhérents à une mise en place défectueuse du système.

7.8.3 Partenariat et sauvegarde

7.8.3.1 Comme cela a été discuté précédemment, pour pouvoir bénéficier de la pleine capacité de sauvegarde, un partenariat avec une institution disposant d'une expérience reconnue et sûre en matière de gestion d'archives numériques constitue la meilleure gestion des risques. Un réseau d'entrepôts capable de créer et d'accepter de tels paquets organisés d'informations constitue la stratégie de conservation la plus efficace, répartissant les risques de perte lorsque des catastrophes d'origine naturelle ou humaine se produisent, ou lorsque les ressources à un moment critique du cycle de vie de l'objet numérique viennent à manquer.

7.8.4 Coûts et extension

7.8.4.1 Un système de taille réduite comme décrit ci-dessus peut être ajouté pour offrir de plus grandes capacités de stockage et améliorer les conditions de gestion. Des petites unités de drives de bandes sont disponibles, elles peuvent faire l'objet d'extension à l'aide de systèmes de robots de plus grande taille. Dans la mesure où le prix des disques HDD continue de baisser, le coût de remplacement et d'extension des baies reste abordable.

7.8.4.2 Grâce au partenariat établi entre fournisseurs de systèmes et de codes open source, des logiciels de gestion d'entrepôts très élaborés peuvent être intégrés en toute sécurité grâce aux services qu'offre un fournisseur commercial. DSpace et FEDORA, par exemple, sont deux systèmes open source produits en relation avec une société commerciale proposant des solutions de stockage.

7.8.4.3 Le coût d'installation d'un système de stockage de données de petite taille peut sembler relativement élevé en comparaison d'un graveur de CD, toutefois, en comparaison bit-à-bit avec les conditions de stockage de plus d'une centaine d'heures d'enregistrement audio, la différence est fortement réduite quand on prend en compte toutes les contraintes (exigences) d'un service d'archivage. Un service de stockage de données bien géré constitue un système absolument fiable qui permettra d'effectuer les futurs et inévitables transferts de données audio sur la solution suivante d'archivage.

8: Disques optiques

8.1 CD/DVD Enregistrables

8.1.1 Introduction

8.1.1.1 Les CD enregistrables (CD-R) et les DVD enregistrables (DVD-R/+R) sont devenus partie intégrante des moyens d'enregistrement et de distribution de nombreux types de documents sonores et audiovisuels. Bien que les CD et DVD constituent actuellement une technologie de stockage parmi de nombreuses autres plus abordables et plus fiables, de tels formats restent populaires pour de nombreuses raisons, parmi lesquelles la facilité d'usage et leur familiarité. Le CD a été initialement commercialisé en tant que support parfaitement pérenne, mais la défaillance de nombreux disques de première génération a rapidement montré que ce n'était pas le cas. Malgré les améliorations apportées par la suite à de nombreux défauts de fabrication il ne faut accorder aucun crédit à ceux qui prétendent que ces supports sont pérenne. En fait, les spécialistes d'archivage numérique reconnaissent qu'aucun support n'est pérenne. Bien au contraire, l'acquisition des données, leur transfert sur des systèmes de stockage, la gestion, les interventions de maintenance, la mise en place de moyens permettant l'accès et la préservation de l'intégrité de l'information stockée, de tels processus présentent de nouveaux risques qu'il faut maîtriser pour bénéficier des avantages de la conservation et de l'archivage numérique. Tout manquement à une bonne gestion de ces risques peut avoir pour conséquence une perte significative de données et de contenus.

8.1.1.2 On choisit souvent les disques CDs et DVDs enregistrables comme supports d'archivage, mais les risques de défaillance inhérents à cette technologie sont élevés en comparaison avec d'autres approches. On considère qu'un système de stockage de masse intégrant un logiciel de gestion de l'entrepôt adapté offre la meilleure solution de durabilité des données à long terme. Toutefois, selon les circonstances, un responsable de collection pourra prendre la décision d'utiliser des disques optiques comme support de stockage.

8.1.1.3 Gardant à l'esprit de telles contraintes, il est possible d'utiliser des disques enregistrables comme supports fiables à court terme, à condition que les recommandations suivantes soient soigneusement respectées.

8.1.2 Formats d'enregistrement des CD-R et DVD-R

8.1.2.1 Il y a deux approches d'encodage des signaux audio et vidéo sur disque enregistrables CDs et DVDs : soit en mode audio de flux continu ("stream"), soit en mode fichier. Dans la première approche, le son est enregistré au format CD Audio CD-DA, ce qui rend les CD-R compatibles avec des lecteurs CD ordinaires, ou bien il est encodé au format DVD MPEG, ce qui ne permet pas toujours de les lire avec n'importe quel lecteur DVD standard. Seuls les enregistreurs autonomes (de salon) enregistrent de tels formats, même si certains ordinateurs peuvent, en option, produire des disques sous cette forme grand public. L'utilisation de tels formats restreint sévèrement toute possibilité d'accès en ligne ; choisir une telle option peut engendrer un problème de migration lorsqu'un changement de support devient nécessaire. Pour le long terme, le format audio en flux continu ("stream") n'est pas recommandé.

8.1.2.2 Une approche alternative plus fiable consiste à enregistrer un fichier sur ordinateur à l'aide d'un système d'éditing audio et de le graver ensuite sur CD-R ou DVD-R. L'enregistrement sur un CD-R de 650 MB permet le stockage de fichiers PCM 48 kHz 16 bits linéaires sur une durée de 59 mn et de fichiers PCM 48 kHz 24 bits linéaires sur une durée de 39 mn. L'enregistrement de fichiers de ce format sur un DVD-R de 4,7 GB permet le stockage d'enregistrement audio pouvant atteindre 6 heures. Pour cette raison, on recommande l'écriture sous la forme de fichiers de données. Du fait de la simplicité et de la généralisation du codage PCM linéaire (entrelacé pour la stéréo), l'IASA recommande l'utilisation de fichiers .wav ou de préférence de fichiers BWF.sav (EBU/UER Tech 3285) si les disques CDs et DVDs enregistrables sont pris pour supports cibles.

8.1.3 Enregistrement, réécriture, effacement et accessibilité

8.1.3.1 Les disques CD-R, DVD-R et DVD+R à base de colorant (dye) sont des disques enregistrables un fois (write once), c'est-à-dire non effaçables. Les disques CD-RW, DVD-RW, DVD+RW à changement de phase sont réinscriptibles, ce qui permet d'effacer les données précédentes et d'enregistrer de nouvelles données au même endroit sur le disque. Les disques réinscriptibles DVD-RAM à changement de phase sont formatés pour offrir un accès aléatoire, à la manière du disque dur d'un ordinateur.

8.1.4 Description des CD et DVD enregistrables

8.1.4.1  Les disques CD-R et DVD-/+R stockent les données en ligne sous forme de marques microscopiques disposées sur une piste en spirale qui s'étend du centre du disque vers sa périphérie. Tous les modèles de lecteurs CD/DVD utilisent des rayons laser pour lire ces marques. Ils diffèrent par la longueur d'onde : L'écartement entre deux spires (pas de piste) des DVD est plus étroit : 0,74 µm en comparaison avec l'écartement des CD de 1,6 µm. Les DVD bénéficient également d'une nouvelle méthode de codage de modulation et de correction d'erreurs qui n'étaient pas disponibles quand les spécifications du CD ont été élaborées.

8.1.4.2  Les dimensions des CD et des DVD sont identiques : 120 mm de diamètre et 1,2 mm d'épaisseur. Toutefois, le DVD est constitué de deux disques de 0,6 mm d'épaisseur collés l'un contre l'autre.

8.1.4.3  Les CD-R et DVD+R comportent trois couches : le substrat polycarbonate transparent, la couche de colorant (dye) et la couche réfléchissante. Pour les CD, la couche réfléchissante est proche de la face imprimée du disque, aussi une couche de laque de protection supplémentaire recouvre-t-elle le la surface fragile. La couche réfléchissante des DVD-R est située au milieu des deux couches de polycarbonate. Dans le processus d'enregistrement, un laser d'intensité beaucoup plus élevée que l'intensité du laser de lecture 'brûle" la couche organique de colorant en fonction du signal codé, laissant de minuscules traces successives transparentes et non-transparentes tout au long de la piste. Tous les disques CD et DVD comportent une couche réfléchissante permettant au laser de lecture de rebondir hors du disque CD/DVD afin d'être "lu" par un capteur placé dans le dispositif du lecteur. De nombreux métaux peuvent convenir pour la couche réfléchissante, mais deux d'entre-eux seulement sont fréquemment utilisés pour les disques CD et DVD enregistrables, l'or et l'argent. Le système combinant la piste portant les marques et la couche réfléchissante produit la modulation du laser de lecture, de la même manière que les pits et lands moulés par injection avec la couche d'aluminium du CD-ROM.        

8.1.4.4  Les trois colorants couramment utilisés pour les disques enregistrables sont : la cyanine, la phtalocyanine et l'azo. Le type de colorant donne au disque enregistrable un aspect caractéristique selon le métal utilisé ; le colorant cyanine (bleu) est vert sur un support réfléchissant or et bleu sur un support argent ; le colorant phtalocyanine (vert clair) est transparent sur l'or et vert clair sur l'argent ; le colorant azo (bleu profond) est développé en différentes nuances de bleu, la version originale était d'un bleu profond, la plus récente Super Azo correspond à une nuance de bleu lumineux. Pour les DVD enregistrables, la couche de colorant est appliquée de manière si mince que le type de colorant utilisé n'est pas facile à reconnaître. Toutefois, les fabricants de CD et DVD enregistrables encodent l'information concernant le type de colorant utilisé. Les graveurs de CD et DVD utilisent cette information pour calibrer la puissance du rayon laser ; de plus, avec des logiciels adaptés, l'information peut être accessible par les utilisateurs qui disposent ainsi d'une description plus précise du disque lui-même. Ces données peuvent être lues grâce à des dispositifs logiciels tels que CD Media Code Identifier (http://www.softpedia.com/get/CD-DVD-Rip-Other-Tools/CDR-Media-Code-Ident...). Cet outil permet aux utilisateurs d'accéder à des informations telles que le type de colorant, le fabricant, la capacité, les vitesses d'écriture et le type de support. Clover propose également un dispositif freeware, IRSCView (http://www.cloversystems.com/ISRCView.htlm) qui fournit la table des contenus (TOC), les codes de contrôle, et enfin les codes ISRC des CD Audio, Mixed Modes et Enhanced CD. Il fournit beaucoup moins d'information de la part du fabricant que le logiciel CD Media Code Identifier.


Fig. 1 Paragraphe 8.1 : représentation schématique du CD-R (non à l'échelle)

 

Fig. 2 Paragraphe 8.1 : représentation schématique du CD-­‐RW (non à l'échelle)

8.1.4.5  Les CD et DVD réinscriptibles fonctionnent selon un principe entièrement différent. Les disques réinscriptibles sont effaçables et peuvent être réécrits un certain nombre de fois. La couche enregistrable est constituée de germanium, d'antimoine et de tellurium. Un rayon laser chauffe la surface sensible selon deux régimes. La température la plus élevée correspond au point de fusion (environ 600 degrés centigrades), tandis que la température la plus basse (350 degrés environ) correspond à la température de cristallisation. L'échauffement du disque et le refroidissement contrôlé  produisent une succession de zones amorphes ou cristallines. Les différentes propriétés de réflexivité de ces zones seront interprétées par le rayon laser de lecture à la manière des pits/lands d'un CD-ROM. Les premiers disques réenregistrables et graveurs ne pouvaient inscrire les données qu'à vitesse relativement lente, autant de conditions encodées et implémentées dans les drives et  standards de première génération. Des développements plus récents proposent des mécanismes d'inscription des données sur des disques réinscriptibles à plus grande vitesse. Bien que les drives plus anciens soient en mesure de lire les disques plus récents enregistrés à grande vitesse, seules les dernières générations de graveurs peuvent enregistrer les disques de formulation plus récente.        

8.1.4.6  Il n'a pas été entrepris d'analyses portant à conséquence sur le support ou sur la fiabilité à long terme des disques RW. Des investigations préliminaires semblent indiquer que le film comportant l'information encodée peut se dégrader plus rapidement que la couche de colorant des CD-R (Byers 2003 : 9), ce que d'autres commentaires contredisent. D'un point de vue purement pratique, les CD et DVD réinscriptibles peuvent présenter un plus grand risque lorsqu'ils sont utilisés à des fins de conservation car les données peuvent être accidentellement effacées, ce qui entraîne la perte des fichiers originaux.

8.1.5 Normes des disques optiques

8.1.5.1 La conformité aux normes, ce sont les mécanismes par lesquels les disques peuvent être gravés ou lus par des machines de différentes fabrications. Les fabricants sont responsables de la production de leurs produits conformément aux normes spécifiques. Toutefois, ces normes ne sont pas élaborées en fonction des performances de longévité et de fiabilité des supports, mais seulement sur des critères de formats d'échange. En conséquence, un disque gravé et lu sur une machine donnée peut, en fait, être limite ou encore défectueux eu égard aux normes en application. Bien que les fabricants soient responsables de la formulation du disque, la durée de vie potentielle de l'intégralité des informations stockées sur le support ne sera effective que si les utilisateurs prennent la responsabilité de réaliser une copie numérique dont les paramètres respectent bien les normes. Compter sur la technologie pour respecter les normes ne suffit pas pour assurer une durée de vie optimale.

8.1.5.2 L'exigence de garantie selon laquelle l'inscription de l'information numérique sur un disque optique est bien produite en conformité avec les normes est illustrée par la question de compatibilité du disque avec le graveur. Les normes s'appliquent plutôt au support d'enregistrement qu'à la technologie du système de lecture et d'enregistrement. Philips prévient les fabricants de graveurs qu'ils "doivent implémenter une stratégie d'écriture donnant des résultats acceptables". Un avertissement qui peut toutefois être interprété de plusieurs manières, et qui a précédé différentes tentatives de Philips / Sony de résoudre le problème de conformité grâce au code d'identification du fabricant MID (Manufacturers identification code). Pour connaître la nature de la production de supports enregistrable, on ne dispose que la seule information MID réellement enregistrée : le nom du fabricant de matrices (stampers) utilisées pour produire les disques. En conséquence, il n'existe que peu d'éléments pour résoudre le problème d'interaction disque/graveur, qui reste en question.

8.1.5.3 Les normes s'appliquant aux CD enregistrables comprennent les documents suivants : le Livre Orange (Orange Book) Part II : CD-R Volume I CD-WO (CD à écriture unique), considéré comme norme du CD-R pour les vitesses 1x, 2x, et 4x la vitesse nominale. Le Livre Orange Part II : Volume 2 : CD-R vitesses multiples (CD enregistrable) pour des vitesses atteignant 48x fois la vitesse nominale. Le Livre Orange Part III : CD-RW Volume I CD-RW (CD réenregistrable) pour les vitesses 1x, 2x et 4x la vitesse nominale. Le Livre Orange Part III : CD-RW Volume 2 : CD-RW (CD enregistrable haute vitesse) pour les vitesses 4x et 10x la vitesse nominale. Le Livre Orange Part III : CD-RW Volume 3 : CD-RW (CD réenregistrable) ultra haute-vitesse pour les vitesses 8x et 32x la vitesse nominale. Le Livre Vert (Green Book), Spécifications complètes des fonctionnalités du Compact Disc Interactif et le Livre Blanc (White Book) des spécifications du Vidéo-CD. Il existe également d'autres standards pour les formats CD propriétaires.

8.1.5.4 Normes s'appliquant aux DVD enregistrables : ISO/IEC 16824 : 1999 Information Technology -- Disque DVD réenregistrable (DVDRAM) 120 mm. ISO/IEC 16825 : 1999 Information Technology -- Cas des disques DVD-RAM 120 mm. ISO/IEC 17341 : 2004 Information Technology -- Disque DVD réenregistrable (DVD+RW) 80 mm (1,46 Gbytes per side) et 120 mm (4,70 Gbytes per side). ISO/IEC 17342 : 2004 Information Technology -- Disque DVD réenregistrable (DVD-RW) 80 mm (1,46 Gbytes per side) et 120 mm (4,70 Gbytes per side). ISO/IEC 17592 : 2004 Information Technology -- Disque DVD réenregistrable (DVD+RAM) 120 mm (4,7 Gbytes per side) et 80 mm (1,46 Gbytes per side). ISO/IEC 17594 : 2004 Information Technology -- Cas des Disques DVDRAM 12 mm et 80 mm. ISO/IEC 20563 : 2001 Information Technology -- Disque DVD enregistrable (DVD-R) 80 mm (1,23 Gbytes per side) et 120 mm (3,95 Gbytes per side). ISO/IEC 16969 : 1999 Information Technology -- Echange de données sur disque optique 120 mm en cartouche au format RW -- Capacité 3,0 Gbytes et 6,0 Gbytes. ISO/IEC DTR 18002 -- Spécifications des systèmes de fichiers DVD. ISO/IEC 13346, Volumes et structures de fichiers des supports enregistrables une fois et réenregistrables (ECMA-167) et disques optiques enregistrables DVD+R de 4,7 GB de vitesse d'écriture atteignant 16x (ECMA-349 : 2008).

8.1.5.5 Ces normes s'ajoutent à celles spécifiées dans le paragraphe 5.6.2.

8.1.6 Description, complexité et coûts des systèmes

8.1.6.1 Comme il a été noté au chapitre 2, Principes numériques fondamentaux, pratiquement toutes les nouvelles générations d'ordinateurs possèdent une puissance suffisante pour traiter des fichiers audio de grande taille. Pour rester en conformité avec toutes les normes de systèmes concernant les équipements utilisés pour la conversion et l'entrée des données audio présentées dans le chapitre 2, la complexité des systèmes et le niveau d'expertise requis ne sont guère plus importants que ceux rencontrés pour les ordinateurs de bureau. De nombreux programmes de gravure de CD et DVD respectant les exigences des normes sont disponibles.

8.1.6.2 Le seul équipement complémentaire nécessaire à la production de CD et DVD enregistrables concerne le graveur, ou drive. Ils peuvent être montés dans la tour de l'ordinateur ou rester connectés à part. Ils communiquent avec l'ordinateur par l'intermédiaire de protocoles tels que IDE et SCSI pour les drives internes, Firewire ou USB pour les drives autonomes. Certains drives produisent moins de taux d'erreurs de CD-R ou DVD-R que d'autres, aussi le personnel doit-il prendre la responsabilité d'évaluer et d'analyser les résultats de gravure du disque avant tout achat (voir paragraphe 8.1.9 Erreurs, espérance de vie, tests et analyses).

8.1.6.3 La simplicité du système, l'accès facile à cette technologie et le faible coût des supports sont à l'origine de la popularité des disques CD-R et DVD-R dans le domaine des archives sonores. Toutefois, comme il a été démontré au chapitre 6 Formats et systèmes cibles de pérennisation, le coût du système de stockage le plus fiable est moins élevé s'il est rapporté à toute la collection ; on notera qu'il en va de même pour des collections de très petite taille.

8.1.7 Compatibilité des disques et des drives

8.1.7.1 La compatibilité entre les disques et les drives peut poser problème lors de l'enregistrement des données sur disques CD et DVD enregistrables et réenregistrables. Souvent de telles situations se manifestent lorsque des disques réalisés avec certains graveurs présentent une très mauvaise qualité de duplication, ou lorsqu'ils sont illisibles sur d'autres drives. L'examen de cette question a révélé que le taux d'échec pouvait être très élevé. Un projet de l'Organisation Internationale de Normalisation--ISO N178 Electronic imaging--Classification and verification of information stored on optical media, aborde les problèmes spécifiques de compatibilité de drives.

8.1.7.2 L'origine des médiocres performances peut être mise sur le compte de nombreux facteurs : drives de première génération ne disposant pas de dispositif de calibration pour différents types de disques produits ultérieurement ; drives conçus pour les disques utilisant une couche sensible avec colorant ne pouvant graver, et souvent même, lire les disques réinscriptibles ; problèmes de logiciels, de vieillissement de certains composants, des lasers notamment, implémentation particulières, tous ces facteurs peuvent être à l'origine de résultats incorrects. Les informations de calibration encodées dans le substrat polycarbonate ne sont pas forcément très précises. Ainsi, même en tenant compte de ces questions, de nombreuses défaillances ne peuvent être interprétées que par des incompatibilités d'ordre technique. Les légères variations de fabrication concernant l'implémentation normalisée des dispositifs de lecture et les variations de qualité des disques peuvent provoquer une incompatibilité entre disques et drives au point de produire, pour certaines combinaisons de marques ou de lots particuliers de produits, des disques défectueux.

8.1.7.3 Afin de s'assurer de la compatibilité des drives et des disques, on recommande de pratiquer l'enregistrement des disques de marque fiable et reconnue avec un drive sélectionné, et de tester ces disques pour en déterminer le niveau de taux d'erreurs. Comme discuté dans les paragraphes suivants.

8.1.8 Sélection des disques

8.1.8.1  Trois types de base de colorants (dye) sont utilisés pour réaliser les disques enregistrables une fois : la phtalocyanine, la cyanine et l'azo. Les fabricants de disques phtalocyanine prétendent que leurs produits  ont une plus longue durée de vie que ceux de la concurrence. Un point de vue qui ne s'appuie sur aucun test préalable. Quelques fabricants utilisant les colorants Azo prétendent qu'il s'agit alors de disques d'archivage. La cyanine fut le premier type de colorant développé pour l'enregistrement de disques optiques, mais la plupart des fabricants reconnaissent généralement que leur durée de vie (Life Expectancy (LE)) est plus courte. La nature du colorant, bien que jouant un rôle significatif, n’est qu’un des facteurs déterminant la durée de vie du média.

8.1.8.2  La variation de quantité de colorant de la couche sensible, résultat de la course à laquelle se prêtent les fabricants pour augmenter la vitesse d'inscription et la densité d'enregistrement, constitue un facteur contribuant à la défaillance à long terme des disques optiques. Pour les CD-R, la vitesse d'enregistrement est passée de x1 à x52, et elle augmente toujours, quant à la densité d'enregistrement, elle est passée de 650 MB à 800 MB. On notera que les disques optimisés pour de grandes vitesses d'enregistrement utilisent moins de colorant, ce qui peut signifier une durée de vie plus courte. Les DVD-R utilisent naturellement moins de colorant, le taux de transfert des données à l'écriture d'un DVD enregistrable étant beaucoup plus élevé que celui d'un CD-R.   

8.1.8.3  Il n'est toutefois pas question de réduire la vitesse : si des disques comportent une couche de colorant plus dense, ils sont optimisés pour de faibles vitesses d'écriture, s'ils sont gravés à des vitesses plus importantes, le taux d'erreurs augmentera. Les fabricants mentionnent la vitesse d'enregistrement maximum, pour autant l'écriture à une telle vitesse extrême ne donnera pas de bons résultats. Il est une vitesse d'écriture optimale pour laquelle le disque offre les meilleurs résultats d'analyses correspondant aux meilleures performances. Pour identifier cette vitesse on effectue des essais et la mesure de taux d'erreurs à l'aide d'un analyseur fiable. Typiquement, les meilleurs résultats seront obtenus pour un disque comportant une couche de colorant dense et gravé à une vitesse de 8 X environ.
 
8.1.8.4  Au mieux, la qualité des CD et DVD enregistrables vierges peut être qualifiée de variable. L'industrie de fabrication de CD et DVD enregistrables est devenu un marché de marges réduites et de production massive. Les équipements de fabrication des CD et DVD enregistrables ont vu leur taille réduite, leur coût diminuer ; ils sont devenus plus autonomes. En conséquence, la production de supports de données fiables, destinés à un marché de qualité, a cédé la place à celle de la production de CD et DVD enregistrables destinés à un marché à bas coût.

8.1.8.5  De nombreux disques de marque de bonne réputation  peuvent être produits par une autre unité de fabrication et reconditionnés pour être mis en vente. Un fabricant de CD ou DVD peut manipuler les composants : le colorant, la couche réfléchissante ou le polycarbonate, devenu cher, pour réduire les coûts ou la qualité des contrôles. En règle générale, il a été souvent recommandé de ne faire l'acquisition que de CD ou DVD de marque fiable, mais  les tests ont révélé des variations par rapport aux spécifications normalisées et même entre les disques eux-mêmes. Au lieu de cela, on recommande au responsable, en tant qu'individu ou institution, d'insister pour traiter avec un fournisseur en relation directe avec l'importateur ou le fabricant, qui soit en mesure d'établir le contact avec les personnels techniques compétents de la société de fabrication. Les disques  qui ne respectent pas les spécifications normatives mentionnées ci-dessous seront retournés.  

8.1.8.6  Il est très difficile d'identifier le support de meilleure qualité sans disposer d'analyseurs très performants (Slattery et al., 2004). Dans la plupart des cas, les disques doivent être enregistrés avant de pouvoir être testés. Certains testeurs de CD et DVD de haute qualité peuvent analyser des disques vierges, mais la plupart des tests consistent à enregistrer un signal test et à analyser le résultat. L'ISO 18925 : 2002, l'AES 28-1997, ou l'ANSI/NAPM 1T9.21  sont des méthodes normalisées de détermination de l'espérance de vie des disques compacts. L'ISO 18927 : 2002/AES 38-2000 est une norme définissant une méthode d'estimation de durée de vie de disques compacts enregistrables par effet de la température et de l'humidité relative. La température et l'humidité relative ne produisant pas toujours de résultats probants, d'autres approches se sont intéressées  aux effets d’une exposition prolongée à la lumière sur les disques à colorant, et certains fabricants ont entrepris d'effectuer des tests dans ce sens. Il n'existe toutefois pas de norme à cet égard (Slattery et al. 2004).

8.1.8.7  Résumé des opérations de sélection des disques
    
8.1.8.7.1  Sur la base d'une étude de marché, faire l'acquisition d'une gamme de disques de la meilleure qualité.
    
8.1.8.7.2  Acheter plusieurs disques de chaque sorte. (Le prix n'est pas forcément un critère, toujours se rappeler que le coût des disques, même le plus élevé est faible en comparaison de la valeur des données).
    
8.1.8.7.3  Enregistrer dans des conditions contrôlées quelques données sur chacun des disques.
    
8.1.8.7.4  Effectuer les tests pour détecter les disques de meilleure qualité en regard des spécifications établies dans ce document. Tous les disques doivent dépasser les normes de qualité recommandées ci-dessous (voir Tableau I, niveau maximum d'erreurs pour les disques CDR d'archives).

8.1.8.7.5  Réaliser des tests pour différentes vitesses d'écriture.
8.1.8.7.6  Garder à l'esprit la compatibilité disque / graveur : différents graveurs peuvent donner différents résultats.
    
8.1.8.7.7  Sélectionner les trois meilleurs disques de deux types de colorant différents au moins (phtalocyanine et azo).
    
8.1.8.7.8  Enregistrer des copies identiques de données sur les trois disques sélectionnés.
    
8.1.8.7.9  S'assurer que les disques délivrés correspondant aux sélections sont bien identiques aux échantillons de disques testés.

8.1.8.7.10  Répéter les tests à chaque livraison de nouveau lot de disques.

8.1.9 Erreurs, espérance de vie, tests et analyses

8.1.9.1  La seule manière de connaître l'état d'une collection   est de pratiquer régulièrement des tests complets. On ne le répètera jamais assez : aucune collection de CD-R ou de DVD-/+R d'archives ne peut se passer de dispositif de tests fiable. Les systèmes de corrections d'erreurs  de  la plupart des équipements de lecture masquent les dégradations jusqu’à ce que les erreurs dues aux dégradations ne soient plus corrigibles. Lorsque que ce degré d’erreurs sera atteint, toutes les copies seront, et de manière irréversible, défectueuses. En revanche, l'approche globale d'une procédure de tests permet de planifier, dans les meilleures conditions, les stratégies de conservation en agissant sur les paramètres reconnus, objectifs et mesurables, ce que l'archivage numérique rend possible. Pour constituer des archives numériques bien documentées, les métadonnées devront comporter l'enregistrement de l'historique de tous les objets, y compris celui des mesures d'erreurs et de toutes les corrections significatives effectuées.

8.1.9.2  L'espérance de vie des CD ou des DVD enregistrables est un sujet à multiples facettes. Pour la plupart des utilisateurs, un CD-R ou un DVD-R/DVD+R atteint sa limite lorsque le drive ne permet plus d'accéder aux données inscrites sur le disque. Mais comme les drives ne sont  pas normalisés, un CD/DVD non lisible avec un appareil peut fort bien l'être avec un autre. De très nombreux exemples l'attestent. La norme ANSI/NAPM IT9.21-1996 / ISO 18927-2002 Life Expectancy of Compact Discs (CD-ROM)-Method for Estimating Based on Effects of Temperature and Relative Humidity [Espérance de durée de vie des disques compacts (CD-ROM)-Méthode d'estimation basée sur les effets de la température et de l'humidité relative], aborde bon nombre  de ces questions. Par ailleurs, certaines normes et  certains fournisseurs spécifient un taux d'erreurs BLER (Bloc Error Rate) acceptable. Le BLER est défini par le nombre de blocs erronés mesurés par seconde  à l'entrée du décodeur C1 (voir ISO/IEC 60908) lors d'une lecture à vitesse nominale X1, le taux de données mesurées étant moyenné sur une durée d'analyse de 10 s. La norme ISO/IEC 10149 / ANSI/NAPM IT9.21-1996, dite standard du Livre Rouge spécifie un taux de BLER maximum de 220. La norme relative aux enregistrements de données en mode général sur CD, désignée encore par standard du Livre Jaune, spécifie un taux de BLER de 50. Ce niveau plus bas est essentiel pour les données.   

8.1.9.3 Les études ont montré que le BLER seul n'était pas d'une grande utilité pour déterminer l'espérance de vie [Life Expectancy LE] car des disques défectueux peuvent présenter des taux de BLER largement inférieurs à 220, voire inférieurs à 50. Il est nécessaire de mesurer d'autres paramètres de test , parmi lesquels les erreurs E22 ou E32 (erreurs incorrigibles) et les erreurs en rafale [frame burst error FBE], parfois appelées longueur d'erreurs en rafale [Burst Error Length (BERL)], qui constituent des indicateurs pertinents de fin de vie. Quand ces paramètres dépassent les limites spécifiées ci-dessous, ils signalent la nécessité de procéder à une duplication immédiate, dans l'hypothèse selon laquelle le disque qui détient les informations archivées est encore lisible.    

8.1.9.4  Les erreurs   affectant des CD-R d'archivage ne devront pas dépasser les valeurs spécifiées dans le tableau suivant. Elles représentent les niveaux maximums au-delà desquels les disques CD-R devront-être copiés. En pratique, des niveaux d'erreurs beaucoup plus faibles peuvent être préférables.  Ces conditions doivent être satisfaites pour disposer d'une certaine durée d'archivage avant de devoir effectuer une copie. Un BLER moyen de 1 et un niveau pic inférieur à 20 peuvent être facilement réalisés. Le Jitter constitue également un indicateur utile pour poser un diagnostic de la qualité des données enregistrées sur un CD, il doit être mesuré après écriture. Les valeurs de jitter 3T ne devront pas dépasser 35 ns (Fontaine et Poitevineau, 2005).
 

Erreur en rafale (FBE) < 6
Taux moyen d'erreurs BLER < 10
Valeur pic du taux d'erreurs BLER < 50
E22 (erreurs corrigibles) 0
E32 (erreurs incorrigibles) 0
Jitter 3T < 35 s

Tableau I Paragraphe 8.1, niveaux d'erreurs maximum d'un disque CD-R d'archivage

8.1.9.5  La fabrication d'un DVD est très différente de celle du CD, malgré leurs nombreuses similitudes, les critères s'appliquant aux CD ne s'appliquent pas forcément aux DVD. Pour ce dernier, le jitter est habituellement mesuré en pourcentage. Bien que déterminé de manière différente, les valeurs de jitter sont en grande partie équivalentes pour les deux types de disques ; les mesures d'erreurs les plus importantes sont toutefois très différentes. Les deux principales mesures d'erreurs relevées pour les DVD sont : Erreurs de parité interne [Parity Inner Errors (PIE)] et Erreurs de parité externe [Parity Outer Errors (POE)]. Les normes industrielles stipulent que la valeur POE doit être nulle. Il existe d'autres types d'erreurs mais à l'heure d'écrire ces lignes, aucune limite n'a été fixée pour les objectifs d'archivage. Les spécifications établies pour les DVD précisent également que huit blocs ECC consécutifs (PI Sum 8) peuvent comprendre au maximum 280 erreurs PI et que la valeur de jitter ne doit pas dépasser 9%. Cependant, en ce qui concerne le CD enregistrable, les pratiques d'archivage et les tests ont conduit à recommander un niveau d'erreurs maximal diminué de 25% environ par rapport aux valeurs recommandées dans le Livre rouge (red book). Une extrapolation pour le DVD devrait conduire à une recommandation de valeurs d'erreurs PI maximum de 70 pour toute succession de huit blocs ECC. Il est important de reconnaître qu’aucun test à grande échelle sur DVD enregistrables en situation d'archives, qui permettrait  d'évaluer la validité de ces valeurs, n'a  été entrepris.

8.1.9.6  Les premières investigations ont montré que la dégradation des CD enregistrables ne suivait pas obligatoirement un processus linéaire, aussi, un faible changement du taux d'erreur initial peut-il avoir en conséquence un plus grand effet sur la durée de vie du disque. Plusieurs tests ont montré qu'il en était ainsi (Trock, 2000), (Bradley, 2001), mais il n'y a pas eu d'examen approfondi de cette proposition. L'examen "longitudinal" au cours du temps des enregistrements, mené conjointement à  des expérimentations de vieillissement artificiel peuvent apporter des informations supplémentaires à propos des facteurs de stabilité du disque. Un facteur s'ajoute au manque de recherches consistantes, l'absence de normes concernant la production des drives CD/DVD.

8.1.9.7  La comparaison de la courbe en trait plein avec celle en pointillés (voir ci-dessous) illustre le fait qu'une plus grande qualité initiale de l'enregistrement augmente l'espérance de vie de celui-ci. Plusieurs tests ont validé cette hypothèse (Trock JTS 2000, Bradley IASA, SEAAPAVA 2001), mais aucune donnée empirique ne l'a confirmé. La ligne en pointillé, partant d'un niveau d'erreurs plus important, représente un taux de dégradation similaire, mais démarrant plus tôt, elle atteint plus rapidement le niveau maximum de dégradation admissible. Le suivi dans le temps ou contrôle "longitudinal" des enregistrements et les expérimentations de vieillissements accélérés peuvent apporter d'importantes informations à propos des facteurs de stabilité des disques. Au manque de recherche consistante s'ajoute le fait qu'il n'existe pas de normes quant à la production de drives CD/DVD.


Fig. 1, paragraphe 8.1 : Erreurs cumulées d'un CD-­‐R en fonction du temps.

8.1.9.8  Considérant l'existence d'un composite contenant, parmi d'autres éléments, des colorants organiques ou autres composés chimiques, il s'agit de supports optiques voués à la dégradation du fait des réactions chimiques lentes. Le choix des disques optiques comme support cible implique la nécessité de mettre en place un programme de contrôle de ceux-ci et une procédure de recopies de disques proches de la limite d'espérance de vie. On ne préconise pas l'usage de CD/DVD enregistrables et réenregistrables comme support d'archivage, à moins qu'un programme de tests rigoureux et de contrôles ne soit mis en œuvre. On notera que les opérations de tests et d'analyses, pourtant absolument nécessaires, prennent beaucoup de temps, ce qui alourdit durablement le coût des solutions d'archivage. Quand on élabore une stratégie, de tels coûts doivent être inclus. Les enregistrements des résultats des tests devront être conservés. Les tests occasionnels, annuels par exemple, peuvent être effectués sur un nombre statistiquement représentatif de disques stockés afin de fournir des informations sur l'état d'archivage. Lorsque le taux d'erreurs augmente, le transfert vers un nouveau support doit être entrepris pour tous les disques de même ancienneté ou de même type.

8.1.9.9  Résumé des procédures de test
8.1.9.9.1  Tester tous les disques après gravure,

8.1.9.9.2  Rejeter tous les disques ne respectant pas les spécifications,
    
8.1.9.9.3  Stocker les enregistrements des tests concernant la totalité des disques,
     
8.1.9.9.4  Entreprendre des tests réguliers pour un nombre statistiquement significatif de disques de chaque lot,

8.1.9.9.5  Entreprendre la duplication des disques lorsque les taux d'erreurs augmentent.

8.1.10 Tests des disques enregistrables existants

8.1.10.1 Si les données sur disques CD ou DVD n'ont pas été testées au moment de leur création, il est crucial de conduire de tels tests en l'état. Les disques doivent être soumis à des tests d'erreurs rigoureux car ceux-ci jouent un rôle majeur dans la détermination de leur espérance de vie à partir de ce moment. Si les taux d'erreurs mesurés dépassent les niveaux présentés dans le tableau 1 ci-dessus, les contenus doivent être immédiatement transférés sur de nouveaux media.

8.1.11 Equipements de tests

8.1.11.1  Les équipements de test professionnels pourvus de drives dédiés ou pour le moins spécifiés sont recommandés pour tester en toute rigueur les DVD et CD. Bien que plus coûteux, de tels systèmes s'avèrent nécessaires du fait du caractère précis, fiable et répétable des mesures d'erreurs. Les tests devront pour le moins être en conformité avec la norme ISO 12142 Electronic imaging - Media error monitoring and reporting techniques for verification of stored data on optical digital data discs (Imagerie électronique - Méthodes de surveillance et d'établissement de compte rendu d'erreurs pour la vérification des données stockées sur des disques optiques numériques) [Norme en version anglaise uniquement NDT]. Toutefois, de telles procédures de tests ne résoudront pas le problème de l'absence de normes  pour les drives de disques optiques. Au moment d'écrire ces lignes, il existe un projet de normalisation de l'organisation Internationale de normalisation (International Standards Organisation) ISO N178 Electronic imaging - Classification and verification of information stored on optical media (Imagerie électronique - Classification et vérification de l'information stockée sur support optique) qui peut aborder le problème spécifique  de compatibilité avec le drive. Des logiciels de tests sont disponibles sur le web et peuvent être téléchargés, mais ils devront être soigneusement évalués avant d'être opérationnels dans un environnement d'archives.  Ces logiciels de tests dépendent de la précision des drives non normalisés d'ordinateurs. Dans le cas où l'utilisation d'un testeur avec ordinateur s'avère nécessaire, un dispositif propriétaire fourni par le fabricant des disques offrira les meilleures conditions. Un fabricant au moins de graveurs de CD/DVD propose un logiciel permettant d'utiliser le drive pour effectuer des tests. Les résultats de chaque système de tests dépendent du drive de gravure de CD, aussi devront-ils être vérifiés par comparaison avec des résultats obtenus avec un système de test reconnu et calibré pour s'assurer de leur conformité.  

8.1.11.2  On trouve dans le commerce des équipements de tests de bonne référence normative et  mesurant précisément les seuls paramètres spécifiés dans ce guide. Toutefois, la représentation graphique des paramètres testés n'est adaptée que pour l'identification des problèmes. Selon toute probabilité, l'analyse des problèmes nécessite l'utilisation d'un système de tests de CD et DVD de haut niveau. Il est utile d'avoir accès à ce type de matériel par location ou emprunt lorsqu'on doit résoudre un problème, sélectionner des média vierges ou calibrer des dispositifs de tests à demeure.  

8.1.11.3  Kodak, dans un document internet "Permanence and Handling of CDs" (Pérennité et manipulation des CDs) (Kodak 2002) annonce que 95 % de leur CD-R prétendent à une durée de vie de cent ans dans un environnement de bureaux. Les résultats de tels tests sont souvent considérés avec scepticisme par les archivistes, nombre d'entre eux ayant rencontré des difficultés pour obtenir des résultats identiques en reproduisant les tests. Ceci peut-être dû à des différences d'interprétation des graphiques et des divergences quant au bien-fondé de la méthode d'estimation de la durée de vie. Même si ces tests s'avèrent exacts, et dans l'hypothèse improbable selon laquelle des drives CD seront encore disponibles dans 100 ans, un taux de défaillance de 5 % est inacceptable pour un service d'archives. Cette conclusion renforce la nécessité de mettre en œuvre un programme de surveillance des erreurs.     

8.1.11.4  Testeurs de production précis et de haute qualité
    
8.1.11.4.1 Au moment  d’écrire ces lignes, le prix des testeurs de haute qualité débute à 30 000 US$ pour les modèles de base,  et  s’élève à plus de 50 000 US$ pour de nombreux dispositifs. Le coût provient des drivers de référence de haute qualité indispensables pour assurer la précision et la reproductibilité des tests. Tous les testeurs visent le marché du contrôle de production de fabrication des disques optiques. Les prix actuels dépendent du nombre de paramètres mesurés, mais nombre d'entre eux ne sont guère pertinents pour tester la fiabilité des disques optiques enregistrables d'archivage. Actuellement, on compte trois producteurs de testeurs de haute qualité : AudioDev (http://www.audiodev.com/). DaTARIUS (http://www.datarius.com/) et Expert Magnetics Corporation (http://www.expertmg.co.jp/). On s'adressera aux fabricants et aux distributeurs pour les demandes de devis.

8.1.11.5  testeurs  de mileu de gamme
    
8.1.11.5.1 Au moment de la rédaction de ces lignes, le coût de ces dispositifs est compris entre 3 000 US$ et 11 000 US$ ou plus. Ces systèmes qui testent tous les paramètres recherchés utilisent des drives PC standards spécialement sélectionnés et calibrés. Avant de prendre en compte de tels testeurs de milieu de gamme, il est recommandé au futur acquéreur de se renseigner sur les différents types de drives et sur la précision du dispositif. Il est également fortement recommandé de calibrer régulièrement le système selon les normes établies. Actuellement, le principal fabricant d'un tel équipement de test  de milieu de gamme est Clover Systems (http://www.cloversystems.com/).

8.1.11.6  Testeurs disponibles en téléchargement
    
8.1.11.6.1 De nombreux testeurs sont téléchargeables en ligne.  Ils utilisent le drive CD/DVD interne de l'ordinateur pour mesurer les taux d'erreurs produits par des CD et DVD gravés. Néanmoins, du fait des limitations du logiciel et du manque de précision des drives, la plupart d'entre eux, si ce n'est la totalité, ne conviennent pas dans un contexte d'archivage.

8.1.12 Accès et migration des données

8.1.12.1 Les supports discrets (individuels, matériels) tels que les CD et DVD ne sont pas particulièrement adaptés comme supports de communication en ligne/réseau. Donner accès à une telle collection signifie qu’une équipe manipule les disques. Or La manipulation constitue l'un des pires ennemis de ce type de support. Il faut tenir les disques par les bords exclusivement, et toujours les replacer dans leur boîtier quand ils ne sont pas utilisés. Il est établi que l'effet de la lumière sur les colorants est un facteur de détérioration ; la température et l'humidité excessives doivent être évitées car elles peuvent accélérer la dégradation du disque et, dans les cas extrêmes, provoquer une délamination des couches de polycarbonate (Kunej 2001). Les disques devront être stockés dans des boîtiers acrylique : il faut éviter les pochettes plastique bon marché car elles peuvent créer un environnement néfaste au disque.

8.1.12.2 La copie à des fins de communication est toutefois facile à réaliser, et peut être effectuée à une vitesse bien supérieure à la vitesse réelle de lecture. On trouve sur le marché des jukeboxes qui, avec un logiciel approprié, permettront d'accéder en ligne à la collection, bien qu’il soit préférable de copier ces supports sur disque dur.

8.2 Disques Magnéto-optiques

8.2.1.1  La première (2004) édition du TC-04 décrivait les disques Magnéto-optiques comme format cible possible. Au moment de la publication il avait atteint une capacité de 9,1 GB. Ce développement marquait la fin de cette technologie, et ce format  est aujourd’hui en voie de disparition. La conséquence est qu’avec le temps les informations et leurs supports vont devenir difficiles, voire impossible à obtenir.  Tous les contenus des disques M-O doivent être repérés et notés pour faire l'objet d'une migration sur un système de stockage approprié.

8.2.1.2  Un nouveau format a toutefois été développé,  qui utilise les mêmes caddies de 5,25 pouces que les disques MO, il s'agit du disque UDO (Ultra Density Disc [Optical]). Ces disques utilisent une technologie à changement de phase similaire aux CD-RW, ils différent de ceux-ci seulement par la présence du caddy qui les protège comme les disques MO. Certains systèmes de hardware permettent l'utilisation des technologies MO et UDO dans le même robot. Un laser bleu (405 nm) est utilisé pour le disque double face. Le premier disque UDO de 30 GB de capacité a été présenté à l'automne 2003. Actuellement, les disques UDO d'une capacité de 60 GB sont disponibles ; une feuille de route annonce une capacité de 120 GB l'année prochaine, spéculant sur une capacité ultime de 500 GB.

8.2.1.3  Les tests avec extrapolation d'Arrhenius ont permis d'estimer une durée de vie de 50 ans. Comme discuté plus haut en relation avec d'autres media, de tels tests doivent être considérés avec précaution. En outre, Il est très probable que l'obsolescence de format constituera à long terme la limite ultime de viabilité. Bien que le format UDO compte quelques adhérents, cette technologie n'a pas pénétré le marché de manière conséquente, aussi présente-t-il un risque pour l'archivage à long terme. 22

8.2.1.4  Si les développements technologiques  tracent une voie pour la conservation à long terme de nos contenus audio, il appartient aux conservateurs, aux archivistes et aux techniciens responsables de collections d'archives d'aborder toute nouvelle technologie avec prudence et attention.


22. Le disque UDO n'est plus disponible en 2012 : remplacé par le format Blu-Ray.

9: Partenariats, planification de projet et ressources

9.1.1 Introduction

9.1.1.1 La production d'objets audionumériques et la conservation à long terme de ceux-ci comporte plusieurs éléments interdépendants, nombre d'entre eux étant particulièrement complexes. Ce guide définit les tâches telles que : Extraction des contenus audio pour créer des objets audionumériques d'archives ; ingestion des contenus dans un système d'archivage avec création des métadonnées nécessaires ; administration, gestion des données et systèmes ; stockage d'archivage : planification de la conservation et accès.

9.1.1.2 Certaines institutions sont en mesure d'entreprendre toutes les actions utiles, ainsi que d'abriter une collection dont la dimension justifie les dépenses. Une autre possibilité consiste à négocier des relations de partenariat pour effectuer certaines tâches pour le compte de propriétaires des collections. Ces partenariats peuvent être constitués avec d'autres institutions de plus grande taille se trouvant dans des situations analogues, ou pouvant présenter une relation commerciale avec un fournisseur.

9.1.1.3 Ce paragraphe examine les ressources nécessaires pour créer et préserver les objets audio numériques répondant aux exigences techniques mentionnées dans ce guide. Il prend en compte les questions relatives à la taille de la collection et à l'ampleur de la tâche, reconnaissant que la réponse favorable aux exigences professionnelles décrites ne peut être apportée que si la taille de la collection détenue par chacune des institutions atteint la masse critique suffisante pour rendre les opérations autonomes de conservation viables. De nombreuses institutions, collections, ou services d'archives disposent en interne des expertises spécifiques et des ressources humaines pouvant être déployés pour faciliter les processus. Il leur est recommandé d'optimiser les avantages que leur procure leurs activités tout en examinant soigneusement les sites extérieurs où l'on pourrait trouver de meilleurs services.

9.1.2 Responsabilité des archives, collections

9.1.2.1 La première décision à prendre est de décider si l'institution doit s'engager ou non dans la conservation des documents audionumériques. Souvent, les collections audio et audiovisuelles entrent dans les institutions avec divers objectifs qui peuvent ne pas viser la conservation des documents audio à un niveau professionnel. Les problèmes toujours plus importants de conservation physique d'une collection audio, d'obsolescence des équipements de lecture, de pérennisation des documents numériques peuvent suggérer de repenser la collection et la politique de conservation. Quand des alternatives appropriées se présentent, les collections audio pourraient être transférées dans des institutions plus spécialisées. Ce qui n'implique pas nécessairement une renonciation totale à la propriété de la collection ; au service d'archives destinataire des documents, il peut-être demandé de fournir, en retour, des copies de consultation qui pourraient rester disponibles - sans coût supplémentaire significatif - pour d'autres utilisations internes. Diverses possibilités de détention, partielle ou entière, des droits de propriétés aussi bien que des droits d'usage, peuvent être appliqués.

9.1.3 Responsabilité partagée des archives

9.1.3.1 Si une institution se doit d'assurer la responsabilité de ses collections, différents scenarios peuvent être envisagés sans pour autant constituer un renoncement à celle-ci.

9.1.3.2 Il est possible de produire les objets numériques en interne et d'en assurer la conservation en externe. De nombreuses manières de conduire ce scénario peuvent être proposées. Une solution, qui semble plus appropriée pour les institutions académiques et les universités, propose d'engager plusieurs unités dans la production et l'utilisation des documents audio (et audiovisuels). Généralement, de telles institutions disposent d'un ordinateur central, le plus souvent avec la responsabilité de gestion des différents objets numériques. Le dispositif de stockage des données devrait être en mesure de prendre en charge les modalités de conservation à long terme des contenus audio créés. Cependant, il est important d'apporter à l'unité centrale tous les éléments spécifiques à la conservation à long terme des objets audionumériques, et d'élaborer des règles bien définies pour la production de fichiers d'archivage. L'unité centrale devrait prescrire les formats d'enregistrement, la résolution, les procédures d'annotations et autres modalités d'archivage qui devront être suivies. De plus, les tâches de conservation à long terme de ce type devraient pouvoir être remplies également par des entrepreneurs privés. Ce concept devrait servir pour les nouvelles productions, particulièrement les enregistrements sur le terrain dans diverses disciplines telles que l'anthropologie, la linguistique, l'ethnomusicologie et l'histoire orale.

9.1.3.3 Dans un tel scénario, une autre voie peut être préconisée dans le cas où une collection importante dotée de conditions de stockage appropriées, de moyens de transfert et de l'expertise technique, ne bénéficierait pas d'une infrastructure de stockage numérique suffisamment développée pour construire un dépôt numérique digne de confiance. Dans ces conditions, on pourra entreprendre localement l'extraction du signal et répartir les objets audionumériques obtenus vers les services d'archives sélectionnés.

9.1.3.4 Toutefois, lorsque des institutions ont déjà accumulé voire dispersé des originaux analogiques et numériques, les opérations d'extraction des signaux depuis ces originaux à des fins de constitution de fichiers numériques de conservation pourraient être concentrées pour être menées par une unité équipée de manière professionnelle, reliée à l'unité informatique centrale. Si l'institution, dans sa totalité, n'atteint pas la masse critique de supports, il vaudra mieux externaliser les opérations d'extraction du signal. De même si l'institution ne dispose pas de l'expertise requise ou des équipements pour mener à bien la numérisation professionnelle.

9.1.3.5 Pour chacun de ces scenarios, pour lesquels un service d'archives tiers prend la responsabilité des entrées, de la gestion, et de la conservation des objets audionumériques, il est impératif d'avoir une parfaite compréhension du rôle et de la responsabilité des différents partenaires impliqués dans ces tâches. La norme ISO 20652 : 2006 "Space data and information transfer systems -- Producer-archive interface -- Methodology abstract standard" (Systèmes de transfert des informations et données spatiales -- Interface entre producteur et archives -- Norme pour la méthodologie concernant les abstraits) [Norme en anglais (NTD)] identifie, définit et fournit les structures des relations et interactions entre les producteurs d'informations et les archives. Elle définit la méthodologie de structure des actions requises depuis l'instant du premier contact entre le producteur et l'archive jusqu'à réception et validation des objets d'information par les archives. Ces actions couvrent la première étape du processus des entrées telles que définies dans le modèle de référence d'un système ouvert d'archivage d'information (Open Archival Information System (OAIS)) (voir ISO 14721 [norme en anglais, révisée 2012, (NTD)]. http://www.iso.org/iso/fr/home/store/catalogue_ics/catalogue_detail_ics.....

9.1.4 Masse critique

9.1.4.1 Dans le domaine de la conservation du son, la taille de la collection justifiant les dépenses pour mener les travaux en interne représente la masse critique. Il est difficile de donner une estimation chiffrée pour définir une masse critique ; plus grand est le nombre d'institutions professionnelles disponibles dans un pays ou une région, plus élevée sera la masse critique. La masse critique sera d'autant plus grande que le nombre d'institutions professionnelles dans un pays ou une région sera élevé. Toutefois, si les institutions engagées dans l'archivage de niveau professionnel sont peu nombreuses, ou si aucune n'est disponible, alors la masse critique sera plus faible. La masse critique devrait toujours être évaluée en fonction des formats de supports ; disques à gravure large (78t), microsillons, bande en bobine libre, etc. Dans les pays ou régions développés, la masse critique devrait être atteinte pour plusieurs milliers d'items au moins, toutefois, dans de nombreux cas, des institutions détenant des dizaines de milliers d'exemplaires d'un support de même type, prennent la décision rationnelle d'externaliser les opérations d'extraction du signal. En des circonstances de moindre développement, le transfert en autonomie de quelques milliers d'items / heures seulement peut être correctement effectué.

9.1.4.2 La masse critique dépend également de l'homogénéité des documents dans leurs formats respectifs. Des collections homogènes peuvent être transférées avec un certain niveau d'automatisation. Généralement, les coûts associés avec des systèmes entièrement automatisés impliquent une externalisation vers des institutions ou des prestataires proposant des transferts en parallèle sous contrôle informatique. Les collections comportant différents types de supports ou standards d'enregistrement - comme rencontré fréquemment dans les collections de recherche - exigent des conditions de transferts manuels fiables pouvant être disponibles en interne à plus bas coût, et à condition de disposer d'une expertise spécialisée.

9.1.4.3 Même si elles sont de grande taille, les archives audio professionnelles peuvent prendre en considération l'envoi d'une partie de leur collection vers des institutions ou des prestataires spécialisés pour effectuer les transferts. Ceci tout particulièrement pour certains supports analogiques historiques et pour des supports numériques.

9.1.5 Sous-traitance

9.1.5.1 Chaque fois que l'on fait appel à la sous-traitance pour extraire le signal, tout particulièrement auprès d'entreprises privées, il est important de définir très précisément les tâches à accomplir. La meilleure manière d'y parvenir est de spécifier, dans le cadre du contrat, les éléments de références fournis par IASA dans ses Cahiers de recommandations (Directives).

9.1.5.2 Pour tous les processus audio effectués en sous-traitance, il est indispensable de mettre en place un système de contrôle qualité afin de s'assurer de la conformité des prestations contractuelles. De telles pratiques devront s'appuyer sur des métadonnées de conservation précisément fournies, sur des tests pratiqués à partir d'échantillons prélevés de manière aléatoire, sur des tests des équipements de transfert opérés lors de visites inopinées chez les sous-traitants. Une attention toute particulière sera portée aux tests des systèmes de contrôle qualité - automatiques ou manuels - mis en place par les prestataires ; une attention qui sera portée également à leur capacité à gérer des contrats à long terme selon une méthodologie de gestion de projet, à leur expérience en matière de contrats similaires, de supports spécifiques, de maintenance des équipements, et enfin à propos du rapport qualité-prix. Avant de lancer les opérations de numérisation en production, une phase de tests à petite échelle devra être pratiquée pour s'assurer que tous les aspects du processus sont bien conformes aux critères.

9.1.5.3 Il relève de la responsabilité du service d'archives audio de gérer et de contrôler l'accès à toutes ses collections dans le strict respect des contraintes légales, morales et éthiques associées aux contenus. La sous-traitance des opérations n'autorise en aucune manière le service d'archives à abroger ses responsabilités en la matière. Lorsque des matériaux sonores sont transmis à une tierce partie pour entreprendre une action sur le son, il est nécessaire de définir et de contractualiser les restrictions auxquelles le prestataire de services doit souscrire. Pour des documents sonores commerciaux sous copyright, les limitations légales sont probablement décrites dans les textes auxquels on pourra se référer. Quand la vie privé ou autres questions d'éthique doivent être prises en compte, des règles doivent être définies et portées à la connaissance des prestataires qui s'y conformeront. Il est également important de préciser quand et comment les copies seront éliminées du système de stockage de l'entreprise lorsque sa responsabilité viendra à échéance et lorsque les matériels et des contenus reviendront vers les propriétaires ou les services d'archives.

9.1.6 Evaluation quantitative de l'importance d'un projet

9.1.6.1 Que les opérations de conservation soient menées en interne de manière autonome, partiellement autonome ou qu'elles soient entièrement sous-traitées, le préalable indispensable à une planification rigoureuse passe par une estimation quantitative du projet. Des erreurs importantes et coûteuses ont été fréquemment produites par la sous-estimation du travail nécessaire à l'extraction du signal optimum depuis les supports originaux. Par conséquent, la première étape consiste à décompter le nombre de supports et à estimer la durée de lecture de ceux-ci. Avec les supports mécaniques, les mini cassettes et les disques optiques, une relation assez simple peut être établie entre nombre de supports et durée nécessaire pour les lire. Une estimation qui peut être rendue plus complexe dans le cas des bandes magnétiques en bobine libre car la durée dépend de la longueur de la bande, de la vitesse de l'enregistrement et du nombre de pistes. Toutefois, la bonne connaissance d'une collection, quelques hypothèses bien fondées permettent dans bien des cas d'effectuer des estimations suffisamment précises. En ce qui concerne les collections peu ou non documentées, cas souvent rencontrés chez des personnalités importantes, l'estimation peut-être extrêmement longue.

9.1.6.2 Une fois estimée la durée de transfert des supports, il convient de tenir compte d'un deuxième facteur important : leur état physique. Les ratios mentionnés dans les différentes parties du chapitre 5 "Extraction du signal du support original", s'entendent pour des supports en bon état. Toute opération de nettoyage et de restauration peut induire une durée de transfert supplémentaire substantielle qui doit être comprise en conséquence dans les chiffrages.

9.1.7 Hiérarchisation du transfert numérique

9.1.7.1 Le paragraphe 16 du document IASA-TC 03 "Sauvegarde du patrimoine sonore : Ethique, Principes et Stratégie de Conservation" précise que, exception faite des disques à gravure directe qui peuvent devenir inutilisables sans avertissement et à n'importe quel moment, le transfert d'une collection donnée relève d'une décision aux multiples facettes répondant aux exigences d'accès aux documents, à leur état physique, et, avec une importance qui ne cesse de croître, à la disponibilité des équipements, des pièces de rechange et d'un support professionnel. Le projet "Sound Directions" (Directions sonores) a développé "FACET", un outil d'évaluation des paramètres respectifs et d'assistance dans la prise de décision sur des bases objectives et transparentes. On notera toutefois que l'obsolescence des formats, qui engendre des problèmes comme l'abandon de service professionnel pour les machines R-DAT par exemple, est rapide, ce qui doit nécessiter une veille permanente et une réévaluation régulière de la situation.

9.1.8 Conservation à long terme des objets audionumériques

9.1.8.1 Habituellement, lorsqu'on débute les opérations de conservation du numérique, les coûts de stockage à long terme des objets audionumériques sont, et ceci de manière permanente et persistante, sous-estimés. Au moment de la rédaction de ces lignes, on estime que l'ordre de grandeur des coûts de stockage professionnel est au moins de 5 $US/GB/an pour des collections de taille moyenne à très grande taille (supérieures à 5 TB). Si les coûts de hardware ne cessent de diminuer, les dépenses correspondant à la gestion de stockage, aux continuelles migrations vers une nouvelle génération, à l'hébergement dans des locaux adaptés (salle blanche, etc.) sont toujours sous-estimées. L'objectif politique de l'UNESCO de mettre au défit l'industrie des technologies de l'information (TI) de parvenir à un coût de 1 $US/GB/an à court terme semble loin d'être atteint. Certains chiffres détaillés dans l'étude PrestoSpace font apparaître une tendance à la stabilisation des coûts de stockage à long terme à 9 $US/GB/an. Puisque les objets audionumériques nécessitent en moyenne 2GB/heure, les coûts de conservation, même les moins élevés, seront encore trop élevés pour de nombreuses institutions culturelles.

9.1.8.2 Les plus faibles coûts de stockage numérique peuvent être atteints seulement pour les plus faibles volumes et si on excepte les coûts de main-d'œuvre associés à petite échelle dans les prestations manuelles. Dans un avenir proche, l'utilisation systématique de logiciels open source peut conférer une certaine autonomie, sinon un total automatisme aux processus, y compris pour des capacités moyennes (10-20 TB) de stockage. L'implication d'un personnel spécialisé apportant la garantie de disponibilité permanente des fichiers archivés grâce à des interventions manuelles ou semi-automatiques ne doit pas être sous-estimée.

9.1.9 Calcul des coûts généraux

9.1.9.1 Au moment de prendre des décisions, le point crucial correspond peut-être au calcul des coûts. Malheureusement, un chiffrage concret, applicable de manière générale, ne peut être avancé dans ce contexte. Les coûts de prestations en interne sont difficiles à évaluer, de nombreuses institutions détentrices de collections audiovisuelles disposent d'infrastructures (salles, air conditionné, intranet) dont les coûts sont intégrés au budget général, ce qui rend difficile le calcul des coûts généraux de transfert et/ou ceux de la conservation numérique permanente. Le coût de main-d'œuvre diffère de manière significative, même entre pays voisins industrialisés, ce qui affaiblit toute conclusion économique d'ordre général. Finalement, l'offre commerciale des services professionnels varie de manière considérable, en fonction du nombre d'items par support, de l'état de conservation de ceux-ci, et désormais de la possibilité d'automatiser les processus. Alors que les coûts de personnels, d'équipements et autres ressources augmentent généralement avec le temps, le coût de certains processus automatisés peut diminuer.

9.1.9.2 Du fait de nombreux facteurs impliqués dans un projet donné de conservation, ces conseils ne s'accompagnent pas d'estimation de budget de transfert. Les indications fournies suggèrent qu'il revient aux détendeurs de collections de s'informer très précisément de la situation spécifique de leur pays ou de leur région, et d'observer l'état du marché sur des bases comparables.

9.1.9.3 Pour la recherche de prix de prestations de conservation de documents audio, les appels d'offres doivent être très bien préparés, détaillés, et toutes les réponses soigneusement examinées. Les offres proposant les mêmes services que d'autres prestataires mais à moindre coût, devront être examinés avec le plus grand scepticisme. Finalement, la sous-traitance peut être gérée avec succès si un dispositif d'assurance qualité rigoureux est mis en place comme décrit et si toute tâche défectueuse est rigoureusement rejetée.

9.1.10 Résumé

9.1.10.1 En résumé, lors de la planification des opérations de conservation, il est fortement recommandé aux détenteurs de collections audiovisuelles de profiter de la prise en compte des besoins nécessaires à la conservation de leur fonds pour repenser toute leur stratégie : tous les scénarios, depuis le retrait de toute responsabilité à l'égard de la conservation, en passant par les prestations d'extraction du signal et de conservation numérique à long terme, en interne ou en externe, jusqu'à assumer en autonomie toute la responsabilité, devront être examinés. Chaque collection est différente et les institutions, intégrées dans des environnements très variés. Ces multiples scénarios, qui changent également avec le temps en fonction du développement technique, rendent difficiles les prises de décision sur les seules considérations économiques. Généralement, tous les détenteurs de collections audiovisuelles, de petites collections notamment, sont fortement encouragés à établir des relations de coopération afin de répondre aux exigences de conservation. L'importance avec laquelle la responsabilité de l'extraction du signal et de la conservation à long terme se manifeste en interne doit être en rapport avec la mission générale de l'institution ou de la collection. Les institutions chargées de préserver la mémoire peuvent prendre différentes décisions à propos de collections de recherche, pour lesquelles l'intérêt est grand en termes de disponibilité des documents audio mais dont le cœur de métier n'intègre pas nécessairement les processus garantissant leur survie.

Références

  • Al Rashid, Shahin 2001 Super Audio CD Production Using Direct Stream Digital Technology, Internet online http://www.merging.com/uploads/assets/Merging_pdfs/dsd1.pdf Merging Technologies/Canada Promedia Inc.
  • Anderson, Dave, Jim Dykes and Erik Riedel 2003 More than an interface – SCSI vs.ATA, in Proceedings of the 2nd Annual Conference on File and Storage Technology (FAST), March 2003. Available online at http://www.cs.cmu.edu/~riedel/papers/apr03_ExternalSCSIvsATA.pdf
  • Benson K. Blair (ed) 1988 Audio Engineering Handbook, McGraw Hill, New York
  • Boston, George IASA Survey of Endangered carriers, (draft). Circulated to IASA TC Members September 2003.
  • Bradley, Kevin (2001) CD-R, Case Study of an Interim Media. IASA/SEAPAAVA Conference. Singapore.
  • Bradley, Kevin (2006) Risks Associated with the Use of Recordable CDs and DVDs as Reliable Storage Media in Archival Collections – Strategies and Alternatives, Memory of the World Programme, Sub-Committee on Technology. Available from http://unesdoc.unesco.org/images/0014/001477/147782E.pdf
  • Bradley, Kevin 1999 Anomolies in the Treatment of Hydrolysed Tapes: Including Non-Chemical Methods of Determining the Decay of Signals in George Boston (ed) Technology and our Audio Visual Heritage; Technology’s role in Preserving the memory of the worldJTS 95 A Joint Technical Symposium, pp. 70-83.
  • Bradley, Kevin 2004 Sustainability Issues, APSR Report http://www.apsr.edu.au/documents/APSR_Sustainability_Issues_Paper.pdf
  • Bradley, Kevin, Lei Junran, Blackall, Chris 2007 Towards an Open Source Repository and Preservation System: Recommendations on the Implementation of an Open Source Digital Archival and Preservation System and on Related Software Development UNESCO Memory of the World, http://portal.unesco.org/ci/fr/files/24700/11824297751towards_open_sourc...
  • Brock-Nannestad, G. 2000 The calibration of audio replay equipment for mechanical records, in Michelle Aubert and Richard Billeaud, (eds) Image and Sound Archiving and Access: the challenges of the 3rd Millenium Proceeding of the Joint Technical Symposium Paris 2000, CNC, Paris, pp. 164-175.
  • Byers, F. R. (2003) Care and Handling of CDs and DVDs – A Guide for Librarians and Archivists, NIST Special Publication 500-252.
  • Byers, Fred R. 2003 Care and Handling of CDs and DVDs – A guide for Librarians and Archivists (Draft) National Institute of Standards and Technology, Maryland, USA.
  • Casey, Mike and Gordon, Bruce 2007 Sound Directions: Best Practices for Audio Preservation Indiana University and Harvard University http://www.dlib.indiana.edu/projects/sounddirections/papersPresent/sd_bp...
  • Copeland, Peter 2008 Manual of Analogue Sound Restoration Techniques, British Library Sound Archive http://www.bl.uk/help/manual-of-analogue-audio-restoration-techniques
  • Dack, Dianna 1999 Persistent Identification Schemes National Library of Australia, Canberra available online http://pandora.nla.gov.au/pan/33822/20030228-0000/www.nla.gov.au/initiat... [accessed 4 Nov 2012].
  • Dempsey, Lorcan 2005 All that is solid melts into flows, Lorcan Dempsey’s weblog On libraries, services and networks. May 31, 2005 Internet on line, http://orweblog.oclc.org/archives/000663.html [accessed January 2009].
  • Dublin Core, http://dublincore.org/
  • DVD Forum 2003 Guideline for Transmission and Control for DVD-Video/Audio through IEEE1394 Bus Version 0.9 [Internet] DVD Forum. Available from http://dvdforum.org/tech-guideline.htm [accessed January 2008].
  • Eargle, John M. 1995 Electroacoustical Reference Data, Kluwer Academic Publishers.
  • Engel, Friedrich 1975 Schallspeicherung auf Magnetband, Agfa-Gevaert, Munich.
  • Enke, Sille Bræmer: 2007 Udretning af Deforme Vinylplader (Flattening of deformed vinyl discs), research project, The School of Conservation, The Royal Danish Academy of Fine Arts.
  • Feynman, Richard P. 2000 The pleasure of finding things out, London: Penguin, 2000.
  • Fontaine, J.-M. & Poitevineau, J. (2005) Are there criteria to evaluate optical disc quality that are relevant for end-users? AES Convention Paper. Preprint Number 6535.
  • Gunter Waibel. Like Russian dolls: nesting standards for digital preservation, RLG DigiNews, June 15, 2003, Volume 7, Number 3, http://worldcat.org/arcviewer/1/OCC/2007/08/08/0000070511/viewer/file674...
  • Hess, Richard L. 2001 Vignettes; Media Tape Restoration Tips – Cassette track layoutInternet on-line http://richardhess.com/notes/
  • King, Gretchen, (N.D.) Magnetic Wire Recordings: A Manual Including Historical Background, Approaches to Transfer and Storage, and Solutions to Common Problems, http://www.music.washington.edu/ethno/wire1.html (accessed 10 October 2008).
  • Klinger, Bill 2002 Stylus Shapes and Sizes: Preliminary Comments on Historical Edison Cylinder Styli. Unpublished paper.
  • Kodak 2002 Permanence and Handling of CDs, Internet on-line web.archive.org/web/20041230085156/ http://www.kodak.com/global/en/professional/products/storage/pcd/techinf... [accessed 23 June 2011].
  • Kunej, D. (2001) Instability and Vulnerability of CD-R Carriers to Sunlight. Proceedings of the AES 20th International Conference Archiving, Restoration, and New Methods of Recording, Budapest, pp. 18-25.
  • Langford-Smith, F (ed) 1963 Radiotron Designer’s Handbook,Wireless Press, for Amalgamated Wireless Valve Co. Pty. Ltd., Sydney, Fourth Edition, Sixth Impression.
  • LOCKSS (Lots of Copies Keep Stuff Safe) http://www.lockss.org/lockss/Home Accessed November 2008.
  • Machine Readable Cataloging (MARC). Library of Congress, http://www.loc.gov/marc/
  • Maxfield, Joseph P. and Henry C. Harrison. 1926 Methods of High Quality Recording and Reproducing of Music and Speech Based on Telephone Research, in Bell System Technical Journal 5, p. 522.
  • McKnight, John G 2001 Choosing and Using MRL Calibration Tapes for Audio Tape Recorder Standardization. MRL (Magnetic Research Laboratories, Inc) Publication Choo&U Ver 5.7 2001-10-25, internet online https://home.comcast.net/~Emrltapes/choo&u.pdf [accessed 23 June 2011].
  • McKnight, John G. 1969 Flux and Flux-frequency Measurements and Standardization in Magnetic Recording, Journal of the SMPTE,Vol. 78, pp. 457-472.
  • Metadata Encoding and Transmission Standard (METS), http://www.loc.gov/standards/mets/
  • Metadata Object Description Schema (MODS), http://www.loc.gov/standards/mods/
  • Morton, David 1998, Armour Research Foundation and the Wire Recorder: How Academic Entrepreneurs Fail, Technology and Culture 39, no. 2 (April 1998, pp. 213-244).
  • Open Archives Initiative – Protocol for Metadata Harvesting (OAI-PMH) http://www.openarchives.org/OAI/openarchivesprotocol.html [accessed November 2008].
  • Osaki, H. 1993 Role of Surface Asperities on Durability of Metal-Evaporated Magnetic Tapes in IEEE Trans on Magnetics 29/1 Jan 1993.
  • Paton, Christopher Ann,Young, Stephanie E., Hopkins, Harry P. & Simmons, Robert B. 1997 A Review and Discussion of Selected Acetate Disc Cleaning Methods:Anecdotal, Experiential and Investigative Findings in ARSC Journal XXVIII/i.
  • Plendl, Lisa 2003 Crash Course: Keeping The Trusted Hard Drive More Reliable Than Ever, The Ingram Micro Advisor, Internet online http://web.archive.org/web/20081120175220/http://www.macadept.com/images... 23/06/2011].
  • Powell, James R., Jr. & Stehle, Randall G. 1993 Playback Equalizer Settings for 78 rpm Recordings, Gramophone Adventures, Portage MI, USA.
  • PREMIS (PREservation Metadata: Implementation Strategies) Working Group 2005 http://www.oclc.org/research/projects/pmwg/ [accessed November 2008].
  • Ross, Seamus and Ann Gow 1999 A JISC/NPO Study within the Electronic Libraries (eLib) Programme on the Preservation of Electronic Materials, Library Information Technology Centre, London. Available online http://www.ukoln.ac.uk/services/elib/papers/supporting/pdf/p2.pdf [accessed 7 January 2004].
  • Rumsey, Francis and John Watkinson 1993 The Digital Interface Handbook Focal Press, Oxford, UK.
  • Schuller, Dietrich (ed) IASA-TC 03 2005 The Safeguarding of the Audio Heritage: Ethics, Principles and Preservation Strategy, International Association of Sound and Audiovisual Archives, IASA Technical Committee, Version 3, September 2005, internet online, http://www.iasa-web.org/tc03/ethics-principles-preservation-strategy [accessed January 2009].
  • Schuller, Dietrich (1980) Archival Tape Test. Phonographic Bulletin 27/1980, pp. 21-25.
  • Slattery, O., Lu, R., Zheng, J., Byers, F. & Tang, X. (2004) Stability Comparison of Recordable Optical Discs – A Study of Error Rates in Harsh Conditions, Journal of Research of the National Institute of Standards and Technology. NIST.
  • Tennant, Roy 2004 A Bibliographic Metadata Infrastructure for the 21st Century, inLibrary Hi Tech, vol 22 (2) 2004, pp.175-181.
  • Tennant, Roy. The Importance of Being Granular, Library Journal 127(9) (May 15, 2002) p.: 32-34, http://libraryjournal.reviewsnews.com/index.asp?layout=article&articleId....
  • Trock, J. (2000) Permanence of CD-R Media, in Aubert, M. & Billeaud, R. (Eds.) The Challenge of the 3rd Millennium JTS 2000. Paris.
  • Trustworthy Repositories Audit and Certification (TRAC): Criteria and Checklist http://www.crl.edu/sites/default/files/attachments/pages/trac_0.pdf
  • Watkinson, John: 1991 R-DAT Focal Press
  • Webb, Colin 2003 Guidelines for the Preservation of Digital Heritage UNESCO Memory of the World, Internet online http://unesdoc.unesco.org/images/0013/001300/130071e.pdf [accessed November 2003].
  • Wheatley, P. (2004) Institutional Repositories in the context of Digital Preservation. DPC Reports. Digital Preservation Coalition.
  • Wright, Richard and Adrian Williams 2001 Archive Preservation and Exploitation Requirements, PRESTO-W2¡BBC- 001218, PRESTO - Preservation Technologies for European Broadcast Archives 2001 Internet online, http://presto.joanneum.ac.at/Public/D2.pdf