7.7.1.1 Les informations suivantes décrivent la manière dont un système opérationnel peut être implémenté. Comme il a déjà été discuté ci-dessus, on se place dans l'hypothèse selon laquelle toutes les archives audio sont stockées sur disques durs et sont en totalité dupliquées en mode miroir sur bande telle que LTO.
7.7.2 Disques durs
7.7.2.1 Une approche courante et abordable de stockage sur disque dur consiste à connecter l'unité de stockage avec un cluster de disques durs (HDD hard disc drive) organisés en système RAID (voir section 6.3.14 Disques durs (Hard Disc Drives)). Le RAID niveau 1 est un peu plus performant que deux disques en miroir (mirroring) ; deux copies des données sont placées sur différents dispositifs hardware physiques ; si l'un des disques tombe en panne, les données sont disponibles sur l'autre drive. Les niveaux RAID plus élevés (2 à 5) implémentent des systèmes de redondance et de contrôle de parité de plus en plus complexes qui assurent le maintien de l'intégrité. Le niveau le plus élevé d'un ensemble RAID réalise le même niveau de sécurité que le niveau 1, ou mirroring, mais avec une moindre perte d'espace de stockage. RAID 5, par exemple, peut subir une perte de 25 % (moins selon l'implémentation), à comparer avec les 50 % de RAID I. Des jeux de disques sophistiqués sont largement disponibles.
7.7.3 Sauvegarde sur bandes
7.7.3.1 Aucun composant élémentaire d'un système numérique ne peut-être considéré comme fiable : on ne rend un système fiable qu’en réalisant à chaque étape de multiples copies redondantes. La composante finale d'une chaîne de stockage qui est aussi la plus importante, est constituée par les bandes de données. Dans un passé récent, les bandes LTO ont conquis leur popularité à cet égard (voir paragraphe 6.3.12 Sélection et contrôle des bandes de données). Cependant, d'autres formats de bandes peuvent convenir selon les circonstances.
7.7.3.2 Toutes les données enregistrées sur disques de stockage devront être dupliquées sur un support convenable. Au moins deux jeux de bandes de données devront être produits et être stockés physiquement en différents endroits. Il n'est pas exceptionnel que le deuxième jeu soit nécessaire pour restaurer des données, aussi de nombreuses archives réalisent-elles trois jeux de copies, deux gardés à proximité du système pour faciliter les accès, le troisième étant stocké à distance pour assurer sa protection physique si un sinistre se produisait. Habituellement on fait en sorte que les jeux de bandes séparées soient réalisés avec des produits différents, chacun d'entre eux provenant d'un même lot de fabrication et achetés en une fois. Ceci facilitera les opérations de contrôle qualité et les mesures de sauvegarde lorsqu'un défaut se manifestera sur un lot donné. Un logiciel de gestion des volumes approprié viendra en aide lors des processus de sauvegarde et de récupération, en particulier si le système comporte plusieurs dispositifs de stockage.
7.7.3.3 Le contrôle d'erreurs est difficile à implémenter dans des solutions open source et low-tech (technologie rudimentaire) car leur efficacité est liée à des logiciels spécifiques. Cependant, une alternative possible au low-tech pour tester les erreurs est décrite dans le paragraphe suivant. Le logiciel de gestion des données possède un catalogue (avec une imprimante jointe). Le disque dur (en configuration RAID) contient un jeu complet de données. Toutes les données sont copiées sur des bandes identiques. Il existe au moins deux copies. Lorsque les données sont copiées sur une bande, un identificateur unique est imprimé sur une étiquette (lisible par le personnel) fixée sur la bande. Le même identificateur peut-être enregistré sur l'amorce de la bande. Le système de gestion des données peut-être organisé pour que l'utilisateur soit en mesure d'insérer rapidement la bande identifiée par le système. Plutôt que de contrôler les erreurs produites par la bande, le système pourra comparer le contenu de la bande avec celui du disque. Le disque dur peut vérifier l'authenticité de ses propres données, il est informé de toute défaillance par auto-contrôle. Si le système de vérification de la bande tombe en panne, il produira une nouvelle bande à partir du disque dur. Supposons un volume de stockage de 20 téraoctets, le système vérifiera deux bandes par jour, chaque bande et ses duplicatas pourront être vérifiées trois fois par an. Dans le cas où une défaillance du disque nécessiterait son remplacement par une bande, on disposerait de deux bandes contrôlées dans les quatre mois qui précèdent. Le risque de voir les bandes et le disque dur tomber en panne simultanément reste très faible.
7.7.4 Systèmes de stockage avec un ou plusieurs opérateurs
7.7.4.1 Le système d'archivage le plus simple consisterait à connecter un dispositif RAID contenant les seules données audio à la station audionumérique principale (digital audio workstation (DAW)). Une telle configuration ne pourrait être mise en œuvre que par des institutions disposant d'un opérateur en charge des procédures de numérisation. Pour réussir une telle approche, il est nécessaire de bien structurer le plan de numérisation et de dédier au système un ensemble de disques afin que les tâches puissent être menées en continu, sans interruption conséquente. On assure ainsi le déclenchement des copies des disques HDD rattachés au DAW sur bandes chaque fois que le support cible se remplit.
7.7.4.2 Si les tâches de numérisation sont entreprises par deux opérateurs travaillant sur deux postes de travail, il faut pouvoir accéder à des drives en mode partagé ou indépendant. Pour réaliser le partage de telles ressources, il faut attribuer à un ordinateur le rôle de serveur, le configurer pour pouvoir piloter les drives, et mettre en œuvre les moyens de partage à l'aide d'une connexion simple. Une telle approche de partage entre deux opérateurs est relativement facile à réaliser, même si elle exige des ententes sur les procédures afin d'éviter des conflits. Une organisation logique des données et le strict respect des procédures de nommage sont indispensables pour les petits systèmes de stockage gérés manuellement.
7.7.4.3 Si un système de la taille décrite a été mis en place, il peut être plus avantageux d'établir un partenariat avec une institution d'archives plus importante, ou bien de passer un contrat de service avec un prestataire spécialisé dans les opérations de stockage. Cependant, l'approche décrite ci-dessus reste possible.
7.7.5 Systèmes de stockage avec opérateurs multiples
7.7.5.1 Lorsque le nombre de connexions est supérieur à deux, un système d'archivage et de sauvegarde en réseau doit être mis en œuvre. Un tel dispositif en réseau permet à de nombreux utilisateurs d'accéder aux données conformément aux règles établies par le système de gestion des données. Les petits réseaux sont relativement courants, et leur mise en œuvre, avec juste le niveau de connaissances nécessaires, est aisée et abordable. Des quantités raisonnables d'archives peuvent être traitées grâce à un dispositif de stockage de niveau entreprise. On peut distinguer trois grandes catégories en matière de technologies de stockage et d'équipement : le stockage à connexion directe ou DAS (direct-attached storage), le stockage en réseau ou NAS (Network-attached storage), et le réseau de stockage ou SAN (storage area network). Le système NAS est plus performant et évolutif que le système DAS, il est moins coûteux et de configuration plus simple que le système SAN. Considérant le rapport coût / bénéfice, la technologie NAS constitue la technologie évolutive la plus intéressante d'un point de vue économique, pour des systèmes de taille dont nous discutons dans ce chapitre.
7.7.5.2 La plupart des dispositifs à bas-coût NAS présentent une bande passante restreinte en comparaison de systèmes plus coûteux et de temps d'accès plus court ; ils présentent aussi un nombre d'accès simultanés plus limité. Ceci ne présente pas de difficulté particulière pour les plus petites collections, ainsi en est-il des conditions requises pour les accès simultanés, peu contraignantes, en particulier lorsque des copies de master sont proposées en consultation dans des formats dérivés de MP3.
7.7.5.3 Un système de stockage de petite taille en réseau pourra comprendre un serveur de type PC-portable connecté à un système de stockage en réseau. Le NAS devra pouvoir accueillir des disques durs assemblés en grappe RAID. Un système NAS de faible coût devra disposer d'une capacité de stockage sur disques comprise entre 0,5 et 20 téraoctets (on notera que la capacité de stockage des disques en configuration RAID est réduite, inférieure à celle correspondant à la taille annoncée pour les disques bruts. Les plateformes audionumériques (DAW) sont connectées via un commutateur Ethernet ou dispositif équivalent qui, lorsqu'il est correctement configuré, a pour effet de séparer l'unité de stockage du réseau local LAN (Local area network), ce qui renforce la sécurité de la structure de stockage. Les données sur disques durs HDD devront être sauvegardées sur bandes de données.