6.3.11 Récupération automatisée ou manuelle des données

6.3.11.1 Pour des opérations à petite échelle, il est possible de sauvegarder les données d'une petite station avec un lecteur de bande, puis de placer manuellement la cartouche enregistrée sur une étagère pour un stockage traditionnel. Pour les systèmes en réseau de taille réduite également, on peut effectuer des sauvegardes manuelles des données archivées (voir aussi Chapitre 7 Approches des systèmes de stockage à petite échelle). Les mêmes conseils prodigués à propos des conditions d'environnement de stockage s'appliquent également aux autres types de bandes magnétiques ; dans ce cas il ne peut être que bénéfique de bien veiller à réduire au maximum la présence de poussière, particules et agents polluants. Pour des opérations de plus grande échelle, notamment dans les pays où le coût du travail est élevé et les budgets d'équipement plutôt favorables, un certain niveau d'automatisation est d'ordinaire souhaitable car plus économique que les systèmes exclusivement manuels. Le niveau d'automatisation dépend de l'ampleur et de l'importance des tâches à accomplir, du type d'accès du contenu, des ressources.

6.3.11.2 Bibliothèques de bandes à autochargeurs et robotisées : après les simples drives lecteurs, on évoquera les petits systèmes équipés d'un automate de chargement, d'un lecteur unique (parfois double), de cassettes en rangée simple ou en carrousel qui seront chargées au moment des opérations de sauvegarde. La principale différence entre les autochargeurs et les robots des grandes bibliothèques  se trouve dans le mode de lecture :  les bandes enregistrées ne sont pas identifiées par un logiciel de sauvegarde dans une base de données centrale permettant la récupération automatique des données. Au contraire, Les tâches  de recherche, de récupération et de chargement des fichiers individuels incombent encore à un opérateur.  Tous ce que font ces systèmes à chargement automatique, c’est de permettre, comme leur nom l'indique, l'écriture ou la lecture séquentielle  d’un lot de bandes afin de surmonter les limitations d'échelle des  supports de données individuels, et de se passer de la présence d'un opérateur pour effectuer le chargement de la bande suivante lors d'un long processus de sauvegarde.

6.3.11.3 En contraste, même les plus petites bibliothèques automatisées sont programmées pour se comporter comme un simple système autonome de stockage. La localisation de fichiers individuels sur différentes bandes est transparente pour l'utilisateur, le contrôleur garde la trace de l'adresse des fichiers sur chaque bande, ainsi que la localisation physique des bandes dans la bibliothèque. Si les bandes sont retirées ou rechargées, le système du robot scanne à nouveau l’emplacement de la bande pour mettre à jour son inventaire à l'aide des métadonnées détenues dans le code à barres, ou bien par identification rf des étiquettes ou des puces mémoires que comportent certains boîtiers.

6.3.11.4 Les bibliothèques de bandes de grande taille présentent quelques avantages en comparaison des plus petites bibliothèques. Elles peuvent être conçues pour accueillir des informations redondantes et les distribuer : les temps d'arrêt peuvent-être minimisés et les chargements lecture / écriture répartis sur plusieurs systèmes similaires. Les bibliothèques de grande taille peuvent aussi être utilisées en tant que système polyvalent. Elles peuvent, par exemple, effectuer les opérations de maintenance des sauvegardes d'une société de service informatique tout en assurant la gestion des archives sonores et audiovisuelles dans leur totalité.       

6.3.11.5 Les bandes de données en bobine libre ou en cartouche utilisées dans les systèmes robotisés bénéficient des systèmes de codes à barres, d'étiquettes rf ou autres dispositifs d'identification. Ces systèmes de reconnaissance optique ou électromagnétique se conjuguent parfois avec un codage MIC afin de disposer d'informations supplémentaires ID de la bande et des contenus. Certains formats incorporent un système ID global de codes à barres, aussi une bande utilisée dans une bibliothèque robotisée peut-elle être reconnue par un autre système de bibliothèque.

6.3.11.6 Logiciels de sauvegarde et de migrations, calendrier : des confusions et incompréhensions se manifestent dans le milieu des technologies de l'information (IT) et dans la communauté de l'archivage des données à long terme. On relève deux idées fausses très répandues dans l'opinion. La première, que l'archivage est un processus qui consiste à déplacer des supports peu utilisés, d’un système coûteux composé de disques durs de stockage en réseau  vers un dispositif local non connecté (offline), sur étagère, moins coûteux mais qui, inaccessible, ne permettra jamais la récupération des données ; la deuxième, que la sauvegarde est une opération de routine quotidienne ou hebdomadaire de duplication de la totalité des données stockées dans le système.

6.3.11.7 A propos de la première idée fausse, certains documents sonores parmi les plus importants et les plus précieux peuvent  effectivement ne pas être utilisés pendant des mois, voire des années, mais, pour autant, leur survie doit être garantie sans concession. De même pour la seconde idée fausse, si des règles appropriées sont mises en œuvre, il n'est pas nécessaire de dupliquer chaque jour ou chaque semaine une quantité importante de données alors qu'une faible proportion d'entre-elles est actualisée. En pratique, si un processus strict de duplication des données sur différents média placés en des lieux différents est essentiel pour minimiser les risques de défaillance technologiques et assurer la récupération de données en     cas de sinistre, les caractéristiques particulières d'un patrimoine numérique nécessitent des procédures qui différent des opérations de routine utilisées dans le domaine des technologies de l'information (IT).  

6.3.11.8 Les systèmes HSM (Hierarchical Storage Management) conventionnels peuvent être optimisés pour effectuer régulièrement les sauvegardes de tous les documents et déplacer les contenus les plus rarement utilisés vers des emplacements inaccessibles. Des systèmes plus élaborés peuvent être configurés en fonction des règles de gestion et des pratiques des services d'archives de différentes tailles, pour lesquels plusieurs niveaux d'accès peuvent être proposés. Une institution de taille moyenne peut emmagasiner 100 GB de données audio chaque semaine ou 1 TB de programmes vidéo. Il est clair qu'il faut réaliser des copies dès l'entrée de documents précieux dans le système et préserver l'accessibilité des contenus fréquemment utilisés.

6.3.11.9 Certaines fonctions de base de logiciels de gestion d'archives optimisent les ressources et les composantes matérielles du système tout en régulant le trafic et en ne provoquant qu'un retard minimum pour les utilisateurs. Les logiciels HSM permettent de définir les critères de migration des fichiers, d'un disque en ligne vers une bande, critères tels que : ancienneté du document, volume de données atteint, localisation dans tel ou tel sous-dossier, ou bien encore espace restant disponible sur le disque dur (lignes de niveau supérieur et inférieur).

6.3.11.10 Typiquement, lorsqu'on produit des fichiers haute résolution et leur copie d'accès basse résolution, la version haute résolution réalisée pour la conservation des documents et les transmissions radiophoniques devra être migrée sur bandes afin de libérer de l'espace sur les disques durs, plus coûteux. Un équilibre est nécessaire pour maintenir la disponibilité  des informations tout en optimisant l'utilisation des lecteurs de bandes et des médias. Si l'on doit accéder aux bandes de manière très fréquente, les chargements et déchargements de celles-ci, les opérations d'enroulement et de remise en route répétées auront pour conséquence la dégradation des performances du système. Les systèmes de gestion de contenus plus élaborés comportent des niveaux inférieurs de gestion du stockage, de sorte que  les utilisateurs ont une conscience moindre des fichiers individuels et composants qui soutiennent le système.