7.7 Disposicions pràctiques de maquinari

7.7.1.1 La informació que segueix descriu maneres d'implementar un sistema a la pràctica. Com ja s'ha comentat anteriorment, es suposarà que totes les dades de l'arxiu sonor s'emmagatzemen sobre discs durs, dades que al seu torn tindran una rèplica sobre un format de cinta tipus LTO.
 

7.7.2 Unitats de disc dur

7.7.2.1 Una opció comuna i assequible per a l'emmagatzematge de dades sobre disc es basa en la connexió d'un clúster de discs durs organitzats en RAID (vegeu la secció 6.3.14 Discs durs). El RAID de nivell 1 és poc més que dos discs replicats, que Així mantenim dues còpies de les dades en dos dispositius físics diferents: si un dels discs falla, les dades continuaran disponibles en l'altre. Els RAID de més alt nivell (nivells 2 a 5) implementen sistemes progressivament més complexos de redundància de dades i control de paritat que garanteixen el manteniment de la integritat de les dades. Aquests nivells més alts de RAID aconsegueixen el mateix nivell de seguretat que el nivell 1 (RAID 1) o rèplica, amb una quantitat d'espai de disc significativament més baixa. Comparat amb el 50 % de pèrdua d'espai útil en RAID 1, el nivell RAID 5 pot arribar, per exemple, al 25 % (o menys, en funció de la implementació). Els conjunts de discs més sofisticats estan àmpliament disponibles.

7.7.3 Còpia de seguretat sobre cinta

7.7.3.1 No hi ha cap component d'un sistema digital que pugui ser considerat fiable. La fiabilitat d'un sistema només s'aconsegueix mitjançant la creació de múltiples còpies redundants en cada fase. El component final i més important en la cadena d'emmagatzematge és la cinta de dades. En els darrers temps, el format LTO ha guanyat popularitat per a aquest propòsit (vegeu la secció 6.3.12 Selecció i monitoratge del mitjà de cinta de dades). Hi ha, però, altres formats de cinta de dades que poden ser apropiats segons les circumstàncies particulars. 

7.7.3.2 Totes les dades emmagatzemades en discs durs s’haurien de duplicar en cintes d'emmagatzematge adequades. Caldria produir un mínim de dos conjunts de còpies sobre cinta per a poder-les emmagatzemar en ubicacions físicament diferents. Ja que el fet d'utilitzar el segon conjunt de cintes per a la restauració de dades no és tan inusual, molts arxius ben establerts mantenen tres conjunts de còpies, dues d'elles situades a prop del sistema a fi de facilitar-ne l'accés, i una tercera emmagatzemada en una ubicació remota per a protegir-se de desastres físics. Ha esdevingut habitual produir tres conjunts separats de cintes de dades utilitzant diferents productes, dels quals s'adquireix, en una sola compra, un lot considerable. Aquesta pràctica facilita les mesures de control de qualitat i rescat, una vegada un lot d'un cert producte comença a fallar. Un programari de gestió de volums (lots) ajudarà en el procés de còpies de seguretat i recuperació de dades, especialment si el sistema incorpora un bon nombre de dispositius d'emmagatzematge.

7.7.3.3 En entorns de codi obert o solucions de baixa tecnologia és difícil implementar un control d'errors, donada la dependència del procés amb el maquinari específic. Malgrat això, a continuació es descriu una possible alternativa per al control d'errors en entorns tecnològicament poc sofisticats. Suposem que el programari de gestió de dades disposa d'un catàleg (amb una impressora connectada). El disc dur, en configuració RAID, conté un conjunt complet de les dades. A més, hi ha dues còpies completes d'aquest conjunt sobre cintes. Disposem, doncs, almenys de dues còpies. En el procés de còpia de la informació en una cinta, s'ha d'imprimir un identificador únic (llegible per humans), sobre una etiqueta. Aquesta etiqueta s'enganxa al cartutx o casset de cinta. El mateix identificador únic s'enregistra també a la capçalera de dades de la cinta. Es programa el sistema de gestió de dades per recordar a l'usuari que busqui (manualment) i insereixi una certa cinta identificada pel sistema. Més que revisar la cinta a la recerca d'errors, el que farà el sistema és verificar el contingut de la cinta contrastant-lo amb el mateix contingut emmagatzemat en disc. El sistema en disc dur pot verificar la informació dels seus propis continguts de dades i és conscient dels seus propis errors. Si la verificació de la cinta falla, el sistema podrà produir una nova còpia en cinta a partir del disc dur. Suposant uns 20 terabytes d'emmagatzematge i un procés de verificació de dues cintes al dia, el sistema seria capaç de verificar cada cinta i el seu duplicat a raó de tres vegades per any. En el cas d'una fallada en el disc dur que requerís les cintes per al reemplaçament, es disposaria de dues cintes revisades en els darrers quatre mesos. El risc que tant les dues còpies en cinta com el disc dur fallessin simultàniament és molt baix.

7.7.4 Sistema d'emmagatzematge amb un (o doble) operador

7.7.4.1 El sistema d'emmagatzematge d'arxiu més simple consistiria a connectar un conjunt de discs en RAID, amb contingut exclusiu de dades, a l'estació d'àudio digital (DAW) principal. Aquesta configuració només és adequada per a institucions amb un únic operador en el procés de digitalització. Per a l'èxit d'aquest enfocament és primordial dotar-se d'un pla de digitalització ben estructurat i una matriu de discs durs dedicada a dur a terme la tasca sense interrupcions. Això garantirà que els disc dur connectat a l'estació d'àudio digital faci còpia a cinta sempre que la quantitat de dades arribi a omplir el suport de destinació.

7.7.4.2 Si les tasques de digitalització estan en mans de dos operadors mitjançant dues estacions de treball, caldrà facilitar l'accés a una o més unitats de disc compartides. La compartició dels recursos es pot aconseguir definint un dels dos ordinadors com a servidor, configurant-lo com a gestor de discs i connectant-lo al segon amb un sol cable de xarxa per permetre l'accés compartit. Aquesta opció s'implementa de manera relativament senzilla i permet als dos operadors compartir la cabina de discs, tot i que demana certs acords de procediment per a evitar conflictes. Per a sistemes d'emmagatzematge manual a petita escala caldrà en tot cas una organització de les dades lògica i procediments estrictes de nomenclatura.

7.7.4.3 En funció de les dimensions del sistema, pot resultar més eficaç establir una associació amb una institució d'arxiu més consolidada o fins i tot contractar un proveïdor extern d'emmagatzematge. En qualsevol cas, l'opció descrita més amunt és viable.

7.7.5 Sistema d'emmagatzematge amb múltiples operadors

7.7.5.1 Per a qualsevol nombre de connexions superior a la unitat, resultarà imprescindible implementar un sistema en xarxa per a l'emmagatzematge de dades i còpies de seguretat. Els sistemes en xarxa permeten l'accés a múltiples usuaris d'acord amb les normes establertes pel sistema de gestió de dades. Les xarxes de petites dimensions són relativament habituals i, amb el nivell adequat de coneixements, d'implementació fàcil i assequible. Amb un dispositiu annex d'emmagatzematge per a empreses pot aconseguir-se un espai de magatzem raonable. Els productes i tecnologies d'emmagatzematge poden classificar-se en tres tipus: Direct-Attached Storage (DAS) o emmagatzematge directament annexat, Network-Attached Storage (NAS) o emmagatzematge connectat a xarxa, i finalment, xarxa d’emmagatzematge (Storage Area Network,SAN). La tecnologia NAS ofereix millor rendiment i escalabilitat que la DAS i resulta alhora més assequible i simple de configurar que la SAN. Per això la NAS es considera, des del punt de vista del cost/benefici, la tecnologia escalable més apropiada per a sistemes d’aquesta mida.

7.7.5.2 La majoria dels sistemes NAS de baix cost pateixen d'un ample de banda reduït en comparació amb sistemes més cars, fet que implica temps d'accés més alts (són més lents) o un menor nombre d'accessos permesos simultàniament. Això no comporta grans conseqüències per a col·leccions petites, ja que els requisits d'accés simultani es mantenen baixos, especialment si s'opta pel format MP3 per a còpies d'accés derivades dels màsters de preservació.

7.7.5.3 Un sistema típic d'emmagatzematge en xarxa a petita escala pot comptar amb poc més que un ordinador de sobretaula de tipus servidor connectat a un dispositiu NAS. El dispositiu NAS serà capaç d'allotjar múltiples discs en un conjunt en RAID. Un sistema NAS estàndard de baix cost acollirà entre 0,5 i 20 terabytes d'emmagatzematge en disc (cal recordar que, a causa de la configuració en RAID, l'emmagatzematge útil serà menor que el que indica la capacitat teòrica dels discs). Les estacions de treball d'àudio digital (DAW) accediran al dispositiu NAS via un commutador d'Ethernet o un dispositiu similar que, configurat adequadament, podrà separar l'emmagatzematge de dades d'àudio del flux de dades propi de la xarxa d’àrea local (Local Area Network, LAN).