7: Opcions a petita escala per a sistemes d’emmagatzematge digital

7.1 Introducció

7.1.1.1 És possible construir un sistema d'emmagatzematge digital a petita escala capaç de satisfer els requisits d'arxius amb petites col·leccions i pressupost limitat. Fins fa poc, només les organitzacions de grans dimensions i recursos comparativament més importants podien digitalitzar i emmagatzemar els seus fons a gran escala mitjançant sistemes d'emmagatzematge digital massiu (DMSS) sobre la base de conjunts de discs durs i unitats de cinta. Aquests sistemes acostumen a ser grans, cars i específics per a contingut sonor i audiovisual. De la mà d'institucions universitàries i d'educació superior, moltes fonoteques i biblioteques d'àmbit nacional han iniciat i finançat el desenvolupament d'estàndards oberts i programari de codi obert que avui dia faciliten els processos d’arxiu digital. Aquests sistemes de treball són actualment la columna vertebral i el model per a totes les propostes d’arxiu digital. L'arxiu sonor se’n beneficia mitjançant l'ús d'aquestes tecnologies i l'aportació de coneixements específics per un desenvolupament millor.

7.1.1.2 Al mateix temps que apareixen en el mercat solucions de programari de codi obert i altres de baix cost, el cost econòmic de les cintes i els discs durs es redueix, encara més en el cas d'aquests darrers. Avui dia és possible implementar l’arxiu digital d'una manera molt més professional que mitjançant l'arriscada metodologia de còpia sobre suports d’enregistrament individuals, tipus CD o DVD.

7.1.1.3 Aquest capítol de les Directrius descriu com establir i gestionar un repositori digital a petita escala que pugui satisfer els requisits de l'estàndard OAIS.

7.2 Mètodes d'arxiu digital a petita escala

7.2.1 Finançament i coneixements tècnics

7.2.2.1 És factible construir un sistema digital de preservació a baix cost, sempre que es disposi d'un mínim nivell de coneixements tècnics i alguns recursos ordinaris, encara que siguin de baix nivell. Amb independència de la seva simplicitat o robustesa, el sistema s’ha de gestionar i mantenir, i caldrà substituir-lo en un moment donat o quan hi hagi risc de pèrdua de continguts.

7.2.1.2 «La preservació digital és tant un problema econòmic com tècnic. Els requisits de contínua sostenibilitat exigeixen en essència una font de finançament fiable, necessària per a garantir el suport continuat —encara que sigui de baix nivell— al contingut digital i al manteniment dels necessaris repositoris, tecnologies i sistemes associats, pel temps que sigui necessari. Aquest finançament constant no és pas habitual dins de les comunitats que construeixen aquestes col·leccions digitals, sinó que sol basar-se en subvencions episòdiques. Per això és tan necessari el desenvolupament de models de cost sostenible per a materials digitals segons els requisits dels diversos tipus de contingut, accés i sostenibilitat». (Bradley, 2004)

7.2.1.3 El manteniment i gestió del sistema i els seus components de maquinari i programari és inevitable i indefugible. Requereix que s’hi dediquin coneixements tècnics i finançament. Qualsevol proposta de construcció i gestió d'un arxiu d'objectes d'àudio digital s'ha d'acompanyar d'una estratègia que inclogui estratègies de finançament del manteniment i la substitució de components, així com una llista dels riscos associats amb la pèrdua de coneixements tècnics i la manera d'abordar-los.
 

7.2.2 Estratègies alternatives

7.2.2.1 En cas de no poder assumir adequadament els riscos descrits en la secció anterior, l'arxiu pot buscar el suport de tercers en aquest aspecte per poder continuar amb la preservació i la digitalització de la seva col·lecció. L'arxiu pot optar per la dispersió del risc mitjançant una sèrie d'iniciatives, establint, per exemple, col·laboracions locals per a distribuir els seus fons entre una sèrie de col·leccions afins, habilitant acords amb un arxiu estable i financerament capaç, o contractant un proveïdor comercial de serveis d’emmagatzematge (vegeu la secció 6.1.6 Planificació a llarg termini).

7.2.2.2 Per a aprofitar efectivament els avantatges de les alternatives esmentades seran necessaris acords precisos sobre quines dades i continguts seran intercanviats entre els signants i com es realitzarà l'intercanvi. Caldrà establir l’acord raonablement abans que la necessitat de fer-ho esdevingui urgent. En l'apartat d'intercanvi de paquets hi haurà de constar tota la informació rellevant necessària per a continuar la tasca arxivística desenvolupada per un arxiu. Això inclourà les dades que constitueixen l'objecte propi d'àudio en la seva forma d'arxiu, les metadades tècniques, descriptives, estructurals i sobre drets, així com les de procedència de l'enregistrament i l'historial de canvis. Les dades hauran de ser empaquetades d'una manera estandarditzada de manera que permetin recrear la informació d'arxiu en cas de pèrdua, o bé la represa de la gestió del contingut per part d’un tercer fitxer si es considera necessari.

7.2.2.3 La creació d'aquests perfils es fa possible mitjançant l'ús d'eines com METS (Metadata Encoding and Transmission Standard), un estàndard de codificació i transmissió de metadades àmpliament utilitzat en l'entorn bibliotecari. Qualssevol que siguin les estratègies utilitzades, l'acord sobre els aspectes formals és crític. Sigui com a base per a una replicació remota de continguts, sigui per a facilitar la federació d'arxius cooperants, un acord estandarditzat en els aspectes de forma i intercanvi d'informació és l'estratègia de preservació més efectiva possible, ja que escampa i redueix el risc d'errors deguts a desastres naturals o humans o a la manca de recursos en un moment crític del cicle de vida d'un objecte d'àudio digital.

7.3 Descripció del sistema

7.3.1.1 En la secció 6.1.4 Aspectes pràctics de les estratègies de protecció de dades es debat la necessitat d'abordar les categories funcionals definides en el model de referència del sistema OAIS (OAIS, ISO 14721:2003). Aquest marc de referència és crític en el desenvolupament de sistemes d'emmagatzematge digital amb intercanvi interoperable de contingut, de manera que s'ha d'aplicar de la mateixa manera per a col·leccions tant de grans dimensions com menors. La següent secció, enfocada a sistemes a petita escala, adopta el principals components funcionals del model de referència OAIS com a guia en l'anàlisi de les solucions de programari disponibles i en la proposta de recomanacions per a un necessari desenvolupament. Aquests components són l’ingrés, l’accés, l’administració, la gestió de dades, la planificació de la preservació i l’emmagatzematge en arxiu.

7.3.1.2 El sistema descrit es basa en algun tipus de programari de repositori per a la gestió del contingut, almenys un conjunt mínim de metadades, a més de maquinari, i finalment algunes recomanacions sobre opcions manuals de gestió de la integritat de les dades. La secció de maquinari descriu dues situacions en les quals implementar sistemes d'emmagatzematge a petita escala: la primera, quan un sol operari digitalitza contingut a través d'un sol dispositiu d'emmagatzematge; la segona, quan més d'un operador ha d‘accedir al sistema d'emmagatzematge. Qualsevol de les dues opcions assumeix el compliment de tots els punts esmentats en aquest document, incloent-hi la disponibilitat de conversors A/D, targetes de so, estacions digitals de treball (DAWs) i equips de reproducció d'acord amb especificacions.

7.3.1.3 La informació que segueix descriu sistemes i programari que permetin a una institució o col·lecció exercir autònomament el conjunt de tasques necessàries per a la gestió de fons de petita dimensió. Convé subratllar que les opcions que es descriuen a continuació no han de ser dutes a terme per una institució en solitari. Poden buscar aliats i proveïdors comercials que puguin ajudar en alguna o totes les tasques que es descriuen. És igualment important recordar que la suma de totes aquestes tasques conformen el paquet complet de preservació i arxiu (PAI/AIP) i algú les ha de dura a terme ja sigui mitjançant una gestió local o distribuïda.
 
7.3.2 Programari de repositori

7.3.2.1 Un programari de repositori ben dissenyat inclourà un cert nombre de les funcions identificades a OAIS. Hi ha tant proveïdors comercials de programari com de codi obert. L'avantatge del programari comercial és que s'espera del proveïdor el compromís de fer funcionar el sistema. Cal esperar, però, contínues despeses i el perill de quedar encasellat en un sistema propietari, dependent del fabricant, del qual és difícil escapar. Els principals avantatges del programari de codi obert són la gratuïtat i que els desenvolupadors adopten estàndards i marcs oberts que permeten l'extracció o migració de contingut en el cas d'actualitzacions futures. El seu desavantatge és que, malgrat disposar de l'ajut de les comunitats de codi obert, la responsabilitat final del manteniment recau en l'usuari. No obstant això, es poden trobar proveïdors comercials que ofereixin assistència tècnica sobre solucions de codi obert.

7.3.2.2 La majoria d'aquests sistemes de programari per a repositoris permetran les tasques identificades en l'accés, l'administració, la gestió de dades i certs aspectes de l’ingrés. En el moment de l'escriptura d'aquest document, els programaris habituals no acostumen a tenir en compte la planificació de la preservació i l'emmagatzematge en arxiu. La primera, perquè sovint és molt tecnològica o específica d'un format, i el segon per la seva dependència del maquinari associat. Aquestes dues tasques es discuteixen a part en les seccions següents.

7.3.2.3 Es descriuen aquí breument dues solucions de programari de codi obert. Cal recordar que el programari està en constant desenvolupament, i les al·legacions i observacions formulades a continuació hauran de ser confrontades amb els darrers desenvolupaments dels proveïdors de programari. Les solucions descrites són DSpace i FEDORA.

7.3.2.4 La plataforma DSpace és un repositori molt popular àmpliament adoptat en els àmbits de la recerca i l'educació superior. El seu coneixement i ús entre museus i sectors del patrimoni cultural és encara limitat, tot i que creixent. Una de les raons de la popularitat de DSpace és que és relativament fàcil d’instal·lar i mantenir, i que té una interfície d'usuari ja configurada, que integra les funcions de gestió de dades i accés dins de l'arquitectura del sistema. DSpace gaudeix d'una important comunitat internacional de desenvolupament que aporta assistència i afegeix constantment noves característiques.

7.3.2.5 Un dels punts forts de DSpace és seu conjunt de funcions integrades, que permet als usuaris institucionals la ràpida posada en marxa del repositori, començar a afegir nous ítems a la col·lecció. No obstant això, aquesta fortalesa és també una de les seves debilitats, ja que ha convertit DSpace en una aplicació de programari monolítica, amb codi base complex, que introdueix potencials limitacions d’escalabilitat i capacitat per a repositoris institucionals de grans dimensions. Això no comporta grans problemes per col·leccions petites o mitjanes i probablement no és inconvenient per a la col·lecció d'àudio digital. DSpace utilitza actualment una versió de l'esquema Dublin Core basada en el Dublin Core Libraries Working Group Application Profile (LAP).

7.3.2.6 FEDORA (Flexible Extensible Digital Object and Repository Architecture o arquitectura de repositori flexible i extensible per a objectes digitals) és un sistema de repositori de popularitat creixent dissenyat com a arquitectura de programari base sobre la qual es pot construir una ampli ventall de serveis de repositori, inclosos els serveis de preservació. En comparació amb la ràpida adopció de DSpace, FEDORA ha anat guanyant adeptes de manera més gradual perquè no disposa d'una interfície dedicada d'usuari i un servei d'accés immediat (o en la seva expressió anglesa, out-of-the-box). Hi ha un bon nombre de proveïdors, tant en l'àmbit comercial com de codi obert, que ofereixen interfícies basades en entorn web per a FEDORA.

7.3.2.7 Els principals actius de FEDORA són la seva flexibilitat i arquitectura escalable. L'experiència recollida d'institucions que han adoptat FEDORA confirmen la seva escalabilitat i capacitat amb grans col·leccions, a més de la seva flexibilitat per emmagatzemar múltiples tipus d'ítems digitals juntament amb les seves complexes interrelacions. Hi ha poques limitacions a les característiques que pot assumir FEDORA, al mateix temps que manté la interoperabilitat amb altres aplicacions de programari i sistemes. Pot configurar-se per a acceptar pràcticament qualsevol dels perfils de metadades, a través de les capacitats d'ingrés que METS ofereix. El principal escull de FEDORA és l'alt nivell d'experiència en enginyeria de programari necessari per a contribuir al seu desenvolupament de base, a més a més de no oferir una instal·lació i implementació immediates, out-of-the-box (Bradley, Lei and Blackall, 2007).
 
7.3.2.8 S'han desenvolupat eines per a la migració de continguts des de DSpace a FEDORA i viceversa que en teoria garanteixen la compatibilitat i permeten la compartició de dades i fluxos de treball (vegeu http://www.apsr.edu.au/currentprojects/index.htm).1

 


1 Recentment DSpace i FEDORA han unit esforços amb la creació de DURASPACE, http://www.duraspace.org. (n. dels t.)

7.4 Metadades bàsiques

7.4.1.1 El capítol 3, sobre les metadades, perfila els requisits per a la documentació i gestió d'una col·lecció. Com s'ha dit, les metadades són fonamentals en tots els aspectes del cicle de vida d'un objecte d'àudio digital. La descripció estricta de tots els aspectes de la col·lecció és un dels passos més importants per a la seva preservació. El registre detallat de metadades referents a tots els aspectes tècnics, de procés, descriptius i de procedència és part vital del procés de preservació. Sovint apareixen, però, imperatius tècnics en la preservació del material sonor que inevitablement cal prioritzar per sobre del desenvolupament de les polítiques de gestió de metadades. Les següents recomanacions bàsiques en són només el primer pas. Pretenen ajudar en la creació d'una col·lecció de metadades que serveixi per a gestionar el fitxer, o en la captura de metadades a partir de les dades per a evitar la seva pèrdua.

7.4.1.1.1 Identificador únic. Hauria de ser estructurat, significatiu i llegible per humans, així com únic. Un identificador amb significat pot ser útil per a referir-se a objectes com: fitxers de preservació o màster, còpies de distribució, registres de metadades, sèries, etc., Que els sistemes sofisticats gestionen amb metadades.

7.4.1.1.2 Descripció. Descripció de la seqüència de so. Una petita quantitat de text per a identificar simplement el contingut sonor del fitxer.

7.4.1.1.3 Dades tècniques. Format, freqüència de mostreig, nombre de bits per mostra, mida del fitxer. Encara que aquesta informació es pugui adquirir més tard, el fet d’explicitar-la en el registre de metadades permet la planificació de la gestió i la preservació de la col·lecció.

7.4. 1.1.4 Historial de codificació. El format BWF permet arxivar, en una sèrie de línies de text, informació descriptiva sobre el document original i el procés i la tecnologia emprats en la creació del fitxer digital arxivat.

7.4.1.1.5 Errors de procés. Qualsevol error que el sistema de transferència pugui detectar en el procés de transferència de dades (per exemple, errors no corregibles en transferències de dades via DAT o CD).

7.4.1.2 La informació descrita en els apartats de Identificador únic, Descripció i Dades tècniques es pot emmagatzemar en registres Dublin Core o a la capçalera d'un fitxer BWF. L'historial de codificació i els errors de procés es poden guardar en el fragment BExT (BeXT chunk) de la capçalera de BWF o bé en documents associats codificats en XML. Cal guardar la data i, si s'escau, l'hora del procés de transferència a la capçalera del fitxer BWF. La data i, si cal, l'hora d'ingrés en el repositori es guardaran en l'entitat de gestió de metadades del repositori. En certes circumstàncies, la informació conjunta de data i hora (de l'anglès timestamp) relaciona els components d'un enregistrament multipista entre si, per la qual cosa resulta d'obligada col·lecció. En general, es recomana incloure la informació de data i hora associada amb tot esdeveniment o objecte digital.

7.5 Planificació de la preservació

7.5.1.1 Com ja s'ha dit, la planificació de la preservació es refereix a la preparació necessària per a garantir que l'objecte d'àudio digital romangui accessible a llarg termini, encara que l'entorn informàtic d'emmagatzematge i accés esdevingui obsolet. Per a una col·lecció de petites dimensions, interessada únicament en la preservació dels seus objectes d'àudio digital, aquesta tasca és relativament directa i senzilla. Les metadades capturades més amunt argumenten les decisions a prendre sobre preservació en establir clarament les relacions entre l'original i la còpia de preservació emmagatzemada al repositori digital. La informació tècnica ofereix assistència en la planificació. L'elecció de BWF com a estàndard de preservació respon a la voluntat d'assegurar el màxim termini de temps possible abans que resulti inevitable una nova migració de format. Queda en mans dels gestors i conservadors de la col·lecció mantenir-se al dia sobre els canvis i desenvolupaments esdevinguts en el domini dels arxius digitals, a través del contacte amb associacions com ara la IASA.

7.6 Emmagatzematge d'arxiu

7.6.1.1 Tècnicament parlant, el sistema d’emmagatzematge d'arxius es situa per sota del repositori i incorpora un conjunt de subprocessos com ara l'elecció del mitjà d'emmagatzematge, la transferència del paquet d'arxiu d'informació (PAI/AIP) al sistema de l'emmagatzematge, la seguretat i la validació de les dades, així com la restauració i la còpia de seguretat, i finalment la reproducció o migració del paquet PAI/AIP sobre un nou mitjà.

7.6.1.2 Els principis bàsics de l'emmagatzematge d'arxiu es poden resumir en els punts següents:

7.6.1.2.1 Cal que hi hagi múltiples còpies. El sistema ha de ser capaç d'acollir un cert nombre de duplicats d'un mateix document.

7.6.1.2.2 Les còpies s’haurien d’ubicar en posicions remotes del sistema principal o original, i també entre elles mateixes. Com més gran és la distància física entre còpies, més gran la seguretat en cas de desastre.

7.6.1.2.3 Hi haurien d’haver còpies en diferents tipus de suport. Si totes les còpies estan un mateix tipus de suport, com ara un disc dur, el risc que un únic mecanisme d'error les destrueixi totes és gran.

7.6.1.3 La major part del cost d'un sistema d'emmagatzematge de dades no se l’endu el maquinari en si mateix, sinó el sistema de gestió emmagatzematge jeràrquic (Hierarchical Storage Management System, HSM). Les funcions d’emmagatzematge d’arxiu en OAIS inclouen la noció d’HSM com a part del model conceptual. Quan es va definir l'estàndard OAIS no es concebia encara la possibilitat de gestionar còmodament grans quantitats de dades de cap altra manera. La qüestió pràctica que sosté l'opció HSM consisteix en la diferència de cost entre diferents mitjans d'emmagatzematge, és a dir, la premissa per la qual l'emmagatzematge sobre disc dur resulta més car que sobre cinta. HSM ofereix en aquest cas un magatzem virtual d'informació unificat, encara que en la realitat les còpies de dades puguin estar escampades a través d'un bon nombre de tipus de suport diferents en funció de l'ús i les velocitats d'accés.

7.6.1.4 No obstant això, el cost del disc dur ha disminuït a un ritme més gran que el de la cinta, fins al punt de resultar equivalents en preu. Conseqüentment, l'ús d’HSM passa a ser una opció d'implementació. Sota aquestes circumstàncies, un sistema d'emmagatzematge que contingui totes les seves dades en un conjunt de discs, al mateix temps que una còpia completa en un conjunt de cintes, resultarà un opció molt assequible especialment per a col·leccions d'àudio digital petites o mitjanes. Per aquest tipus de casos un HSM completament funcional resultarà innecessari. En lloc d’això es poden preveure sistemes molt més senzills que administrin i mantinguin informació sobre la localització de les còpies i l'edat i versió dels mitjans fungibles (Bradley, Lei i Blackall, 2007).

7.7 Disposicions pràctiques de maquinari

7.7.1.1 La informació que segueix descriu maneres d'implementar un sistema a la pràctica. Com ja s'ha comentat anteriorment, es suposarà que totes les dades de l'arxiu sonor s'emmagatzemen sobre discs durs, dades que al seu torn tindran una rèplica sobre un format de cinta tipus LTO.
 

7.7.2 Unitats de disc dur

7.7.2.1 Una opció comuna i assequible per a l'emmagatzematge de dades sobre disc es basa en la connexió d'un clúster de discs durs organitzats en RAID (vegeu la secció 6.3.14 Discs durs). El RAID de nivell 1 és poc més que dos discs replicats, que Així mantenim dues còpies de les dades en dos dispositius físics diferents: si un dels discs falla, les dades continuaran disponibles en l'altre. Els RAID de més alt nivell (nivells 2 a 5) implementen sistemes progressivament més complexos de redundància de dades i control de paritat que garanteixen el manteniment de la integritat de les dades. Aquests nivells més alts de RAID aconsegueixen el mateix nivell de seguretat que el nivell 1 (RAID 1) o rèplica, amb una quantitat d'espai de disc significativament més baixa. Comparat amb el 50 % de pèrdua d'espai útil en RAID 1, el nivell RAID 5 pot arribar, per exemple, al 25 % (o menys, en funció de la implementació). Els conjunts de discs més sofisticats estan àmpliament disponibles.

7.7.3 Còpia de seguretat sobre cinta

7.7.3.1 No hi ha cap component d'un sistema digital que pugui ser considerat fiable. La fiabilitat d'un sistema només s'aconsegueix mitjançant la creació de múltiples còpies redundants en cada fase. El component final i més important en la cadena d'emmagatzematge és la cinta de dades. En els darrers temps, el format LTO ha guanyat popularitat per a aquest propòsit (vegeu la secció 6.3.12 Selecció i monitoratge del mitjà de cinta de dades). Hi ha, però, altres formats de cinta de dades que poden ser apropiats segons les circumstàncies particulars. 

7.7.3.2 Totes les dades emmagatzemades en discs durs s’haurien de duplicar en cintes d'emmagatzematge adequades. Caldria produir un mínim de dos conjunts de còpies sobre cinta per a poder-les emmagatzemar en ubicacions físicament diferents. Ja que el fet d'utilitzar el segon conjunt de cintes per a la restauració de dades no és tan inusual, molts arxius ben establerts mantenen tres conjunts de còpies, dues d'elles situades a prop del sistema a fi de facilitar-ne l'accés, i una tercera emmagatzemada en una ubicació remota per a protegir-se de desastres físics. Ha esdevingut habitual produir tres conjunts separats de cintes de dades utilitzant diferents productes, dels quals s'adquireix, en una sola compra, un lot considerable. Aquesta pràctica facilita les mesures de control de qualitat i rescat, una vegada un lot d'un cert producte comença a fallar. Un programari de gestió de volums (lots) ajudarà en el procés de còpies de seguretat i recuperació de dades, especialment si el sistema incorpora un bon nombre de dispositius d'emmagatzematge.

7.7.3.3 En entorns de codi obert o solucions de baixa tecnologia és difícil implementar un control d'errors, donada la dependència del procés amb el maquinari específic. Malgrat això, a continuació es descriu una possible alternativa per al control d'errors en entorns tecnològicament poc sofisticats. Suposem que el programari de gestió de dades disposa d'un catàleg (amb una impressora connectada). El disc dur, en configuració RAID, conté un conjunt complet de les dades. A més, hi ha dues còpies completes d'aquest conjunt sobre cintes. Disposem, doncs, almenys de dues còpies. En el procés de còpia de la informació en una cinta, s'ha d'imprimir un identificador únic (llegible per humans), sobre una etiqueta. Aquesta etiqueta s'enganxa al cartutx o casset de cinta. El mateix identificador únic s'enregistra també a la capçalera de dades de la cinta. Es programa el sistema de gestió de dades per recordar a l'usuari que busqui (manualment) i insereixi una certa cinta identificada pel sistema. Més que revisar la cinta a la recerca d'errors, el que farà el sistema és verificar el contingut de la cinta contrastant-lo amb el mateix contingut emmagatzemat en disc. El sistema en disc dur pot verificar la informació dels seus propis continguts de dades i és conscient dels seus propis errors. Si la verificació de la cinta falla, el sistema podrà produir una nova còpia en cinta a partir del disc dur. Suposant uns 20 terabytes d'emmagatzematge i un procés de verificació de dues cintes al dia, el sistema seria capaç de verificar cada cinta i el seu duplicat a raó de tres vegades per any. En el cas d'una fallada en el disc dur que requerís les cintes per al reemplaçament, es disposaria de dues cintes revisades en els darrers quatre mesos. El risc que tant les dues còpies en cinta com el disc dur fallessin simultàniament és molt baix.

7.7.4 Sistema d'emmagatzematge amb un (o doble) operador

7.7.4.1 El sistema d'emmagatzematge d'arxiu més simple consistiria a connectar un conjunt de discs en RAID, amb contingut exclusiu de dades, a l'estació d'àudio digital (DAW) principal. Aquesta configuració només és adequada per a institucions amb un únic operador en el procés de digitalització. Per a l'èxit d'aquest enfocament és primordial dotar-se d'un pla de digitalització ben estructurat i una matriu de discs durs dedicada a dur a terme la tasca sense interrupcions. Això garantirà que els disc dur connectat a l'estació d'àudio digital faci còpia a cinta sempre que la quantitat de dades arribi a omplir el suport de destinació.

7.7.4.2 Si les tasques de digitalització estan en mans de dos operadors mitjançant dues estacions de treball, caldrà facilitar l'accés a una o més unitats de disc compartides. La compartició dels recursos es pot aconseguir definint un dels dos ordinadors com a servidor, configurant-lo com a gestor de discs i connectant-lo al segon amb un sol cable de xarxa per permetre l'accés compartit. Aquesta opció s'implementa de manera relativament senzilla i permet als dos operadors compartir la cabina de discs, tot i que demana certs acords de procediment per a evitar conflictes. Per a sistemes d'emmagatzematge manual a petita escala caldrà en tot cas una organització de les dades lògica i procediments estrictes de nomenclatura.

7.7.4.3 En funció de les dimensions del sistema, pot resultar més eficaç establir una associació amb una institució d'arxiu més consolidada o fins i tot contractar un proveïdor extern d'emmagatzematge. En qualsevol cas, l'opció descrita més amunt és viable.

7.7.5 Sistema d'emmagatzematge amb múltiples operadors

7.7.5.1 Per a qualsevol nombre de connexions superior a la unitat, resultarà imprescindible implementar un sistema en xarxa per a l'emmagatzematge de dades i còpies de seguretat. Els sistemes en xarxa permeten l'accés a múltiples usuaris d'acord amb les normes establertes pel sistema de gestió de dades. Les xarxes de petites dimensions són relativament habituals i, amb el nivell adequat de coneixements, d'implementació fàcil i assequible. Amb un dispositiu annex d'emmagatzematge per a empreses pot aconseguir-se un espai de magatzem raonable. Els productes i tecnologies d'emmagatzematge poden classificar-se en tres tipus: Direct-Attached Storage (DAS) o emmagatzematge directament annexat, Network-Attached Storage (NAS) o emmagatzematge connectat a xarxa, i finalment, xarxa d’emmagatzematge (Storage Area Network,SAN). La tecnologia NAS ofereix millor rendiment i escalabilitat que la DAS i resulta alhora més assequible i simple de configurar que la SAN. Per això la NAS es considera, des del punt de vista del cost/benefici, la tecnologia escalable més apropiada per a sistemes d’aquesta mida.

7.7.5.2 La majoria dels sistemes NAS de baix cost pateixen d'un ample de banda reduït en comparació amb sistemes més cars, fet que implica temps d'accés més alts (són més lents) o un menor nombre d'accessos permesos simultàniament. Això no comporta grans conseqüències per a col·leccions petites, ja que els requisits d'accés simultani es mantenen baixos, especialment si s'opta pel format MP3 per a còpies d'accés derivades dels màsters de preservació.

7.7.5.3 Un sistema típic d'emmagatzematge en xarxa a petita escala pot comptar amb poc més que un ordinador de sobretaula de tipus servidor connectat a un dispositiu NAS. El dispositiu NAS serà capaç d'allotjar múltiples discs en un conjunt en RAID. Un sistema NAS estàndard de baix cost acollirà entre 0,5 i 20 terabytes d'emmagatzematge en disc (cal recordar que, a causa de la configuració en RAID, l'emmagatzematge útil serà menor que el que indica la capacitat teòrica dels discs). Les estacions de treball d'àudio digital (DAW) accediran al dispositiu NAS via un commutador d'Ethernet o un dispositiu similar que, configurat adequadament, podrà separar l'emmagatzematge de dades d'àudio del flux de dades propi de la xarxa d’àrea local (Local Area Network, LAN).

7.8 Riscos

7.8.1.1 Els sistemes d'emmagatzematge automatitzats es poden configurar per a copiar i refrescar dades de manera constant, descartant les cintes de dades que resultin poc fiables. Els sistemes d'emmagatzematge digital massiu (Digital Mass Storage Systems) es dissenyen de manera professional i estan en mans d'organitzacions amb ampli pressupost que poden permetre i garantir les mesures necessàries per a la seguretat de les seves dades. Atès que aquí parlem de processos manuals de còpia de seguretat i recuperació de dades, no es poden menystenir els riscos de pèrdues de dades associades amb sistemes de disseny propi i administració manual o semiautomàtica. La responsabilitat d'assegurar que l'arxiu de dades d'àudio roman vàlid i accessible recau sobre l'individu i requereix la revisió periòdica de les cintes de dades. Aquesta situació s'agreuja especialment pel fet que moltes institucions culturals i de recerca es troben, de forma notòria, insuficientment finançades.

7.8.1.2 Encara que pugui semblar que els sistemes descrits incorporen un alt nivell de redundància, cal no oblidar que els dispositius i suports digitals poden fallar en qualsevol moment i sense previ avís. Per això cal disposar, en qualsevol estadi del procés de digitalització i emmagatzematge, de com a mínim dues còpies de seguretat del fitxer lineal arxivat. Qualsevol petit error conduirà inevitablement a la pèrdua d'una major o menor quantitat de dades. No obstant això, si s'han posat en marxa les estratègies adequades, el resultat no serà fatal gràcies a les còpies redundants disponibles. En vista del temps de procés de transferència, , per no parlar de les inevitables pèrdues ocasionades per suports vells, s’han de fer tots els esforços per evitar tornar a digitalitzar els materials per causes derivades d'una arquitectura de seguretat inconsistent o d’una conducta negligent en les accions concretes.
 

7.8.2 Complexitat del sistema

7.8.2.1 Un cop implementats i instal·lats, els sistemes d'emmagatzematge de dades són relativament fàcils d'operar i mantenir. No obstant això, es recomana l'assistència tècnica d'especialistes en TIC en els estadis inicials d'implementació i subsegüents incidències o processos d'actualització per a minimitzar el risc derivat d'una instal·lació deficient.

7.8.3 Associacions i còpies de seguretat

7.8.3.1 Com ja s'ha comentat, l'aliança o associació amb una institució de referència a nivell d’arxiu digital que pugui facilitar la còpia de seguretat de les dades resultarà un gran actiu en la gestió de riscos. Una xarxa de repositoris que pugui crear i acceptar paquets organitzats d'informació potencia l'estratègia de preservació, ja que escampa i redueix el risc d'errors deguts a desastres naturals o humans o la manca de recursos en un moment crític del cicle de vida d’un objecte d'àudio digital.

7.8.4 Cost i escalabilitat

7.8.4.1 El sistema a petita escala que s'acaba de comentar es pot considerar per a incrementar la capacitat d'emmagatzematge i gestió. Es troben disponibles unitats de cinta relativament petites capaces de manejar un cert nombre de cintes, i l'ús de sistemes robotitzats pot ajudar a expandir el sistema. Si els costos dels discs durs continuen caient, el cost de l'actualització i expansió de cabines de discs resulta assequible.

7.8.4.2 Les aliances entre subministradors comercials i proveïdors de l'àmbit del codi obert possibiliten la integració de sofisticats sistemes de programari de repositori en el marc segur d'un proveïdor de serveis comercial. DSpace i FEDORA, per exemple, han presentat ambdós un sistema de codi obert que opera amb una companyia comercial de solucions d'emmagatzematge.

7.8.4.3 El cost d'establir un sistema d'emmagatzematge de dades a petita escala pot semblar alt en comparació amb la compra d'un enregistrador de CD. No obstant això, la comparació a nivell de cost per bit de l'emmagatzematge de més d'uns quants centenars d'hores d'àudio revela, tenint en compte tots els costos associats a l'arxiu, diferències menors. A més, un sistema d'emmagatzematge de dades adequadament gestionat és en conjunt molt més fiable i permetrà la transferència de dades d'àudio sobre la següent tecnologia d'emmagatzematge, quan això inevitablement hagi de succeir.