7.7 Disposiciones prácticas de hardware

7.7.1.1      La información que sigue describe maneras de implementar un sistema práctico. Como ya se ha comentado anteriormente, se supondrá que todos los datos del archivo sonoro se almacenarán sobre discos duros, datos que a su vez serán replicados sobre un formato de cinta tipo LTO.

7.7.2   Unidades de disco duro

7.7.2.1      Una opción común y asequible para el almacenamiento de datos sobre disco se basa en la conexión de un conjunto de discos duros organizados en RAID (ver la sección 6.3.14, «Introducción a los discos duros (HDD)»). El RAID de nivel 1 es poco más que información replicada entre dos discos, siendo uno la copia exacta o «espejo» del otro. Así mantenemos dos copias de los datos en dos hardwares físicos distintos: si un disco falla, los datos seguirán disponibles en el otro. Los RAID de más alto nivel (niveles 2 a 5) implementan sistemas progresivamente más complejos de redundancia de datos y control de paridad que garantizan el mantenimiento de la integridad de los datos. Estos niveles más altos de RAID logran el mismo nivel de seguridad que el nivel 1 (RAID 1) o nivel de espejo, con una cantidad de espacio de disco significativamente más baja. Comparado con el 50% de pérdida de espacio útil en RAID 1, el nivel RAID 5 puede llegar, por ejemplo, al 25% (o menos, en función de su implementación). Los conjuntos o baterías de discos más sofisticados se encuentran con facilidad.

7.7.3   Copia de seguridad sobre cinta

7.7.3.1      No existe ningún componente de un sistema digital que pueda ser considerado fiable. La fiabilidad de un sistema solo se consigue mediante la creación de múltiples copias redundantes en cada fase. El componente final y más importante en la cadena de almacenamiento es la cinta de datos. En los últimos tiempos, el formato LTO ha ganado popularidad para este propósito (ver la sección 6.3.12, «Selección y supervisión del medio de cinta de datos»). Existen sin embargo otros formatos de cinta de datos que pueden ser apropiados en función de las circunstancias particulares.
    
7.7.3.2      Todos los datos almacenados en discos duros deben disponer de duplicados en cintas de almacenamiento adecuadas. Deben producirse un mínimo de dos conjuntos de copias sobre cinta con el objetivo de almacenarlas en ubicaciones físicamente distintas. Puesto que el hecho de utilizar el segundo conjunto de cintas para la restauración de datos no es tan inusual, muchos archivos bien establecidos mantienen tres conjuntos de copias, dos de ellas situadas cerca del sistema a fin de facilitar el acceso, y una tercera almacenada en una ubicación remota para protegerse de desastres físicos. Se ha convertido en norma la producción de tres conjuntos separados de cintas de datos utilizando diferentes productos, de los cuales se adquiere, en una sola compra, un lote considerable. Esta práctica facilita las medidas de control de calidad y rescate, una vez un lote de un cierto producto empiece a fallar. Un adecuado software de gestión de volúmenes (lotes) ayudará en el proceso de copias de seguridad y recuperación de datos, especialmente si el sistema incorpora un buen número de dispositivos de almacenamiento.

7.7.3.3      En entornos de código abierto o soluciones de baja tecnología resulta difícil implementar un control de errores, puesto que esta capacidad está ligada a un hardware específico. A pesar de ello, a continuación se describe una posible alternativa para el control de errores en entornos tecnológicamente poco sofisticados. Supongamos que el software de gestión de datos dispone de un catálogo (con una impresora conectada a este). El disco duro, en configuración RAID, contiene un conjunto completo de los datos. Además, existen copias completas de este conjunto en cintas. Disponemos al menos de dos copias. En el proceso de copia a cinta deberá imprimirse un identificador único (legible por humanos), sobre una etiqueta. Esta etiqueta se pegará al cartucho o casete de cinta. El mismo identificador único se grabará también en la cabecera de datos de la cinta. Se programará el sistema de gestión de datos para recordar al usuario que busque e inserte una cierta cinta identificada por el sistema. Más que chequear la cinta en busca de errores, lo que hará el sistema es verificar el contenido de la cinta contrastándolo con el mismo contenido almacenado en disco. El sistema en disco duro puede verificar la información de sus propios contenidos de datos y es consciente de sus propios fallos. Si la verificación de la cinta falla, el sistema podrá producir una nueva copia en cinta a partir del disco duro. Suponiendo unos 20 terabytes de almacenamiento y un proceso de verificación de dos cintas al día, el sistema sería capaz de verificar cada cinta y su duplicado a razón de tres veces por año. En el caso de un fallo en el disco duro que requiriese de las cintas para el reemplazo, se dispondría de dos cintas chequeadas en los últimos cuatro meses. El riesgo de que tanto las dos copias en cinta como el disco duro fallaran simultáneamente es muy bajo.

7.7.4   Sistema de almacenamiento con un único (o doble) operador

7.7.4.1      El sistema de almacenamiento de archivo más simple consistiría en conectar un conjunto de discos en RAID, con contenido exclusivo de datos, a la estación de audio digital (DAW) principal. Esta configuración solo es adecuada para instituciones con un único operador en el proceso de digitalización. Para el éxito de este enfoque resulta primordial dotarse de un plan de digitalización bien estructurado y una serie dedicada de discos con la que llevar a cabo la tarea sin mayores interrupciones. Esto garantizará que los discos duros conectados a la estación de trabajo realicen copias continuas a cinta siempre que se alcance la cantidad de datos establecida como objetivo para el medio.

7.7.4.2      Si las tareas de digitalización están en manos de dos operadores mediante dos estaciones de trabajo, será necesario facilitar el acceso a una o más unidades de disco compartidas. Se pueden compartir recursos si se define uno de los ordenadores como servidor, configurándolo como gestor de discos y conectándolo al segundo mediante un solo cable de red para permitir el acceso común. Esta opción se implementa de forma relativamente sencilla y permite a los dos operadores compartir la cabina de discos, aunque requiere algunos acuerdos de procedimiento para evitar conflictos. Para sistemas de almacenamiento manual a pequeña escala se requiere en cualquier caso una organización lógica de los datos, así como procedimientos estrictos de denominación.

7.7.4.3      En función del tamaño del sistema puede resultar más eficaz establecer una asociación con una institución de archivo más consolidada, o hasta contratar un proveedor externo de almacenamiento. En cualquier caso, la opción descrita más arriba resulta viable.

7.7.5   Sistema de almacenamiento con múltiples operadores

7.7.5.1      Para cualquier número de conexiones superior a dos, resultará imprescindible implementar un sistema en red para el almacenamiento de datos y copias de seguridad. Los sistemas en red permiten el acceso a múltiples usuarios de acuerdo con las normas establecidas por el sistema de gestión de datos. Las redes de pequeñas dimensiones son relativamente comunes y, con el nivel adecuado de conocimientos, de implementación fácil y asequible. Con un dispositivo anexo de almacenamiento para empresas puede lograrse un espacio de almacén razonable. Los productos y tecnologías de almacenamiento pueden clasificarse en tres tipos: almacenamiento directamente anexado (Direct-Attached Storage, DAS), almacenamiento conectado a red (Network-Attached Storage, NAS), y finalmente red de área de almacenamiento (Storage Area Network, SAN). La tecnología NAS ofrece mejor rendimiento y escalabilidad que DAS y resulta a la vez más asequible y simple de configurar que SAN. Por eso NAS se considera, desde el punto de vista del coste/beneficio, la tecnología escalable más apropiada para los sistemas del tamaño que nos ocupa.

7.7.5.2      La mayoría de los sistemas NAS de bajo coste adolecen de un ancho de banda reducido en comparación con sistemas más caros, lo que depara tiempos de acceso más altos (más lentos) o un menor número de accesos permitidos simultáneamente. Esto no acarreará mayores problemas para colecciones pequeñas, pues los requisitos de acceso simultáneo se mantienen bajos, especialmente si se opta por el formato MP3 para copias de acceso derivadas de los masters de preservación.

7.7.5.3      Un sistema típico de almacenamiento en red a pequeña escala puede consistir en un ordenador de sobremesa de tipo servidor conectado a un dispositivo NAS. El dispositivo NAS será capaz de albergar múltiples discos en una batería RAID. Un sistema NAS estándar de bajo coste albergará entre 0,5 y 20 terabytes de almacenamiento en disco (debido a la configuración en RAID, el almacenamiento útil será menor que el que indica la capacidad de los discos sin formato). La estaciones de trabajo de audio digital (DAW) accederán al dispositivo NAS a través de un conmutador de Ethernet o un dispositivo similar que, configurado adecuadamente, podrá separar el almacenamiento de datos de audio del flujo de datos propio de la red de gestión de oficina (Local Area Network, LAN). Las copias de seguridad de los discos duros se harán sobre cinta de datos.