10. Formatos digitais alvo e exatidão

Assim como em todas as formas de tecnologia digital, os esquemas de codificação digital estão sujeitos a um desenvolvimento contínuo. Portanto, a discussão sobre os formatos mais apropriados para a preservação também continuará a evoluir. Independentemente das opções disponíveis, contudo, vários princípios podem ser aplicados na escolha de formatos de destino.

  • Os formatos de arquivo digital oferecem maior segurança de dados e capacidade de monitoramento de integridade do que os suportes físicos que contêm fluxos de dados (como DAT, CD de áudio ou Betacam Digital).
  • Ao transferir conteúdos digitais baseados em suporte físico (por exemplo, formatos DAT ou cassete DV), o arquivo resultante deverá, quando se julgar apropriado, reter o esquema de codificação do fluxo original de dados. Quando isso não for apropriado, por exemplo, quando tiver sido usado um esquema de codificação proprietário e com perdas (veja a seção 11), deveria ser escolhido um esquema de codificação que preserve a integridade do original.
  • Um requisito essencial de qualquer formato digital de arquivo é que os esquemas de codificação usados com propósito de preservação sejam definidos abertamente e não sejam de propriedade de um número limitado de fabricantes.
  • Quando há pouco ou nenhum consenso da comunidade arquivística sobre a escolha do formato alvo para uma determinada finalidade, o arquivo deve escolher um formato com relação ao qual possa estar relativamente confiante de sua própria habilidade de manter de forma sustentável. Isso pode exigir a disponibilidade de recursos suficientes, inclusive conhecimento especializado, bem como o suporte amplo da indústria para o formato escolhido.
  • Um arquivo deve garantir que o formato alvo escolhido conserve a necessária combinação mínima de informações primárias e secundárias.

Comentários:

Geralmente, os registros matrizes de preservação são realizadas em um formato alvo que consiste em um arquivo único, no qual um contêiner carrega a informação primária de som ou de som e imagem, juntamente com informações secundárias como legendas, subtítulos, timecode e outros dados auxiliares. Em alguns casos, entretanto, as informações secundárias podem estar contidas no que algumas vezes chamamos de arquivos paralelos (sidecar). Essa abordagem não é incomum para legendas de tradução e de acessibilidade, e pode ser usada para materiais secundários, como rótulos de discos.

Para áudio, o formato Broadcast WAVE (BWF) tornou-se um padrão de fato. Este formato é oficialmente recomendado pelo Comitê Técnico (ver IASA-TC 04, 6. 1. 2. 1). Os arquivos Broadcast WAVE, como todos os arquivos WAVE, não podem exceder 4 GB de tamanho e são limitados a gravações mono ou estéreo de dois canais. Para maiores quantidades de dados de som e múltiplos canais de áudio, a União Europeia de Radiodifusão definiu o arquivo RF64 BWF com um tamanho máximo de aproximadamente 16 exabytes e com até 18 canais.

Para a digitalização de gravações analógicas originais de áudio, a IASA recomenda uma resolução digital mínima de 48 kHz de taxa de amostragem com comprimento de palavra de 24 bits, usando codificação LPCM (linear pulse code modulation). Em instituições de patrimônio/ memória, a resolução de 96 kHz / 24 bits foi amplamente adotada. Transferências melhores de partes acidentais de um documento sonoro (ver seção 8) tornarão possível, no futuro, a remoção mais fácil desses artefatos através de processamento de sinais digitais no momento de fazer cópias de acesso. Devido ao caráter intermitente das consoantes, as gravações de fala devem ser tratadas como gravações de música.

Quando as informações primárias de gravações sonoras de discos e cilindros são capturadas por técnicas de escaneamento óptico sem contato, os próprios dados de escaneamento podem ser o elemento principal no arquivo matriz de preservação, mais do que resultar em um fluxo de bits de áudio derivado convencional.

Em instituições de memória, os formatos alvo de matrizes de preservação de imagens em movimento ainda estão em fase inicial de implementação. Para vídeo, várias instituições têm usado uma variante do contêiner MXF padronizada pela SMPTE, com o sinal de imagem codificado como JPEG 2000 de compressão sem perdas. Ao mesmo tempo, outras instituições avançam com a codificação sem perdas em FFV1, transportando o sinal de imagem e trilhas sonoras correspondentes em contêineres como QuickTime, Matroska ou AVI.

O formato alvo mais frequente para a digitalização de filmes em instituições de memória é o DPX, padronizado pela SMPTE. Enquanto isso, alguns arquivos exploram abordagens que permitirão o transporte de sinais de som e imagem sincronizados no mesmo contêiner e/ou a capacidade de incorporar dados adicionais de tom e de cor. Estas explorações implicam na reformatação dos sinais de imagem (e trilhas sonoras) inicialmente capturados em DPX para formatos de matrizes de preservação como os escolhidos para vídeo, por exemplo, o JPEG 2000 sem perda em MXF ou FFV1 em QuickTime ou Matroska.

Em alguns casos, pode ser praticamente impossível migrar conteúdos audiovisuais. Isto pode se dever a alguma funcionalidade integral específica como a encontrada, por exemplo, nos videogames, ou ao uso da tecnologia de proteção contra cópias. O acesso futuro (e, portanto, a preservação) pode, portanto, depender da emulação dos sistemas operacionais originais e/ou softwares aplicativos.

Os arquivos podem incorporar materiais em formas de arquivo digital, cuja transcodificação para formatos arquivísticos pode resultar em alterações irreversíveis na representação do conteúdo. Em tais casos, a autenticidade e a perspectiva de melhores métodos de transcodificação no futuro devem ser consideradas. A instituição pode optar por manter o arquivo original (tal como foi incorporado), bem como uma versão transcodificada, considerada a melhor opção para a capacidade de reprodução de longo prazo, ou simplesmente transcodificar, manter as novas cópias e apagar as originais. A última opção pode ser aplicada particularmente em casos “limite”, como clipes de vídeo que foram reunidos como parte de um projeto de coleta na web.

A muito longo prazo, a migração posterior de qualquer formato parece inevitável. Portanto, sempre que possível, um arquivo deve buscar assegurar que a migração futura de qualquer formato alvo escolhido preserve essa informação.