14. Metadados de preservação

Num sentido amplo, os metadados de preservação podem incluir qualquer informação contextual necessária para possibilitar acesso duradouro a conteúdos. Além das necessidades técnicas, isso pode incluir informações necessárias à autenticação de conteúdo, por exemplo. Nesse sentido amplo, os metadados de preservação devem conter detalhes completos sobre:

  • qualquer suporte físico de mídia não baseado em arquivo em que o conteúdo tenha sido mantido, inclusive sua condição
  • o equipamento de reprodução usado no processo de transferência e seus parâmetros
  • o equipamento de captura usado, inclusive o software de renderização conhecido
  • informações de formato do arquivo resultante, inclusive a resolução digital
  • os operadores envolvidos no processo
  • checksum – a assinatura digital que permite a autenticação do arquivo
  • detalhes de quaisquer fontes de informação secundárias.

Na prática, os metadados são em geral separados em categorias, inclusive metadados descritivos, estruturais, administrativos e de preservação. Metadados de preservação em sentido específico são obrigatórios para avaliar os parâmetros técnicos de um registro e para tirar conclusões adequadas para o gerenciamento de preservação. Um subconjunto de metadados de preservação, nomeadamente os metadados necessários para reproduzir fielmente as informações primárias, pode ser considerado parte indispensável de um documento audiovisual.

É muito recomendável que os metadados sejam escritos de acordo com os padrões estabelecidos, da maneira mais consistente possível. Escrever metadados em forma legível por máquinas (por exemplo, usando XML) tem a vantagem adicional de permitir a automação de certas ações de preservação e disseminação.

Comentários:

Metadados, muitas vezes descritos como “dados sobre dados”, são, no ambiente digital, uma extensão detalhada e específica da prática de catalogação. Contudo, quando associados a acervos digitais, são parte necessária de seu uso e controle. Um Conjunto de Metadados de Preservação (Preservation Metadata Set) é uma expressão das informações necessárias para administrar a preservação de acervos digitais. Os metadados de preservação serão um componente fundamental na preservação e administração de qualquer acervo digital e precisam ser estruturados para apoiar as futuras estratégias de preservação. Um componente vital dos metadados de preservação é o checksum ou resumo do arquivo, que é fundamental para o monitoramento da integridade dos dados e verificação de autenticidade. Como tal, pode ser comparado à impressão digital de um determinado arquivo.

A mais completa articulação de metadados de preservação é representado pelo PREMIS (http://www.loc.gov/standards/premis/), produto de um grupo de trabalho internacional ativo entre 2003 e 2005, e periodicamente atualizado e revisado pelos membros da comunidade de bibliotecas digitais. O PREMIS é estruturado em quatro categorias: o Objeto, o Evento, o Agente e os Direitos.

O Objeto diz respeito ao que é armazenado e administrado no repositório de preservação.

O Evento agrega informações sobre as ações que afetam objetos no repositório, vital para manter a origem digital de um objeto, o que, por sua vez, é importante para demonstrar a autenticidade do objeto.

Os Agentes são os atores que têm papel nos eventos e declarações de direitos. Podem ser pessoas, organizações ou programas aplicativos.

As questões relativas a direitos e outras restrições não surgem apenas quando se dá acesso ao conteúdo, mas também quando o preservamos, pois a maioria das estratégias de preservação envolve a produção de cópias idênticas ou versões derivadas dos objetos digitais, ações que podem ser limitadas pela lei de direitos autorais e outras restrições, por exemplo, as exigências impostas por doadores. Os metadados sobre direitos do PREMIS agregam informações sobre restrições que são diretamente relevantes para a preservação de itens do repositório.

Os metadados podem ser armazenados com o objeto que descrevem (por exemplo, em formatos de arquivo que admitem cabeçalhos descritivos ou contêineres de arquivos), separados do objeto (por exemplo, em um catálogo externo) ou separados mas vinculados ao objeto (por exemplo, um arquivo vinculado ao objeto digital numa estrutura de repositório). Cada estratégia tem benefícios e desvantagens específicas. É possível, e provavelmente desejável, usar essas estratégias em paralelo. O uso de contêineres padronizados aparece como uma tendência na preservação digital de materiais audiovisuais, devido a sua capacidade de lidar com relações entre arquivos. Os contêineres também admitem a possibilidade de reter todas as informações primárias de um arquivo dentro no objeto digital.