6.2 摄取

6.2.1 提交信息包 (SIP)

6.2.1.1 SIP 是交给仓储和数字存储系统进行摄取的信息包。 SIP 包括要 存储的音频数据以及关于对象及其内容的所有必需的相关元数 据。在 OAIS 模型中, 摄取是接受内容及其相关元数据(SIP)、 验证该文件、提取相关数据并准备AIP 进行存储、确保所有的 AIP 及其描述性信息在 OAIS 中得以建立的过程。

6.2.1.2 数字仓储和保存系统应该能够接收和验证音频文件。验证是确保 数字存储系统接收的文件符合标准的过程。在重放系统不复存在 的当下, 非标准的文件在未来可能会变得难以利用。有用于文件 格式自动验证的工具, 还可以得到一些开源解决方案并进一步开 发, 如 JHOVE (JSTOR 哈佛对象验证环境)。

6.2.2 格式

6.2.2.1 IASA 建议使用 .wav 或优选 BWF.wav 文件 [EBU tech 3285]。 两者之间的区别在于 BWF 包含一组可用于组织和管理元数据的 头文件。虽然 BWF 元数据足够用于多种目的, 但在一些复杂的 系统和交换情况下, 需要一个更全面的包, 因此, 常常使用元数 据编码和传输标准 (METS)。 METS 模式是对数字图书馆中各种 对象的描述性、管理性和结构性元数据进行编码的标准, 采用可 扩展标记语言 (XML) 表达。由元数据和内容组成的METS 包通 常用作数字档案馆之间的交换标准。

6.2.2.2 素材交换格式 (MXF) 是由 SMPTE 标准定义的一种专业数字 音视频媒体的容器文件格式。虽然MXF 能够管理音频, 但 MXF 主要应用于影视行业。像 METS 一样, 它主要是一组元 数据, 它“包裹” 内容(本指南指音频)。这两种格式都是 非常有用的格式, 用于档案部门和仓储之间内容与信息的交 换和管理。

6.2.2.3 SIP 的格式取决于系统以及机构的规模和复杂程度。很有可能使 用 .wav 文件建立可行的存档系统, 将大部分必要的元数据手工 输入系统, 并在摄取阶段获取必要的技术元数据。但这只适用于 馆藏规模很小的机构。对于具有远程和独立数字化过程且馆藏规 模大的机构, 则必须构建复杂的摄取和数据交换系统, 以确保内 容充分摄入数据存储系统。生产和验证软件将大部分数据生成为 可用于保存目的的标准化 XML 文件。例如, 新西兰国家图书馆 元数据提取工具是一种基于 Java 的工具, 它从数字对象中提取 保存元数据, 并以标准格式 (XML) 输出元数据。

6.2.3 保存元数据

6.2.3.1 在摄取阶段, 保存过程所需的元数据包括有关创建数字音频对象 的信息以及摄取之前发生的格式更改的信息。数字音频对象的技 术性来源以这种方式得以保存, 从而能够跟踪其当前形式与其形 成时的原始形式之间的变化。

6.2.3.2 BWF 有一个非强制性建议, 标题为“广播波形格式编码历史字 段格式” (http://www.ebu.ch/CMSimages/en/tec_text_r98-1999_tcm6-4709.pdf), 介绍了如何描述文件的变化。本地使 用 ASCII 自由文本字段允许描述在创建数字音频对象时使用的技 术设备或软件。