3.3 基础架构

3. 3. 1  不需要“唱片分类学” 那样的元数据标准: 在某一特定领域的解 决方案将会是不可行的约束条件(限制)。现阶段需要一个可以和 其他领域共享核心组件的元数据基础架构, 每个核心组件都允许 适用于任何特定音视频档案工作的局部变量(如采取扩展模式的 形式)。以下是有助于定义结构和功能需求的一些基本特征。

3. 3. 1. 1 多功能性 (Versatility) 对于元数据而言, 系统必须能够从描述各种对象的各种来源中获 取、合并、索引、增强, 以及向用户呈现元数据信息。还必须能 够定义逻辑和物理结构, 其中逻辑结构表示知识实体, 例如馆藏 和作品, 而物理结构表示构成数字化对象来源的物理介质(或 载体)。系统不得与一个特定的元数据模式相关联(绑定): 必 须在不影响互操作性的前提下, 将元数据模式和适合档案特殊需 求的应用程序配置文件(见3. 9. 8) 混合使用。建立一个可以适 应这种多样性的系统是相关人员面临的挑战, 而且同时要求不会 对入门级用户产生不必要的复杂性, 也不会为那些需要更多操作 空间的人避免更复杂的活动。

3. 3. 1. 2 可扩展性 (Extensibility) 能够容纳广泛的对象、文件类型(如图像和文本文件) 和商业 实体(如用户认证、使用许可、获取策略等)。允许扩展、开发 和应用或(全部) 忽略, 而不会破坏整体, 换句话说, 适合实 验———实施元数据解决方案———仍然是不成熟的科学。

3. 3. 1. 3 可持续性 (Sustainability) 能够进行迁移, 在维护方面具有成本效益、可利用、可随时间相 关和相适应。

3. 3. 1. 4 模块化 (Modularity) 用于创建或获取、合并、索引、导出元数据的系统, 本质上应该 是模块化的, 以便可以用不同的组件替换执行特定功能的组件, 而不会破坏整体。

3. 3. 1. 5 粒度 (Granularity) 元数据必须具有足够的粒度来支持所有预期用途。元数据很容易 粒度不足, 但元数据粒度太细以致不能支持某个特定目的的情况 也极少见。

3. 3. 1. 6 流动性 (Liquidity) 一次写入, 多次使用。流动性将使数字对象和这些对象的表示随 着时间的推移而自我记录, 元数据将在许多网络空间中更加努力 地工作, 并为原始的时间和金钱的投资提供高回报。

3. 3. 1. 7 开放性 (Openness) 和透明度 (transparency) 支持与其他系统的互操作性。为了促进诸如可扩展性的要求, 所 引入的标准、协议和软件应尽可能公开和透明。

3. 3. 1. 8 关系(层次/ 序列/ 来源) 必须表达亲子关系, 正确排序———例如戏剧表演的场景———派生 关系。对于数字化项目, 可以支持原始载体及其信息内容文件的 准确映射和实例化。这有助于确保归档对象的真实性 (Tennant,2004)。

3. 3. 2  这种多样性的方法本身就是一种开放的形式。如果选择了一个开 放的万维网联盟 (W3C ) 标准, 如可扩展标记语言 (XML) ———这是一种已广泛采用的标记语言———那么这不会阻 止特定的实现方式包括诸如“媒体交换格式 (MXF)” 和微软  (Microsoft) 的高级制作格式 (AAF) 间的格式变换。

3. 3. 3  尽管MXF 是一个开放标准, 但实际上将元数据包含在MXF 中通 常会以其专有的方式进行。 MXF 对于广播行业更有优势, 因为 它可以以专业的流媒体形式传输内容, 而其他包装仅支持下载完 整的文件。使用MXF 打包内容和元数据只能在以开放元数据格 式替换以专有格式表示的元数据后再进行归档。

3. 3. 4  关于XML 的资料已经写了很多, 很容易将其视为灵丹妙药。 XML 本身不是一个解决方案, 而是一种关于内容如何组织和 重复使用的方式, 其巨大的功能通过与一系列相关工具和技 术的结合而得到广泛的应用, 这些工具和技术是为了经济上 的重复使用和再利用而继续开发数据。因此, XML 已经成为 表示互联网上描述资源的元数据的事实标准。由于开发了许 多开源的和商业的XML 编辑工具 (见3. 6. 2), 可将XML 的 十年发展与现在的处理手段相匹配。

3. 3. 5  尽管本章对本指南中使用的特定元数据格式进行了介绍, 或 者将来也可能会有更有用的特定元数据格式, 但这并不意味 它们都是规范性的。通过回顾3. 3. 1 中的关键因素, 并维护 清晰、充分、分散的所有技术细节的记录, 数据创建和政策 变更, 包括日期和责任, 未来迁移和翻译, 都不需要对基础 架构进行实质性的更改。一个健壮的元数据基础架构应该能 够通过创建或应用特定于该格式的工具来适应新的元数据格 式, 例如采用元数据转换 (crosswalks) 或以有效和准确的方 式将元数据从一个编码方案转换到另一个编码方案的算法来 适应新的元数据格式。已经存在许多种元数据转换格式, 如 MARC, MODS, MPEG - 7 路径, SMPTE 和都柏林核心元数 据 (Dublin Core) 格式, 等等。除了使用元数据转换将元数 据从一种格式移动到另一种格式之外, 它们还可以将两个或 多个不同的元数据格式合并到第三个或一组可搜索的索引中。 给定适当的容器/ 传输格式 (如 METS), 实际上可以容纳诸 如 MARC-XML, Dublin Core, MODS, SMPTE 之类的元数据 格式。此外, 这种开放的基础架构将使档案馆能够部分或全 部地从其遗留系统中吸收目录著录, 同时基于它们提供新的 服务, 例如使可用的元数据收割———参见开放档案元数据收 割协议 (OAI - PMH)


① 信息粒度(granularity of information) 有粗细之分。

② 开放档案元数据收割协议(Open Archives Initiative Protocol for Metadata Harvesting, 简称“OAI 协议”) 是一种独立于应用的、能够提高Web 上资源共享范围和能力的互操作协议标准。