3.6 Diseño - Codificación y esquemas

3.6.1     De la misma manera que las señales de audio se codifican en un fichero WAV, cuya especificación es conocida, también deben codificarse las categorías de metadatos. Para esta tarea recomendamos el formato XML, quizá combinado con RDF. Esta especificación deberá constar en la primera línea de cualquier instancia de metadatos como <?xml version=”“1.0” encoding=“UTF-8” ?>. Esta línea aporta por sí misma poco valor informativo: es como si dijéramos a un hipotético usuario que el folleto del CD que está leyendo está hecho de papel y que hay que sujetarlo de cierta manera. Las líneas que siguen proporcionan ese valor (tanto para máquinas como para usuarios humanos, recordemos), sobre los patrones previsibles y la semántica de los datos que integran resto del fichero. El resto de la cabecera del fichero de metadatos consiste por regla general en una secuencia de dominios de identificadores (namespaces) para otros estándares y esquemas (a menudo conocidos como «esquemas de extensión») invocados por el diseño de metadatos.

<mets:mets xmlns:mets=“http://www.loc.gov/standards/mets/”
xmlns:xsi=“http://www.w3.org/2001/XMLSchema-instance”
xmlns:dc=“http://dublincore.org/documents/dces/”  
xmlns:xlink=“http://www.w3.org/TR/xlink”
xmlns:dcterms=“http://dublincore.org/documents/dcmi-terms/”
xmlns:dcmitype=“http://purl.org/dc/dcmitype”
xmlns:tel=“http://www.theeuropeanlibrary.org/metadatahandbook/telterms.html”
xmlns:mods=“http://www.loc.gov/mods”  
xmlns:cld=“http://www.ukoln.ac.uk/metadata/rslp/schema/”
xmlns:blap=“http://labs.bl.uk/metadata/blap/terms.html”
xmlns:marcrel=“http://www.loc.gov/loc.terms/relators/”
xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#type”
xmlns:blapsi=“http://sounds.bl.uk/blapsi.xml” xmlns:namespace-prefix=“blapsi”>

Figura 2: Conjunto de identificadores usados en el perfil METS de la British Library para registros sonoros

3.6.2     Estas especificaciones inteligentes se engloban en XML bajo el metalenguaje llamado esquema XML (XML schema),16 sucesor del metalenguaje DTD (Definition Type Document). Todavía es fácil hallar ejemplos de DTD dada la relativa simplicidad de su compilación. El esquema XML se define en un fichero propio con extensión* .xsd (XML Schema Definition) y deberá tener su propio dominio de identificadores (namespace) al cual puedan referirse las diferentes operaciones e implementaciones. Los esquemas requieren conocimiento experto para su compilación. Por fortuna existen herramientas de código abierto que permiten obtener automáticamente un esquema a partir de un documento XML bien estructurado. También existen herramientas que convierten ficheros XML en otros formatos habituales como .pdf o .rtf (Word). Por otro lado, el esquema también puede incorporar recursos idealizados para presentar los datos como un archivo XSLT. Los esquemas (y los dominios de identificadores) correspondientes a metadatos descriptivos se analizan con detalle en la sección 3.9, «Metadatos descriptivos — Perfiles de aplicación, Dublin Core (DC)».

3.6.3     Como resumen de todo lo anterior, podemos decir que un esquema XML o DTD describe una estructura XML que señala contenido textual en el formato propio de un fichero codificado en XML. El fichero (o instancia) contendrá uno o más dominios de nombres o identificadores que representarán el esquema extendido, responsable de ampliar posteriormente la estructura XML desarrollable.


16. Un esquema XML define la sintaxis de cualquier lenguaje basado en XML (n. de los t.).