3.6 Projet – Codage et schémas

3.6.1 De manière analogue aux signaux audio codés en fichier WAV, dont les spécifications sont décrites et publiées, il est nécessaire de coder le jeu d'éléments : en langage XML, peut-être en combinaison avec RDF, selon la recommandation énoncée ci-dessus. Cette spécification sera précisée dans la première ligne de chaque instance de métadonnée <?xml version="1.0"encoding="UTE-8"?>. Ainsi, acquiert-il par lui-même de l'intelligence : c'est un peu comme dire à des auditeurs que la page du livret du CD qu'ils sont en train de lire est en papier et qu'elle doit être préservée d'une certaine manière. Les étapes suivantes produisent de l'intelligence (souvenons-nous, pour les machines tout autant que pour les personnes) à propos des schémas prévisibles et de la sémantique des données rencontrés dans les fichiers restants. Le reste des en-têtes de fichiers des métadonnées consiste typiquement en une séquence d'espaces de noms (namespaces) attribuée à d'autres normes et schémas (habituellement désignés comme "schéma d'extension") lors de la conception du projet.

<mets:mets xmlns:mets="http://www.loc.gov/standards/mets/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:dc="http://dublincore.org/documents/dces/"
xmlns:xlink="http://www.w3.org/TR/xlink"
xmlns:dcterms="http://dublincore.org/documents/dcmi-terms/"
xmlns:dcmitype="http://purl.org/dc/dcmitype"
xmlns:tel="http://www.theeuropeanlibrary.org/metadatahandbook/telterms.html"
xmlns:mods="http://www.loc.gov/mods"
xmlns:cld="http://www.ukoln.ac.uk/metadata/rslp/schema/"
xmlns:blap="http://labs.bl.uk/metada/blap/terms.html"
xmlns:marcrel="http://www.loc.gov/loc.terms/relators/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#type"
xmlns:blapsi="http://sound.bl.uk/blapsi.xml"xmlsn:namespace-prefix="blapsi">

Fig. 2 : Ensemble des espaces de noms (namespaces) utilisés dans les profils METS de la British Library pour les enregistrements sonores

3.6.2 De telles spécifications intelligentes, en XML, sont appelées schémas XML qui succèdent aux DTDs. Les DTDs sont encore couramment utilisées considérant la relative facilité de leur compilation. Le schéma demeurera dans un fichier avec l'extension .xsd (XML Schema Definition), il possèdera son propre namespace auquel d'autres opérations et implémentations pourront se référer. Pour être compilés, les schémas nécessitent de l'expertise. Heureusement, les outils open source sont disponibles, qui permettent à un système informatique de déduire un schéma d'un fichier XML bien fait. Des outils sont également disponibles pour effectuer la conversion XML en d'autres formats, tel que .pdf ou bien des documents .rtf (Word) en XML. Le schéma peut aussi incorporer des moyens idéalisés pour afficher les données selon des fichiers XLST. Les schémas (et les namespaces) de métadonnées descriptives seront détaillés au paragraphe 3.9 Métadonnées de description - Profils d'application, Dublin Core (DC) ci-dessous.

3.6.3  Pour résumer les relations  présentées ci-dessus, un schéma XML ou DTD décrit une structure XML qui balise le contenu textuel au format d'un fichier codé XML. Le fichier (ou instance) contiendra un ou plusieurs namespaces représentant le schéma étendu de meilleure qualité que la structure XML pourrait déployer.