3.9 Metadades descriptives. Perfils d'aplicació, Dublin Core (DC)

3.9.1 Històricament, la major part dels esforços dedicats pel sector de l’arxivística a les metadades han estat destinats a les metadades descriptives, com una branca natural de la catalogació tradicional. No obstant això, sembla clar que dedicar massa atenció a aquesta àrea (desenvolupant, per exemple, etiquetes descriptives i vocabularis controlats fins a un nivell de refinament molt localitzat) a costa d'altres consideracions ja descrites més amunt pot provocar limitacions o defectes del sistema en conjunt. La figura 4 ens mostra les variades interdependències que s'han d'establir, on les metadades descriptives representen només una de les subcategories entre tots els elements en joc.

  

TCA fig 3.8.2

Fig 4: Metadades descriptives simples (cortesia de Dempsey, CLIR/DLF primer, 2005)

3.9.2 La interoperabilitat ha de ser un component clau en qualsevol estratègia de metadades. Qualsevol sistema elaborat de forma independent per un equip propi per a ser un repositori d'arxiu és la recepta perfecta per a una baixa productivitat, alt cost i mínim impacte. El resultat serà una reserva particular de metadades incapaç d'estendre's. El domini de les metadades descriptives és sens dubte un exemple clàssic de la màxima de Richard P. Gabriel «el que és pitjor, és millor». Gabriel va predir correctament que, entre dos llenguatges de programació, un d’elegant però complex i l'altre de maldestre però simple, el segon es propagaria a més velocitat i, en conseqüència, un major nombre d'usuaris s'interessaria per millorar aspectes d'aquest segon llenguatge en detriment del primer. Un exemple d'això el constitueix la ràpida i satisfactòria adopció de Dublin Core (DC), inicialment considerat una opció improbable per part dels professionals a causa de la seva rigorosa simplicitat.

 
3.9.3 La missió de la DCMI (Dublin Core Metadata Initiative) ha estat facilitar la troballa de recursos a través d'Internet gràcies al desenvolupament d'estàndards de metadades que permetin la descoberta entre diferents dominis de coneixement, i amb aquest objectiu defineix marcs per a la interoperabilitat de categories de metadades i facilita el desenvolupament de metadades específiques per a una comunitat o una disciplina concreta. Per això s'ha proposat un vocabulari de només quinze elements amb els quals descriure un recurs, elements pensats per a cobrir amb economia de mitjans les tres categories de metadades. Cap d'aquests elements no és obligatori. Tots ells són repetibles, encara que qui ho implementi pugui aportar les seves pròpies especificacions en perfils d'aplicació (vegeu el punt 3.9.8). El nom de Dublin es deu a l'origen del vocabulari, proposat en el primer taller organitzat a la ciutat de Dublin, Ohio (Estats Units) l'any 1995. El terme Core, traduïble com a centre o nucli, respon al fet que els seus elements són genèrics i d'ampli abast, utilitzables per a descriure un ample ventall de recursos. L'ús de DC ha gaudit d'un ampli suport durant més d'una dècada i els seus quinze elements descriptors han estat formalment avalats en els següents estàndards: ISO Standard 15836-2003 de febrer de 2003 [ISO15836 http://dublincore.org/documents/dces/#ISO15836 ] NISO Standard Z39.85-2007, de maig de 2007 [NISOZ3985, http://dublincore.org/documents/dces/#NISOZ3985 ], i IETF RFC 5013, d'agost de 2007 [RFC5013 http://dublincore.org/documents/dces/#RFC5013 ].

La taula 1 (a sota) llista els quinze elements de DC amb les seves definicions oficials abreujades i possibles interpretacions en un context audiovisual.

Element DC Definició Interpretació audiovisual
Títol Nom donat a un recurs Títol principal associat a l'enregistrament
Matèries i Paraules clau Tema (topic) del recurs Principals temes tractats
Descripció Informe sobre el recurs Notes explicatives, sumari d'entrevistes, descripcions de contextos culturals o de l'entorn, llistat de continguts
Creador Entitat responsable principal de la creació del recurs Nom del creador del fitxer, no pas autors o compositors de les obres enregistrades
Editor Entitat responsable de fer el recurs accessible No es tracta de l'editor del document original que s'ha digitalitzat. Normalment l'editor és el mateix que el creador
Contribuïdor Entitat responsable de fer contribucions al recurs Qualsevol nom de persona o font de so. S'ha qualificar amb el  paper que hi té (per exemple, intèrpret, executant, tècnic de so)
Data Data concreta o període de temps associat amb un esdeveniment en el cicle de vida d'un recurs No pas la data d'enregistrament del document, sinó una data associada al recurs en qüestió
Tipus Naturalesa o gènere del recurs Domini del recurs, però no pas el seu gènere musical. Per exemple, "so", però no "jazz"
Format Format del fitxer, mitjà físic o dimensions del recurs descrit Format del fitxer digital, no pas el suport o continent físic original
Identificador del recurs Referència unívoca a un recurs en un context donat Possiblement l'identificador universal de recurs o IUR12 del fitxer de so
Font Recurs relacionat del qual es deriva el recurs descrit Referència a un recurs del qual es deriva el recurs descrit
Llengua Llengua del recurs Llengua del recurs
Relació Recurs relacionat Referència a objectes relacionats
Cobertura El tema espacial o temporal del recurs, la possible aplicació espacial del recurs o la jurisdicció sota la qual el recurs és rellevant Allò que l’enregistrament exemplifica, sigui una característica cultural, com per exemple un dialecte, o cançons tradicionals
Drets Informació sobre els drets de i sobre el recurs Informació sobre els drets de i sobre el recurs

 Taula 1: DC de 15 elements

 

3.9.4 Els elements de Dublin Core han estat expandits per a abastar noves propietats. Aquestes propietats es coneixen com a termes DC. Un cert nombre d'aquests elements o termes addicionals són útils per a la descripció de mitjans basats en la reproducció temporal:

 

Element DC Definició Interpretació audiovisual
Alternatiu Qualsevol tipus de títol emprat com a substitut o alternativa al títol formal del recurs. Subtítol Títol alternatiu; per exemple, traducció, pseudònim o ordenació alternativa dels elements del títol genèric
Extensió Grandària o durada del recurs Grandària i durada del fitxer
Extensió original Manifestació física o digital del recurs Grandària o durada dels enregistraments del recurs original
Espacial Característiques espacials del contingut intel·lectual del recurs Ubicació de l'enregistrament, incloent-hi coordenades topogràfiques per a interfícies de mapes
Temporal Característiques temporals del contingut intel·lectual del recurs Ocasió en què es va realitzar l'enregistrament
Creat Data de creació del recurs Data d'enregistrament o qualsevol altra data significativa en el cicle de vida d'un enregistrament

Taula 2: Selecció de termes DC rellevants

 

3.9.5 Els implementadors de DC poden escollir entre els quinze elements de la seva variant original, dc:variant (com per exemple en http://purl.org/dc/elements/1.1/creator) o bé entre els termes de la variant estesa, dctermes: variant (per exemple en http://purl.org/dc/terms/creator) en funció dels requisits d'aplicació. Amb el temps s'espera —i el DCMI ho fomenta— un ús estès dels termes semànticament més precisos dctermes:propietats, més encara si el marc RDF esdevé part de l'estratègia de metadades. Aquests termes faciliten el processament automatitzat de metadades.

3.9.6 Fins i tot en la seva forma expandida, el DC pot ser que no tingui la granularitat requerida per a un arxiu especialitzat en contingut audiovisual. L'element contribuent, per exemple, haurà d'explicitar el paper exercit en el procés concret d’enregistrament per a evitar, donat el cas, l'habitual confusió entre intèrprets i compositors, o entre actors i dramaturgs.

<dcterms:contribuïdor>
<marcrel:CMP>Beethoven,Ludwig van,1770-1827</marcrel:CMP>
<marcrel:INT>Quartet Pascal</marcrel:INT>
</dcterms:contribuïdor>
<dcterms:contribuïdor>
<marcrel:ORA>Greer,Germaine,1939-(dona)</ marcrel:ORA>
<marcrel:ORA>McCulloch,Joseph,1908-1990(home)</ marcrel:ORA>
</dcterms: contribuïdor>

El primer exemple etiqueta "Beethoven" com el compositor (CMP) i el "Quartet Pascal" com l'intèrpret (INT). El segon exemple etiqueta tots dos contribuents, Greer i McCulloch, com a oradors o conferenciants (ORA) encara que no aporta prou granularitat per a determinar quin és l'entrevistador i quin l'entrevistat. Aquesta informació detallada s'hauria d'especificar en algun altre camp de metadades (element DC) com ara la descripció o el títol.

3.9.7 En aquest aspecte podrien preferir-se altres esquemes, incloure’ls com una extensió addicional d'esquema (tal com s'ha vist a la figura 2). Per exemple, MODS (Metadata Object Description Esquema o esquema de descripció d'objectes de metadades, http://www.loc.gov/standards/mods/) permet més granularitat en els noms i la seva vinculació amb fitxers d'autoritat, reflex de la seva derivació de l'estàndard MARC:

name

 

Subelements:

namePart

   Attribute: type (date, family, given, termsOfAddress)

 displayForm

affiliation

role

   roleTerm

       Attributes: type (code, text); authority

       (vegeu: http://www.loc.gov/standards/sourcelist/)

   description

 

Attributes: ID; xlink; lang; xml:lang; script; transliteration 

type (enumerated: personal, corporate, conference)

authority (vegeu: http://www.loc.gov/standards/sourcelist/)

3.9.8 En el marc de METS és admissible la inclusió de més d'un conjunt de metadades descriptives en funció del compliment de diferents propòsits. Tindríem, per exemple, el DC (per al compliment del protocol OAI-MPH) a més de MODS —un conjunt de metadades més sofisticat— per al compliment d'altres iniciatives i en particular per a l'intercanvi de registres amb sistemes codificats en MARC. L'habilitat d'incorporar diferents estàndards és un dels punts forts de METS.

3.9.9 Sota el control del DCMI, Dublin Core Metadata Initiative, es segueix desenvolupant el DC D'una banda, la seva capacitat per a entrellaçar recursos es veu reforçada mitjançant la seva interrelació amb eines semàntiques en xarxa com són RDF (vegeu Nilsson et al, DCMI 2008). D'altra banda, l'associació formal des de 2009 amb RDA (Resource Description & Access http://www.collectionscanada.gc.ca/jsc/rda.html) incrementa la rellevància de DC en el sector de l’arxivística tradicional. Atès que RDA es considera el successor de AACR (Anglo-American Cataloguing Rules), aquest particular desenvolupament pot comportar implicacions estratègiques per als arxius audiovisuals que formen part de biblioteques nacionals i universitàries. També per als arxius de radiodifusió i televisió les iniciatives de DCMI tenen la seva repercussió. En el moment de la redacció d'aquest document, l’EBU (Unió europea de ràdio i televisió) completa el desenvolupament de l’EBU CORE Metadata Set, un nucli de metadades basat en —i compatible amb— l'estàndard Dublin Core.

3.9.10 Pot donar-se el cas que l'arxiu vulgui modificar (expandir, adaptar) el nucli d'elements de metadades. Aquests conjunts modificats, basats en un o més esquemes d'espais de noms ( com ara MODS i/o IEEE LOM així com també DC) es coneixen com a perfils d'aplicació. Tots els elements en un perfil d'aplicació s'obtenen de recursos externs com poden ser diferents esquemes d'espais de noms. Si els implementadors desitgen crear "nous" elements no categoritzats en cap altre esquema, com ara rols de contribuïdor no disponibles en el grup de ponents o relators de MARC (agents no humans com ara espècies, màquines, entorns) han de declarar llavors el seu propi esquema d'espai de nom i assumir la responsabilitat de mantenir-lo.

3.9.11 Els perfils d'aplicació inclouen una llista d'espais de nom juntament amb els seus localitzadors uniformes13 (preferiblement URL permanents, PURL). Aquests URL s'indiquen en cada instància o entrada de metadades. A aquests URL els segueixen una llista de cada element de dades juntament amb els seus possibles valors i tipus de contingut. Aquests valors es poden regular mitjançant regles internes o addicionals, vocabularis controlats com tesaurus o glossaris de, per exemple, noms i gèneres d'instruments, fitxers d'autoritat o noms i matèries personals. El perfil d'aplicació ha d'especificar també esquemes obligatoris per a elements particulars com dates (any-mes-dia) i coordenades geogràfiques. Aquestes representacions estandarditzades de localització i temps permetran mostrar informació sobre mapes i línies de temps en sistemes d'informació no textual.

Nom del terme Títol
URI (identificador uniforme del recurs) http://purl.org/dc/elements/1.1/title
Etiqueta Títol
Definit per http://dublincore.org/documents/dcmi-terms/
Definició de la font Nom atorgat al recurs
Definició a BLAP-S Títol o component d'una obra
Comentaris a BLAP-S Si no hi ha títol disponible, se’n construeix un que es derivi del recurs o proveïdor [no hi ha títol]. Se segueixen les pràctiques habituals de catalogació. Per a títols en altres idiomes s’utilitza el refinament alternatiu. Quan les dades es derivin del catàleg del BL Sound Archive, el títol equivaldrà a un dels següents camps de títol en el següent ordre jeràrquic: títol de l'obra (1), títol del document (2), títol de la col·lecció (3) , títol del producte (4), espècies originals (5), títol de difusió (6), títol curt (7), sèrie publicada (8), sèrie no publicada (9)
Tipus de terme Element
Afinaments  
Afinat per Alternatiu
Disposa d'esquema de codificació  
Obligació Obligatori
Ocurrència No repetible

 Figura 5. Part del perfil d'aplicació de la British Library per al so, BLAP-S

 

Espais de noms emprats en aquest perfil d'aplicació:

DCMI Metadata Terms http://dublincore.org/documents/dcmi-terms/
RDF http://www.w3.org/RDF/
MODS Elements http://www.loc.gov/standards/mods/
TEL terms http://www.theeuropeanlibrary.org/metadatahandbook/telterms.html
BL Terms http://labs.bl.uk/metadata/blap/terms.html
MARCREL http://id.loc.gov/vocabulary/relators.html

3.9.12 El perfil d'aplicació incorpora per tant elements d'un diccionari de dades (un fitxer que defineix l'organització bàsica d'una base de dades fins al nivell de camps individuals i tipus de camps) o fins i tot de diferents diccionaris de dades que poden ser mantinguts per un arxiu individual o compartits per una comunitat d'arxius. El diccionari de dades PREMIS (http://www.loc.gov/standards/PREMIS/v2/PREMIS-2-0.pdf, actualment en la seva versió 2), referit exclusivament a metadades de preservació, és un dels de més projecció. Els seus nombrosos elements es coneixen com a «unitats semàntiques». Les metadades de preservació aporten informació sobre la procedència, l’activitat de preservació i les característiques tècniques de les dades, així com ajuda en els processos de verificació de l'autenticitat de l'objecte digital. El Grup de Treball de PREMIS va editar el seu Diccionari de Dades per a metadades de preservació al juny de 2005 i recomana el seu ús en tots els repositoris de preservació  més enllà del tipus de material arxivat i les estratègies de preservació desenvolupades.

3.9.13 Gràcies a la definició de perfils d'aplicació i, cosa que és més important, a la seva declaració pública, els implementadors poden compartir informació sobre els seus esquemes per col·laborar en tasques universals com són la preservació a llarg termini.

 


12  De l'anglès URI, Universal Resource Identifier. (n. dels t.)

13  Més habitualment URL, de l'anglès Uniform Resource Locator. (n. dels t.)