3.10 Fonts de metadades

3.10.1 Els arxius no haurien d'aspirar a crear tota l'estructura de metadades descriptives des de zero per ells mateixos (és a dir, a la manera d'abans). De fet, donat el cicle de vida inherent i entrellaçat entre recursos i metadades, aquesta idea és impracticable. Hi ha diverses fonts de metadades, especialment pel que fa a metadades descriptives, fet que ha de ser explotat per a abaratir costos i generar riquesa a través de la diversificació de les tipologies d'entrada. Hi ha tres principals fonts de metadades descriptives: professionals, contributives i intencionals (Dempsey, 2007), que poden ser desplegades en paral·lel.

3.10.2 Les fonts professionals fan referència a bases de dades històriques, fitxers d'autoritat i vocabularis controlats, formats tancats de gran valor pel que fa a materials publicats o replicats. Aquestes fonts, especialment catàlegs d'arxiu, són notòriament incompletes i incapaces d'interoperar sense l'ajut de sofisticats programes de conversió i complexos protocols. Hi ha en la indústria de la radiodifusió i l’enregistrament —en el sector audiovisual clàssic en general— gairebé tants estàndards en operació com bases de dades independents. La manca d'un identificador universal per al sector audiovisual, com és el codi ISBN per al sector editorial , és un impediment històric. Després de dècades de desenvolupament discogràfic encara no hi ha consens sobre què constitueix un catàleg d'enregistraments: és una pista o tema individual, o bé una seqüència de pistes el que configura una unitat intel·lectual, com ara una obra musical multiseccionada o un treball literari? És el conjunt de pistes en un portador únic o un conjunt de portadors? En altres paraules, és el suport físic la unitat de catalogació? Evidentment, una agència que hagi optat per una definició de major granularitat trobarà molt més senzilla i reeixida l'exportació de les seves metadades històriques cap a la seva nova infraestructura de metadades. Les exportacions amb redundància basades en Z39.50 (http://www.loc.gov/z3950/agency/, protocol per a l'obtenció categoritzada d'informació) i SRW/SRU (protocol per a la recerca i obtenció d'informació via URL estandarditzades, amb resposta estandarditzada en XML) continuaran aportant un cert grau d'èxit, com ho farà l'habilitat dels ordinadors per a recollir metadades a partir d'un recurs central. No obstant això, caldrà fer l'aposta per sistemes més efectius en el procés de la producció compartida de recursos capaços d'identificar i descriure noms, matèries, llocs, períodes de temps i obres.

3.10.3 Fonts contributives fan referència a contingut generat pels  usuaris. Un fenomen destacable en els darrers temps és l'emergència de molts  llocs a Internet que promouen la generació, agregació i extracció de metadades per part d'usuaris, en un procés el resultat del qual permet al seu torn establir recomanacions, preferències (rànquings) i relacions entre recursos. És el cas, per exemple, de YouTube i LastFM. Aquests llocs web aporten valor pel fet de revelar relacions entre les persones i entre les persones i els recursos, alhora que donen informació sobre els recursos mateixos. Les biblioteques ha començat ja a experimentar amb aquestes propostes i s'entreveuen avantatges palpables en el fet de permetre als usuaris finals incrementar les metadades de fonts professionals. L'anomenada Web 2.0, amb les seves característiques orientades a facilitar la contribució i sindicació de dades per part dels usuaris, està convertint aquestes pràctiques en habituals en els sistemes de gestió de continguts.

3.10.4 Les fonts intencionals fan referència a la recollida de dades a partir de l'ús reiterat dels recursos, amb la intenció de millorar-ne el descobriment. El concepte es manlleva del sector comercial: les recomanacions del portal Amazon, per exemple, basades en l'anàlisi de paràmetres agregats de les seleccions de compra. Es poden usar algorismes similars per a puntuar i classificar objectes en un recurs. Aquest tipus de dades són ja un factor clau per a l'èxit de certs llocs web i han obert el camí per a la gestió de quantitats ingents de dades d'informació complexa.