3.10 Sources de métadonnées

3.10.1  Les services d'archivage ne doivent pas s'attendre à créer elles même  toutes les métadonnées descriptives en partant de zéro (l'ancienne manière). Etant donnée l’imbrication des ressources et  des métadonnées tout au long de leur vie, une telle notion est en fait inopérante.  Pour réduire les coûts et apporter un enrichissement par l'extension des entrées, plusieurs sources de métadonnées sont à considérer, notamment  la catégorie des métadonnées descriptives. On compte trois sources principales : professionnelle, contributive et intentionnelle : elles peuvent être déployées parallèlement.      

3.10.2  Les sources professionnelles, cela signifie qu'elles sont élaborées sur la valeur intangible des bases de données légales, des fichiers d'autorité et des vocabulaires contrôlés valables pour les matériels publiés ou dupliqués. Les bases de données industrielles tout autant que les catalogues d'archives sont concernés. De telles sources, en particulier les catalogues d'archives, sont notoirement incomplets et incapables d'interopérations sans la mise en œuvre de programmes de conversion sophistiqués et de protocoles complexes. Il y a presque autant de standards de données opérationnels dans les industries d'enregistrement et de radiodiffusion ou dans le domaine du patrimoine audiovisuel qu'il y a de bases de données séparées. Le manque de solution universelle pour l'AV, telle que l'ISBN pour l'imprimé, est un obstacle permanent et après des décennies d'efforts en matière discographique, il reste encore des divergences sur ce qui constitue une notice de catalogage : une piste individuelle ou une séquence de pistes réalise-t-elle une unité intellectuelle telle qu'une œuvre musicale constituée de multiples sections ou une œuvre littéraire ? Est-ce-la somme totale des pistes d'un simple support ou d'un ensemble de supports ? En d'autres termes, le support physique est-il l'unité de catalogage ? Manifestement, un organisme qui choisit une définition de plus grande granularité trouvera qu'il est plus facile de réussir l'export de ses données légales dans une infrastructure de métadonnées. Les approches "ceinture et bretelles" de l'export des données tirées de Z39.50 (http://www.loc.gov/z3950/agency/protocol for information retrieval) et SRW/SU (un protocole de recherche et de récupération via les URL standards avec réponse XML standard) permettent d'atteindre un certain niveau de réussite, de même que la capacité des ordinateurs à moissonner les métadonnées à partir des ressources centralisées. Cependant, il faudrait investir de manière plus efficace dans la production partagée des ressources d’identification et de description des noms, des sujets, des emplacements, des périodes et les œuvres.

3.10.3  Par sources contributives il faut comprendre les contenus générés par les utilisateurs. Ces dernières années, un phénomène important s'est manifesté par l'émergence de nombreux sites qui sollicitent, regroupent et exploitent les données contributives des utilisateurs, et qui mobilisent ces données pour classer, recommander et commenter les ressources. Ceci inclus, par exemple, YouTube et LastFM. Ces sites ont une certaine utilité en ce qu'ils révèlent les relations entre personnes, entre personnes et ressources et entre les informations portant sur les ressources elles-mêmes. Les bibliothèques ont commencé à expérimenter ces approches ;  il y a de vrais avantages à tirer par le fait que les utilisateurs peuvent accroître le nombre de métadonnées en provenance de sources professionnelles. Les caractéristiques du soi-disant Web 2.0 qui supporte les contributions et les syndications des utilisateurs, sont devenues de banals systèmes de gestion de contenus disponibles.

3.10.4  Intentionnelle signifie que les données collectées sur des utilisations et des usages peuvent améliorer la découverte des ressources. Le concept est emprunté au secteur commercial comme les recommandations d'Amazon,  basées sur des choix d'achats groupés. Des algorithmes similaires peuvent être utilisés pour classer des objets dans une ressource. Ce type de données est apparu comme un facteur central des sites web à succès, procurant des chemins utiles à travers des volumes intidimidantes d'informations complexes.