Réunir sans oblitérer : préserver la spécificité culturelle à l’ère de la recherche transversale
Le Réseau canadien d’information sur le patrimoine (RCIP) est responsable de l’agrégation de nombreuses données unilingues dont la plupart sont en anglais ou en français, mais dont certaines sont dans d’autres langues ou dialectes. Puisque la valeur d’une information repose non seulement sur son utilité, mais aussi sur sa contextualisation adéquate et sur l’interprétation juste des données qu’elle recèle, lesquelles sont profondément ancrées dans le langage, il est essentiel de recenser adéquatement ces aspects afin d’offrir une information exacte et fonctionnelle. Pour ce faire, le RCIP s’appuie sur les méthodologies des données ouvertes et liées (DOL) qui permettent, grâce à l’usage de thésauri dont les termes d’autorité deviennent des points d’ancrages, de lier entre elles des données auparavant disparates.
Alors que les termes et les concepts qu’ils représentent sont amalgamés par le processus d’agrégation, la distinction entre la manière dont le soumissionnaire de données utilise le terme et la manière dont le thésaurus le défini est obscurcie. Par conséquent, l’agrégation des données peut induire une mésinterprétation de celles-ci : cette perte de granularité entrave la contextualisation, la représentation, et la compréhension rigoureuses de données essentielles à la recherche, en particulier dans le cas de concepts issus de langues et de cultures non-dominantes.
Cette présentation examinera comment le RCIP propose de documenter la spécificité linguistique et culturelle grâce à l'annexion, en plus des étiquettes de langage, de trois attributs aux données-ancrages : la culture de référence, le cadre conceptuel et un exemple d’utilisation. Elle portera plus précisément sur la manière dont chacun de ces attributs peut être soit documenté à la source par le soumissionnaire, soit inféré par l’agrégateur depuis les données soumises depuis lesquelles cette information peut être extraite (langue, champ d’expertise du soumissionnaire ou de la base de données, entrée d’où est issue la donnée).
Cette documentation des cadres d’utilisation du soumissionnaire permet d’assurer un accès aux cadres d’autres soumissionnaires et sous-tend une co-documentation des concepts qui permet dès lors une information et un paysage de recherche plus granulaires, ainsi qu’une meilleure compréhension des concepts par les praticiens.