Le Réseau canadien de documentation pour la recherche (RCDR) ainsi que Bibliothèque et Archives Canada (BAC) se sont associés en vue de mener un projet pilote qui mettra à profit la reconnaissance intelligente de caractères (RIC) pour faciliter la recherche dans le matériel de la BAC de la collection Héritage. Un sous-ensemble de la collection RG 10, « Documents relatifs aux Affaires autochtones » sera ainsi traité à partir du logiciel de RIC Transkribus, développé par READ-COOP. Ce projet pilote facilitera la consultation d’une série de documents très utilisés et marquera le lancement de nos efforts à long terme pour rendre la recherche en texte intégral dans la collection Héritage à la disposition des utilisateurs.
La RIC utilise des modèles d’intelligence artificielle pour reconnaître les caractères de textes manuscrits numérisés autant que de textes imprimés. Conscient du besoin de faciliter la consultation de la collection Héritage, qui se compose à quelque 60 % de textes manuscrits, le personnel du RCDR a déterminé que le logiciel Transkribus constituait la meilleure option pour lancer ce projet pilote. Les premiers essais ont montré que ce logiciel était capable de transcrire un échantillon de textes manuscrits avec un taux d’erreurs de seulement 5 à 7 %, un résultat qui pourrait encore s’améliorer avec un apprentissage.
Ensemble, le RCDR et BAC ont choisi le sous-ensemble RG 10, « Documents relatifs aux Affaires autochtones », pour mener le projet pilote. Cette décision montre que nos deux organismes sont déterminés à faciliter la consultation des documents autochtones et tient aussi compte de l’utilisation fréquente de ce matériel, surtout de la part de chercheurs sur les revendications qui travaillent pour les communautés autochtones. Étant donné que la collection renferme des documents de nature sensible, le RCDR et BAC mèneront une évaluation du contenu transcrit afin de déterminer des conditions d’accès appropriées.
« Le RCDR a depuis longtemps comme objectif d’améliorer la découvrabilité des documents indispensables de la collection Héritage pour les chercheurs. Nous nous réjouissons d’amorcer le travail en ce sens avec BAC et READ-COOP, a déclaré Ken Hernden, président du Comité de préservation et d’accès ainsi que University Archivist and Associate University Librarian à Queen’s University. Ce projet pilote renforcera la fonctionnalité de la collection Héritage, mais en plus il nous permettra d’approfondir notre compréhension du matériel de la collection RG 10 et d’explorer des moyens de veiller à ce que ces documents soient accessibles aux chercheurs travaillant avec les communautés autochtones. »
« BAC travaille en faveur de la réconciliation et souhaite nouer des partenariats solides, diversifiés et permanents qui s’inscrivent dans sa Vision 2030 pour faire connaître nos collections et les rendre plus accessibles à un public élargi et diversifié. Cette collaboration novatrice avec le RCDR permettra de transcrire deux millions de pages manuscrites qui seront interrogeables à partir de mots-clés. Les chercheurs de partout au pays pourront dorénavant chercher “documents liés aux Affaires indiennes” dans la collection RG 10 », précise Johanna Smith, directrice générale, Diffusion et engagement, BAC.
Dans le cadre de ce projet, le RCDR est devenu membre de READ-COOP et profitera ainsi d’un tarif réduit sur le travail de RIC en plus d’appuyer le développement de la technologie de reconnaissance de textes manuscrits. À mesure que cette technologie évolue et que d’autres outils axés sur l’intelligence artificielle se développent, le RCDR pourra renforcer ses capacités, perfectionner la mécanique de la recherche pour les utilisateurs et assurer le soutien de son infrastructure.
Le RCDR tient à remercier son Comité de préservation et d’accès, les directions de recherche sur les revendications nationales et Maxime Gohier, professeur à l’Université du Québec à Rimouski, pour leur appui en vue du lancement de ce projet pilote. Le RCDR et BAC ont discuté de ce projet avec le Centre national pour la vérité et la réconciliation et se sont engagés à le tenir au courant des résultats. Le RCDR et BAC ont aussi échangé avec le Union of B.C. Indian Chiefs (UBIC) et comptent également communiquer avec d’autres groupes qui travaillent sur ces documents.
Pour tout savoir sur ce projet pilote de transcription avec le logiciel Transkribus, veuillez écrire à :
Francesca Brzezicki
Agente de mobilisation patrimoniale, RCDR
fbrzezicki@crkn.ca
Relations avec les médias
Bibliothèque et Archives Canada
819-994-4589
media@bac-lac.gc.ca