L’infrastructure actuelle de Canadiana offre un accès en ligne fiable et public à plus de 65 millions de pages (150 To de données, et ce chiffre ne cesse de croître) d’informations historiques et culturelles canadiennes numérisées, datant du 16e siècle à nos jours. Cette infrastructure est toutefois désuète et ne met pas à profit les progrès réalisés dans le domaine des technologies numériques. Pour y remédier, le RCDR est en train de repenser et d’optimiser l’infrastructure de Canadiana, afin de renforcer l’accès à la mine de données contenues dans les collections de Canadiana et leur utilisation.
Comparaison entre l’infrastructure de Canadiana existante et l’infrastructure future
Fonctionnalités et capacités | Infrastructure existante | Infrastructure modernisée |
Accéder gratuitement aux contenus | oui | oui |
Lire les métadonnées en ligne | oui | oui |
Télécharger des PDF | partiellement | oui |
Télécharger du contenu en masse | partiellement | oui |
Visualiser des métadonnées fiables et respectueuses | partiellement | oui |
Télécharger des métadonnées | non | oui |
Apposer des avis ou des étiquettes relatifs au savoir traditionnel | non | oui |
Consulter des textes intégraux enrichis sémantiquement | non | oui |
Intégrer aux systèmes de calcul à haute performance (p. ex., Globus) | non | oui |
Gérer le contenu avec des contrôles d’accès précis | non | oui |
Interroger le corpus via l’API IIIF | non | oui |
Effectuer une recherche, lire ou télécharger un texte intégral | non | oui |
Effectuer des recherches intelligentes, y compris dans des documents non textuels | non | oui |
Objectifs de développement pour Canadiana
- Accès API au corpus de données sous-jacent de 65 millions d’images de contenu numérisé (150 To de données et en augmentation) pour faciliter l’accès par machine et la recherche à grande échelle.
- Intégration avec le service Globus pour faciliter les échanges de contenu avec les systèmes HPC et ARC soutenus par l’Alliance de recherche numérique et les centres de calcul régionaux au Canada.
Exemple de cas d’utilisation – Tai, un informaticien intéressé par l’utilisation de l’apprentissage automatique et du traitement du langage naturel pour découvrir des modèles coloniaux des premières décennies du Canada jusqu’à aujourd’hui, décide de travailler avec la base de données remodelée de Canadiana. Tai télécharge les données pertinentes dans son environnement HPC Alliance via l’intégration Canadiana-Globus. S’appuyant sur son expérience dans la formation de l’IA à l’annotation de documents en texte intégral, Tai peut ensuite affiner le texte intégral déjà annoté et fournir un contenu amélioré au RCDR, ce dont bénéficiera l’ensemble de la communauté.
Exemple de cas d’utilisation – Nidal est chercheur en sciences humaines numériques et étudie les premiers effets des changements climatiques au Canada. Il a besoin d’accéder aux données des magnétogrammes solaires du 19e et du milieu du 20e siècle contenues dans les collections de Canadiana. Grâce aux métadonnées robustes de la collection modernisée de Canadiana, combinées à l’accès API et Globus au corpus de données, Nidal peut télécharger les données pertinentes et effectuer une analyse programmatique sur ces ensembles de données qui tient compte des changements dans les normes de mesure au fil du temps. Nidal est alors capable de déterminer des lignes de base historiques qui, combinées à des données climatiques récentes, peuvent contribuer à orienter les stratégies actuelles d’atténuation des changements climatiques.
- Une meilleure qualité du corpus de données
- Transcription : grâce à des techniques d’intelligence artificielle, les images de textes manuscrits et d’autres contenus difficiles à lire seront transcrites en texte intégral
- Enrichissement sémantique : en utilisant des techniques d’intelligence artificielle, le texte intégral sera enrichi par l’identification et l’étiquetage des noms propres, des zones géographiques, etc.
Exemple de cas d’utilisation – En sa qualité de professeur d’études culturelles étudiant l’histoire intellectuelle des Noirs au Canada, Cameron a besoin de solides capacités de recherche pour découvrir des détails historiques qui sont traditionnellement absents des métadonnées et des outils de recherche relatifs au passé du Canada. En utilisant les capacités de recherche intelligente de la plateforme reconstruite, Cameron peut interroger la collection de manière très nuancée, sauvegarder ses recherches et y revenir, et faire apparaître des informations jusqu’alors cachées. Grâce aux fonctions IIIF (International Image Interoperability Framework) de Canadiana, Cameron pourra ensuite créer une exposition numérique d’informations relatives à l’histoire intellectuelle des Noirs et relier ce contenu à d’autres archives et collections pertinentes.
- Amélioration de l’engagement et de la facilité d’utilisation du corpus
- Outils intégrés pour améliorer l’interaction avec le corpus de données
- Interopérabilité avec d’autres ensembles de données ouvertes, outils de sciences humaines numériques et dépôts
Exemple de cas d’utilisation : Dans le cadre de ses recherches en sciences humaines numériques sur la formation des mouvements sociaux au fil de divers discours gouvernementaux et contre ceux-ci, Rowan doit être en mesure de rassembler les informations des collections de Canadiana avec celles d’autres collections de recherche scientifique canadiennes. Grâce aux capacités de données liées de la nouvelle version de Canadiana, Rowan peut analyser les détails des mouvements sociaux et de la formation de l’identité sociale dans divers ensembles de données. Dans sa publication en libre accès présentant ses résultats, Rowan est également en mesure de tirer parti des capacités de données liées de la nouvelle version de Canadiana pour établir un lien avec les sources primaires citées dans son article.
- Capacité d’accès au contenu et de gestion de celui-ci
- Accès à la ligne de commande et à l’interface utilisateur graphique pour un plus grand nombre d’utilisateurs, afin de permettre aux établissements membres d’ajouter des collections de recherche à Canadiana
- Avis et étiquettes relatifs au savoir traditionnel pour appuyer les principes et les pratiques de souveraineté des données pour les Premières Nations, les Inuits et les Métis
Exemple de cas d’utilisation : Awena est membre d’une communauté des Premières Nations et cherche de la documentation historique sur les pratiques culturelles de sa Nation. Lorsqu’elle trouve dans Canadiana des documents relatifs à sa propre Nation, Awena collabore avec sa communauté afin d’identifier et d’établir des protocoles appropriés pour l’accès à ces documents. En utilisant la fonctionnalité d’autorisation de la nouvelle infrastructure de Canadiana, Awena applique les étiquettes et les protocoles définis par la communauté pour les documents.
Exemple de cas d’utilisation : Quinn est bibliothécaire, chargé des collections numériques historiques dans un établissement membre du RCDR. Celui-ci dispose d’une collection de journaux numérisés vieille de plus de 15 ans qui fonctionne sur une plateforme obsolète sans possibilité de migration, avec des métadonnées limitées et une mauvaise reconnaissance optique des caractères (ROC). En utilisant les nouveaux outils de gestion de l’API/de la collection, avec l’approbation du personnel du RCDR, Quinn peut facilement téléverser la collection dans Canadiana. La collection fait désormais partie du corpus de Canadiana et bénéficie de nouvelles fonctionnalités d’infrastructure, de transcription améliorée alimentée par l’IA et de l’enrichissement des métadonnées. Elle bénéficie également d’une préservation permanente et des protocoles d’accès API. La bibliothèque peut l’intégrer à ses systèmes de découverte et/ou à ses plateformes de collections numériques actuelles.
Le projet Infrastructure scientifique ouverte pour le Canad(ian)a : Collections numériques de l’avenir (DCoF)
Des changements climatiques aux inégalités socioéconomiques, les problèmes auxquels les Canadiens sont confrontés aujourd’hui prennent leur source dans notre histoire commune. Il se peut que les solutions potentielles à ces problèmes se trouvent aussi dans cette histoire, mais encore faut-il que les chercheurs puissent accéder aux forces qui ont façonné la vie canadienne contemporaine, les analyser et les mettre en évidence.
Pour appuyer la recherche novatrice qui sera rendue possible par l’infrastructure modernisée de Canadiana, le RCDR s’associe à ses membres dans le cadre d’une demande auprès du Fonds d’innovation de la Fondation canadienne pour l’innovation (FCI). Dirigé par l’Université d’Ottawa et Constance Crompton, titulaire de la Chaire de recherche du Canada en humanités numériques, ce projet de la FCI permettra d’effectuer des recherches de calibre mondial sur le passé du Canada afin de favoriser un meilleur avenir pour toute la population canadienne.