Transcrire les documents manuscrits à l'aide de l'intelligence artificielle
Année après année, depuis plus de vingt ans, BAnQ enrichit son offre numérique grâce à son programme de numérisation. La présente communication fait état d’un partenariat d’un grand potentiel pour faciliter l’accès au contenu des documents numérisés. Financé par le CRSH (volet Développement de partenariat) et conçu à l’Université du Québec à Rimouski, le projet de recherche « Nouvelle-France numérique » vise à vise à mieux documenter les mécanismes de la production documentaire et ses réseaux d’acteurs en Nouvelle-France. Ce projet table notamment sur la plateforme informatique Transkribus de la coopérative READ (Recognition and Enrichment of Archival Documents), qui utilise l’intelligence artificielle pour développer la reconnaissance automatique des écritures manuscrites. À partir de modèles préparés par des chercheurs ou des archivistes familiers avec les sources du Régime français, l’outil parvient à transcrire avec un taux d’efficacité croissant et déjà très élevé les documents soumis à son traitement. Au cours des deux prochaines années, BAnQ contribuera à ce partenariat en partageant les connaissances de son personnel sur les fonds et documents d'archives de la Nouvelle-France et en mettant à la disposition des chercheurs les sources à modéliser et à traiter par le logiciel de transcription. Produites dans un format standardisé et extensible (XML-TEI), les transcriptions pourront être réutilisées et enrichies dans le cadre de recherches futures. Elles seront également intégrées dans les outils de recherche de BAnQ, pour le bénéfice de ses utilisateurs.