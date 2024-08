Les procès de crimes en tout genre et de chasse aux sorcières attisent toujours les curiosités. Les Archives de l’ancien Évêché de Bâle (AAEB) l’ont bien compris, d’autant que cette région historique (à cheval sur les cantons du Jura, de Berne et des deux Bâle) regorge particulièrement de ce genre de récits. Un travail colossal de numérisation va permettre la mise en ligne de quelque 160'000 pages de procès criminels et de sorcellerie compris entre 1461 et 1797, soit entre la fin du Moyen Âge et la Révolution française. « Cela en fait le plus corpus numérique au monde en langue française sur les périodes du 16e et 17e siècle », avance le président de la fondation des AAEB Arthur Bisseger.





Une transcription via l’IA puis corrigée par des paléographes

Pour que le grand public puisse lire et déchiffrer ces écritures cursives anciennes, en allemand comme en vieux français, un imposant travail de transcription, encore non achevé, a été nécessaire. « On a fait le pari dans ce projet d’utiliser l’intelligence artificielle et de développer nous-même des modèles qui permettent de faire la transcription automatique de ces documents du XVIe et XVIIe siècle. En langue française, il n’existait rien, on a donc été un peu des pionniers en la matière. On a surtout eu besoin de développer de la vérité de terrain, c’est-à-dire des données qui permettent d’entraîner ces modèles et les améliorer. Pour cela, on a besoin de paléographes, donc un humain qui apporte derrière des corrections », explique Élodie Paupe, cheffe du projet « Crimes et châtiments ». Certains documents n’ont actuellement subi qu’une « transcription automatique » via la plateforme de reconnaissance de texte et d’analyse d’images de documents historiques Transkribus, développée par l’université d’Innsbruck. D’autres bénéficient déjà d’une transcription corrigée, le reste du travail s’étalant jusqu’à 2026. « La quasi-totalité du corpus lié au thème de la chasse aux sorcières est actuellement déjà disponible, soit environ 5'000 pages », relève le conservateur des AAEB Jean-Claude Rebetez, par ailleurs historien et paléographe.