Peut-on confier à l’ordinateur la tâche d’identifier des plans fonciers parmi un corpus de documents cartographiques variés ? C’est la question à laquelle des étudiant·es des masters Archives et Sciences de l’Information et des Bibliothèques de l’université d’Angers ont répondu, à l’issue d’un travail de cinq mois dans le cadre de leur formation à la gestion des corpus numériques, mené sous la direction d’Octave Julien (MCF Archives, Bibliothèques et IA à l’université d’Angers, laboratoire TEMOS).
Ils ont pour cela pu bénéficier des interventions de plusieurs spécialistes des disciplines dont relève le projet : David Rousseau et Félix Mercier (intelligence artificielle), Aurélie Peylhard (archivistique), Carmen Brando (géomatique).
Ils se sont ainsi familiarisés avec les méthodes de l’intelligence artificielle et ont assuré les différentes tâches que ces approches impliquent : constitution d’un corpus d’entrainement, définition de l’architecture et des paramètres d’un réseau de neurones convolutionnel, analyse et interprétation des résultats. Les étudiant·es ont aussi réalisé un audit des sites web des archives départementales pour mieux cerner la quantité de documents numérisés disponibles en ligne et évaluer leur accessibilité.
À partir d’un corpus de documents tirés des fonds des Archives nationales, et des archives départementales du Bas-Rhin et d’Ille-et-Villaine, ils ont entrainé un algorithme à identifier des plans fonciers parmi d’autres types de cartes (atlas, cartes de routes, plans d’aménagement, etc.). Les résultats préliminaires sont très encourageants : le taux de réussite obtenu pour cette tâche dépasse 90 %. Ces premières expérimentations ont aussi permis de mieux comprendre le fonctionnement des réseaux de neurones et les éléments du document qui guident son choix.
Ce travail a donné lieu à la rédaction d’une documentation qui a été remise à Benjamin Landais le 12 février, afin qu’elle puisse bénéficier aux futurs participants du projet PlaFonD.


