pen icon Colloque
quote

Utilisation d'une grammaire formelle pour la préparation d'une base de données historiques

AC

Membre a labase

André Cloutier

Résumé du colloque

Cette communication a pour but de montrer comment une méthode relevant de la théorie des langages formels a été utilisée avec succès pour la préparation d'une base de données sur les registres fiscaux de La taille de Paris, de la fin du XIIIe siècle (environ 70,000 lignes). D'abord une grammaire formelle (de type 0) reflétant les liens syntaxiques, qui apparaissent dans le document original entre les entrées étudiées (ex.: lieu, identification, profession, provenance, etc.), doit être conçue. Un lexique des numériseurs est défini, chaque mot devant être utilisé pour marquer un type particulier d'entité. Le texte original parsé de marqueurs peut ensuite être comparé avec les règles de la grammaire permutent. Toute erreur est signalée et peut être corrigée. La dernière étape consiste à coder les données, ce qui peut être fait de façon semi-automatique puisque les décisions concernant le contenu et la structure des tables de codes ne sont prises qu'une fois les types d'entité connus "in extenso", le codage se fait avec une uniformité optimale.

Contexte

news icon Thème du colloque :
Études médiévales
host icon Hôte : Université d’Ottawa

Découvrez d'autres communications scientifiques

news icon

Titre du colloque :

Études médiévales

Autres communications du même congressiste :

news icon

Thème du colloque :

Études médiévales