pen icon Colloque
quote

Problèmes de catégorisation dans l'analyse automatique du discours

AB

Membre a labase

Aline Boulanger

Résumé du colloque

Nous avons entrepris depuis 1980 une recherche sur la complexification syntaxique dans les différents types de discours (à l'oral et à l'écrit) enseignés au primaire. Nous avons pu dégager certaines étapes dans la complexification et certains critères de maturation. Cependant, étant donné l'ampleur du corpus et la nécessité d'une analyse plus systématique, nous avons décidé de recourir à l'analyse automatique. Nous travaillons donc avec le logiciel DEREDE (Pierre Martineau UQAM) qui comprend entre autres une grammaire des structures de surface du français (GDSF). L'application de la GDSF implique une certaine préparation des textes. Nous décrirons en premier temps les conventions d'entrée de notre corpus. Dans un deuxième temps, nous explorerons les problèmes rencontrés au niveau de la catégorisation des items lexicaux. Nous présenterons des exemples illustrant les implications du choix d'une catégorie sur l'analyse. Notre recherche, en cours, n'a pas la prétention d'apporter une solution globale à l'analyse syntaxique automatique. Elle a cependant l'intérêt de montrer les problèmes auxquels les chercheurs sont confrontés dans ce domaine et les implications des choix qui y sont faits.

Contexte

Section :
Linguistique
news icon Thème du colloque :
Linguistique
host icon Hôte : Université du Québec à Chicoutimi

Découvrez d'autres communications scientifiques

news icon

Titre du colloque :

Linguistique

Autres communications du même congressiste :

news icon

Thème du colloque :

Linguistique