pen icon Colloque
quote

Le phénomène de cascade adjectivale dans un corpus médical et son traitement automatique au moyen de la sémantique

PB

Membre a labase

Philippe Barbaud

Résumé du colloque

La cascade adjectivale est un phénomène d'accumulation d'adjectifs modifiant la même tête nominale. Il est à la source d'un bruit non négligeable en traitement automatique des langues naturelles, ce qui peut fausser significativement l'extraction de suites susceptibles de figurer dans une banque terminologique ou encore dans une base de connaissances du domaine médical. L'exploitation du corpus MÉNELAS au moyen de divers outils informatiques (LEXTER, SYCLADE, SATO) révèle que certains appariements en arbres élémentaires {N, Adj*} sont de nature à fausser les résultats à partir desquels on construit des réseaux de relations sémantico-lexicales. Par exemple, à partir d'une suite comme INSUFFISANCE RÉNALE CHRONIQUE ANCIENNE MODÉRÉÉ, la chaîne de traitement aboutit notamment à l'arbre élémentaire [INSUFFISANCE ANCIENNE], un résultat indésirable. Pour diminuer le bruit, on fait l'hypothèse que la distinction sémantique entre adjectifs relationnels et non relationnels est pertinente et implantable. Le filtre sémantico-lexical ainsi constitué doit permettre d'éliminer du résultat de l'opération d'appariement les arbres élémentaires conceptuellement illégitimes. En pratique, le marquage automatique des adjectifs en fonction du trait [+/-relationnel] est basé sur une classification morphologique préalable des suffixes adjectivaux. L'expérimentation révèle que sur les 850 cas de cascade adjectivale dans le corpus MÉNÉLAS, il est possible de réduire de 16% le bruit imputable à un mauvais appariement.

Contexte

Section :
Linguistique
news icon Thème du colloque :
Linguistique
manager icon Responsables :
Zélie Guével
host icon Hôte : Université Laval

Découvrez d'autres communications scientifiques

news icon

Titre du colloque :

Linguistique

Autres communications du même congressiste :

news icon

Thème du colloque :

Linguistique