pen icon Colloque
quote

Ressources lexicographiques et terminologiques dans le TALN

CB

Membre a labase

Caroline Barriere

Résumé du colloque

La désambiguïsation automatique des phrases-clés syntagme nominal d'importance pour illustrer les concepts véhiculés dans le texte se trouvant dans un texte est une tâche primordiale pour plusieurs activités du Traitement Automatique du Langage Naturel (TALN), tels le résumé automatique de texte et la traduction automatisée. Une ressource terminologique qui contient des milliers de termes classifiés par domaine d'utilisation est un outil prometteur pour cette tâche, mais aussi très spécialisé. Une ressource lexicographique est souvent plus appropriée, mais elle n'inclue pas la notion de domaines. Référant aux divers sens des mots, ceux-ci sont définis à des granularités différentes d'une ressource à une autre. Ni les dictionnaires terminologiques, ni lexicographiques, ne suffisent individuellement. Leur utilisation conjointe est complexe et nous fait découvrir leurs incompatibilités. Nous exposons les incompatibilités entre les ressources terminologiques et lexicographiques en présentant plusieurs exemples concrets de problèmes de désambiguïsation de termes et phrases-clés en leur contexte. Il ne s'agit pas d'une étude en profondeur sur chacune des divergences et les questions philosophiques qu'elles peuvent soulever, mais plutôt une tentative de cerner ces divergences et leurs implications. Notre étude se limite à la ressource terminologique Termium (banque Bureau de la traduction du Canada, accessible à www.termium.com) et lexicographique Wordnet (base de connaissance lexicale pour l'anglais développé par l'Université Princeton, accessible à www.cogsci.princeton.edu/~wn/). Nous explorerons : 1) Phrase-clé versus terme. 2) Couverture des termes et phrases-clés des ressources. 3) Sens versus domaine. 4) La définition des domaines. 5) La composante terminologique et lexicographique d'un texte. 6) Granularité lexicographique et terminologique. Quelques idées sont présentées pour l'élaboration d'une ressource combinée qui serait un atout pour la désambiguïsation sémantique.

Contexte

manager icon Responsables :
Marie-claude L'homme
host icon Hôte : Université du Québec à Montréal

Découvrez d'autres communications scientifiques

Autres communications du même congressiste :