pen icon Colloque
quote

L'implémentation des fonctions lexicales en LFG et dans la TST pour la génération automatique de textes

FL

Membre a labase

François Lareau : Université de Montréal

Résumé de la communication

Dans un système de génération automatique de textes (GAT) à base de grammaires symboliques, une des étapes importantes est la lexicalisation (le choix des mots pour exprimer un message). Pour que les textes générés soient fluides et naturels, il faut savoir générer un type particulier de locutions appelées « collocations », c'est-à-dire des expressions semi-idiomatiques où il existe un lien privilégié entre des mots qui « vont ensemble » (par exemple, "procéder à l'arrestation" au lieu de "arrêter"). Ce phénomène lexical, loin d'être marginal dans l'usage, est omniprésent, et pourtant il reste encore mal traité en TAL. L'arbitraire de ces combinaisons de mots exige que l'information soit encodée d'une façon ou d'une autre dans le dictionnaire d'un système de GAT, et la théorie sens-texte (TST) offre une façon élégante d'encoder cette information grâce aux « fonctions lexicales » (FL). Dans notre exposé, nous allons comparer comment les FL s'implémentent dans MATE, un système de GAT basé sur la TST, et dans XLE, un système basé sur la lexical functional grammar (LFG). Nous allons montrer en quoi les formalismes diffèrent et quelles conséquence cela a pour l'implémentation des FL.

Résumé du colloque

Le sujet de ce colloque traite de la linguistique informatique et plus particulièrement du traitement automatique des langues naturelles (TALN/TAL) ainsi que de son interaction avec les sciences cognitives. Il s’agit d’un domaine qui se situe au carrefour de la linguistique, de l’intelligence artificielle et des sciences cognitives dans leurs recherches sur le langage naturel.

Le colloque proposé vise les différentes applications du TALN dans un contexte monolingue, bilingue ou multilingue, telles que le développement des méthodologies nécessaires pour la construction et l’enrichissement des ressources linguistiques. Tous les aspects du traitement automatique des langues sont considérés, en particulier les travaux théoriques ayant pour but de décrire les phénomènes linguistiques par des modèles calculatoires, le développement de logiciels d’aide aux linguistes pour leurs travaux de recherche, tels que des études de corpus, le développement de logiciels et de ressources pour utiliser, traiter, organiser et conserver des données linguistiques écrites ou orales.

Plus spécifiquement, nous proposons d’abord les sujets suivants :

– modèles de calcul des langues naturelles

– réseaux sémantiques de grande taille

– modèles cognitifs et psychologiques des langues naturelles

– évolution des langues naturelles

– traitement du discours

– pragmatique, processus cognitifs et sociaux des langues

– résumé automatique et extraction d’information

– interfaces et systèmes de dialogue

– traduction automatique

– traitement des ressources multilingues

– outils et ressources en TALN

– corpus linguistique

– forage de données.

Il sera demandé aux présentateurs de mettre en valeur les aspects liés au traitement automatique des langues naturelles, quel que soit le sujet abordé, ainsi qu’à leur pertinence au niveau des sciences cognitives.

Contexte

section icon Thème du congrès 2014 (82e édition) :
La recherche : zones de convergence et de créativité
section icon Date : 13 mai 2014

Découvrez d'autres communications scientifiques

Autres communications du même congressiste :