pen icon Colloque
quote

Les itemsets partagés et la classification textuelle

LR

Membre a labase

Louis Rompré

Résumé de la communication

L’identification et l’évaluation de descripteurs qui permettent de distinguer une classe de similarité d’une autre est à la base du processus de classification. Le choix d’un descripteur plutôt qu’un autre a un impact majeur sur la qualité des résultats obtenus. Il influence le comportement d’un classifieur, la présence ou non d'un descripteur étant un indice permettant de cibler la classe à laquelle appartient un document. Cet article propose une étude comparative de trois descripteurs utilisés en traitement automatique du texte et dont le niveau d’abstraction varie, soit les n-grammes de caractères, les mots et les itemsets. Les itemsets représentent les relations de cooccurrence qui existent entre des mots qui composent un texte. Par rapport aux mots ou aux n-grammes, l’apport sémantique de ce descripteur est plus significatif. Nous proposons une méthode et l’ajout d’une contrainte pour dégager des itemsets pertinents répartis dans des documents textuels. Les expérimentations effectuées suggèrent que les classes produites à l’aide de la méthode proposée sont de meilleure qualité que celles produites avec les mots ou les n-grammes.

Résumé du colloque

Le langage sert à exprimer et à communiquer les pensées des interlocuteurs. C’est en dialoguant que les locuteurs communiquent leurs pensées. Les sciences qui traitent du langage, de l’action et de la pensée (philosophie, sciences humaines et intelligence artificielle) reconnaissent l’importance des actes de discours (actes d’énonciation, de référence, de prédication, d’expression de propositions et d’attitudes ainsi qu’actes illocutoires et perlocutoires). Selon la théorie des actes de discours, les actes illocutoires sont les unités de base de signification et de communication dans l’usage et la compréhension du langage. Jusqu’à présent, on a surtout analysé les actes de discours accomplis par des locuteurs individuels à un seul moment d’énonciation. Cependant, les interlocuteurs entendent accomplir des actes illocutoires afin de poursuivre des conversations. Notre objectif principal est d’analyser la structure et la dynamique de jeux de langage oral et écrit importants. Le colloque réunit des logiciens, des linguistes, des philosophes, des informaticiens et des experts en intelligence artificielle et en apprentissage machine qui collaborent. Il est question des discours ayant un but conversationnel propre, des actes illocutoires de niveau supérieur et de l’intentionnalité collective. Certains chercheurs font des présentations critiques des hypothèses de la théorie des actes de discours sur l’analyse de la conversation à la lumière de nouvelles hypothèses, par exemple, en linguistique ou en intelligence artificielle. Les communications sont regroupées selon trois axes. Le premier, actes de discours et philosophie, regroupe des communications en philosophie du langage et de l’esprit. Le second, informatique, intelligence artificielle et communication, concerne la modélisation informatique des dialogues intelligents. Le troisième consacre l’analyse du discours et des interactions discursives ainsi que le traitement des langues naturelles.

Contexte

section icon Thème du congrès 2021 (88e édition) :
Du jamais su
news icon Thème du colloque :
Langage, discours et pensée
section icon Date : 3 mai 2021

Découvrez d'autres communications scientifiques

news icon

Titre du colloque :

Langage, discours et pensée

Autres communications du même congressiste :

news icon

Thème du colloque :

Langage, discours et pensée