pen icon Colloque
quote

Des cas pour représenter les données dans la génération automatique de résumés

LC

Membre a labase

Laurence Capus

Résumé du colloque

Générer de façon automatique des résumés impliquent divers problèmes liés au traitement du langage naturel. Un de ces principaux problèmes repose sur la représentation des connaissances. En effet, on peut résumer toutes sortes de documents individuels ou multiples dans le but de présenter, d'instruire ou encore d'évaluer et ceci pour une audience bien particulière. Il semble donc difficile de déterminer quels sont les éléments du document source qui doivent être réellement représentés afin d'en proposer un résumé satisfaisant. Ces éléments doivent être identifiés comme les plus pertinents et être représentés de manière appropriée pour être analysés et ainsi permettre la réduction de la version originale. L'utilisation de cas semble être une alternative à ces difficultés. De nombreuses observations ont en effet révélé que les connaissances pouvaient exister naturellement sous forme de cas décrivant ainsi des situations. En d'autres termes, il peut être plus facile de "raconter" la façon dont on a résumé les documents plutôt que d'essayer de déduire des règles générales. De plus, les travaux en psychologie montrent que la représentation sous forme de cas est plus naturelle pour les personnes et ce formalisme est d'ailleurs largement utilisé dans les environnements éducationnels pour la création de stratégies d'apprentissage. Nous utilisons cette alternative pour le développement de GARUCAS, un générateur de résumés d'histoires pour enfants. Les cas dans cette application représentent une histoire, soit les concepts permettant de comprendre le contenu, sa version condensée, à partir de laquelle on peut générer un résumé, et enfin la façon dont on a procédé pour résumer l'histoire. Cette façon de représenter les connaissances nous permet ainsi de disposer d'exemples d'histoires résumées plus faciles à gérer. Ces exemples pourront être utilisés dans des situations futures similaires pour résumer d'autres histoires, les résumés sont donc obtenus plus rapidement. Enfin, ces exemples peuvent aussi aisément s'inscrire dans une stratégie d'apprentissage individuel de rédaction de textes.

Contexte

Section :
Informatique
news icon Thème du colloque :
Informatique
manager icon Responsables :
Robert Laganière
host icon Hôte : Université d’Ottawa

Découvrez d'autres communications scientifiques

news icon

Titre du colloque :

Informatique

Autres communications du même congressiste :

news icon

Thème du colloque :

Informatique