Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Filtrer les résultats
Au sein du projet Accès Intelligent à l'Information (http://www.csi.uottawa.ca/~clank/IIA.html), le sous-groupe travaillant sur le résumé de texte à l'Université d'Ottawa (http://www.csi.uottawa.ca/~terry/ts.html) étudie un programme capable de fabriquer automatiquement un résumé à partir d'un texte électronique. Le résumé peut être orienté par une requête éventuellement donnée par l'utilisateur. Le programme se base sur des caractéristiques du texte plutôt que sur des connaissances encyclopédiques préalables. Il applique un traitement linguistique limité (lemmatisation, segmentation, catégorisation syntaxique, repérage de groupes nominaux), des statistiques de distribution des termes, et des indices superficiel de discours. Dans une première version (http://res24.res.ca/sumdir/dev2.htm), des mots-clés (ou expressions-clés) sont déterminés …
Il est admis que les textes techniques sont plus faciles à traiter informatiquement que les autres, mais peu d'auteurs se soucient de les définir. Nous avons établi une liste de 42 traits qui pouvaient avoir un degré significatif de corrélation avec la "technicalité". Certains sont objectifs, comme présence d'interrogations, présence de phrases interrogatives; certains sont subjectifs: organisation hiérarchique. Neuf textes, sur lesquels un questionnaire détaillé a été rempli par 22 personnes, ont fourni un jeu de données sur les traits. 32 des traits sont statistiquement de bons prédicteurs. L'expérience réalisée est sujette à un élément de variabilité dû à la …