pen icon Colloque
quote

Indexation assistée par ordinateur de monographies de langue française: une réalisation

DL

Membre a labase

Diane Lanteigne

Résumé du colloque

L'index de livre ajoute à la valeur au texte, facilite sa réutilisation, multiplie les clés d'accès à l'information qu'il contient. Mais les coûts reliés à l'indexation sont souvent opérateur par la non-production d'index. Ne pourrait-on profiter du fait que de plus en plus de monographies sont indexées pour assister l'indexation humaine? Une comparaison entre l'indexation qui s'exerce dans le cadre des systèmes documentaires et l'indexation de livres nous permettra de dégager certaines caractéristiques de l'index de livre qui laissent croire qu'on pourrait en automatiser partiellement la production. Pourtant, très peu de recherches ont porté sur cette problématique. Les réalisations dans le domaine de l'indexation de fin de texte intègrent toutes pour caractéristique d'exiger des ressources humaines importantes pour la constitution d'un vocabulaire contrôlé ou d'une base de connaissances. Peut-on développer un système permettant d'indexer des documents variés sans connaissance préalable du vocabulaire de domaine? L'aide de méthodes statistico-linguistiques, nous avons réalisé l'indexation semi-automatique d'une monographie de langue française sans l'aide de thésaurus. Nous décrivons les résultats obtenus et discutons les caractéristiques de l'index produit. Les résultats obtenus montrent que l'indexation assistée peut constituer une alternative à l'absence totale d'indexation, et qu'il serait possible de développer un système modulaire d'aide à l'indexation de monographies de langue française souple pour s'adapter à différents types de textes.

Contexte

news icon Thème du colloque :
Sciences de l'information
host icon Hôte : Université du Québec à Montréal

Découvrez d'autres communications scientifiques

news icon

Titre du colloque :

Sciences de l'information

Autres communications du même congressiste :

news icon

Thème du colloque :

Sciences de l'information