pen icon Colloque
quote

Vers une typologie des relations entre termes qui se voudraient être "universelles" pour COGNIWEB, un système de recherche d'informations pertinentes sur les réseaux

CJ

Membre a labase

Christophe Jouis

Résumé du colloque

Le but de COGNIWEB consiste à rechercher des informations pertinentes à partir d'un ensemble considérable de documents hétérogènes sur support informatique (Bases de données documentaires, INTRANET, INTERNET, WEB, etc.). La plupart des outils disponibles actuellement sur le marché offrent à l'utilisateur des possibilités de recherche restreintes : combinaisons de mots clés avec les opérateurs ET, OU, SAUF, les opérateurs de proximité et les troncatures. En conséquence, l'utilisateur est trop souvent submergé par le nombre de réponses. Par exemple, la requête "ADN" ou "DNA" dans le moteur de recherche Alta-Vista retourne plus de 700.000 documents! COGNIWEB est une recherche en cours. L'apport de COGNIWEB consiste à brancher à la suite d'un tel moteur de recherche, un outil de filtrage des documents obtenus à partir du WEB ou d'un réseau INTRANET. COGNIWEB combine une approche sémantique linguistique et une approche de classification-catégorisation: le résultat escompté est plus précis. Ce résultat fait apparaître des relations sémantiques fines entre les termes, plus fines que les opérations booléennes. Le résultat est présenté à l'utilisateur sous la forme d'une interface graphique plus intuitive et ergonomique (graphe de termes et de relations). En effet, les méthodes numériques doivent permettre d'absorber de gros corpus mais le résultat obtenu est un filtrage numérique rustique (filtrage pour classification de l'information). En revanche, les méthodes linguistiques permettent une représentation structurée des connaissances contenues dans le texte. Elles permettent une analyse sémantique approfondie sur des portions limitées de textes, et à partir des résultats de l'analyse numérique. L'analyse sémantique complète et enrichit l'analyse numérique. Dans cet article, nous nous focaliserons sur les fondements du module d'analyse sémantique. Celui-ci s'appuie sur une typologie des relations construite à partir d'un ensemble de primitives. La sémantique de chaque relation correspond à des propriétés intrinsèques, qui se voudraient être indépendantes d'un domaine ou d'une langue particulière.

Contexte

manager icon Responsables :
Michel Prévost
host icon Hôte : Université d’Ottawa

Découvrez d'autres communications scientifiques

Autres communications du même congressiste :