pen icon Colloque
quote

Une approche par les champs de Markov au problème de l'Extraction de Documents

DB

Membre a labase

Djamel Bouchaffra

Résumé du colloque

Nous proposons une approche par les champs aléatoires markoviens au problème de l'extraction de documents d'un fonds documentaire. Une analogie est établie entre ces documents fonc de requêtes images de documents et les états d'un système physique statistique. La machine de Processus à Flot Markovien (PFM) que nous proposons est fondée sur une interaction dynamique entre les requêtes et les images de documents. La représentation du fonds documentaire est soumise à des variations d'états émanant du flot de requêtes. La machine PFM cherche à satisfaire les requêtes de l'utilisateur en modifiant l'ensemble des descripteurs contenus dans les images de documents, ainsi la machine PFM transite d'un état de configuration vers un autre état en faisant varier le seuil affecté au processus d'indexation. Pour chaque état, une certaine dégradation du système est considérée. Cette dernière dépend du seuil attribué au processus d'indexation et de l'ordre des requêtes soumises au système. Le concept d'équivalence entre un champ de Markov et la loi de Gibbs (entropie maximale) nous fournit une fonction d'énergie qui décrit ce système physique. Nous utilisons l'algorithme de recuit simulé afin d'isoler les états d'énergie minimale: ceci correspond au meilleur "matching" selon un certain sens entre les requêtes et les images de documents. A ces états de niveau d'énergie minimale, la machine PFM se comporte comme un classifieur.

Contexte

news icon Thème du colloque :
Mathématiques et statistiques
host icon Hôte : Université du Québec à Chicoutimi

Découvrez d'autres communications scientifiques

news icon

Titre du colloque :

Mathématiques et statistiques

Autres communications du même congressiste :

news icon

Thème du colloque :

Mathématiques et statistiques