Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Filtrer les résultats
L’identification et l’évaluation de descripteurs qui permettent de distinguer une classe de similarité d’une autre est à la base du processus de classification. Le choix d’un descripteur plutôt qu’un autre a un impact majeur sur la qualité des résultats obtenus. Il influence le comportement d’un classifieur, la présence ou non d'un descripteur étant un indice permettant de cibler la classe à laquelle appartient un document. Cet article propose une étude comparative de trois descripteurs utilisés en traitement automatique du texte et dont le niveau d’abstraction varie, soit les n-grammes de caractères, les mots et les itemsets. Les itemsets représentent les …
L’utilisation d’outils de classification s’intègre aux efforts déployés pour accélérer l’interprétation des données numériques. Ces outils appliquent des critères de sélectivité sur des unités d’information réparties dans les données brutes. Ainsi, les unités d’information considérées influencent le contenu des classes de similarités générées. Le problème de la sélection de l’unité d’information se pose alors puisqu’à ce jour aucune théorie ne permet de guider ce choix. Face à ce manque, le choix de l’unité d’information est plus souvent qu’autrement mené par des intuitions. Plusieurs itérations sont habituellement nécessaires pour obtenir des résultats convenables. De surcroît, les outils de classification automatisée ont …