Colloque

La classification automatique

Jean-François Chartier

Membre a labase

Jean-François Chartier

Résumé de la communication

La classification automatique est une technique d’exploration et d’analyse de texte largement utilisée par la communauté des sciences humaines et sociales. Plusieurs dizaines d’algorithmes ont été conçus, chacun s’appuyant sur un principe d’induction différent. La comparaison du comportement de ces différents algorithmes est devenue un enjeu méthodologique fondamental. Trois stratégies de comparaison ont été suggérées, basées sur des critères externes, internes ou relatifs. Nous présentons les premiers résultats d’une étude basée sur une stratégie de comparaison relative. Cette étude a pour objectif de mesurer la variation dans les résultats de classification automatique de texte en fonction de l’algorithme utilisé. Quatre algorithmes sont comparés : les réseaux de neurones adaptatifs (ART1), le K-Means (KM), Expectation Maximisation (EM) et les cartes topologiques auto-organisatrices (SOM). Nos résultats de recherche nous amènent à la conclusion que les résultats de la classification sont fortement déterminés par le choix d'un algorithme. Seulement un consensus relatif d’environ 10% entre les partitions produites par différents algorithmes est observé.

Résumé du colloque

Nous aimerions inviter un conférencier de marque à donner une conférence plénière, mais également lancer des coopérations entre des spécialistes de différentes disciplines.