Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Filtrer les résultats
Le chunking consiste à segmenter un texte en chunks, segments sous-phrastiques qu'on peut définir de manière approchée comme des syntagmes non récursifs, ou bien comme des groupes accentuels. Traditionnellement, le chunking est monolingue, et utilise des ressources lexicales monolingues, le plus souvent partielles : un lexique de mots grammaticaux et de ponctuations, qui marquent des débuts et fin de chunks (dans les langues occidentales). Cette méthode, dès lors qu'on veut l'étendre à de nombreuses langues, nécessite de multiplier les ressources monolingues. Nous présentons une autre méthode : le chunking endogène, c'est-à-dire qui n'utilise aucune ressource hormis le texte analysé lui-même, …