Résultats de recherche

filters logos

Filtrer les résultats

arrow down
Années
exclamation icon
Type de contenu
Exporter les résultats Sauvegarder les résultats
1 résultats de recherche
pen icon Colloque
Une méthode de chunking multilingue endogène
quote

Le chunking consiste à segmenter un texte en chunks, segments sous-phrastiques qu'on peut définir de manière approchée comme des syntagmes non récursifs, ou bien comme des groupes accentuels. Traditionnellement, le chunking est monolingue, et utilise des ressources lexicales monolingues, le plus souvent partielles : un lexique de mots grammaticaux et de ponctuations, qui marquent des débuts et fin de chunks (dans les langues occidentales). Cette méthode, dès lors qu'on veut l'étendre à de nombreuses langues, nécessite de multiplier les ressources monolingues. Nous présentons une autre méthode : le chunking endogène, c'est-à-dire qui n'utilise aucune ressource hormis le texte analysé lui-même, …

quote