Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Filtrer les résultats
Nous avons constitué le corpus NLP4NLP pour étudier le contenu des publications scientifiques dans le domaine du traitement automatique de la parole et du langage naturel. Il contient les articles publiés dans 34 conférences et revues principales du domaine, sur une période de 50 ans (1965-2015), comprenant 65.000 documents, rassemblant 50.000 auteurs et représentant environ 270 millions de mots. La plupart de ces publications sont en langue anglaise, certaines en français, en allemand ou en russe. Certaines sont en accès libres, d’autres ont été fournies par leurs maisons d’édition. Pour constituer et analyser ce corpus, plusieurs outils ont été utilisés …
Nous avons constitué le corpus NLP4NLP pour étudier le contenu des publications scientifiques dans le domaine du traitement automatique de la parole et du langage naturel. Il contient les articles publiés dans 34 conférences et revues principales du domaine, sur une période de 50 ans (1965-2015), comprenant 65.000 documents, rassemblant 50.000 auteurs et représentant environ 270 millions de mots. La plupart de ces publications sont en langue anglaise, certaines en français, en allemand ou en russe. Certaines sont en accès libres, d’autres ont été fournies par leurs maisons d’édition. Pour constituer et analyser ce corpus, plusieurs outils ont été utilisés …