Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Filtrer les résultats
Notre projet a pour objectif d'identifier automatiquement à partir d'un corpus des relations sémantiques entre mots du Lexique scientifique transdisciplinaire (lexique partagé par divers domaines scientifiques) (Tutin 2014). Pour y parvenir, nous exploitons des techniques du traitement automatique des langues; plus particulièrement une analyse distributionnelle automatisée. D'une part, nous utilisons Hyperwords, un logiciel permettant l'exploitation de la méthode distributionnelle (Harris 1955) et d'autre part, nous faisons appel à l'algorithme word2vec (Mikolov et al. 2013) reposant sur une architecture en réseaux de neurones artificiels.Le corpus analysé est issu de Scientext ; il comporte 3,6 millions de mots et regroupe des articles, …