Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Filtrer les résultats
Notre travail s'inscrit au sein du projet ANR TermITH dont l'objectif est l'indexation automatique d'écrits scientifiques en sciences humaines et sociales. Nous cherchons à établir une liste du lexique scientifique transdisciplinaire (LST : méthode, résultat) qui sera exploité lors de la détection de termes. Dans cette perspective, nous constituons des listes de mots simples (noms, adjectifs et verbes). Notre processus d'extraction, combinant fréquence, dispersion et spécificité (Drouin 2007, Paquot 2010, Da Sylva 2010), se base sur l'utilisation conjointe d'un corpus d'articles scientifiques et d'un corpus de contraste diversifié (écrits journalistiques, fiction, oral transcrit, sous-titres) de grande échelle. La distribution régulière …
Le travail présenté fait partie du projet TermITH dont l'objectif principal est d'aider à l'indexation automatique d'articles scientifiques en SHS en tirant parti des occurrences de termes apparaissant dans ces articles. La communication que nous proposons s'intéresse à la validation ou au rejet de chaque occurrence des candidats termes extraits automatiquement par la plateforme TTC-TermSuite relativement à leurs contextes d'apparition. Le contexte d'apparition d'une occurrence de candidat terme peut être qualifié et exploité de différentes manières (variantes terminologiques, dérivations morphologiques, patrons lexico-syntaxiques, relations de dépendances syntaxiques, exploitationstextométriques) et selon différentes finalités (acquisition terminologique, acquisition de relations entre termes, construction et …
Le travail présenté fait partie du projet TermITH dont l'objectif principal est d'aider à l'indexation automatique d'articles scientifiques en SHS en tirant parti des occurrences de termes apparaissant dans ces articles. La communication que nous proposons s'intéresse à la validation ou au rejet de chaque occurrence des candidats termes extraits automatiquement par la plateforme TTC-TermSuite relativement à leurs contextes d'apparition. Le contexte d'apparition d'une occurrence de candidat terme peut être qualifié et exploité de différentes manières (variantes terminologiques, dérivations morphologiques, patrons lexico-syntaxiques, relations de dépendances syntaxiques, exploitationstextométriques) et selon différentes finalités (acquisition terminologique, acquisition de relations entre termes, construction et …
Le travail présenté fait partie du projet TermITH dont l'objectif principal est d'aider à l'indexation automatique d'articles scientifiques en SHS en tirant parti des occurrences de termes apparaissant dans ces articles. La communication que nous proposons s'intéresse à la validation ou au rejet de chaque occurrence des candidats termes extraits automatiquement par la plateforme TTC-TermSuite relativement à leurs contextes d'apparition. Le contexte d'apparition d'une occurrence de candidat terme peut être qualifié et exploité de différentes manières (variantes terminologiques, dérivations morphologiques, patrons lexico-syntaxiques, relations de dépendances syntaxiques, exploitationstextométriques) et selon différentes finalités (acquisition terminologique, acquisition de relations entre termes, construction et …