Colloque

Complémentarité de ressources et de corpus : le cas du DiCoEnviro

Élizabeth Marshman

Marie-claude L'homme

ÉM

Membre a labase

Élizabeth Marshman : Université d'Ottawa

Résumé de la communication

Les dictionnaires spécialisés, souvent créés à partir de corpus, sont le fruit d'un investissement important de temps et d'effort dans l'analyse, la sélection et la structuration de données. Quel est le retour sur cet investissement? En quoi l'interaction des utilisateurs avec ces données soigneusement présentées est-elle différente de celle avec des données brutes? Les bénéfices tirés sont-ils comparables?

Dans cette communication, nous explorons ces questions par une étude de cas. Nous avons enregistré l'activité de huit étudiants en traduction qui analysaient des occurrences de six termes de l'environnement. Trois étaient étudiés dans les contextes annotés du DiCoEnviro, un dictionnaire de l'environnement qui s'inspire des principes de la lexicographie explicative et combinatoire et de la sémantique des cadres (L'Homme 2012). Un concordancier en ligne et le corpus utilisé pour créer le dictionnaire ont servi à analyser les trois autres. Les participants ont alors rédigé des définitions pour les termes.

Nous résumons nos observations de ces activités (entre autres le temps passé à consulter les données, les choix effectués au niveau des recherches, le résultat de la rédaction) ainsi que les réactions des participants aux deux ressources. Ceci nous aidera à mieux comprendre le comportement des apprenants face à de telles données, et contribuera éventuellement à une meilleure compréhension de la complémentarité de ressources telles que le DiCoEnviro et son corpus.

Résumé du colloque

Les ressources linguistiques et lexicales sont utilisées à plusieurs fins dans différents domaines : traitement automatique de la langue (TAL), terminologie, indexation, didactique des langues, fouille de texte, analyse de contenu, etc. Ainsi, les documents textuels non structurés traités par des systèmes de TAL peuvent nécessiter des ressources linguistiques pour appréhender leur contenu : terminologies, réseaux lexicaux, bases de connaissances, ontologies, etc., où les liens entre termes sont explicites. Aussi, pour décrire, indexer ou classifier des documents (textuels, visuels, audio, vidéo), on recourt à des thésaurus, à des plans de classification, etc. Et l’enseignement utilise souvent des ressources pédagogiques linguistiques ou terminologiques.

Des relations diverses existent entre ces ressources, les documents auxquels elles sont appliquées et les applications auxquelles elles servent. Notre colloque permettra d’étudier ces interactions en tentant de répondre aux questions suivantes :

— Quelles ressources sont mieux adaptées à une application, à un genre, à un type de document ou de discours particulier? Qu’en est-il des corpus non linguistiques (images ou vidéos, par exemple)?

— En quoi les ressources reflètent-elles le corpus de documents ou de connaissances qui ont servi à les créer?

— Quelles adaptations des ressources sont nécessaires pour traiter un corpus donné?

— Comment combiner des ressources pour atteindre un traitement optimal, ou composer un corpus pour en extraire des ressources optimales?

— Comment intégrer une documentation ou une organisation aux ressources pour maximiser leur réutilisation?

— Quels écueils rencontrerait une utilisation imprévue de ressources données?

Les communications présentées dans le colloque aborderont ces questions d’un point de vue théorique, pratique ou empirique.

Le caractère interdisciplinaire de la thématique proposée vise à rassembler des chercheurs issus de divers champs afin de partager les expertises.

Contexte

Thème du congrès 2016 (84e édition) :

Points de rencontre

Section :

Section 600 - Colloques multisectoriels

Thème du colloque :

Documents et ressources pour leur traitement : un couplage crucial

Responsables :

Lyne Da Sylva Patrick Drouin

Date : 9 mai 2016

Découvrez d'autres communications scientifiques

Dans le même colloque
Du même congressiste

Titre du colloque :

Documents et ressources pour leur traitement : un couplage crucial

Étude des changements lexicaux dans la terminologie d'Internet avant et après l'avènement des résea…

Angélique Lafrance

Pause

De quelques aspects de l'adjectif dans un corpus textuel autour des énergies renouvelables

Maria Francesca BONADONNA

Voir tous les contenus de ce colloque

Autres communications du même congressiste :

Thème du colloque :

Documents et ressources pour leur traitement : un couplage crucial

Partenariats communautaires dans les cours de terminologie : quelques observations du terrain

Élizabeth Marshman

Traduction automatique et éthique : la perspective du corps professoral

Élizabeth Marshman

Complémentarité de ressources et de corpus : le cas du DiCoEnviro

Élizabeth Marshman