Veuillez choisir le dossier dans lequel vous souhaitez ajouter ce contenu :
Membre a labase
Élizabeth Marshman : Université d'Ottawa
Les dictionnaires spécialisés, souvent créés à partir de corpus, sont le fruit d'un investissement important de temps et d'effort dans l'analyse, la sélection et la structuration de données. Quel est le retour sur cet investissement? En quoi l'interaction des utilisateurs avec ces données soigneusement présentées est-elle différente de celle avec des données brutes? Les bénéfices tirés sont-ils comparables?
Dans cette communication, nous explorons ces questions par une étude de cas. Nous avons enregistré l'activité de huit étudiants en traduction qui analysaient des occurrences de six termes de l'environnement. Trois étaient étudiés dans les contextes annotés du DiCoEnviro, un dictionnaire de l'environnement qui s'inspire des principes de la lexicographie explicative et combinatoire et de la sémantique des cadres (L'Homme 2012). Un concordancier en ligne et le corpus utilisé pour créer le dictionnaire ont servi à analyser les trois autres. Les participants ont alors rédigé des définitions pour les termes.
Nous résumons nos observations de ces activités (entre autres le temps passé à consulter les données, les choix effectués au niveau des recherches, le résultat de la rédaction) ainsi que les réactions des participants aux deux ressources. Ceci nous aidera à mieux comprendre le comportement des apprenants face à de telles données, et contribuera éventuellement à une meilleure compréhension de la complémentarité de ressources telles que le DiCoEnviro et son corpus.
Les ressources linguistiques et lexicales sont utilisées à plusieurs fins dans différents domaines : traitement automatique de la langue (TAL), terminologie, indexation, didactique des langues, fouille de texte, analyse de contenu, etc. Ainsi, les documents textuels non structurés traités par des systèmes de TAL peuvent nécessiter des ressources linguistiques pour appréhender leur contenu : terminologies, réseaux lexicaux, bases de connaissances, ontologies, etc., où les liens entre termes sont explicites. Aussi, pour décrire, indexer ou classifier des documents (textuels, visuels, audio, vidéo), on recourt à des thésaurus, à des plans de classification, etc. Et l’enseignement utilise souvent des ressources pédagogiques linguistiques ou terminologiques.
Des relations diverses existent entre ces ressources, les documents auxquels elles sont appliquées et les applications auxquelles elles servent. Notre colloque permettra d’étudier ces interactions en tentant de répondre aux questions suivantes :
— Quelles ressources sont mieux adaptées à une application, à un genre, à un type de document ou de discours particulier? Qu’en est-il des corpus non linguistiques (images ou vidéos, par exemple)?
— En quoi les ressources reflètent-elles le corpus de documents ou de connaissances qui ont servi à les créer?
— Quelles adaptations des ressources sont nécessaires pour traiter un corpus donné?
— Comment combiner des ressources pour atteindre un traitement optimal, ou composer un corpus pour en extraire des ressources optimales?
— Comment intégrer une documentation ou une organisation aux ressources pour maximiser leur réutilisation?
— Quels écueils rencontrerait une utilisation imprévue de ressources données?
Les communications présentées dans le colloque aborderont ces questions d’un point de vue théorique, pratique ou empirique.
Le caractère interdisciplinaire de la thématique proposée vise à rassembler des chercheurs issus de divers champs afin de partager les expertises.
Titre du colloque :
Thème du colloque :