Colloque

Étude des changements lexicaux dans la terminologie d'Internet avant et après l'avènement des réseaux sociaux dans un corpus diachronique anglais

Angélique Lafrance

Membre a labase

Angélique Lafrance : Université de Montréal

Résumé de la communication

Cette présentation vise à étudier les changements lexicaux en anglais dans le domaine de l'Internet en diachronie courte. Nous voulons ainsi mettre en lumière les termes nouveaux qui sont apparus avec l'avènement des réseaux sociaux en ligne, notamment Facebook, le plus populaire. À l'instar de Paquin (2007) et Picton (2009), nous travaillons en diachronie courte, car l'Internet est un domaine qui évolue rapidement.

Nous avons construit un corpus anglais constitué d'articles de revues d'informatique grand public, PC Magazine et PC World, couvrant les années 2001 à 2010. Le corpus est divisé en deux sous-corpus : 2001 à 2005 et 2006 à 2010. Nous avons choisi 2006 comme pivot, car c'est depuis cette année-là que Facebook est ouvert au public. Pour chacune des deux revues, nous avons sélectionné un numéro par année de 2001 à 2010, pour un total d'environ 540 000 mots pour le sous-corpus de 2001 à 2005 et environ 390 000 mots pour le sous-corpus de 2006 à 2010. Chaque sous-corpus sera soumis à l'extracteur de termes TermoStat pour en extraire les candidats-termes, puis nous tenterons de voir si l'avènement des réseaux sociaux a modifié la terminologie.

Le corpus anglais étant déjà compilé, la présentation portera sur le montage du corpus anglais et sur les résultats préliminaires des expérimentations faites avec ce corpus dans TermoStat.

Résumé du colloque

Les ressources linguistiques et lexicales sont utilisées à plusieurs fins dans différents domaines : traitement automatique de la langue (TAL), terminologie, indexation, didactique des langues, fouille de texte, analyse de contenu, etc. Ainsi, les documents textuels non structurés traités par des systèmes de TAL peuvent nécessiter des ressources linguistiques pour appréhender leur contenu : terminologies, réseaux lexicaux, bases de connaissances, ontologies, etc., où les liens entre termes sont explicites. Aussi, pour décrire, indexer ou classifier des documents (textuels, visuels, audio, vidéo), on recourt à des thésaurus, à des plans de classification, etc. Et l’enseignement utilise souvent des ressources pédagogiques linguistiques ou terminologiques.

Des relations diverses existent entre ces ressources, les documents auxquels elles sont appliquées et les applications auxquelles elles servent. Notre colloque permettra d’étudier ces interactions en tentant de répondre aux questions suivantes :

— Quelles ressources sont mieux adaptées à une application, à un genre, à un type de document ou de discours particulier? Qu’en est-il des corpus non linguistiques (images ou vidéos, par exemple)?

— En quoi les ressources reflètent-elles le corpus de documents ou de connaissances qui ont servi à les créer?

— Quelles adaptations des ressources sont nécessaires pour traiter un corpus donné?

— Comment combiner des ressources pour atteindre un traitement optimal, ou composer un corpus pour en extraire des ressources optimales?

— Comment intégrer une documentation ou une organisation aux ressources pour maximiser leur réutilisation?

— Quels écueils rencontrerait une utilisation imprévue de ressources données?

Les communications présentées dans le colloque aborderont ces questions d’un point de vue théorique, pratique ou empirique.

Le caractère interdisciplinaire de la thématique proposée vise à rassembler des chercheurs issus de divers champs afin de partager les expertises.

Contexte

Thème du congrès 2016 (84e édition) :

Points de rencontre

Section :

Section 600 - Colloques multisectoriels

Thème du colloque :

Documents et ressources pour leur traitement : un couplage crucial

Responsables :

Lyne Da Sylva Patrick Drouin

Date : 9 mai 2016

Découvrez d'autres communications scientifiques

Dans le même colloque
Du même congressiste

Titre du colloque :

Documents et ressources pour leur traitement : un couplage crucial

Élaboration de ressources linguistiques pour la génération de texte

Florie Lambrey

Étude des changements lexicaux dans la terminologie d'Internet avant et après l'avènement des résea…

Angélique Lafrance

Mot de clôture

Patrick Drouin

Voir tous les contenus de ce colloque

Autres communications du même congressiste :

Thème du colloque :

Documents et ressources pour leur traitement : un couplage crucial

Étude des changements lexicaux dans la terminologie d'Internet avant et après l'avènement des résea…

Angélique Lafrance