pen icon Colloque
quote

De quelques aspects de l'adjectif dans un corpus textuel autour des énergies renouvelables

MB

Membre a labase

Maria Francesca BONADONNA : Università degli Studi di Verona

Résumé de la communication

Dans cette contribution, nous nous proposons de décrire les adjectifs dans la terminologie des énergies renouvelables à partir de corpus textuels et de les modéliser par le biais des fonctions lexicales conçues par la Lexicologie Explicative et Combinatoire.

La première partie est consacrée à la constitution du corpus, qui, en raison de l'hétérogénéité du domaine, exige une structuration préalable en différents sous-corpus : technique et scientifique ; législatif ; économique et financier ; journalistique. Grâce à l'extracteur terminologique TermoStat et au concordancier AntConc, on passe ensuite à l'extraction et au filtrage manuel des adjectifs du corpus. D'abord est considérée la polysémie des adjectifs moyennant l'observation en contexte : par exemple, l'adjectif vert, qui figure dans des expressions telles que « emploi vert », « technologie verte », est chargé d'un sens métaphorique qui ne correspond pas à son acception dans la langue générale. Cette acception est explicitée dans la paraphrase « verts (environnementaux) ». Ensuite, les dérivés sémantiques adjectivaux repérables dans le corpus sont examinés : dérivés actanciels purs (électrique, énergétique) et dérivés actanciels de potentiels (durable, éligible, renouvelable). Des antonymes peuvent aussi être identifiés, par exemple renouvelable vs fossile. L'analyse comparée des résultats des sous-corpus permettra de vérifier si, et dans quelle mesure, le fonctionnement des adjectifs varie selon le type de texte considéré.

Résumé du colloque

Les ressources linguistiques et lexicales sont utilisées à plusieurs fins dans différents domaines : traitement automatique de la langue (TAL), terminologie, indexation, didactique des langues, fouille de texte, analyse de contenu, etc. Ainsi, les documents textuels non structurés traités par des systèmes de TAL peuvent nécessiter des ressources linguistiques pour appréhender leur contenu : terminologies, réseaux lexicaux, bases de connaissances, ontologies, etc., où les liens entre termes sont explicites. Aussi, pour décrire, indexer ou classifier des documents (textuels, visuels, audio, vidéo), on recourt à des thésaurus, à des plans de classification, etc. Et l’enseignement utilise souvent des ressources pédagogiques linguistiques ou terminologiques.

Des relations diverses existent entre ces ressources, les documents auxquels elles sont appliquées et les applications auxquelles elles servent. Notre colloque permettra d’étudier ces interactions en tentant de répondre aux questions suivantes :

— Quelles ressources sont mieux adaptées à une application, à un genre, à un type de document ou de discours particulier? Qu’en est-il des corpus non linguistiques (images ou vidéos, par exemple)?

— En quoi les ressources reflètent-elles le corpus de documents ou de connaissances qui ont servi à les créer?

— Quelles adaptations des ressources sont nécessaires pour traiter un corpus donné?

— Comment combiner des ressources pour atteindre un traitement optimal, ou composer un corpus pour en extraire des ressources optimales?

— Comment intégrer une documentation ou une organisation aux ressources pour maximiser leur réutilisation?

— Quels écueils rencontrerait une utilisation imprévue de ressources données?

Les communications présentées dans le colloque aborderont ces questions d’un point de vue théorique, pratique ou empirique.

Le caractère interdisciplinaire de la thématique proposée vise à rassembler des chercheurs issus de divers champs afin de partager les expertises.

Contexte

section icon Thème du congrès 2016 (84e édition) :
Points de rencontre
section icon Date : 9 mai 2016

Découvrez d'autres communications scientifiques

Autres communications du même congressiste :