pen icon Colloque
quote

Analyse à grande échelle du fonctionnement des marqueurs de relations conceptuelles en corpus spécialisés

LL

Membre a labase

Luce Lefeuvre : Université Toulouse-Jean-Jaurès

Résumé de la communication

La variation du fonctionnement des marqueurs de relations conceptuelles a été assez peu étudiée. Dans le cadre du projet ANR CRISTAL1 (Contextes RIches en connaissanceS pour la TrAduction terminoLogique), nous étudions cette variation à grande échelle, en fonction du domaine, du genre et de la langue afin d'améliorer le fonctionnement des outils d'extraction de relations.


Une première étape a permis de constituer une liste de marqueurs, pour l'anglais et pour le français, des relations d'hyperonymie, de méronymie et de cause. Ces marqueurs sont constitués d'éléments lexico-syntaxiques qui, hors contexte, peuvent être associés à une interprétation « relationnelle » (Y être Dét_Indéfini espèce de Dét X pour l'hyperonymie ou X cause Y pour la cause). L'étape actuelle vise à étudier la productivité de ces quelques 469 marqueurs dans des corpus français portant sur la volcanologie et le cancer du sein, et pour deux genres textuels : scientifique et vulgarisé. Trois catégories de fonctionnement apparaissent selon le taux d'occurrences dans lesquelles l'élément testé joue le rôle de marqueur : 1- plus de 60 % des cas, 2- 30 à 60 % des cas, 3- moins de 30 % des cas. Cette catégorisation nous permettra d'évaluer le rôle du domaine et du genre dans le fonctionnement de chaque marqueur et donc son utilisabilité dans des outils. L'étape suivante permettra, pour la tranche 30 à 60%, de voir comment la prise en compte de ressources extérieures, contraignant le co-texte, améliore ce résultat.

Résumé du colloque

Le lexique d’une langue n’est pas un objet monolithique. Son étude passe par l’identification de caractéristiques particulières de mots isolés, mais aussi de regroupements de mots qu’on pourrait appeler des ensembles lexicaux. On peut les définir de différentes manières : par thématique (p. ex., le lexique de l’environnement), par niveau d’apprentissage (p. ex., le Basic English), par caractéristiques sémantiques (p. ex., événements, prédicats, objets, etc.), par contexte d’utilisation (p. ex., terminologie spécialisée vs langue générale). Selon l’optique retenue, les méthodes d’identification, de caractérisation, d’enseignement et de description ne sont pas les mêmes.

Il devient intéressant de comparer les différentes approches afin de voir dans quelles mesures elles peuvent s’alimenter et s’enrichir mutuellement. Le travail en vase clos des chercheurs s’intéressant à la thématique peut conduire à des recherches en parallèle qui sont trop rarement mises en commun dans un cadre d’échange multidisciplinaire. Or, une considération moins monolithique du lexique ne peut que conduire à des descriptions plus flexibles et complémentaires.

Le colloque permettra de :

1) réunir des chercheurs intéressés par la thématique du lexique à vocation particulière afin qu’ils puissent échanger sur leurs cadres théoriques, leurs méthodes et leur utilisation des divers sous-ensembles lexicaux;

2) explorer les bases théoriques de classes de vocabulaire ou de sous-ensembles lexicaux ou terminologiques;

3) caractériser des ensembles lexicaux;

4) réunir des chercheurs provenant de pays différents.

Dans un tel contexte, réunir des chercheurs provenant de la didactique, de la lexicologie, de la lexicographie, de la terminologie, de la linguistique de corpus et de l’informatique, des sciences cognitives, des sciences de l’information et des divers domaines spécialisés contribuera nécessairement à enrichir la réflexion sur le sujet.

Contexte

section icon Thème du congrès 2015 (83e édition) :
Sortir des sentiers battus
section icon Date : 29 mai 2015

Découvrez d'autres communications scientifiques

Autres communications du même congressiste :