Colloque

Inventaire systématique et raisonné des données lexicales de la BDTS en vue d'en extraire le vocabulaire d'une nomenclature distinctive des textes québécois

Hélène Cajolet-Laganière

Jean-Marie Lessard

Membre a labase

Hélène Cajolet-Laganière

Résumé du colloque

La BDTS est un corpus momentanément stabilisé à 15 millions d'occurrences, divisé en bloc comparables de 250 000 occurrences, dont la typologie est échelonnée sur deux axes de stratification, en abscisse selon le type de discours (langue orale/langue écrite), en ordonnée selon le niveau de la langue utilisée (usage familier/usage soutenu). Ce sont les progrès réalisés dans le domaine de la numérisation et du traitement informatique des données textuelles qui nous ont permis de constituer cet échantillon représentatif du français en usage au Québec, par conséquent de satisfaire, nous semble-t-il, à la première exigence en matière d'extraction d'une nomenclature d'un corpus, la qualité de la source. Notre exposé porte essentiellement sur cet aspect initial de l'élaboration de la nomenclature d'un dictionnaire complet, général et normatif, destinés aux francophones du Québec et d'Amérique. Plus précisément, nous décrirons les divers traitements et analyses lexicales appliqués à la BDTS et aux sous-ensembles de données textuelles qui la composent (élaboration d'une typologie équilibrée, sélection attentive et regroupement des textes, découpage des textes en unités lexicales, étude de la dispersion en fréquence des unités lexicales dans le corpus, comparaison avec les nomenclatures de certains dictionnaires usuels existants, français ou adaptés pour le Québec. Qu'y a-t-il enfin à noter comme particularités, comme traits d'originalité?

Contexte

Section :

La lexicographie canadienne à l'aube de l'an 2000

Thème du colloque :

La lexicographie canadienne à l'aube de l'an 2000

Responsables :

Roda P. Roberts Chantale Grenon-Nyenhuis

Hôte : Université d’Ottawa

Découvrez d'autres communications scientifiques

Dans le même colloque
Du même congressiste

Titre du colloque :

La lexicographie canadienne à l'aube de l'an 2000

Problèmes de décodage d'exemples servant à illustrer les ornythonymes dans le Petit Robert et le Pe…

Lucie Lahaie

Deux fondements de la lexicographie franco-canadienne enfin mis à jour : les manuscrits de Potier (…

André Lapierre

Comparaison de l'utilisation des dictionnaires électroniques et des dictionnaires papier en traduct…

Nadine Forget

Voir tous les contenus de ce colloque

Autres communications du même congressiste :

Thème du colloque :

La lexicographie canadienne à l'aube de l'an 2000

La nomenclature d'un futur dictionnaire du français standard en usage au Québec : problématique et …

Hélène Cajolet-Laganière

Le français à la dérive : une réalité?

Hélène Cajolet-Laganière

Divers outils informatisés d'aide à la rédaction professionnelle

Hélène Cajolet-Laganière