pen icon Colloque
quote

Évaluation de quelques indices «simples» de richesse lexicale (R.C. et W.)

AC

Membre a labase

André Cossette

Résumé du colloque

Certaines formules qui servent à estimer la richesse lexicale, comme la loi binomiale, exigent que l'on connaisse la distribution des fréquences d'un texte. D'autres, au contraire, ne nécessitent la connaissance que du nombre de mots ou d'occurrences (N) et du nombre de vocables différents (V). Nous évaluons ici les indices de Guiraud (R); Herdan (C), Dugast (U) et Brunet (W) qui appartiennent à cette deuxième catégorie réunissant des indices plus simples à utiliser. Deux questions sont posées par ces indices: est-il fidèle à la richesse lexicale réelle que l'on veut évaluer et est-il sensible à la longueur du texte? Pour répondre à ces questions, nous avons prélevé sur deux textes de richesse lexicale différente des séries de trente échantillons aléatoires exhaustifs de même longueur, puis des séries de longueur inégale. Cette technique nous a permis d'isoler et de faire varier chacune des deux variables (richesse et longueur) tout en maintenant l'autre constante. On a aussi comparé les indices les uns aux autres de façon à faire ressortir la valeur relative de chacun de même que les similitudes qui les unissent et les limites qu'il convient de poser à leur utilisation.

Contexte

Section :
Linguistique
news icon Thème du colloque :
Linguistique
host icon Hôte : Université de Sherbrooke

Découvrez d'autres communications scientifiques

news icon

Titre du colloque :

Linguistique

Autres communications du même congressiste :

news icon

Thème du colloque :

Linguistique