pen icon Colloque
quote
JD

Membre a labase

Jean-Francois Delannoy

Résumé du colloque

Il est admis que les textes techniques sont plus faciles à traiter informatiquement que les autres, mais peu d'auteurs se soucient de les définir. Nous avons établi une liste de 42 traits qui pouvaient avoir un degré significatif de corrélation avec la "technicalité". Certains sont objectifs, comme présence d'interrogations, présence de phrases interrogatives; certains sont subjectifs: organisation hiérarchique. Neuf textes, sur lesquels un questionnaire détaillé a été rempli par 22 personnes, ont fourni un jeu de données sur les traits. 32 des traits sont statistiquement de bons prédicteurs. L'expérience réalisée est sujette à un élément de variabilité dû à la limitation de compétence des sujets en matière de linguistique, à la différence d'appréciation de paramètres flous comme "fréquent" (et de ce qui serait une valeur neutre). L'inventaire a été révisé, et une formule de calcul du degré de technicalité a été créée à partir de ce nouvel inventaire. Les traits retenus sont variés : ils sont de type binaire ou scalaire; portent sur le niveau document, page, paragraphe ou phrase; et relèvent de la sphère lexicale/syntaxique (usage de termes techniques, nominalisations, etc.), sémantique/pragmatique (objectivité, usage d'invectives) ou structurale (table des matières, etc.). Pour l'instant, le degré de technicalité d'un texte s'obtient par une combinaison linéaire des valeurs de ces traits. Nous travaillons actuellement sur le raffinement du traitement statistique.

Contexte

Section :
Informatique
news icon Thème du colloque :
Informatique
manager icon Responsables :
Robert Laganière
host icon Hôte : Université d’Ottawa

Découvrez d'autres communications scientifiques

news icon

Titre du colloque :

Informatique

Autres communications du même congressiste :

news icon

Thème du colloque :

Informatique