pen icon Colloque
quote

Quelques problèmes reliés au choix de la meilleure régression

GD

Membre a labase

Guylaine Dubreuil

Résumé du colloque

Le but de cette présentation consiste à comparer quelques-uns des critères de sélection de variables rencontrés lors de l'utilisation des logiciels statistiques à notre disposition. Il s'agit d'estimer la probabilité de sélectionner le bon modèle selon un des critères de sélection à l'étude et ce, pour le modèle de régression linéaire multiple Y = Xβ + ε où ε est un vecteur de dimension n, de loi multinormale avec espérance 0 et covariance σ²I où σ² est une constante inconnue et I est la matrice identité. Par la suite, nous examinons les diverses conséquences qui surviennent lorsque certaines variables explicatives sont omises ou considérées en trop. Ainsi, connaissant les circonstances d'une sélection inadéquate de variables, différents aspects de certains critères de sélection dont celui basé sur la statistique du Cp de Mallows sont présentés. Les simulations nous permettent de faire la différence entre les divers critères de sélection. Les probabilités de sélectionner le bon modèle sont effectuées avec ce dernier. Après avoir détecté la cause principale de l'un des problèmes survenant avec l'utilisation du critère de sélection basé sur la statistique du Cp de Mallows, nous proposons une nouvelle statistique consistant en une fonction du Cp. Nous répétons alors les mêmes simulations avec cette nouvelle statistique afin de vérifier l'importance de l'amélioration apportée par celle-ci quant à la probabilité de sélectionner le bon modèle.

Contexte

host icon Hôte : Université de Montréal

Découvrez d'autres communications scientifiques

Autres communications du même congressiste :