Colloque

L’évaluation du biais dans le taux d’erreur apparent d’une régression logistique avec la méthode du bootstrap

Bertrand Fournier

Danielle Morin

Dale Doreen

Brenda MacGibbon

Membre a labase

Bertrand Fournier

Résumé du colloque

Chaque fois que nous utilisons une fonction de prédiction, nous sommes intéressés à évaluer le taux d’erreur de cette fonction, c’est-à-dire la probabilité de prédire une future observation avec erreur. Si les mêmes observations servent à la fois pour construire et évaluer une règle de décision, il est généralement connu que le taux d’erreur obtenu, le taux d’erreur manifeste, sous-estime le taux d’erreur réel. Nous avons vu que le biais manifeste est lié à la taille de l’échantillon de formation, l’échantillon utilisé pour construire la fonction de prédiction, nous avons également montré que le paramètre moyen Poin doit estimer. Quel est le taux d’erreur d’une règle de prédiction avec et sans sélection de variables? Plus spécifiquement, nous nous intéressons à savoir comment et jusqu’où utilise la régression logistique et nous évaluons le biais de l’erreur manifeste par la méthode du bootstrap. Nous appliquons cette règle de décision à une banque de données de 151 questionnaires portant sur l’évaluation des demandes de crédit de petites entreprises canadiennes. Le taux d’erreur manifeste obtenu avec la fonction de prévision est de 0,059%. Nous utilisons 500 échantillons bootstrap pour déterminer le taux d’erreur supplémentaire. Le taux de convergence des échantillons logistiques est 77.6%. Les résultats des 500 échantillons nous donnent un taux d’erreur supplémentaire estimée de -0,0068. Si l’on utilise que les échantillons avec convergence, nous obtenons un taux d’erreur supplémentaire égal à -0,0005.

Contexte

Section :

Méthodes et applications de la statistique 1994

Thème du colloque :

Méthodes et applications de la statistique 1994

Hôte : Université du Québec à Montréal

Découvrez d'autres communications scientifiques

Dans le même colloque
Du même congressiste

Titre du colloque :

Méthodes et applications de la statistique 1994

L'homogénéité des variances en ANOVA : aspects pratiques

Sylvain Végiard

Les déterminants de la mortalité au Canada

Charles Bérubé

Différents aspects de la méthodologie utilisée dans la production des fichiers de microdonnées à gr…

Danielle Lebrasseur

Voir tous les contenus de ce colloque

Autres communications du même congressiste :

Thème du colloque :

Méthodes et applications de la statistique 1994

L’évaluation du biais dans le taux d’erreur apparent d’une régression logistique avec la méthode du…

Bertrand Fournier

L’évaluation du biais dans le taux d’erreur apparent d’une régression logistique avec la méthode du…

Bertrand Fournier

L’évaluation du biais dans le taux d’erreur apparent d’une régression logistique avec la méthode du…

Bertrand Fournier