pen icon Colloque
quote

L’évaluation du biais dans le taux d’erreur apparent d’une régression logistique avec la méthode du bootstrap

BF

Membre a labase

Bertrand Fournier

Résumé du colloque

Chaque fois que nous utilisons une fonction de prédiction, nous sommes intéressés à évaluer le taux d’erreur de cette fonction, c’est-à-dire la probabilité de prédire une future observation avec erreur. Si les mêmes observations servent à la fois pour construire et évaluer une règle de décision, il est généralement connu que le taux d’erreur obtenu, le taux d’erreur manifeste, sous-estime le taux d’erreur réel. Nous avons vu que le biais manifeste est lié à la taille de l’échantillon de formation, l’échantillon utilisé pour construire la fonction de prédiction, nous avons également montré que le paramètre moyen Poin doit estimer. Quel est le taux d’erreur d’une règle de prédiction avec et sans sélection de variables? Plus spécifiquement, nous nous intéressons à savoir comment et jusqu’où utilise la régression logistique et nous évaluons le biais de l’erreur manifeste par la méthode du bootstrap. Nous appliquons cette règle de décision à une banque de données de 151 questionnaires portant sur l’évaluation des demandes de crédit de petites entreprises canadiennes. Le taux d’erreur manifeste obtenu avec la fonction de prévision est de 0,059%. Nous utilisons 500 échantillons bootstrap pour déterminer le taux d’erreur supplémentaire. Le taux de convergence des échantillons logistiques est 77.6%. Les résultats des 500 échantillons nous donnent un taux d’erreur supplémentaire estimée de -0,0068. Si l’on utilise que les échantillons avec convergence, nous obtenons un taux d’erreur supplémentaire égal à -0,0005.

Contexte

host icon Hôte : Université du Québec à Montréal

Découvrez d'autres communications scientifiques

Autres communications du même congressiste :