Colloque

Auto-apprentissage d'une fonction heuristique pour un jeu stratégique déterministe

Jean-François Isabelle

Samy Bengio

Jocelyn Cloutier

Membre a labase

Jean-François Isabelle

Résumé du colloque

Le design d'une fonction heuristique pour des jeux stratégiques complexes n'est pas une tâche facile, d'où l'intérêt du développement d'une méthode d'apprentissage automatique d'une telle fonction. À l'aide d'un réseau de neurones artificiel et d'une technique récente d'apprentissage par différenciation temporelle, nous avons réalisé un programme pouvant apprendre, en jouant contre lui-même, à bien évaluer les différentes situations du jeu Othello. Une bonne évaluation devrait prédire l'issue d'un match à partir de la position courante des pièces sur l'othellier. Ce jeu présente deux caractéristiques intéressantes pour nos travaux : l'humain est pour le moment le champion incontesté, mais surtout, ce jeu est purement déterministe : aucun hasard (coup des autres) n'intervient durant la partie, c'est donc un processus déterministe. Cette deuxième caractéristique est importante, puisqu'il est reconnu dans la littérature qu'elle constitue un handicap au succès de l'application des méthodes connues d'analyse de jeux. Nous présentons donc trois solutions au problème de l'auto-apprentissage avec des déterministes, ainsi que l'introduction d'un nouveau paramètre destiné à simuler une recherche plus approfondie de jeu. Les résultats des expériences réalisées montrent qu'il est possible d'atteindre un niveau d'auto-apprentissage suffisant pour permettre d'apprendre suffisamment de stratégies pour que le joueur gagne 80% des parties contre un bon programme-joueur d'Othello.

Contexte

Section :

Apprentissage et réseaux de neurones artificiels

Thème du colloque :

Apprentissage et réseaux de neurones artificiels

Hôte : Université du Québec à Montréal

Découvrez d'autres communications scientifiques

Dans le même colloque
Du même congressiste

Titre du colloque :

Apprentissage et réseaux de neurones artificiels

Auto-apprentissage d'une fonction heuristique pour un jeu stratégique déterministe

Jean-François Isabelle

Analyse Frontale Neuronique

Régis Cardin

Un système d'encryptage basé sur un réseau de neurones formels

J. Rouat

Voir tous les contenus de ce colloque

Autres communications du même congressiste :

Thème du colloque :

Apprentissage et réseaux de neurones artificiels

Auto-apprentissage d'une fonction heuristique pour un jeu stratégique déterministe

Jean-François Isabelle

Auto-apprentissage d'une fonction heuristique pour un jeu stratégique déterministe

Jean-François Isabelle