pen icon Colloque
quote

Auto-apprentissage d'une fonction heuristique pour un jeu stratégique déterministe

JI

Membre a labase

Jean-François Isabelle

Résumé du colloque

Le design d'une fonction heuristique pour des jeux stratégiques complexes n'est pas une tâche facile, d'où l'intérêt du développement d'une méthode d'apprentissage automatique d'une telle fonction. À l'aide d'un réseau de neurones artificiel et d'une technique récente d'apprentissage par différenciation temporelle, nous avons réalisé un programme pouvant apprendre, en jouant contre lui-même, à bien évaluer les différentes situations du jeu Othello. Une bonne évaluation devrait prédire l'issue d'un match à partir de la position courante des pièces sur l'othellier. Ce jeu présente deux caractéristiques intéressantes pour nos travaux : l'humain est pour le moment le champion incontesté, mais surtout, ce jeu est purement déterministe : aucun hasard (coup des autres) n'intervient durant la partie, c'est donc un processus déterministe. Cette deuxième caractéristique est importante, puisqu'il est reconnu dans la littérature qu'elle constitue un handicap au succès de l'application des méthodes connues d'analyse de jeux. Nous présentons donc trois solutions au problème de l'auto-apprentissage avec des déterministes, ainsi que l'introduction d'un nouveau paramètre destiné à simuler une recherche plus approfondie de jeu. Les résultats des expériences réalisées montrent qu'il est possible d'atteindre un niveau d'auto-apprentissage suffisant pour permettre d'apprendre suffisamment de stratégies pour que le joueur gagne 80% des parties contre un bon programme-joueur d'Othello.

Contexte

host icon Hôte : Université du Québec à Montréal

Découvrez d'autres communications scientifiques

Autres communications du même congressiste :