Apprentissage de combat

Cet exemple met en place des créatures qui apprennent par eux même grâce à un algorithme génétique appliqué sur un réseau de neurones.

Objectif de l'expérience :
Le but est de tuer l'adversaire, qui a 3 vies. On attend des créatures qu'à la fin ils puissent viser (donc régler son champs de vision en conséquence), tirer, et esquiver.

Mise en oeuvre :
Le système de classement et donc de calcul du fitting est un système de tournoi (tout le monde affronte tous les autres), où chaque individu gagne 3 points pour un match gagné, 1 pour un égalité, et 0 s'il perd.

L'algorithme de sélection utilisé est une selection "roulette wheel".

Chaque créature est dotée d'un réseau de neurones qui suit le schéma suivant :

4 inputs :
-présence d'ennemi dans son champs de vision
-présence de boulet dans son champs de vision
-s'il a déjà tiré un missile ou non
-largeur (en radians) de son champ de vision

2 couches de neurones :
Tous les neurones de la première couche sobt reliés à tous les neurones de la deuxième couche, firmant un graphe semi-complet.

5 outputs :
-Avancer tout droit
-Tourner a gauche
-Tourner a droite
-Tirer
-Changer le champs de vision
Un rétro contrôle existe pour le champ de vision (voir schéma).

Le schéma suivant illustre la structure du réseau de neurones mis en oeuvre :