<< Up Title Contents


III.3.1. Utilisation et apprentissage de comportements réactifs

Dans cette première série d'expériences, nous avons cherché à doter Khépéra de comportements purement réactifs vis-à-vis des obstacles. Les commandes motrices sont directement inférées des valeurs sensorielles.

Prenons l'exemple de l'évitement d'obstacle. Le but poursuivi est de donner la capacité à Khépéra d'éviter les obstacles et d'aller en ligne droite lorsqu'il est en espace libre.

Nous avons choisi d'utiliser pour cette expérience les 3 variables Dir, Prox et Vrot. La description correspondante va donc être une distribution de la forme :

[3.5]

Le protocole expérimental adopté est constitué de 2 phases:

La description P(Dir Prox Vrot | D C) obtenue lors de l'apprentissage, dépend évidemment des expériences D, mais aussi, et d'une certaine manière surtout, des connaissances préalables C.
Les connaissances préalables C données par le concepteur peuvent être regroupées en 4 catégories de natures différentes :

[3.6]

[3.7]

[3.8]

[3.9]

[3.10]

[3.11]

Par le calcul formel, on peut alors, en phase de restitution commander Khépéra en choisissant à chaque instant Vrot suivant la distribution P(Vrot |Dir Prox D C).
La commande de Khépéra par cette méthode fonctionne très bien. Après un temps d'apprentissage de quelques minutes, (< 5 minutes) on obtient le comportement souhaité (voir figure 11). Le comportement obtenu s'avère être très "robuste" au changement de position, de taille, de forme, de matière, de couleurs[12] et même de vitesse des obstacles, ainsi qu'aux conditions d'éclairage de la scène.


Figure 11 : comportement d'évitement d'obstacle

Avec la même méthode et les mêmes connaissances préalables, en changeant l'apprentissage téléopéré au "joystick", on a appris a Khépéra à suivre les murs et contours (voir figure 12) et à poursuivre les obstacles mobiles.


Figure 12 : comportement de suivi de contour

Avec la même méthode, sur la base des variables Vrot et Lum nous avons appris à Khépéra un comportement photophile représenté par la description P(Vrot Lum | D' C').


[11]Une structure de dépendance est une généralisation de la notion de réseaux bayésiens due à J. Pearl [Pearl91].

[12]En fait, seul les obstacles noirs et mats, que les proximètres ne voient pas du tout, posent un problème.


<< Up Title Contents ÿÿÿÿ