<< Up Title Contents


III.5. Notes bibliographiques


 

L'idée de base de l'approche F+D est à relier à de nombreux travaux de sciences cognitives qui, chacun avec leur propre terminologie et avec de nombreuses nuances, nient la possibilité de modéliser l'environnement par une simple opération de type "traitement de l'information" et défendent la thèse que toute activité cognitive sensori-motrice doit être "enracinée" dans une interaction physique effective avec l'environnement.
Ces travaux vont du concept de "corporéité" de Merleau-Ponty ([Merleau-Ponty42] & [Merleau-Ponty45]) à la notion d'"enaction" de Varela ([Varela89a], [Varela89b], [Varela91] & [Varela93]) en passant par la "psychologie écologique" de Gibson et sa notion d'"affordance" [Gibson79], par le concept d'"action en situation" de Suchman [Suchman87] et finalement par les travaux de Braitenberg et Brooks ([Braitenberg83] & [Brooks91b]).

De nombreuses logiques "alternatives" ont été proposées pour essayer de pallier les difficultés de l'approche F+I et pour gérer l'incertitude et l'incomplétude de l'information venant d'un phénomène physique et naturel. Toutes ces propositions restent cependant fondamentalement attachées à l'objectivité.
Concernant ces logiques "alternatives", on pourra pour aborder ce vaste sujet se référer à [Rosser58] et [Turner84] pour les logiques multivaluées, à [Bradley79], [McCarthy80], [McDermott80], [McDermott82], et [Turner84] pour les logiques modales et non monotones, à [Zadeh65], [Goguen67] et [Dubois80] pour la logique floue, à [Dempster68] et [Shafer76] pour la théorie dite de "Dempster-Shafer" et enfin, à [Zadeh78] et [Dubois85] pour la théorie des possibilités.
Des débats passionnés ont eu lieu autour des mérites relatifs des diverses théories du raisonnement plausible. On trouvera des arguments en faveur des probabilités dans [Cox61], [deFinetti72], [Cheeseman85], [Robert91] et [Pearl91].

Chercher à élaborer des structures internes rendant compte de dépendances entre variables observées est un paradigme déjà largement exploré et connu sous le nom générique d'apprentissage.

Il en est ainsi, par exemple, de la théorie de l'identification et des très nombreux et très importants travaux qui y sont liés. Elle cherche, étant donné un modèle mathématique d'un phénomène, à identifier la forme et la valeur des paramètres de ce modèle pour décrire "correctement" un ensemble d'observations. On distingue, l'identification paramétrique et l'identification non paramétrique. La première impose des contraintes de type analytique sur le modèle (notamment contraintes de "lissage" et de dérivabilité sur les fonctions) et cherche dans une classe de fonctions laquelle peut le mieux rendre compte des données. La seconde, plus restrictive, part d'une forme fonctionnelle donnée a priori et cherche uniquement à l'ajuster aux données. On distingue aussi la théorie de l'approximation et la théorie de l'estimation. La première prend en compte explicitement la gestion de l'incertitude, alors que la seconde assume qu'une description analytique sans incertitude est suffisante. Les applications de l'identification sont très nombreuses.
L'identification est un sujet trop vaste pour qu'une bibliographie même superficielle en soit proposée. Contentons-nous de citer deux ouvrages introductifs de qualité, [Tarentola87] plutôt théorique, et [Richallet91] couvrant la pratique de ces techniques, ainsi que les thèses de A. Labbi [Labbi93] et R. Balaniuk [Balaniuk96] qui ont l'avantage de faire le lien entre les réseaux neuronaux et l'identification.

L'approche réseaux de neurones formels relève de la même démarche et peut être vu comme un cas particulier de l'identification. La forme fonctionnelle donnée a priori correspond à l'architecture du réseau et les paramètres à identifier pour ajuster le modèle aux observations sont alors appelés "poids".
Les réseaux de neurones formels sont fréquemment utilisés en robotique pour faire de l'apprentissage. De nombreuses voies sont en cours d'exploration, certaines sont assez proches de celle préconisées dans cette étude.
De plus, la tendance actuelle en théorie des réseaux de neurones formels est de montrer que ces réseaux sont des implantations plus ou moins astucieuses et efficaces d'estimateurs probabilistes. La théorie du raisonnement probabiliste et les techniques de maximum d'entropie introduites précédemment et qui seront développées dans la suite apparaissent donc de plus en plus comme le support théorique des travaux effectués dans le domaine des réseaux de neurones formels.
On peut d'une part espérer que l'existence d'une théorie mathématique claire des réseaux va pouvoir faire progresser le développement de ceux-ci et, d'autre part, que les algorithmes étudiés pour les réseaux vont constituer des implantations intéressantes (notamment parallèles) des méthodes théoriques proposées par le raisonnement probabiliste.
Pour les liens théoriques entre réseaux de neurones formels et probabilités on pourra lire, entre autres, [Geman84], [Smolensky86], [Cotrell88], [Robert90b], [Bessière90c], [Hervé90], [Robert91] et [Geman92].
Pour les liens théoriques entre réseaux de neurones formels, probabilités et physique statistique on pourra lire aussi, par exemple, [Gardner89a], [Gardner89b], [Brunel92], [Grassberger92], [Nadal92], [Nadal93] et [Gutfreund94].
Enfin, pour un recensement très large des applications des réseaux de neurones à la robotique on se référera à l'étude faite sur le sujet par le laboratoire LIFIA pour le compte de la DRET.

Ni la théorie de l'identification (approximation + estimation) ni celle des réseaux ne répondent cependant aux exigences que nous nous sommes fixé, car, si elles permettent de construire des structures de données rendant compte des dépendances entre variables observées, elles ne permettent plus, comme s'était le cas dans l'approche F+I, de combiner entre elles ces structures pour dérouler un calcul formel. Tel est l'essence de la critique adressée par Fodor et Pylyshyn au "connexionisme" quand ils lui reprochent de ne plus pouvoir satisfaire les contraintes de productivity, systematicity et compositionality qu'ils considèrent comme indispensable pour tous systèmes cognitifs. Concernant ces objections, l'article de référence est [Fodor88]. On consultera les deux livres de Fodor [Fodor76] et [Fodor84] pour mieux comprendre cet article en le replaçant dans l'ensemble de la théorie cognitive qu'il préconise.


<< Up Title Contents ÿ