L'idée de base de l'approche F+D est à relier à
de nombreux travaux de sciences cognitives qui, chacun avec leur propre
terminologie et avec de nombreuses nuances, nient la possibilité
de modéliser l'environnement par une simple opération de type
"traitement de l'information" et défendent la thèse
que toute activité cognitive sensori-motrice doit être "enracinée"
dans une interaction physique effective avec l'environnement.
Ces travaux vont du concept de "corporéité" de Merleau-Ponty
([Merleau-Ponty42] & [Merleau-Ponty45]) à la notion d'"enaction"
de Varela ([Varela89a], [Varela89b], [Varela91] & [Varela93]) en passant
par la "psychologie écologique" de Gibson et sa notion
d'"affordance" [Gibson79], par le concept d'"action en situation"
de Suchman [Suchman87] et finalement par les travaux de Braitenberg et Brooks
([Braitenberg83] & [Brooks91b]).
De nombreuses logiques "alternatives" ont été proposées
pour essayer de pallier les difficultés de l'approche F+I et pour
gérer l'incertitude et l'incomplétude de l'information venant
d'un phénomène physique et naturel. Toutes ces propositions
restent cependant fondamentalement attachées à l'objectivité.
Concernant ces logiques "alternatives", on pourra pour aborder
ce vaste sujet se référer à [Rosser58] et [Turner84]
pour les logiques multivaluées, à [Bradley79], [McCarthy80],
[McDermott80], [McDermott82], et [Turner84] pour les logiques modales et
non monotones, à [Zadeh65], [Goguen67] et [Dubois80] pour la logique
floue, à [Dempster68] et [Shafer76] pour la théorie dite de
"Dempster-Shafer" et enfin, à [Zadeh78] et [Dubois85] pour
la théorie des possibilités.
Des débats passionnés ont eu lieu autour des mérites
relatifs des diverses théories du raisonnement plausible. On trouvera
des arguments en faveur des probabilités dans [Cox61], [deFinetti72],
[Cheeseman85], [Robert91] et [Pearl91].
Chercher à élaborer des structures internes rendant compte
de dépendances entre variables observées est un paradigme
déjà largement exploré et connu sous le nom générique
d'apprentissage.
Il en est ainsi, par exemple, de la théorie de l'identification et
des très nombreux et très importants travaux qui y sont liés.
Elle cherche, étant donné un modèle mathématique
d'un phénomène, à identifier la forme et la valeur
des paramètres de ce modèle pour décrire "correctement"
un ensemble d'observations. On distingue, l'identification paramétrique
et l'identification non paramétrique. La première impose des
contraintes de type analytique sur le modèle (notamment contraintes
de "lissage" et de dérivabilité sur les fonctions)
et cherche dans une classe de fonctions laquelle peut le mieux rendre compte
des données. La seconde, plus restrictive, part d'une forme fonctionnelle
donnée a priori et cherche uniquement à l'ajuster aux données.
On distingue aussi la théorie de l'approximation et la théorie
de l'estimation. La première prend en compte explicitement la gestion
de l'incertitude, alors que la seconde assume qu'une description analytique
sans incertitude est suffisante. Les applications de l'identification sont
très nombreuses.
L'identification est un sujet trop vaste pour qu'une bibliographie même
superficielle en soit proposée. Contentons-nous de citer deux ouvrages
introductifs de qualité, [Tarentola87] plutôt théorique,
et [Richallet91] couvrant la pratique de ces techniques, ainsi que les thèses
de A. Labbi [Labbi93] et R. Balaniuk [Balaniuk96] qui ont l'avantage de
faire le lien entre les réseaux neuronaux et l'identification.
L'approche réseaux de neurones formels relève de la même
démarche et peut être vu comme un cas particulier de l'identification.
La forme fonctionnelle donnée a priori correspond à l'architecture
du réseau et les paramètres à identifier pour ajuster
le modèle aux observations sont alors appelés "poids".
Les réseaux de neurones formels sont fréquemment utilisés
en robotique pour faire de l'apprentissage. De nombreuses voies sont en
cours d'exploration, certaines sont assez proches de celle préconisées
dans cette étude.
De plus, la tendance actuelle en théorie des réseaux de neurones
formels est de montrer que ces réseaux sont des implantations plus
ou moins astucieuses et efficaces d'estimateurs probabilistes. La théorie
du raisonnement probabiliste et les techniques de maximum d'entropie introduites
précédemment et qui seront développées dans
la suite apparaissent donc de plus en plus comme le support théorique
des travaux effectués dans le domaine des réseaux de neurones
formels.
On peut d'une part espérer que l'existence d'une théorie mathématique
claire des réseaux va pouvoir faire progresser le développement
de ceux-ci et, d'autre part, que les algorithmes étudiés pour
les réseaux vont constituer des implantations intéressantes
(notamment parallèles) des méthodes théoriques proposées
par le raisonnement probabiliste.
Pour les liens théoriques entre réseaux de neurones formels
et probabilités on pourra lire, entre autres, [Geman84], [Smolensky86],
[Cotrell88], [Robert90b], [Bessière90c], [Hervé90], [Robert91]
et [Geman92].
Pour les liens théoriques entre réseaux de neurones formels,
probabilités et physique statistique on pourra lire aussi, par exemple,
[Gardner89a], [Gardner89b], [Brunel92], [Grassberger92], [Nadal92], [Nadal93]
et [Gutfreund94].
Enfin, pour un recensement très large des applications des réseaux
de neurones à la robotique on se référera à
l'étude faite sur le sujet par le laboratoire LIFIA pour le compte
de la DRET.
Ni la théorie de l'identification (approximation + estimation) ni
celle des réseaux ne répondent cependant aux exigences que
nous nous sommes fixé, car, si elles permettent de construire des
structures de données rendant compte des dépendances entre
variables observées, elles ne permettent plus, comme s'était
le cas dans l'approche F+I, de combiner entre elles ces structures pour
dérouler un calcul formel. Tel est l'essence de la critique adressée
par Fodor et Pylyshyn au "connexionisme" quand ils lui reprochent
de ne plus pouvoir satisfaire les contraintes de productivity, systematicity
et compositionality qu'ils considèrent comme indispensable
pour tous systèmes cognitifs. Concernant ces objections, l'article
de référence est [Fodor88]. On consultera les deux livres
de Fodor [Fodor76] et [Fodor84] pour mieux comprendre cet article en le
replaçant dans l'ensemble de la théorie cognitive qu'il préconise.