I.A. et robotique : les cinq sens... Bénéficiant des techniques de l'intelligence artificielle, la transmission des savoirs vit au début des années 90 une révolution copernicienne. Les concepts sont bouleversés. Ils s'enrichissent de l'apport du couple IA-Robotique qui crée ses propres spécificités. Dans la mesure où des sens nouveaux sont investis par une technologie qui commence à savoir les reproduire, nous entrons dans une époque riche de possibilités originales. Les implications sont loin d'être neutres. Les enjeux économiques et culturels se mélent pour susciter le début d'une mutation des sociétés. Cela concerne la perception même de notre identité. L'intelligence artificielle pousse les chercheurs à s'interroger sur la nature de l'homme, afin de la comprendre, puis de la copier partie par partie. Les enjeux sont philosophiques par définition et industriels par nécessité. Déjà avec la biologie se posaient des problèmes fondamentaux que Monod exprimait dans le Hasard et la Nécessité. Mais avec la robotique, outre les éléments biologiques, ce sont les fondements mêmes de l'intelligence et de la perception qui se trouvent placés sous le feu des projecteurs. Est-il bon de savoir qui nous sommes ? Jamais une révolution technologique ne s'est vue remettre en question efficacement pour des raisons philosophiques. Les progrès de la robotique ne concernent pas seulement, à travers leur développement rapide, la philosophie et la religion. Ils mettent en jeux l'avenir industriel et économique dans son ensemble. La productivité et la compétitivité sont liées aux prix de revient, qui dépendent quant à eux de l'état de la technique. Les robots constituent une main d'oeuvre quasi-gratuite, dont la compétence ne cessera de croître au fil des années. Leur sophistication leur ouvre progressivement des tâches jusque là réservées à l'homme. En même temps, la robotique intervient dans la transmission des savoirs. Les cinq sens ne sont plus l'apanage de l'être vivant. Dans le cas contraire il s'agirait tout simplement de redéfinir le vivant, puis l'intelligence, puis la notion d'intelligence évoluée. Mais à chaque étape technologique, les mêmes problèmes se sont posés. La Terre n'a pas été créée l'après-midi d'un jour précis de l'an 4004 avant Jésus Christ. Le soleil ne tourne pas autour de la Terre. Des éléments d'origine organique sont couramment trouvés dans les météorites. Par assimilation et accomodation les sociétés ont absorbé et intégré les nouveaux points de vue. Mais peut-être ces révolutions culturelles n'ont-elles été qu'un entraînement par rapport au défi culturel actuel. Il nous faut faire face maintenant à une redéfinition des aptitudes et de l'identité humaine, face à une technologie qui copie, reproduit et multiplie ce que nous sommes. Au niveau du rapport de puissance sous-jacent à cette évolution, le problème devient politique. Si on ne redéfinit pas les droits de l'homme avec précision, que se passera-t-il lorsque les aptitudes au travail qui définissent la place de chacun dans la société seront remises en question par les progrès de la robotique intelligente ? La transmission des savoirs, avec toute sa richesse, subit actuellement un saut qualitatif, accompagné de ce qui pourrait bien être partiellement une menace : la banalisation de la performance présente ses propres dangers, qu'il s'agira de gérer. Où en est au début des années 90, l'état de l'art en ce qui concerne la robotique, l'intelligence artificielle et les cinq sens ?
Le toucher
Beaucoup plus complexe qu'il n'y paraît, le toucher concerne aussi bien la reconnaissance des formes et leur positionnement dans l'espace que la nature des matériaux, à travers leur texture, leur élasticité, leur temps de réaction à la poussée, ou leur poids. Chez l'homme, le bout des doigts est équipé de telle façon qu'il leur est possible, sous certaines conditions d'entrainement, de "voir", ou du moins de percevoir de façon analogique avec celle dont fonctionnent certaines cellules de l'aire visuelle, notamment pour discerner les bords d'un objet. Les fonctionnalités du toucher, principalement dans la main, sont donc d'une importance capitale pour la réalisation de robots destinés à coordonner une information visuelle de distance et direction avec des modalités de préhension. La gestion des erreurs de manipulation présuppose une bonne compréhension générale des problèmes de feedback relatifs à la pression exercée, à la résistance du matériau signalant sa présence et éventuellement des aspects spécifiques de son positionnement. Par exemple, la répartition de la pression en retour exercée par l'objet saisi peut signaler que l'objet a été mal saisi, ou qu'il s'agit d'une pièce défectueuse. Un robot destiné à ranger des oeufs dans des boîtes doit pouvoir "sentir" qu'une pression visqueuse s'exerce indûment entre ses doigts. L'homme sert de modèle. Il offre à la fois des directions de recherche, et des informations certaines quant aux performances que l'on désire atteindre. Seules les performances minimales sont aujourd'hui visées, parce que l'on ignore encore de quelle façon les fonctions complexes sont organisées entre elles. Ces articulations, et surtout leur optimisation préoccupe déjà nombre de chercheurs. Mais l'industrie se soucie essentiellement des résultats concrets. Elle prend donc modèle actuellement sur ce qui est relativement facile à copier. La peau se compose du derme, de l'épiderme, et d'un ensemble de récepteurs spécialisés qui forment de véritables mosaïques. Ils sont classifiés selon leur fonction et leur vitesse de transmission. Leur perception comprend les aspects mécaniques, thermiques, et nociceptifs c'est à dire sensibles à la douleur en vue de préserver l'intégrité physique. Les fibres mécano-receptives répondent au toucher doux, au toucher appuyé, à la position, et au mouvement. Elles informent sur des considérations spatiales. Elles contribuent à une représentation mentale de la position dans l'espace aussi bien du membre concerné que de l'objet perçu. Leurs relations avec d'autres fonctionnalités du cerveau sont riches et complexes. Il ne s'agit pas de sens isolés. Une stimulation mécanique est perçue en fonction de la sensation qu'elle produit. Ce n'est pas le récepteur lui-même qui est important au final, mais plutôt la structure de l'information transmise, qui sera considérée comme une forme reconnaissable. Elle sera classifiée et catégoriée, immédiatement reconnue par des groupes de cellules spécialisées dans le cerveau. Les récepteurs étant un des éléments de la chaîne de perception, on comprendra mieux comment, sous l'influence des drogues, on voit des sons, on entend des couleurs, on subit un mélange de "perceptions qui n'existent pas". Les messages arrivent aux mauvais endroit, sous l'influence du dopage des récepteurs. Mais la structure des messages est souvent la même. La cellule d'arrivée ne fait que les interpréter, en leur donnant une sensation tactile, auditive ou visuelle. Ainsi les chauve-souris "voient" avec leurs oreilles. Leur sonar leur permet de positionner des objets dans l'espace. Plusieurs sens différents peuvent donc contribuer à un même résultat final : percevoir l'environnement et son mouvement. Dans le domaine de la chirurgie, ou dans celui de la robotique, il s'agit maintenant d'explorer de quelle façon on peut tirer parti de l'analogie de structure des cellules spécialisées dans la reconnaissance des formes (visuelles, tactiles, auditives, olfactives, gustatives avec chacune de leurs nombreuses sous-classes). Certains aveugles voient rudimentairement avec le bout de leurs doigts. Ils peuvent reconnaître des formes, distinguer des changements de couleurs sur une page. Il existe à cela des raisons physiologiques tenant à la nature des fibres qui sont stimulées, au rythme auquel elles se déchargent, et à l'endroit où sont transportés ces messages. Dans le cas d'un homme possédant l'intégralité de ses perceptions, certains chemins sont bloqués parce que réservés. Mais chez d'autres, notamment les aveugles, toute une aire importante du cerveau reste disponible pour analyser des signaux qui ne lui étaient à priori pas destinés et qui deviennent soudain réattribuables. Quand on envisage la création de robots médicaux, il devient évident que plus on disposera de finesse de discrimination au niveau des moindres perceptions (résistance, humidité, densité, pression, élasticité, autres... ) et plus il deviendra possible de sauver de vies humaines. Ainsi, une différence de pression ou de résistance dans un tissu ou une artère pourra être interprétée avant que celui-ci ne cède au cours de l'opération. Actuellement les perceptions courantes des doigts, et de façon plus générale du toucher, concernent les notions de toucher, pression, chaleur, mouvement, avec leurs combinaisons utilisant des variations dans le temps et selon les endroits : chatouillage, gratouillage (cf le Docteur Knock,mais aussi The Cerebral Computer, Robert J. Baron, LEA Publishers 1987, p 365) humidité croissante, texture complexe, variations de température annonçant un message par seuil. Ces perceptions se combinent immédiatement avec des inférences sur le contexte, c'est à dire avec des structures d'interprétation élargies. Ces dernières sont sources d'informations et bien sûr d'illusions lorsque les inductions sont réalisées à partir d'informations insuffisantes ou ambigues. Par exemple, on a parfois l'impression d'éprouver une sensation dont on ne sait pas dire s'il s'agit de chaud ou de froid. Dans les circonstances où il s'agit de réagir rapidement, on éprouvera une sensation de chaleur et on retirera vivement sa main d'un poêle froid. A ce niveau, la perception rejoint les problèmes d'intelligence artificielle : il faut décider en milieu incertain, et réaliser des compromis insatisfaisants. Comme il s'agit, pour les êtres biologiques, d'un mode de survie, l'illusion peut se trouver stockée au milieu des expériences positives, et renforcée en conséquence. Chez les robots l'ambiguité n'existe pas de la même façon. Les senseurs sont monosémiques. Ils gagnent en précision. La réalisation d'un geste passe par un ensemble de contraintes formalisées en fonction des degrés de liberté, du nombre d'articulations, et de la performance de l'algorithme choisi. Ces derniers incluent des vérifications de cheminement afin d'éviter les collisions. Mais en cas d'imprévu le mouvement s'arrête généralement. Il n'existe pas encore d'algorithmes performants susceptibles de créer de nouvelles conduites en environnement complexe. Le robot relié à son unité centrale ne peut s'adapter qu'à des situations déjà modélisées. L'homme, au contraire, et c'est là l'intérêt des travaux de Piaget pour l'I.A. (voir Stallman) sait s'adapter à un environnement changeant par assimilation et accomodation (pour un bon résumé lire Piaget, Mes Idées, Denol, Col. Méditation, Nø153).
Vision et architectures parallèles
Le problème de la reconnaissance des formes ne concerne pas seulement la vision. Cependant les cellules visuelles et surtout l'ensemble des groupes de neurones auxquelles elles sont rattachées sont particulièrement bien adaptés à la résolution de ces problèmes. La reconnaissance des formes conditionne notre perception du monde. Que les formes soient visuelles ou conceptuelles leur définition et surtout leurs articulations à des niveaux de plus en plus élevés constituent la pierre angulaire de notre compréhension au sens large. Dans la mesure où notre esprit perçoit le monde sous forme de structure, le système visuel et sa richesse d'équipements de reconnaissance de formes dépassent de très loin les seuls problèmes de vision. Il s'agit en fait de notre survie au sens biologique du terme. Chez l'homme l'aire visuelle occupe plus de surface que toute autre fonction. Elle ne peut être étudiée indépendamment de ses connexions avec le néo-cortex, siège des abstractions. La mémoire visuelle constitue par exemple un outil exceptionnel pour mémoriser même des notions purement abstraites, ennuyeuses ou ingrates. En effet notre système visuel est d'une rare efficacité pour le stockage de l'information aussi bien que pour son retrait. L'utilisation systématique de la mémoire visuelle à tous les stades, mêmes les plus inattendus de l'apprentissage se révèle d'une rare efficacité (voir encadré).
L'oreille rebelle : dijahititatahm ?
Pierre d'achoppement de l'Intelligence Artificielle, la compréhension de la parole serait-elle un travail d'ingénieur ? La DARPA (Defense Department Advanced Research Project Agency), grande consommatrice d'intelligence artificielle et de robotique, a connu avec les recherches sur la compréhension du langage naturel (c'est à dire ambigu et mal prononcé) son plus beau gouffre à crédits. La conception de programmes susceptibles de comprendre un anglais de base impose aux chercheurs de s'intéresser aux notions fondamentales de la linguistique, de la psychologie, des mathématiques, de la logique ainsi qu'à l'informatique. En algèbre de Boole, on dirait que ce domaine de recherche correspond à une intersection riche. Les problèmes s'y trouvent concentrés. Les premiers programmes de traduction se sont rendus célèbres par leurs bourdes, traduisant par exemple "out of sight, out of mind" (loin des yeux, loin du coeur) par "invisible idiot". Encore ne devaient ils travailler que sur des exemples clairs, non ambigus dans leur écriture. Avec l'analyse des sons, les programmes doivent faire face à des fautes de prononciation, à une mauvaise scansion qui mélange les mots les uns aux autres, et à une explosion combinatoire pour analyser toutes les façons de séparer des mots formés de syllabes exprimées les unes à la suite des autres sans séparation ou avec de mauvaises séparations. Ainsi, "Did you hit it to Tom" sera probablement perçu venant de la bouche de la plupart des américains comme "dijahititatahm ?". Pour comprendre ce qui est perçu par un micro et traduit en impulsions électriques, les programmes doivent donc reconstruire. Mais reconstruire quoi, et comment ? Pour l'instant, si l'on veut dormir tranquille, il vaut mieux être du côté de la personne qui pose la question que de celui du chercheur qui tente d'y répondre. Comment traduire "dijahititatahm ?", phrase courte prononcée d'une façon qui ne pose pas davantage de problèmes que bien d'autres exemples courants ? "Pour récupérer les deux premier mots le programme pourrait utiliser une heuristique signalant que la lettre "y" peut parfois sonner comme un "j" si elle est précédée d'un son "d". Mais "j" pourrait bien signifier "j" ou "dge" comme le "j" de "judge". Le programme doit donc considérer également ces possibilités.En utilisant une autre heuristique signalant que "ou" peut parfois se prononcer "a", ici "dija" pourrait bien signifier "did ya" "(Machinery of the Mind, George Johnson, Times Books1986). Maintenant que se passe-t-il si "Dija" correspond à un nom propre, le programme ne pouvant pas posséder un dictionnaire de tous les noms propres existant ? Même en aimant les puzzles, encore faut-il pouvoir les résoudre, les résoudre avec pertinence, les résoudre avec pertinence dans un temps raisonnable. Le fait de comparer un son à la forme des ondes sonores stockées dans la base de données ne suffit donc pas. Il faut encore grouper les syllabes en mots. Mais avant cela, il faut posséder les syllabes de façon correcte. Si le système réalisait trois tentatives pour chacun des dix phonèmes contenus dans une phrase de dix syllabes, il existerait trois puissance dix possibilités de les comprendre soit 59049 possibilités. Il s'agit donc de se promener intelligemment dans ce labyrinthe sans "succomber à l'explosion combinatoire". Parmi les modes de simplification possibles, l'homme dispose d'un outil puissant : l'analyse contextuelle. Il connaît déjà beaucoup de choses. Chaque mot entendu fait résonner dans notre tête un phénomène de reconnaissance. Nous bénéficions de la puissante architecture parallèle de notre cerveau et de ses milliards de neurones, eux-mêmes reconfigurables avec l'aide des cellules gliales. Mais malgré cela nous avons souvent du mal à reconnaître les paroles d'une chanson "pop" ou "rock" lorsque nous l'entendons à la radio. Les programmes destinés à rendre les "robots" ou les systèmes experts capables de reconnaître la voix humaine se doivent donc de trouver des domaines de simplification, et de restreindre considérablement les contraintes : vocabulaire réduit (environ un millier de mots), règles grammaticales simplifiées, séparation des mots par un temps d'arrêt entre chaque. En acceptant ces simplification$"s, un pilote peut donner des ordres vocalement à ses appareils tout en gardant les mains libres pour d'autres tâches, un voyageur peut obtenir des renseignements sur les vols des compagnies aériennes en téléphonant à un répondeur informatisé. L'oreille humaine est capable de bien des exploits, mais en I.A. et robotique, les chercheurs doivent bien avouer qu'à part s'arracher les quelques cheveux qui leur subsistent encore, il ne leur reste plus qu'à découvrir de nouveaux modes de simplification. Hersay II, le programme qui a le plus marqué ce domaine, ne trouvera sa pleine application que sur des architectures massivement parallèles. Il s'agit de traiter l'information sur cinq niveaux : phonologique, lexical, syntaxique, sémantique et pragmatique. Pour atteindre le niveau pragmatique, la compréhension et les action qui en découlent doivent se dérouler en temps réel.
Baudelaire contre la robotique
Le goût et l'olfaction n'ont pas actuellement d'importance en robotique ni en intelligence artificielle. Personne ne semble souhaiter disposer d'un robot goûteur de vin ni d'un robot dégustateur de foie gras. Cependant les détecteurs de gaz dans les immeubles ou dans les mines peuvent sauver des vies humaines. Certaines odeurs annonciatrices de danger comme l'oxyde de carbone ou le gaz de ville ne sont pas perceptibles par l'homme. Elles sont neutres. Il peut être important d'utiliser des machines susceptibles de remplacer nos sens lorsque ceux-ci sont défaillants, principalement dans les travaux en milieu hostile. Des principes semblables à ceux de l'olfaction interviennent probablement dans la recherche de certains sites, par exemple lorsqu'un sourcier utilise une baguette de coudrier pour rechercher de l'eau. Imaginons la puissance des détecteurs réalisables à partir de l'informatique qui sait amplifier les signaux à volonté. Pour une machine, le métal lui aussi a une odeur. Imaginons la puissance de détecteurs réglables de façon spécifique. Imaginons le couplage de la biotique et d(&e l'informatique. Enfin qui sait si un jour ou l'autre l'art ne consistera pas à traduire des odeurs en sons ou en tableaux par le biais d'ordinateurs. On sait que certains artistes ou des personnes droguées éprouvent des sensations de synesthésie, c'est à dire de mélange des sens. Baudelaire déjà citait dans Correspondances : "Comme de longs échos qui de loin se confondent En une ténébreuse et profonde unité, Vaste comme la nuit et comme la clarté, Les parfums, les couleurs et les sons se répondent." Si les applications concrètes en robotique ou en I.A. de l'olfaction et du goût sont et resteront probablement peu nombreuses en tant que telles, ces deux sens peuvent néanmoins servir de modèles. La recherche progresse parfois de façon inattendue. On peut par exemple supposer que les points communs aux cinq sens permettront d'établir des ponts entre les disciplines, et de trouver ainsi des raccourcis dans le mode de traitement des informations. L'étude des cinq sens et leurs applications en I.A. *(et robotique permet depuis quelques années de relever des défis industriels et médicaux. On espère généraliser des prothèses sensibles à l'influx nerveux. On espère que dans un avenir proche la multiplication des robots permettra à nombre d'entre nous de vivre une ère de loisirs, entouré de "serviteurs", tout comme les nobles anglais du XIXe siècle, chacun bénéficiant d'un pouvoir fascinant dans son domaine limité. On craint cependant une perte d'identité face à des robots ultra-doués, que des méta-heuristiques performantes pourraient peut-être rendre créatifs. En attendant ces hypothétiques catastrophes génératrices de mutations, nous vivons une époque de pionniers. Jacques de Schryver encadrés
Les robots au service de l'homme
Le Robot Institute of America définit le robot industriel comme "un manipulateur reprogrammable et multifonctionnel conçu pour manipuler des matériaux, des éléments, des outils ou des machines spécialisées par le biais de mouvements divers programmés afin de réaliser des tâches de façon performante." Les concepts concernés couvrent les domaines de la cinématique, de la dynamique, de la définition et du contrôle des trajectoires, de la définition et du contrôle du toucher, de la vision et de la reconnaissance vocale. Cela renvoie bien sûr à l'intelligence artificielle dont la robotique est grande consommatrice. Les premiers robots ont été conçus à la fin de la seconde guerre mondiale aux Etats Unis afin de manip-uler les substances radio-actives à la place des chercheurs. En 1947 l'Argonne National Laboratory démarra un projet destiné à développer des manipulateurs à usage général (c.à.d. non spécialisés de façon définitive) qui puissent copier les mouvements et les fonctionnalités de la main humaine. Ces premières machines devinrent performantes lorsqu'on leur adjoignit des mécanismes de feedback, c.à.d. permettant d'agir sur leur état à l'instant n+1 en fonction de leur situation à l'instant n. Depuis la robotique s'est développée avec des crédits gouvernementaux destinés à réaliser des travaux dans l'espace, sous la mer et de façon systématique dans tous les milieux hostiles. Le sous-marin russe coulé dans l'Atlantique par 2000 m de fond voici quelques années fut récupéré par les robots du navire océanographique Glomar Challenger. Les retombées des recherches fondamentales se répercutent relativement rapidement dans l'industrie où les robots sont utilisés pour souder, peindre, assembler, et réaliser /-un ensemble de tâches de précision, y compris la vérification et les tests des produits finis. Mais les systèmes experts capables de donner aux robots toute la souplesse nécessaire à une conduite autonome sont bien sur d'ores et déjà repris dans le cadre de la guerre des étoiles. En cas de destruction des Etats Unis par une attaque surprise, les systèmes experts continueraient la guerre de façon autonome. On pense évidement à la série de science fiction intitulée les "Bersekers" (les tueurs fous). Une application positive de la robotique concerne les robots médicaux. Outre l'aide apportée au cours des opérations couplées à l'imagerie médicale (bombardement intelligent, ciblage évitant de léser les nerfs optiques ou la moelle épinière) il existe tout un champ extrêmement prometteur dans le domaine des prothèses. Le Case Institute of Technology a par exemple réalisé un robot permettant à des quadraplégiques de manipuler divers objets. La machine de lecture Kurzeveil est conçue afin d'aider les aveu1/gles à utiliser des livres. Elle a été installée dans de nombreuses bibliothèques publiques américaines. Elle peut reconnaître plus de 300 polices de caractères. Elle peut lire à deux fois la vitesse de lecture normale et synthétise en même temps les sons correspondants. Elle connaît un millier de règles de prononciation et environ 1500 exceptions à ces règles. La machine de Kurzweil constitue un excellent exemple de ce que la robotique couplée à l'intelligence artificielle peut réaliser pour le pu20blic. D'autres systèmes comme FRUMP (Fast Reading and Understanding Machine) peuvent en outre "comprendre" ce qu'elles lisent et en effectuer un résumé. Mais que vaudrait un résumé de la Recherche du Temps perdu réalisé par un robot ? encadré
La mémoire visuelle
Aldous Huxley a été (après Bergson) un des premiers à émettre l'hypothèse que le cerveau joue essentiellement un rôle de filtre, destiné à endiguer le flot de perceptions qui sans cela noierait notre conscience. Les souvenirs seraient 31bien là, mais inhibés. L'oubli se révèle fonctionnel en nous permettant de faire face à l'instant présent sans être parasité par nos souvenirs. Cependant l'évolution de l'homme exige un usage des plus intensifs de notre mémoire en liaison avec nos facultés d'abstraction qui nous permettent de visualiser le monde de façon plus large, plus globale, plus générale donc plus efficace. Notre néocortex, lui même d'invention récente , fait constamment appel à nos souvenirs tout en se heurtant à la barrière 42de l'oubli. Les travaux du canadien Penfield sur la remontée des souvenirs lors de la stimulation électrique du cerveau par des aiguilles mettent en évidence l'intensité avec laquelle certaines situations passées sont revécues. On aurait alors le sentiment de revivre intégralement le contenu de l'expérience concernée. Le fait de bouger l'aiguille de quelques millimètres provoquait l'émergence de souvenirs très différents. Penfield travaillait en fait sur l'épilepsie et c'est par hasard qu'il réalisa cette découverte qui devait le rendre célèbre. Si nos souvenirs sont stockés de façon plus vaste et plus précise qu'on ne l'imaginait précédemment, pourquoi l'oubli est-il ainsi organisé. Si nous pouvions à volonté revivre nos expériences passées, nous consacrerions probablement une grande partie de notre énergie à nous délecter de nos expériences gratifiantes ou des sensations les plus intenses que nous ayons vécues. Sexualité, gastronomie, exaltation, mysticisme repasseraient en boucle dans notre cer64veau comme un film sans fin. Nous deviendrions probablement les clochards les plus heureux du monde et notre espèce disparaîtrait. Le cerveau bloque par conséquent la remontée des souvenirs. Ceux-ci doivent répondre à certains critères pour devenir accessibles. Pour surgir un souvenir nécessite une association riche. Une vision se compose d'éléments liés qui se soutiennent les uns les autres. Imaginons des milliers de trombones possédant chacun leur numéro gravé en petit. Imaginons maintenant que l'on répande ces trombones sur un tapis de haute laine. Comment retrouver le trombone numéro 17 ? Supposons maintenant que l'on fasse une chaîne avec ces trombones et qu'on lie quelques brins de laine multicolore à chaque extrémité de la chaîne. Maintenant si l'on nous demande de trouver le trombone numéro 17, on conçoit qu'il sera beaucoup plus facile de le saisir. Comparée à la première situation cette dernière est plus rapide. En outre elle ne demande aucun effort. En utilisant notre aire visuelle pour emmagasiner des souvenirs même abstraits, nous faisons tout simplement appel à des mécanismes qui existent déjà et qui fonctionnent bien. De cette façon le stockage de la connaissance s'effectue de façon stucturée, même s'il s'agit d'une structure indirecte. Notre néo-cortex est tout simplement trop jeune (ou trop autonome ?) pour réaliser spontanément les associations qui favorisent le retrait des informations. Quelques rares personnes jouissent cependant de facultés naturelles dans ce domaine. On peut supposer que les liens entre leurs néo-cortex et les autres parties de leur cerveau sont mieux établies que chez la majorité des gens. Les progrès de l'intelligence artificielle et en particulier en créant des liens entre les différents domaines dépend directement de la façon dont, à travers des architectures parallèles, les structures seront liées entre elles de façon rapidement accessibles. Les problèmes rencontrés lors de l'analyse de la reconnaissance des formes et du traitement de l'information visuelle en robotique constituent le point clé de la compréhension non seulement de la robotique et de l'I.A. mais encore du fonctionnement de notre propre cerveau. Ces problèmes constituent en quelque sorte un tronc commun à de nombreuses recherches fondamentales. encadré
Piaget et l'I.A. : la genèse de l'intelligence chez l'enfant
(la commutativité est-elle une propriété des cailloux ?) Un des rares européens a avoir influencé profondément les recherches américaines sur l'intell;9igence artificielle Piaget étudie systématiquement l'émergence des structures logiques chez l'enfant. Les stades successifs par lesquels passe une intelligence en cours de développement peuvent-ils inspirer efficacement les travaux sur l'I.A. ? Les problèmes sur lesquels bute cette dernière ressemblent fort aux obstacles que doit franchir l'enfant au cours de son évolution. Le modèle humain, sur lequel nous savons encore peu de choses, peut en tout cas inspirer les chercheurs et leur fournir des intui<:tions. En éprouvant la compréhension qu'a un enfant du monde physique, biologique et social, à des niveaux d'âge successifs, Piaget espérait trouver une réponse à cette question : Comment acquiert-on le savoir ? Il a appelé cette nouvelle discipline l'Epistémologie Génétique (Mes Idées). Piaget découvrit que les jeunes enfants croyaient que la lune les suivait lorsqu'ils faisaient une promenade la nuit ou que tout ce qui bougeait était vivant. D'où leur venaient ces idées ? Ils n'étaient probablement pas nés avec. De plus ces idées se retrouvent chez des enfatns d'origine très différente. Piaget affirmait que l'expérience n'est pas perçue telle quelle, qu'elle est organisée par notre intelligence... L'intelligence progresse par intégration. Ceci suggère que le développement intellectuel est une spirale ascendante. Si les chercheurs en I.A. réussissaient à modéliser les principes de cette évolution de l'intelligence, ils pourraient probablement les reproduire à travers des programmes><. Les travaux de Douglas B. Lenat, qui sont parmi les plus avancés dans le domaine de l'heuristique, ont toujours buté sur la difficulté de découvrir des heuristiques permettant de découvrir des heuristiques plus puissantes. Le système nerveux et le cerveau humain sont programmés pour cela, avec succès. Pourtant l'intelligence humaine au cours de son développement bute sur des difficultés intéressantes. Piaget cite l'évolution de la vocation mathématique d'un de ses collègues : "Tout jeune enfant, il?= était en train de compter des cailloux. Il les aligna et les compta en commençant par la gauche. Il en trouva dix. Puis, pour s'amuser, il commença par les compter de droite à gauche juste pour voir, et il fut tout étonné d'en compter également dix. C'est ainsi qu'il découvrit ce qu'en mathématique, on appelle la commutativité : c'est à dire que la somme est indépendante de l'ordre. Mais comment l'avait-il découvert ? La commutativité était-elle une propriété des cailloux ? " A travers un vocabulaire descriptif, Piaget établit la carte des stades et des sous-stades qui définissent les différentes étapes de la genèse de l'intelligence chez l'enfant. Au stade sensori-moteur (six sous-stades) succèdent le stade pré-opératoire, opératoire concret et opératoire formel. A chaque étape surgissent des notions nouvelles qui sont autant d'outils favorisant la perception du monde. Le stade opératoire formel voit l'adolescent accéder à l'aptitude de réfléchir sur sa propre réflexion et celle des autres. UnA? des buts visés par l'I.A. consiste à réaliser des programmes capables de s'auto-modifier, non pas seulement au niveau de leur bibliothèque de règles, mais encore au niveau de leur propre structure, de leurs propres lignes de programme. On ne sait pas réaliser cela actuellement. Ce thème est longuement analysé dans G|del, Escher, Bach de Douglas Hofstadter (Interéditions 85). Au cours de ses travaux, Piaget observe des réactions d'enfant inattendues bien que parfaitement logiques : "Des enfants rangeaient des carrés en fonction de leur taille. Au cours de cette activité, un enfant mit un carré sur sa pointe au lieu de le mettre sur le côté. Il l'élimina ensuite en disant que ce n'était plus un carré." Cet exemple en apparence trivial pose en fait le problème des méta-relations. Piaget l'exprime en d'autres termes : "J'ai toujours porté l'accent sur la distinction à faire entre la perception comme résultante ou totalité stabilisée et l'activité perceptive. Les activités de perception représentent notre propre effort pour étudier une configuration ou les rapports entre des configurations. Ce type d'activité perceptive a une grande parenté avec l'intelligence". Pour décrire l'évolution de l'intelligence Piaget utilise deux grandes notions : l'assimilation et l'accommodation. Dans l'assimilation on incorpore un nouvel élément ou objet stimulus dans une structure cognitive déjà en place. Son complément, l'accommodation s'applique à cette tendance à ajuster une organisation déjà existante pour l'adapter à un nouvel objet ou évènement stimulus. Il y a un rapport très étroit entre le développement de l'imitation et le développement de l'intelligence en général qui en est la source." La démarche et l'état d'esprit de Piaget correspondent tout à fait à ceux de l'intelligence artificielle : "Pour moi, une expérience réussit lorsqu'elle apporte l'inattendu. J'ai toujours essayé de formaliser certaines structures. A partir de ces formalisations, on peut faire des déductions de ces structures, ces déductions donnent souvent naissance à de nouveaux points de vue et à de nouvelles expériences inductives." Piaget a eu l'occasion d'échanger des points de vue avec Einstein et Oppenheimer : "Einstein m'a profondément marqué, parce qu'il s'intéressait à tout. Il a été très frappé par le fait que cette notion de conservation intervienne si tard dans le développement. Cela éclairait pour lui la difficulté énorme d'atteindre la pensée rationnelle. Je me souviens de conversations très enrichissantes avec Oppenheimer. Il s'agissait du rôle de la perception. Au début, il ne comprenait pas ce que je voulais dire lorsque j'affirmais que la perception n'est pas tout, qu'elle est subordonnée à l'action. Mais lorsqu'il finit par comprendre que cette subordination avait pour effet de renforcer les activités de perception il se rallia à mon point de vue". Très tôt l'Institut d'Epistémologie Génétique de Genève a regroupé des spécialistes de disciplines telles que la cybernétique, les mathématiqueGEs, la biologie, la philosophie, l'anthropologie culturelle, la sociologie et la psychologie "pour explorer l'évolution du savoir chez l'homme". Pour Piaget, l'anthropologie culturelle apportait la sociogenèse qui vient compléter la psychogenèse. La cybernétique a apporté la notion de "noyau autorégulatoire", en liaison avec l'équilibration dans laquelle des stimuli extérieurs nouveaux sont assimilés dans des structures cognitives existantes et les structures existantes se transforment pour s'adapter àHF de nouvelles situations extérieures. Des collaborateurs et collaboratrices de Piaget sont parfois au cours de leurs expériences tombés sur des points-clé. C'est le cas d'Hermine Sinclair qui a démontré que le développement du langage n'entraîne pas un développement parallèle des opérations, alors que l'inverse a bien lieu. Si l'I.A. s'intéresse à Piaget c'est aussi parce que sa pensée, dans sa structure, concerne l'architecture des systèmes experts : "Il voit en l'intelligence un système ouvert qui s'étend dans le milieu ambiant pour saisir des connaissances, mais qui tend aussi à refermer ses structures afin d'intégrer en lui-même des éléments d'organisation déjà présents. C'est donc une progression évolutive qui oscille entre l'ouverture (transformation de structures déjà présentes en réactions au milieu) et la fermeture (intégration d'éléments du milieu dans des structures déjà établies), réalisant ainsi un équilibre homéostatique. Il est intéressant que Piaget, qui donne un rôle actif au sujet aura beaucoup plus influencé l'I.A. que Skinner qui considère que l'enfant est essentiellement modelé par les circonstances immédiates de renforcement. Skinner privilégie les aspects mécaniques du comportement, notamment l'acquisition des habitudes. Il ne voit pas l'utilité de notions telles que la prise de conscience, l'intention, la compréhension. Il semblerait pourtant que le modèle Piagetien conduise beaucoup plus loin, d'où son influence sur les chercheurs en I.A., toujours à l'affut de paradoxes féconds pour stimuler leurs travaux et les diriger vers de nouvelles voies. De paradoxes en effet, Piaget en est riche. Pour lui, l'enfant dès sa naissance commence à développer des structures cognitives sur la base de ses propres actions, et il s'agit bien d'un processus spontané, inéluctable et inné (Mes Idées, p142). (fin d'encadré) encadré
L'oreille humaine : les niveaux de traduction
Particulièrement complexe dans sa structuration, l'oreille humaine allie des niveaux de structuration mécanique à des réseaux sémantiques sur lesquels nous connaissons encore peu de chose. A l'origine, comme la vue et l'olfaction, l'oreille est un instrument de survie, favorisant aussi bien l'attaque que la fuite. Les informations exigent d'être traitées en temps réel. L'arrivée d'un prédateur redoutable ne doit pas être signalée cinq minutes plus tard. Un son est une vibration mécanique qui agit sur le milieu ambiant, en général de l'air. Les différents récepteurs de l'oreille vont traduire ces vibrations, caractérisées par leur timbre, leur fréquence et leur intensité en impulsions électriques qui seront ensuite décodées. L'oreille interne permet d'amplifier les fréquences situées essentiellement entre 100 et 8000 Hz. Elle maintient une humidité et une température constante sur le tympan. Cela permet de conserver les propriétés d'élasticité de ce dernier, dont dépend la suite des opérations. L'oreille moyenne est un transformateur mécanique qui fait correspondre les propriétés sonores de l'air avec les propriétés hydrauliques de l'oreille interne. Cette dernière, beaucoup plus complexe que les deux autres oreilles (externe et moyenne) analyse les sons et les convertit en "modèles à deux dimensions", c'est le "modèle auditif primaire". Au cours des différentes transformations on passe d'un codage à un autre, la perception étant fonction du logarithme de l'intensité du son. Ainsi on peut percevoir des intensités allant de un à un million sans pour autant avoir l'impression subjective d'une telle différence. Mais dans le demi-sommeil le bruit du réveil paraît parfois particulièrement intense par rapport au bruit du même réveil dans la journée. Les réveils chantent-ils plus fort la nuit ? Au delà des transformations d'un phénomène mécanique (pression et vibration de l'air) en phénomène électrique, il existe un ensemble de filtres destinés à porter les signaux à la conscience de façon sélective. Haldous Huxley et avant lui Bergson ont développé l'hypothèse selon laquelle le cerveau, par rapport à notre conscience, jouerait essentiellement un rôle de filtre destiné à nous empêcher de subir l'agression continuelle de stimulations trop riches. L'oubli jouerait également le même rôle. Nous pouvons ainsi nous consacrer aux péripéties de notre vie quotidienne, en favorisant les éléments de survie, c'est à dire essentiellement les éléments concernant l'immédiat. Si les différentes fonctions mécaniques et électriques de l'oreille sont connues, la façon dont les messages sont jugés pertinents ou non n'est pas connue. On ignore également de quelle façon les messages sont transmis aux différents centres de l'abstraction situés dans le néo-cortex. Ne pouvant expérimenter directement avec des électrodes implantées dans le cerveau d'un homme en train de penser, les chercheurs en sont réduits à imaginer des hyptohèses qui ne sont vérifiables qu'en tant que modèle, c'est à dire par transposition. D'où une frustration certaine... Actuellement les ATN (Augmented Transition NetRP) sont à la fois les plus simples, les plus lourds, et les plus efficaces de ces modèles. Notre cerveau possédant 100 milliards de neurones, si ce modèle était adéquat, cela expliquerait pourquoi les chercheurs en I.A. ont tant de problèmes : la difficulté relèverait davantage de la compétence de l'ingénieur que de celle du théoricien de l'I.A... encadré
Le goût et l'odorat
(documents d'après l'Encycloaedia Universalis) Quand nous goûtons un bon vin, les cellules concernées sont celles du palais davantage que celles de la langue. Une grande partie du plaisir de la table nous parvient ainsi à travers le palais qui possède des cellules de type olfactif. Si le goût utilise des cellules spécialisées situées dans les papilles (salé, sucré, acide, amer plus chez certaines espèces l'eau) pour analyser des molécules en solution, l'odorat quant à lui se montre sensible à la présence de molécules en phase gazeuse. Certaines espèces animales sont sensibles à la présence d'une seule molécule ! On soupçonne que l'interaction entre la molécule stimulante et le substrat accepteur (cellule ou groupe de cellules spécialisées) met en oeuvre des forces de liaison labiles (c'est à dire instables, sujettes à changer). Une électrode posée à la surface du neuroépithélium permet d'enregistrer, lorsque des molécules actives stimulent l'organe, un potentiel négatif lent. Une molécule donnée agit de façon différente sur les différents récepteurs. Certains seront dépolarisés, d'autres inhibés, USd'autres encore hyper-polarisés. Le nerf transporte au cerveau la sommation des stimulations, chaque odeur possédant en principe une structure unique tenant à la variété des sites stimulés par une molécule donnée. La force d'une odeur se traduit par une décharge des fibres activées, l'intensité correspondant à des variations de fréquence. Parmi les constituants de l'odeur d'une molécule on trouve le coefficient de partage air-eau de la molécule, le volume moléculaire, l'aptitude à l'établissement de pVTont hydrogène et la polarisabilité de la molécule. Comme dans le cas du goût, le substrat sur lequel s'appuie la perception est à base de protéines réceptrices situées dans les membranes des cellules sensorielles.
Bibliographie
* The Cerebral Computer, Robert J. Baron, LEA Publishers 1987 * Mes IdWUées, Piaget, Denol, Col. Méditation Nø 153 * Machinery of the Mind, George Johnson, Times Books 1986 * G|del, Escher, Bach de Douglas Hofstadter (Interéditions 85). * The Society of Mind, Marvin Minsky, A Touchstone Book, Simon and Schulster Inc 1986, traduit en français : La Société de l'Esprit, Interédition 88 * Tutorial on Robotics, IEE Computer Society Press 1986 * The brain, the Last Frontier, Richard M. Restak, Warber Books 1979 * The Handbook of Artificial Intelligence, Paul R. Cohen & Edward Feigenbaum volumes 1, 2 et 3 * Machine Learning, A Guide to Current Research, Tom M. Mitchell, Jaime G. Carbonell, Ryszard Michalski, Kluwer Academic Publishers 1986, volume 1 et 2 * La Recherche en Intelligence Artificielle, Seuil, Points Sciences Nø S52 * The Knowledge Machine, Artificial Intelligence and the Future of Man, Donald Michie and Rory Johnston, William Morrow and Company
|