Abonnez-vous Identifiez-vous

Identifiez-vous

Vos codes d'accès sont erronés, Veuillez les saisir à nouveau. Mot de passe oublié ?

robotique : les voies de l'apprentissage

Publié le

Pour éduquer les robots, les chercheurs les équipent de techniques mathématiques très sophistiquées. Et les frottent au monde réel dans les situations les plus diverses.

robotique : les voies de l'apprentissage © Inserm/Patrice Latron

Tirer parti de ses erreurs. Savoir capitaliser son expérience. Imiter ceux qui savent faire. Rebondir sur l’imprévu. S’acharner jusqu’au succès… Quand il s’agit d’apprendre ou de progresser, les bons principes font toujours recette, y compris chez les robots. Les équipes de chercheurs qui, à travers le monde, veulent inculquer aux robots la faculté d’apprendre n’ont pas besoin de chercher bien loin leur inspiration. En matière d’apprentissage et d’adaptation, on n’a pas fait mieux que l’être humain (en attendant l’homme augmenté qu’on nous promet). Ce qui a beaucoup progressé, en revanche, ce sont les techniques mathématiques et numériques qui, sous la forme de l’intelligence artificielle, s’efforcent d’implanter dans une machine une partie au moins des facultés d’apprentissage qui transforment les enfants en adultes autonomes, eux-mêmes toujours capables de s’améliorer (en théorie).

Réparer, coopérer ou cuisiner

Et pour voir si ça marche, rien de tel que de placer les robots dans les situations où l’être humain fait l’apprentissage plus ou moins rude de la vraie vie. Les jeunes enfants apprennent à descendre les escaliers en tombant parfois douloureusement. Ils acceptent aussi, parfois, qu’on les guide par la main. Les robots ont droit à ce genre d’expériences. Plus généralement, c’est en cumulant connaissances et exploration de leur univers que les robots font leur apprentissage. La palette de scénarios qu’on leur propose est très variée : réussir une omelette, saisir n’importe quel objet avec dextérité ou effectuer la maintenance d’une station spatiale. La rencontre et la coopération avec les êtres humains est aussi au programme, et ce n’est pas l’apprentissage le plus facile. Et pour que rien d’humain n’échappe aux robots, certains chercheurs se demandent si un bon sommeil réparateur ne serait pas très profitable à la progression de leurs compétences. 

Écrire son autobiographie

Même les robots ont une histoire. En donnant au petit robot humanoïde Nao les moyens de se constituer une mémoire autobiographique – le souvenir de ses actes dûment datés et localisés –, une équipe de l’Inserm lui permet d’acquérir et de transmettre des connaissances. Par exemple : la procédure à suivre pour réparer un équipement électronique. L’idée serait de placer un tel robot dans la station spatiale internationale, pour servir de relais entre les équipages qui se succèdent. 

S’inspirer du cerveau

Le système de navigation de Diya One, le robot mobile de services de Partnering Robotics, est inspiré de certaines fonctions identifiées dans une partie du cerveau (l’hippocampe). À partir des résultats obtenus par des neurobiologistes, les ingénieurs du laboratoire Etis (université de Cergy-Pontoise, CNRS , Ensea) ont construit des algorithmes du type réseau de neurones qui permettent au robot d’apprendre à s’orienter. Diya One est destiné aux services dans les bâtiments (qualité de l’air, efficacité énergétique…). Cofely, filiale d’Engie, est récemment devenue actionnaire de Partnering Robotics.

Comme un tâcheron

Un laboratoire de Google a fait travailler pendant plusieurs semaines jusqu’à quatorze robots en batterie pour leur faire effectuer un total de… 800 000 essais de saisie d’un objet. Divers types d’objets – rigides ou mous, lourds ou légers, opaques ou transparents… – étaient présentés devant la caméra qui guide chaque bras de robot. Un réseau de neurones était chargé d’extraire de cette masse d’essais les bonnes stratégies pour attraper un objet. Résultat : un système capable d’adapter sa méthode pour arriver à ses fins, y compris avec des objets qu’il n’a jamais vus auparavant.

Se confronter à la foule

Spencer a guidé des passagers en transit de la compagnie KLM à travers l’aéroport de Schiphol (Amsterdam). Ce qui suppose qu’il sait s’orienter, mais pas seulement. Spencer, pour être accepté, doit adapter son comportement au contexte et aux passagers qu’il convoie. Ne pas couper un groupe ou un couple, identifier le responsable d’un groupe, adapter sa vitesse aux personnes âgées et même respecter les règles culturelles quand on aborde une personne… Son apprentissage, piloté par l’Isir (CNRS /UPMC), s’est fait sur la base de règles extraites d’enquêtes sociologiques et de simulations.

Multiplier les erreurs

Son surnom est Brett, pour « Berkeley robot for the elimination of tedious tasks » : la vocation du PR2 est de remplacer l’homme dans les tâches fastidieuses. Pour lui apprendre à plier un linge, par exemple, des chercheurs de Berkeley lui ont mis une serviette entre les mains, pour qu’il se familiarise avec l’objet. Après quelques centaines de manipulations – et beaucoup de ratés –, le robot a finalement pu commencer le pliage. La méthode utilisée ici, du type « essais et erreurs », autrement appelée apprentissage par renforcement, consiste à donner au robot un signal positif (récompense) ou négatif (sanction) selon qu’il progresse ou non dans la réalisation de sa tâche.

En dormant

Le sommeil joue un rôle dans la manière dont les êtres humains consolident et restructurent leurs connaissances. Sur ce modèle, le projet européen Dream (Deferred restructuring of experience in autonomous machines), coordonné par l’Isir (CNRS /UPMC), propose à un robot de consolider ses expériences, en alternant des périodes actives où il explore son environnement et les tâches qu’on veut lui confier, avec des périodes de « sommeil » où il restructure les informations qu’il a emmagasinées à l’aide de diverses techniques de traitement de données (data mining, deep learning…).

Regarder des vidéos

Il y a de tout sur internet : des manuels d’utilisation, des vidéos de démonstration, des recettes… Un robot peut-il se servir de ces informations pour en déduire le programme qui lui permettra d’effectuer correctement une opération ? Préparer un plat simple (une omelette, un sandwich…) ou recharger une imprimante, par exemple. Ces deux scénarios ont servi de tests pour le projet européen RoboHow (université de Brême, EPFL, CNRS …), afin d’étudier comment des instructions très générales captées sur internet, associées à quelques démonstrations et périodes d’apprentissage, pouvaient permettre de programmer un robot semi-automatiquement.

En regardant les hommes tomber

Les robots humanoïdes ont un problème majeur : l’équilibre. Avant même d’accomplir une tâche quelconque, leur principale difficulté est de rester debout. Et la chute peut avoir des conséquences graves sur l’intégrité physique des coûteuses machines ou celle de leur entourage. Des chercheurs de Georgia Tech (États-Unis) ont mis au point un algorithme qui s’inspire de la manière dont les êtres humains amortissent la chute, en dissipant l’énergie via plusieurs points de contacts.

Se laisser guider par la main

Pour apprendre une nouvelle tâche à un robot sans le reprogrammer, pourquoi ne pas lui montrer directement ce qu’il doit faire ? Par exemple, en prenant littéralement le robot par la main (ici, une expérimentation menée à l’École polytechnique fédérale de Lausanne). Cette technique peut être utilisée pour lui enseigner une trajectoire définie. Mais elle devient un véritable apprentissage si, à partir d’un ensemble de démonstrations, elle permet au robot de généraliser et de trouver lui-même le moyen de réaliser une opération similaire.

Par accident

Ce robot à six pattes, testé à l’Inria, sait reprendre son chemin après un accident qui ne lui laisse que quatre pattes valides. Cette résilience, qui existe chez les animaux, la machine la doit à un algorithme qui, en quelques minutes et après quelques essais, permet au robot de réinventer luimême une démarche pour continuer à avancer.

Réagir à cet article

Créez votre compte L’Usine Connect

Fermer
L'Usine Connect

Votre entreprise dispose d’un contrat
L’Usine Connect qui vous permet d’accéder librement à tous les contenus de L’Usine Nouvelle depuis ce poste et depuis l’extérieur.

Pour activer votre abonnement vous devez créer un compte

Créer votre Compte
Suivez-nous Suivre Usine Nouvelle sur Facebook Suivre Usine Nouvelle sur Twitter RSS Usine Nouvelle