L’IA bat les humains pour la première fois dans un jeu d’adresse physique
La capacité de l’IA à battre les joueurs humains dans des jeux comme les échecs et GO n’est plus surprenante. Après tout, l’intelligence artificielle a prouvé qu’elle pouvait surpasser ses créateurs animés dans certaines tâches, notamment lorsqu’il s’agit de traiter et d’analyser des informations. Mais l’habileté physique est restée une prérogative humaine – jusqu’à présent.
Des chercheurs de l’ETH Zurich ont créé un IA robot avec pour tâche d’apprendre à jouer au jeu populaire de labyrinthe. Le but du jeu est simple : à l’aide de deux boutons, vous devez diriger une boule de marbre d’un point de départ à un point final sans qu’elle ne tombe dans les trous du plateau.
Mais si vous y avez déjà joué, vous savez que c’est en fait assez difficile. L’explication scientifique de sa difficulté est qu’elle nécessite des capacités motrices aiguës, des capacités de raisonnement spatial – et beaucoup de pratique.
Le robotnommé CyberRunner, est équipé de deux moteurs (ses mains), d’une caméra (ses yeux) et d’un ordinateur (son cerveau), lui permettant de jouer au jeu comme le ferait une personne.
Tout comme un humain, CyberRunner apprend par l’expérience en tirant parti des avancées récentes en matière d’apprentissage par renforcement basé sur des modèles, qui permettent à l’IA de prendre des décisions et de choisir des comportements potentiellement efficaces en prédisant les résultats de différents plans d’action.
Pendant le jeu, CyberRunner fait des observations du labyrinthe et reçoit des récompenses en fonction de ses performances. Il garde une mémoire de l’expérience collectée, que le algorithme utilise pour apprendre comment le système se comporte. Grâce à ces connaissances, il est capable de reconnaître les comportements les plus prometteurs. En conséquence, l’utilisation des deux moteurs par le robot s’améliore continuellement et CyberRunner ne cesse de s’améliorer tandis que l’algorithme s’exécute à chaque fois qu’il joue.
Le robot a bénéficié de 6,06 heures de pratique. De manière impressionnante, il a battu le précédent record du monde établi par Lars Göran Danielsson, joueur depuis 1988, qui avait établi un temps de 15,41 secondes en 2022. CyberRunner a terminé le jeu en 14,48 secondes, soit plus de 6 % plus vite que le détenteur du record humain.
Notamment, au cours du processus d’apprentissage, le robot a découvert des raccourcis et trouvé des moyens de tricher – un comportement qui la recherche étudie comme un trait humain inné. Les chercheurs responsables du projet, Thomas Bi et le professeur Raffaello D’Andrea, ont dû intervenir et demander à CyberRunner de ne pas sauter certaines parties du labyrinthe.
Une prépublication du document de recherche est déjà disponible sur www.CyberRunner.aitandis que Bi et D’Andrea ouvriront également le projet sur le site Web.
« Nous pensons qu’il s’agit du banc d’essai idéal pour la recherche sur l’apprentissage automatique et l’IA dans le monde réel. Avant CyberRunner, seules les organisations disposant de budgets importants et d’une infrastructure expérimentale sur mesure pouvaient effectuer des recherches dans ce domaine. Désormais, pour moins de 200 dollars, n’importe qui peut participer à des recherches de pointe sur l’IA », a déclaré D’Andrea.
« De plus, une fois que des milliers de CyberRunners seront déployés dans le monde réel, il sera possible de se lancer dans des expériences à grande échelle, où l’apprentissage se déroule en parallèle, à l’échelle mondiale. Le nec plus ultra de la science citoyenne ! »
Vous pouvez voir le robot en action dans la vidéo ci-dessous :
Source link