Fermer

novembre 26, 2020

Comment les CAPTCHA pourraient montrer si un algorithme se rapproche de l'AGI


Créer des machines qui ont les capacités générales de résolution de problèmes du cerveau humain a été le grain sacré des scientifiques de l'intelligence artificielle pendant des décennies. Et malgré d'énormes progrès dans divers domaines de l'informatique, l'intelligence artificielle générale échappe encore aux chercheurs.

Nos méthodes actuelles d'IA nécessitent soit une énorme quantité de données, soit un très grand nombre de règles codées à la main, et elles ne conviennent que pour des domaines très étroits . L'AGI, d'autre part, devrait être capable d'exécuter plusieurs tâches avec peu de données et d'instructions spécifiques.

Alors que les approches de création d'AGI ont changé et évolué au fil des décennies, une chose est restée constante: le cerveau humain est la preuve que les approches générales l'intelligence existe. Le cerveau peut résoudre des problèmes d'une manière flexible et efficace pour les données.

Et si nous pouvons découvrir comment le cerveau humain analyse les informations et résout les problèmes, nous pourrions avoir un plan pour ce qui pourrait devenir plus tard une IA générale.

Les mécanismes du cerveau sont au centre des neurosciences, un domaine qui est devenu de plus en plus étroitement lié à l'intelligence artificielle au cours des dernières décennies. La collaboration entre les neuroscientifiques et les informaticiens a conduit à d'énormes progrès dans l'IA et peut être essentielle pour atteindre l'AGI.

Dans un article publié dans la revue scientifique à comité de lecture Frontiers in Neuroscience des scientifiques de Vicarious, une société d'IA basée à San Francisco, fournissent des informations et un cadre sur la manière dont le cerveau humain extrait et traite les informations du monde, et en quoi ce processus diffère des technologies d'IA actuelles.

Bien qu'il ne s'agisse pas du premier travail qui explore les synergies entre les neurosciences et l'IA l'article offre une perspective intéressante sur l'intelligence organique.

Dirigé par le chercheur en IA et en neurosciences Dileep George, le vicaire les scientifiques tirent des leçons des tests CAPTCHA pour présenter des indices sur les mécanismes de traitement de l'information du cerveau.

Comment l'esprit développe-t-il le bon sens?

«Apprentissage efficace et efficace La généralisation provient de biais inductifs, et la construction de l'intelligence générale artificielle (AGI) est un exercice visant à trouver le bon ensemble de biais inductifs qui permettent un apprentissage rapide tout en étant suffisamment général pour être largement applicable dans les tâches dans lesquelles les humains excellent », les chercheurs de Vicarious AI

Les cerveaux humains et animaux sont la preuve que de tels biais existent. Chaque cerveau a évolué et s'est optimisé pour résoudre de manière flexible des problèmes spécifiques au corps qu'il occupe.

Mais au lieu de procéder à une ingénierie inverse des circuits du cerveau, les chercheurs suggèrent d'examiner les mécanismes de l'esprit d'un point de vue fonctionnel. . La recherche montre que les humains doivent leur intelligence supérieure et au néocortex la couche externe de leur cerveau trouvée chez les mammifères.

«Fonctionnellement, le néocortex, en combinaison avec le système hippocampique est responsable pour l'intériorisation de l'expérience externe, en construisant de riches modèles causaux du monde. Chez les humains et d'autres mammifères, ces modèles permettent la perception, l'action, la mémoire, la planification et l'imagination », écrivent les chercheurs.

Construire des modèles riches du monde est ce qui nous permet de raisonner sur causes et effets, gérer des scénarios contrefactuels «et si» et résoudre différents problèmes sans être instruit sur chaque instance. C'est une exigence clé de l'intelligence générale

«Dès notre naissance, nous commençons à utiliser nos sens pour construire un modèle cohérent du monde. Au fur et à mesure que nous grandissons, nous affinons constamment notre modèle et y accédons sans effort au fur et à mesure que nous vivons notre vie », écrivent les chercheurs en IA.

Par exemple, sans avoir jamais vu un match de baseball, vous pouvez regarder la scène suivante et raisonner à propos de ce qui fait changer la direction du ballon et ce qui se passerait si le ballon volait plus bas ou plus haut que le bâton. C'est parce que nous avons une solide compréhension de la façon dont le monde fonctionne et comment les objets interagissent les uns avec les autres.

«Le bon sens découle de la distillation de l'expérience passée en une représentation accessible à un niveau de détail approprié dans n'importe quel scénario», écrivent les auteurs de l'article. Et c'est exactement ce qui manque aux technologies d'intelligence artificielle actuelles.

Mais apprentissage en profondeur la principale branche actuelle de l'IA souvent comparée au cerveau, s'apparente davantage à la forme brute de l'intelligence trouvée dans des organismes très basiques, observent les chercheurs. Le réseau de neurones profonds peut optimiser leurs paramètres pour des tâches très étroites, telles que la détection de nodules cancéreux dans les tomodensitogrammes, la conversion de la voix en texte ou battre des professionnels dans des jeux vidéo compliqués . Mais ils n'ont pas les riches capacités de construction de modèles du cerveau humain.

Un exemple, sur lequel les auteurs de l'article ont centré leurs recherches, sont les CAPTCHA. Les algorithmes d'apprentissage en profondeur peuvent être formés pour résoudre les défis CAPTCHA, mais ils nécessitent des millions d'exemples étiquetés, et ils ne peuvent pas gérer des situations qui s'écartent de leurs exemples d'entraînement.

 captcha "width =" 383 "height =" 344 "data -attachment-id = "8783" data-permalink = "https://bdtechtalks.com/2020/11/16/captcha/captcha/" data-orig-file = "https://i0.wp.com/bdtechtalks .com / wp-content / uploads / 2020/11 / captcha.jpg? fit = 383% 2C344 & ssl = 1 "data-orig-size =" 383 344 "data-comments-open =" 1 "data-image-meta =" {"aperture": "0", "credit": "", "camera": "", "caption": "", "created_timestamp": "0", "copyright": "", "focal_length": " 0 "," iso ":" 0 "," shutter_speed ":" 0 "," title ":" "," orientation ":" 0 "}" data-image-title = "captcha" data-image-description = "" data-medium-file = "https://i0.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/captcha.jpg?fit=300%2C269&ssl=1" data-large-file = "https://i0.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/captcha.jpg?fit=383%2C344&ssl=1" data-recalc-dims = "1" data-lazy -loaded = "1" / ></figure></div><p> Et bien que les scientifiques continuent à faire des progrès incrémentiels en <span> </span><a href= créant de plus grands réseaux de neurones il n'y a pas eu de percée sérieuse dans la création de modèles qui peuvent généraliser leurs capacités.

«La leçon D'après l'histoire de l'évolution, l'intelligence générale a été obtenue par l'avènement de la nouvelle architecture – le néocortex – qui a permis de construire de riches modèles du monde, et non par une agglomération de circuits spécialisés », écrivent les chercheurs en IA. «Ce qui sépare les réseaux fonctionnels du cerveau des mammifères, c'est la capacité de former de riches modèles internes qui peuvent être interrogés de diverses manières.»

Apprendre du cerveau

Dans leur article, les chercheurs en IA présentent un triangle cadre pour comprendre le comportement intelligent à travers les propriétés connues du monde, la structure physique du cerveau et les algorithmes. Expliquer les observations sous les trois angles peut fournir de meilleurs conseils pour créer des algorithmes d'IA avec des capacités générales de résolution de problèmes.

«La stratégie de triangulation consiste à utiliser cette correspondance monde-cerveau-calcul: lorsque nous observons une propriété du cerveau, pouvons-nous faire correspondre cette propriété à un principe d'organisation du monde? Cette propriété peut-elle être représentée dans un cadre de calcul pour produire des généralisations et une efficacité d'apprentissage / d'inférence? » les auteurs de l'article écrivent.

 stratégie de triangulation "width =" 696 "height =" 342 "data-attachment-id =" 8784 "data-permalink =" https://bdtechtalks.com/2020/11/16 / captcha / triangulation-strategy / "data-orig-file =" https://i2.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/triangulation-strategy.jpg?fit=468%2C230&ssl = 1 "data-orig-size =" 468,230 "data-comments-open =" 1 "data-image-meta =" {"ouverture": "0", "credit": "", "camera": "" , "caption": "", "created_timestamp": "0", "copyright": "", "focal_length": "0", "iso": "0", "shutter_speed": "0", "title" : "", "orientation": "0"} "data-image-title =" stratégie de triangulation "data-image-description =" "data-medium-file =" https://i2.wp.com/bdtechtalks. com / wp-content / uploads / 2020/11 / triangulation-strategy.jpg? fit = 300% 2C147 & ssl = 1 "data-large-file =" https://i2.wp.com/bdtechtalks.com/wp-content /uploads/2020/11/triangulation-strategy.jpg?fit=468%2C230&ssl=1 "data-recalc-dims =" 1 "data-lazy-shared =" 1 "/><figcaption> La stratégie de triangulation utilise des propriétés connues du monde, la structure physique du cerveau et des algorithmes pour interpréter le comportement intelligent.</figcaption></figure></div><p> Les chercheurs notent en outre que les modèles d'apprentissage automatique purs traitent des algorithmes et des données sans tenir compte des connaissances apprises du cerveau.</p><p> L'une des propriétés clés du cerveau est un «modèle génératif» qui nous permet de visualiser en interne les choses et la raison du monde au niveau abstrait et conceptuel. Ce modèle génératif nous aide à combler les lacunes des scènes visuelles et de raisonner sur le langage naturel. Par exemple, lorsque vous entendez la phrase «Sally a enfoncé un clou dans le sol», vous imaginez automatiquement le processus, et vous n'avez pas besoin de savoir explicitement que Sally tenait le clou verticalement.</p><div class=

Le but du génératif modèle n'est pas de recréer une scène photoréaliste. Au lieu de cela, il devrait être capable de composer la scène en termes de ses composants et de leurs relations.

Un algorithme d'IA qui a de telles propriétés pourrait être capable d'effectuer des tâches telles que la classification (quel objet contient une scène), la segmentation (quels pixels appartiennent à quel objet), le raisonnement d'occlusion (détecter les objets partiellement occlus), le raisonnement, etc. Les systèmes actuels d'apprentissage en profondeur peuvent être formés pour effectuer une mais pas toutes ces tâches.

The Recursive Cortical Network (RCN)

Dileep George et Miguel Lázaro-Gredilla, deux des auteurs de l'article, faisaient partie d'un groupe de chercheurs en IA qui a développé le Recursive Cortical Network (RCN) en 2017. RCN tire des enseignements des neurosciences et gère la reconnaissance, la segmentation et le raisonnement de manière unifiée.

Selon les tests, le les chercheurs ont mené à l'époque, les RCNs étaient capables de résoudre des CAPTCHA basés sur du texte avec un petit ensemble de données de formation et avec beaucoup plus de flexibilité que les modèles d'apprentissage profond.

Les chercheurs se sont inspirés des neurosciences et du monde pour développer l'algorithme RCN. Par exemple, des expériences montrent que le système visuel humain donne la priorité aux formes et aux contours par rapport aux textures. Et c'est parce que les objets conservent généralement leur forme, même si leur couleur et leur texture changent dans des conditions d'éclairage différentes.

Le biais de votre esprit pour la forme et les contours est la raison pour laquelle vous n'avez pas besoin d'exemples étiquetés pour reconnaître les objets étranges suivants.

 ] formes et contours "width =" 462 "height =" 664 "data-attachment-id =" 8786 "data-permalink =" https://bdtechtalks.com/2020/11/16/captcha/shapes-and-contours / "data-orig-file =" https://i1.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/shapes-and-contours.jpg?fit=950%2C1364&ssl=1 "données -orig-size = "950,1364" data-comments-open = "1" data-image-meta = "{" ouverture ":" 0 "," credit ":" "," camera ":" "," caption ":" "," created_timestamp ":" 0 "," copyright ":" "," focal_length ":" 0 "," iso ":" 0 "," shutter_speed ":" 0 "," title ":" "," orientation ":" 1 "}" data-image-title = "formes et contours" data-image-description = "" data-medium-file = "https://i1.wp.com/bdtechtalks.com /wp-content/uploads/2020/11/shapes-and-contours.jpg?fit=209%2C300&ssl=1 "data-large-file =" https : //i1.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/shapes-and-contours.jpg? fit = 696% 2C1000 & ssl = 1 "data-recalc-dims =" 1 "data- lazy-shared = "1" /></figure></div><p> «La factorisation de surface de contour pourrait être un principe général utilisé par le cortex pour traiter les signaux naturels, et ce biais aurait pu être découvert par l'évolution», observent les chercheurs.</p><p> Les réseaux de neurones profonds, d'autre part, ont d'autres biais. Par exemple, un <span> </span><a href= réseau neuronal convolutif peut être formé pour détecter les codes QR avec une très grande précision, un exploit qui dépasse les capacités de la plupart des humains. Mais le même modèle d'apprentissage profond formé pour détecter les objets dans les images aurait du mal face à de nombreuses situations du monde réel .

«Un code QR n'est pas un signal naturel du type visuel humain Le système a un biais inné vers », observent les chercheurs en IA, ajoutant que les capacités des CNN à classer les codes QR pourraient être une indication de leur absence de biais de type humain.

Une autre propriété intéressante discutée dans l'article est la composition hiérarchique. Le système visuel humain a tendance à voir le monde comme une composition d'objets imbriqués. C'est aussi une propriété clé du monde. Par exemple, les arbres sont composés de membres, de feuilles et de racines, quelle que soit la forme de chaque composant. Et nous pouvons distinguer ces parties même dans un arbre que nous voyons pour la première fois. D'autres chercheurs en IA, y compris le pionnier de l'apprentissage profond Geoffrey Hinton explorent la composition hiérarchique comme moyen de généraliser les capacités de vision par ordinateur.

«En reflétant la structure hiérarchique du monde, le cortex visuel peut ont l'avantage de construire progressivement des représentations invariantes d'objets en réutilisant des représentations invariantes pour les parties d'objets. L'organisation hiérarchique convient également à des algorithmes d'apprentissage et d'inférence efficaces », écrivent les auteurs.

Il convient également de noter la sensibilité de notre système visuel au contexte et au niveau de détail. Nous gérons la grande variabilité du monde grâce à des mécanismes de rétroaction qui prennent en compte les caractéristiques locales et mondiales. Par exemple, il est difficile de détecter ce qu'est la photo ci-dessous…

 patchs aléatoires de pixels? "Width =" 696 "height =" 214 "data-attachment-id =" 8787 "data-permalink =" https: / /bdtechtalks.com/2020/11/16/captcha/ice-cream-patches/ "data-orig-file =" https://i0.wp.com/bdtechtalks.com/wp-content/uploads/2020/11 /ice-cream-patches.jpg?fit=1584%2C488&ssl=1 "data-orig-size =" 1584,488 "data-comments-open =" 1 "data-image-meta =" {"ouverture": " 0 "," credit ":" "," camera ":" "," caption ":" "," created_timestamp ":" 0 "," copyright ":" "," focal_length ":" 0 "," iso " : "0", "shutter_speed": "0", "title": "", "orientation": "1"} "data-image-title =" patchs aléatoires de pixels? "Data-image-description =" " data-medium-file = "https://i0.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/ice-cream-patches.jpg?fit=300%2C92&ssl=1" data-large -file = "https://i0.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/ice-cream-patches.jpg?fit=696%2C214&ssl=1" data-recalc-dims = "1" data-lazy-shared = "1" /></figure><p>… mais quand le même patch de pixels est affiché ag parmi les autres détails environnants, nous pouvons comprendre ce que représente l'image.</p><figure class= glace "width =" 696 "height =" 442 "data-attachment-id =" 8790 "data-permalink =" https://bdtechtalks.com / 2020/11/16 / captcha / ice-cream / "data-orig-file =" https://i1.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/ice-cream.jpg ? fit = 1574% 2C1001 & ssl = 1 "data-orig-size =" 1574,1001 "data-comments-open =" 1 "data-image-meta =" {"ouverture": "0", "crédit": " "," camera ":" "," caption ":" "," created_timestamp ":" 1605450941 "," copyright ":" "," focal_length ":" 0 "," iso ":" 0 "," shutter_speed " : "0", "title": "", "orientation": "1"} "data-image-title =" glace "data-image-description =" "data-medium-file =" https: // i1.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/ice-cream.jpg?fit=300%2C191&ssl=1 "data-large-file =" https://i1.wp.com /bdtechtalks.com/wp-content/uploads/2020/11/ice-cream.jpg?fit=696%2C442&ssl=1 "data-recalc-dims =" 1 "data-lazy-shared =" 1 "/> [19659027] «Toute observation locale sur le monde est susceptible d'être ambiguë à cause de tous les facteurs de variation qui l'affectent, et donc les informations sensorielles locales doivent être intégrées et réinterprétées dans le contexte d'un tout cohérent. Des connexions de rétroaction sont nécessaires pour cela », écrivent les chercheurs en IA.</p><p> Le contexte et la rétroaction peuvent résoudre de nombreux autres problèmes, tels que la résolution d'occlusion dans les CAPTCHA.</p><div class=
 résolution d'occlusion" width = "686" height = "331" data- attachment-id = "8791" data-permalink = "https://bdtechtalks.com/2020/11/16/captcha/occlusion-resolution/" data-orig-file = "https://i1.wp.com/ bdtechtalks.com/wp-content/uploads/2020/11/occlusion-resolution.jpg?fit=2282%2C1102&ssl=1 "data-orig-size =" 2282,1102 "data-comments-open =" 1 "data- image-meta = "{" aperture ":" 0 "," credit ":" "," camera ":" "," caption ":" "," created_timestamp ":" 0 "," copyright ":" ", "focal_length": "0", "iso": "0", "shutter_speed": "0", "title": "", "orientation": "1"} "data-image-title =" résolution d'occlusion " data-image-description = "" data-medium-file = "https://i1.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/occlusion-resolution.jpg?fit=300%2C145&ssl = 1 "data-large-file =" https://i1.wp.com/bdtechtalks.com/wp-content/uploads/2020/11/occlusion-resolution.jpg?fi t = 696% 2C336 & ssl = 1 "data-recalc-dims =" 1 "data-lazy-shared =" 1 "/><figcaption> Les mécanismes de rétroaction nous permettent de résoudre l'occlusion dans les captchas</figcaption></figure></div><p> Alors que le long- Le terme objectif est AGI, RCN, qui a été créé sur la base de ces principes, est déjà utilisé dans divers domaines. «Nous déployons RCN sur des robots dans les entrepôts et les usines. Vicarious propose des robots en tant que service pour résoudre les problèmes de prélèvement, d'emballage et d'assemblage dans les paramètres de changement élevé », a déclaré George <span> </span><em> TechTalks </em><span> </span> dans des commentaires écrits, ajoutant que l'efficacité des données de RCN est un gros avantage.</p><h2> Tout rassembler</h2><p> Le travail présenté par les chercheurs de Vicarious est l'un des nombreux efforts qui visent à trouver des voies pour codifier la véritable intelligence. Un autre article publié plus tôt cette année traitait de la «<a href= matière noire de la vision par ordinateur » en termes de fonctionnalité intuitive, physique, intention, causalité et utilité (FPICU).

Il y a aussi des développements intéressants dans les tests et mesurer le niveau d'intelligence dans les systèmes d'IA, y compris le Abstract Reasoning Corpus (ARC) par François Chollet, le créateur de la bibliothèque d'apprentissage en profondeur Keras. ARC met les systèmes d'IA au défi d'apprendre à résoudre des problèmes au niveau abstrait avec très peu d'exemples.

Dileep George et ses collègues suggèrent que la résolution des CAPTCHA d'une manière flexible et efficace pour les données serait un bon signe qu'un algorithme d'IA peut résoudre plusieurs et nous rapproche de l’objectif ultime de l’AGI.

«La résolution des captcha basés sur du texte était un défi du monde réel choisi pour évaluer RCN parce que les captchas illustrent la forte généralisation que nous recherchons dans nos modèles – les gens peuvent résoudre de nouveaux captcha styles sans formation spécifique au style », écrivent les chercheurs.

George et ses collègues étendront leurs recherches à d'autres domaines. «Nous étendons le RCN aux domaines temporels, puis le couplons avec l'apprentissage des concepts, et enfin le langage. Nous élargissons également les situations dans lesquelles le RCN est appliqué en robotique », dit-il.

Cet article a été initialement publié par Ben Dickson sur TechTalks [19659082]une publication qui examine les tendances de la technologie, comment elles affectent notre façon de vivre et de faire des affaires et les problèmes qu'elles résolvent. Mais nous discutons également du côté pervers de la technologie, des implications plus sombres des nouvelles technologies et de ce que nous devons surveiller. Vous pouvez lire l'article original ici .

Publié le 26 novembre 2020 – 11:00 UTC




Source link