Site icon Blog ARC Optimizer

Vision par ordinateur et reconnaissance d'image


Ceci est la deuxième histoire de notre série continue couvrant les bases de l'intelligence artificielle. Bien qu'il ne soit pas nécessaire de lire le premier article qui couvre les réseaux de neurones, cela pourrait ajouter à votre compréhension des sujets traités dans celui-ci.

Enseigner à un ordinateur comment «voir» est pas un petit exploit. Vous pouvez claquer une caméra sur un PC, mais cela ne lui donnera pas de visibilité. Pour qu'une machine puisse réellement voir le monde comme le font les humains ou les animaux, elle repose sur la vision par ordinateur et la reconnaissance d'image.

La vision par ordinateur est ce qui permet à un scanner de codes barres de voir un paquet. C'est aussi la façon dont le visage ID d'Apple peut dire si un visage que son appareil photo regarde est le vôtre. Fondamentalement, chaque fois qu'une machine traite une entrée visuelle brute – comme un fichier JPEG ou un flux de caméra – elle utilise la vision par ordinateur pour comprendre ce qu'elle voit. Il est plus facile de considérer la vision par ordinateur comme la partie du cerveau humain qui traite les informations reçues par les yeux – pas les yeux eux-mêmes.

L'une des utilisations les plus intéressantes de la vision par ordinateur est la reconnaissance d'image. ce qui donne à une machine la capacité d'interpréter les données reçues par vision artificielle et de catégoriser ce qu'elle voit.

Voici quelques exemples de reconnaissance d'image au travail:

Il y a aussi l'application qui utilise l'appareil photo de votre smartphone pour déterminer si un objet est un hot-dog ou non – il s'appelle Non Hotdog . Il utilise la vision par ordinateur et la reconnaissance d'image pour faire ses jugements. Cela peut ne pas sembler impressionnant, après tout, un petit enfant peut vous dire si quelque chose est un hot-dog ou non. Mais le processus de formation d'un réseau neuronal pour effectuer la reconnaissance d'image est assez complexe, à la fois dans le cerveau humain et dans les ordinateurs.

AI, à ce stade, ressemble beaucoup à un petit enfant . La vision par ordinateur lui donne le sens de la vue, mais cela ne vient pas avec une compréhension héréditaire de l'univers physique. Pour cela, une IA a besoin d'une formation tout comme les enfants. Si vous montrez à un enfant un nombre ou une lettre suffisamment de fois, il apprendra à reconnaître ce nombre.

Étonnamment, beaucoup de tout-petits peuvent immédiatement reconnaître les lettres et les chiffres à l'envers une fois qu'ils les ont appris. Nos réseaux de neurones biologiques sont assez bons pour interpréter l'information visuelle même si l'image que nous traitons ne ressemble pas exactement à ce que nous attendons.

Il est assez facile de faire reconnaître à un ordinateur une image spécifique, comme un code QR, mais ils aspirent à reconnaître des choses dans des états qu'ils n'attendent pas – entrer dans la reconnaissance d'image.

La façon dont fonctionne la reconnaissance d'image implique généralement la création d'un réseau de neurones qui traite les pixels individuels d'une image. Les chercheurs alimentent ces réseaux autant d'images pré-étiquetées que possible, afin de leur "apprendre" comment reconnaître des images similaires.

Dans l'exemple hotdog ci-dessus, les développeurs auraient nourri une AI de milliers de photos de hot-dogs. L'IA développe alors une idée générale de ce qu'une image d'un hot-dog devrait contenir. Lorsque vous lui donnez une image de quelque chose, il compare chaque pixel de cette image à chaque image d'un hot-dog qu'il a jamais vu. Si l'entrée rencontre un seuil minimum de pixels similaires, l'IA le déclare hotdog.

Tout système d'IA qui traite des informations visuelles repose généralement sur la vision par ordinateur, et ceux capables de identifier des objets spécifiques ou catégoriser des images en fonction de leur contenu sont en train d'effectuer une reconnaissance d'image.

Ceci est extrêmement important pour les robots qui doivent reconnaître et catégoriser rapidement et précisément différents objets dans leur environnement. Les voitures sans conducteur, par exemple, utilisent la vision par ordinateur et la reconnaissance d'image pour identifier les piétons, les panneaux et les autres véhicules.

Pour approfondir la vision par ordinateur, consultez:

  • Apprenez à développer l'IA avec la reconnaissance d'image de TensorFlow tutoriels
  • Mettez vos mains dans le bric-à-brac avec un projet Hackster.IO utilisant la reconnaissance d'image
  • Prenez ce cours d'intelligence artificielle gratuit en ligne

Consultez notre intelligence artificielle ] section pour en savoir plus sur le monde de l'apprentissage automatique.

Lire la suite:

Rolls-Royce travaille sur un cafard robotisé capable de réparer les moteurs d'avion




Source link
Quitter la version mobile