Fermer

août 21, 2018

MIT a créé une IA d'édition d'image qui peut remplacer l'arrière-plan de n'importe quelle image


Le laboratoire d'informatique et d'intelligence artificielle du MIT (CSAIL) vient de développer un outil d'édition d'images assisté par IA qui automatise la sélection d'objets. Ceci est le Saint Graal des outils de sélection – vous pouvez le voir dans la vidéo ci-dessous.

Aimez-vous les bons gadgets?

Ces gadgets sympas?

Pour des millions de personnes faire ressortir les meilleures caractéristiques visuelles des images. Mais chez TNW nous sommes plus susceptibles de l'utiliser pour que Mark Zuckerberg ressemble à un vampire ou mette un sombrero sur un pirate informatique. Et, ne parlant que pour moi, utiliser Photoshop prend du temps et de la peine.

Crédit: Nicole Gray

Ce dont nous avons besoin, c’est d’une IA pour saisir un objet. Nous pourrions l'appeler: Grabber Bot 2000. Malheureusement, les chercheurs du MIT CSAIL en ont créé un, mais ne l'ont même pas nommé. Ils appellent simplement la technique utilisée par leur éditeur d'images assisté par IA "Semantic Soft Segmentation", ou SSS.

L'éditeur sépare les objets et l'arrière-plan d'une image en différents segments, ce qui facilite la sélection. Contrairement au lasso magnétique ou aux outils de lasso magique dans la plupart des logiciels de retouche photo, cela ne dépend pas des entrées utilisateur pour le contexte, vous n'avez pas à tracer un objet ou à zoomer et à saisir les détails. L'IA ne marche que.

Crédit: MIT CSAIL

Bien sûr, la sauce secrète derrière la magie implique de nombreux algorithmes et calculs complexes. L'équipe utilise un réseau neuronal (en savoir plus sur ceux ici ) pour traiter les caractéristiques de l'image et effectuer des déterminations sur les contours souples d'une image.

Quand un humain regarde une image, nous sommes plutôt bons faire des inférences basées sur le contexte. Si une girafe se tient devant un éléphant dans une image, nous n'avons pas tendance à nous demander où en est l’une et l’autre commence. Les ordinateurs doivent apprendre à faire cela, et ce n’est pas une tâche simple.

Selon le chercheur en visite du MIT CSAIL, Yagiz Aksoy:

Le problème avec ces images, c’est que tous les pixels Dans de nombreux cas, il peut être difficile de déterminer quels pixels font partie de l'arrière-plan et qui font partie d'une personne spécifique.

En effet, les transitions douces peuvent entraîner le partage de pixels entre deux objets, ou un objet . L'IA de MIT en tient compte et le travail de détail fastidieux consiste à scinder la différence de manière autonome.

Les applications de cette technologie sont évidentes, que nous parlions de filtres Instagram qui vous permettent de changer le fond ou d'ajouter de la profondeur. les effets de champ, ou le potentiel de mise à l'échelle pour travailler avec la vidéo.

L'avenir de l'édition d'images et de vidéos est certainement l'IA, mais nous ne sommes pas tout à fait là. Le processus actuel sur lequel travaille l'équipe CSAIL du MIT ne fonctionne pas encore avec la vidéo. Et cela prend environ quatre minutes pour traiter une image – un expert humain de Photoshop pourrait probablement le battre dans une course.

Mais ce n’est pas un de ces projets qui pourraient rapporter des dividendes en 10 ou 20 ans. des années où la société rattrape son ambition – cela pourrait offrir un avantage immédiat à quiconque utilise un logiciel de retouche photo ou vidéo, y compris les outils intégrés fournis avec nos téléphones.

le prime time, nous allons l'utiliser pour plus que de faire des vampires et des faux Elon Musk de Zuckerberg Narcos promos . Nous le ferons toujours, bien sûr, mais nous aurons enfin du temps pour les projets moins sérieux que nous avions en tête.

Pour plus d'informations, consultez le livre blanc de l'équipe CSAIL . Et n'oubliez pas de consulter notre section sur l'intelligence artificielle pour toutes les dernières nouvelles et analyses sur l'apprentissage automatique.




Source link