Site icon Blog ARC Optimizer

Un nouvel outil d’IA vise à démocratiser la génération d’images haute résolution

Un nouvel outil d’IA vise à démocratiser la génération d’images haute résolution


Dans le monde de IA génération d’images, des outils comme DALL-E et Midjourney tiennent la couronne – et pas simplement en raison de leurs performances haute résolution. La formation de ces modèles nécessite des investissements et des ressources si importants qu’elle conduit inévitablement à des services centralisés et à un accès payant à l’utilisation.

Un nouvel outil d’IA développé par l’Université de Surrey vise à inverser cette tendance et à démocratiser la technologie, en ouvrant la génération d’images haute résolution à un public plus large.

Baptisé DemoFusion, le modèle permet aux utilisateurs de générer des images de haute qualité sans avoir besoin de s’abonner à un service ou de posséder un ordinateur très puissant. En fait, le système ne nécessite que le GPU RTX 3090 grand public que l’on peut trouver dans n’importe quel PC de jeu de milieu de gamme ou un Mac M1.

L’IA est essentiellement une extension plug-and-play du modèle open source Stable Diffusion XL (SDXL), qui génère des images à une résolution de 1024×1024. DemoFusion permet une augmentation de la résolution de 4x, 16x, voire plus, avec quelques lignes de code simples et sans aucune formation supplémentaire. Le seul compromis selon l’équipe est « un peu plus de patience ». Nous l’avons essayé à TNW et cela dure environ six minutes.

Crédit : Université de Surrey
A gauche : le résultat par SDXL. A droite, le résultat de DemoFusion. Crédit : Université de Surrey

Pour obtenir ces résultats en haute résolution, les scientifiques ont d’abord généré des images en basse résolution, puis les ont améliorées à l’aide d’un processus appelé mise à l’échelle progressive. Cela améliore les détails et la résolution du SDXL en travaillant sur les images dans des correctifs.

« Pour la première fois, notre technique unique permet aux utilisateurs d’améliorer leurs images générées par l’IA sans avoir besoin d’une grande puissance de calcul ni d’un nouvel entraînement du modèle », a déclaré le professeur Yi-Zhe Song.

« L’art et l’imagerie numériques sont un média puissant auquel tout le monde devrait avoir accès, et pas seulement une poignée de sociétés fortunées. C’est pourquoi nous avons rendu DemoFusion accessible au public. Nous pensons qu’il peut enrichir nos vies et que tout le monde devrait pouvoir l’utiliser.

La nouvelle technique est disponible en ligne dans le journal « DemoFusion : démocratiser la génération d’images haute résolution sans $$$

Il reste à voir si DemoFusion gagnera suffisamment de terrain pour rivaliser avec des géants comme le DALL-E d’OpenAI, mais sa création est une étape importante pour ouvrir le potentiel de génération d’images de l’IA au public et au plus grand nombre. technologie communauté.






Source link
Quitter la version mobile