Site icon Blog ARC Optimizer

Stability AI lance Stable Diffusion 3, son modèle d’image « le plus avancé » à ce jour

Stability AI lance Stable Diffusion 3, son modèle d’image « le plus avancé » à ce jour


Stability AI a lancé aujourd’hui Stable Diffusion 3 Medium, que les Britanniques démarrer appelle son « modèle ouvert texte-image le plus avancé à ce jour ».

Composé de 2 milliards de paramètres, SD3 Medium promet des résultats photoréalistes sans flux de travail complexes. Surtout, le modèle peut générer ces images tout en s’exécutant sur des systèmes grand public individuels.

Cela permet également de surmonter les artefacts courants dans les mains et les visages, a déclaré Stability.

L’entreprise a créé SD3 Medium pour comprendre des invites complexes impliquant des relations spatiales, des éléments de composition, des actions et des styles.

Le

Les dernières rumeurs sur la scène technologique européenne, une histoire de notre sage vieux fondateur Boris et un art de l’IA discutable. C’est gratuit, chaque semaine, dans votre boîte de réception. S’inscrire maintenant!

La typographie a également été améliorée. Stability a décrit la précision de la génération de texte comme « sans précédent ». L’entreprise attribue ces améliorations au Architecture du transformateur de diffusion.

Un autre attrait majeur est la taille du modèle. Avec 2 milliards de paramètres, le modèle est plus petit que de nombreux modèles Stable Diffusion 3, qui vont de 800 millions à 8 milliards de paramètres.

Grâce à la faible empreinte VRAM, SD3 Moyen est « idéal » pour fonctionner sur des GPU grand public standard sans dégradation des performances, a déclaré Stability. Il peut également absorber des détails nuancés provenant de petits ensembles de données, ce qui améliore la personnalisation.

Christian Laforte, co-PDG de Stability, a déclaré à TNW que la startup prévoyait d’améliorer continuellement le modèle.

« Stability AI continuera de repousser les frontières de la génération IAet visera à conserver son avance à l’avant-garde de la génération d’images », a-t-il déclaré.

Stability a partagé ces invites et images de SD3 Medium. Crédit : Stabilité AI

Les utilisateurs peuvent désormais tester SD3 Medium via Stability’s API. Les poids des modèles sont disponibles sous une licence ouverte non commerciale et une licence de créateur à faible coût. Toute personne intéressée par une utilisation commerciale à grande échelle peut contacter la startup pour les détails de la licence.

Problèmes et solutions pour l’IA de stabilité

SD3 Medium arrive des temps turbulents pour la stabilité.

Fondée en 2020, la startup a rapidement été saluée comme l’un des leaders émergents de l’IA générative. Aux côtés de ses rivaux Midjourney et OpenAI Dall-E, Stable Diffusion s’est hissé au sommet du sous-secteur naissant de la conversion texte-image. En 2022, les investisseurs apprécié la startup et 1 milliard de dollars.

Depuis lors, cependant, une série de poursuites judiciaires et de problèmes financiers ont englouti l’entreprise.

Les artistes ont poursuivi la société pour avoir entraîné ses modèles d’IA à leur travail sans consentement. Stability a également discuté d’une vente car il fait face à une crise de trésorerie, The Information signalé le mois dernier.

Face à l’aggravation des problèmes, le PDG et fondateur de l’entreprise, Emad Mostaque, a démissionné en mars. Mostaque a dit il partait pour poursuivre l’IA décentralisée.

Le logiciel, cependant, a toujours impressionné. Les images de SD3 Medium suggèrent que les performances ont été encore améliorées.

D’autres mises à niveau sont déjà en préparation, et pas seulement pour les images. Selon Laforte, la société se concentre également sur « les efforts multimodaux en matière de vidéo, d’audio et de langage ».




Source link
Quitter la version mobile