Un village médiéval génial et en spirale créé par l’IA captive les médias sociaux

Le village spiralé d'IA original qui a pris d'assaut les médias sociaux, créé à l'aide de Stable Diffusion et ControlNet.
Agrandir / Le village spiralé d’IA original qui a pris d’assaut les médias sociaux, créé à l’aide de Stable Diffusion et ControlNet.

Dimanche, un utilisateur de Reddit nommé « Ugleh ». de publier Image générée par l’IA d’un village médiéval en forme de spirale se déplaçant rapidement J’ai attiré l’attention Sur les réseaux sociaux pour ses qualités d’ingénierie impressionnantes. Les articles de suivi ont reçu davantage d’éloges, notamment : Tweeter Avec plus de 145 000 likes. Ugleh a créé les images en utilisant Propagation stable Et une technologie de routage appelée ControlNet.

Les réactions à l’œuvre d’art en ligne allaient de l’étonnement et de l’étonnement au respect pour le développement de quelque chose de nouveau dans l’art de l’IA générative. “Je n’ai jamais vu des images comme celle-ci auparavant. Quelque chose de nouveau dans le monde de l’art.” livres Un utilisateur X. “Eh bien, j’ai vu beaucoup d’art sur l’IA, et je suis dans ce domaine depuis longtemps, et c’est l’une des œuvres les plus étonnantes que j’ai jamais vues. Vous avez fait du très bon travail.” livres L’artiste d’intelligence artificielle Kali Yuga sur X.

Le plus remarquable est peut-être Paul Graham, co-fondateur de Y-Combinator et commentateur fréquent de la technologie des médias sociaux. livres“C’est à ce moment-là que l’art généré par l’IA a réussi pour moi le test de Turing.” Pendant que Graham faisait remarquer Test de Turing (qui vise à tester si le comportement des machines est impossible à distinguer du comportement humain) Comme métaphore plutôt que littéralement, il a été clairement impressionné.

Bien sûr, tout le monde n’a pas apprécié que certains utilisateurs de X essayent de faire cela. rompre Éléments texturaux du village en spirale créé par l’intelligence artificielle. “C’est bien, mais il y a beaucoup de décisions qu’un humain ne prendrait pas”, a écrit un graphiste nommé Trent. “Beaucoup d’ombres sont incorrectes et placer les cheminées directement au-dessus des fenêtres n’a aucun sens. En zoomant, on peut également voir des modèles de bruit révélateurs provenant de l’IA.”

En juin, nous Couvert Il s’agit d’une technologie qui utilise le modèle de synthèse d’images AI Stable Diffusion et ControlNet pour créer des codes QR qui ressemblent à de riches œuvres d’art, y compris des œuvres d’art inspirées des dessins animés. Ugleh a pris le même réseau neuronal Le philanthrope Pour créer ces QR codes (qui sont eux-mêmes des formes géométriques) et Nourrir des images simples de spirales Et des motifs en damier à la place.

Lorsque vous êtes guidé par l’invite, « une scène de village médiéval avec des rues animées et un château au loin » (Chef-d’œuvre : 1.4), (meilleure qualité), (détail)“, ControlNet a montré des scènes dans lesquelles les éléments artistiques des images correspondent aux formes perceptuelles des cercles et des damiers. Dans une image, les nuages ​​​​se courbent au sommet et les gens se tiennent dans une courbe douce pour correspondre à la direction de la spirale. Dans une autre, des carrés des nuages ​​et des clôtures forment les faces d’un bâtiment et d’un chariot. Une scène d’échiquier.

La magie ControlNet

Alors, comment ça marche? Nous avons couvert le spread stable à plusieurs reprises avant. Il s’agit d’un modèle de réseau neuronal formé sur des millions d’images capturées sur Internet. Mais la clé ici est ControlNet, qui est apparu pour la première fois dans un article intitulé «Ajout d’un contrôle conditionnel aux formulaires de post-texte en image» Écrit par Lvmin Zhang, Anyi Rao et Maneesh Agrawala en février 2023, il est rapidement devenu populaire au sein de la communauté Stable Diffusion.

Généralement, une image à diffusion stable est créée à l’aide d’un vecteur texte (appelé text2image) ou d’un vecteur image (img2img). ControlNet fournit des instructions supplémentaires qui peuvent prendre la forme d’informations extraites de l’image source, notamment la détection de pose, le mappage de profondeur, le mappage normal, la détection de contours, etc. Grâce à ControlNet, toute personne créant une œuvre d’art basée sur l’IA peut reproduire plus fidèlement la forme ou la pose d’un sujet dans une image.

En utilisant ControlNet et des invites similaires, il est facile de reproduire le travail d’Auglet, et d’autres l’ont fait de manière divertissante, notamment… Personnages d’anime sur échiquierque les dessins animés“Village médiéval”chèvre“(étonnamment sûr pour le travail) et une version village médiévale de”La fille à la boucle d’oreille en perle“.

Malgré l’intérêt massif et les nombreuses offres pour transformer les œuvres d’art en NFT, Ugleh a choisi de faire profil bas pour le moment. Sur X, c’est Il a dit“J’apprécie tous les retours positifs sur l’Art de l’IA, je n’ai pas l’intention de gagner de l’argent avec ma dernière génération et je ne ferai aucune interview formelle. Je suis juste un gars ordinaire obsédé par l’IA. et a expérimenté la nouvelle technologie ControlNet.

Si vous voulez essayer ControlNet, ce site Il a une bonne éducation. Ugleh a également publié un Flux de travail étape par étapey compris les fichiers de modèles en spirale et en damier, sur Imgur.

Même si l’œuvre d’art est magnifique, Politique actuelle du droit d’auteur aux États-Unis Indique que les images ne répondent pas aux critères de protection du droit d’auteur et qu’elles peuvent donc appartenir au domaine public. Alors que les œuvres d’art créées par l’intelligence artificielle sont encore… Sujet controversé Pour beaucoup, pour des raisons éthiques et juridiques, les passionnés de création continuent de repousser les limites de ce qui est possible pour un praticien non qualifié ou non formé utilisant ces nouveaux outils. Il reste incertain si la loi reconnaîtra ou non l’étincelle d’inspiration humaine nécessaire qui rend de telles actions possibles.

Leave a Comment