Keilrod -
posté le 24/11/2023 à 11:02:14 (2236 messages postés)
❤ 3Kenetec Nemau Roi of the Suisse
J'utilise beaucoup Dalle3 perso, je trouve ça vraiment bluffant. Je n'ai pas réussi à avoir la même chose avec Stable Diffusion (et Midjourney je ne paie plus, mais je trouvais pas aussi puissant que Dalle3, il y a déjà 2-3 mois).
J'ai généré ce genre de choses récemment (les images sont grosses mais ça doit passer pour les résolutions 1920*1080, sinon hésitez pas à me spoiler) :
Falco -
posté le 24/11/2023 à 11:20:38 (19777 messages postés)
-
❤ 1Keilrod
Indie game Developer
Ah ouais ok, là on arrive à un stade ou c'est même plus possible de savoir si c'est de l'IA ou pas :O
C'est magnifique, mais ca fait flipper en même temps.
(Je me suis abonné à ta page Insta)
Keilrod -
posté le 24/11/2023 à 11:35:54 (2236 messages postés)
❤ 0
Oui j'ai quelques amis dessinateurs qui sont un peu dégoutés.
Mais je pense qu'il faut voir ça comme un outil supplémentaire pour les artistes (et le monde en fait) !
Puis rien n'empêche un dessinateur de se servir de l'IA comme référence pour ses propres dessins.
Une personne seule va bientôt pouvoir mettre en animation 2D/3D ou sur "papier" ce dont elle rêvait, et qui, sans l'IA, aurait été extrêmement couteux en temps, et sûrement d'une qualité amateur. Un écrivain va pouvoir "facilement" mettre des illustrations de son univers dans son bouquin. Beaucoup de possibilités quoi !
Je dis bientôt car même si c'est très puissant : c'est encore complexe de faire une œuvre entière avec une vraie cohérence graphique (à mon humble niveau).
Je pense que le fait que ça fasse peur est bon signe, ça veut dire que c'est une petite révolution ! Et les créateurs/créatifs seront toujours valorisés (je pense) car l'inspiration humaine a encore de beau jour devant elle !
Keilrod -
posté le 24/11/2023 à 12:27:00 (2236 messages postés)
❤ 0
Merci beaucoup du compliment ! C'est de la patience derrière les prompts surtout, et un peu d'idées bien sûr.
Effectivement je vais devoir m'y pencher sur Stable Diffusion vu ses avantages d'éditions et de poses (j'avais un peu vu tes posts à ce sujet sur les pages précédentes) ! Et j'apprécie beaucoup que le "core" soit sur Github ! Merci beaucoup pour les liens. Ce week-end je vais vider mon stock de Redbull et suivre des tutos.
Niveau qualité de dessin j'ai l'impression que c'est un peu en deçà de Dalle3 quand même (je suppose que OpenAI a du faire travailler les bots à fond vu leurs moyens).
Falco -
posté le 24/11/2023 à 14:01:20 (19777 messages postés)
-
❤ 0
Indie game Developer
Je suis en train de tester Stable là.
C'est pas facile à tout comprendre au début, mais je commence doucement à m'y mettre. J'ai juste du mal encore à comprendre la différence entre les checkpoints et les Lora.
Comment tu fais pour charger une position Trotter?
-Un checkpoint c'est un modèle modifié pour dessiner plus précis/mieux. Mon checkpoint préféré c'est Analog Madness qui évite l'aspect trop lissé des persos par contre attention il aime bien sortir des trucs dénudés.
Un modèle se met dans stable-diffusion-webuimodelsStable-diffusion et se sélectionne en haut à gauche :
-Un Lora c'est un petit fichier d'environ 100mo qui s'additionne à un modèle précis (ne pas utiliser un Lora 1.5 sur XL !). A mettre dans stable-diffusion-webuimodelsLora et se sélectionne là :
-Un Embedding c'est comme un Lora sauf que ça fait quelques Ko (!!), moins précis et se met dans stable-diffusion-webuiembeddings.
-Ya aussi d'autres trucs nouveaux que je ne connais pas.
Lora et Embeddings sont entrainés sur un mot précis genre "Jim Lee". Si tu n'utilises pas ce mot précisément ça ne marchera pas.
Un modèle c'est plus long à entrainer qu'un Lora qui est plus long à entrainer qu'un Embeddings (j'ai déjà entraîné des embeddings sur des trucs précis mais je touche aux limites de mon matériel informatique !).
Citation:
Comment tu fais pour charger une position Trotter?
C'est une extension qui s'appelle ControlNet. Une fois ajoutée elle donne une nouvelle interface :
Cette extension permet de contraindre l'image à partir d'infos diverses : une autre image, la détection de bords d'une autre image, la détection de la profondeur, de pose...
Elle fonctionne elle-même avec des modèles (un modèle pour détecter les bords, un modèle pour détecter les distance, un modèle pour les poses...).
Utilisation de ControlNet sur corps/mains/visages :
Génération d'image à partir de lignes :
Génération d'image à partir de bords :
On peut aussi combiner les ControlNet.
Donc il faut :
1)Télécharger l'extension ControlNet.
2)Télécharger les modèles (celui qui t'intéresse c'est OpenPose).
Niveau qualité de dessin j'ai l'impression que c'est un peu en deçà de Dalle3 quand même (je suppose que OpenAI a du faire travailler les bots à fond vu leurs moyens).
Si tu ne joues qu'avec les prompts, c'est clairement inférieur.
Par contre si tu ajoutes les extensions/modèles spécialisés, ya match.
Il existe des extensions pour :
-corriger la qualité des visages
-générer des vidéos
-améliorer l'agrandissement des images
-faire des zooms infinis dans une image
-remplacer un visage par un autre qu'on lui fourni
etc, etc.
En outre il y a des Lora qui sont des vrais petits outils. Comme on peut sélectionner la puissance de chaque partie prompt, on peut appliquer le Lora plus ou moins fortement, exemple en changeant le genre :
Zoom :
Niveau de barbe :
ౡ
Sylvanor -
posté le 24/11/2023 à 16:38:57 (24806 messages postés)
-
❤ 0
Le gars chiant qui rigole jamais (il paraît)
Oui un gros avantage de Stable Diffusion c'est l'inpainting, je dirais même à mon avis son plus gros avantage.
Controlnet ça a l'air excellent mais pour ma part mes essais je les fais sur InvokeAI (qui est très pratique pour l'inpainting justement) et bien qu'ils aient annoncé un support de Controlnet c'est complètement buggué et Openpose a pas l'air de marcher enfin le petit mannequin apparaît pas, c'est un peu étrange et j'ai pas l'énergie de trouver/comprendre pourquoi, InvokeAI c'est un peu la galère, à chaque mise à jour y a plus rien qui marche tout se met à bugguer c'est l'angoisse.
Très impressionnant Dall-E 3, tu passes par quoi, Bing Image Creator pour l'utiliser ? J'ai l'impression que dessus les images sont plus petites / plus floues que ce que tu produis.
Un truc qui manque toujours en revanche c'est pouvoir conserver le même perso d'une image à l'autre, ce qui permettrait de faire de la BD par exemple (bon là faudrait conserver le décor aussi), ou des artworks et des poses variées d'un même perso etc.
Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ
trotter -
posté le 24/11/2023 à 17:37:38 (10744 messages postés)
-
Keilrod -
posté le 24/11/2023 à 19:42:48 (2236 messages postés)
❤ 0
Sylvanor a dit:
Très impressionnant Dall-E 3, tu passes par quoi, Bing Image Creator pour l'utiliser ? J'ai l'impression que dessus les images sont plus petites / plus floues que ce que tu produis.
Un truc qui manque toujours en revanche c'est pouvoir conserver le même perso d'une image à l'autre, ce qui permettrait de faire de la BD par exemple (bon là faudrait conserver le décor aussi), ou des artworks et des poses variées d'un même perso etc.
J'utilise Chat GPT4, payant, ~20e/mois, j'ai deux comptes pour ne pas trop vite arriver à la limite qui, justement, arrive trop vite quand j'ai du mal à arriver à ce que je veux.
Complètement d'accord sur ton dernier paragraphe, j'ai hâte que ça arrive et je pense que ça va être le cas dans un futur très proche.
Il me semble qu'il est déjà possible d'utiliser les IA pour générer de la 3D donc au moins dans le cadre de la 3D il y a déjà des choses à faire. Mais je ne me suis pas encore penché là dessus !
D'ailleurs je me suis permis d'écrire un #aedemphia sur une de mes premières images (ici) car je suis clairement marqué au fer rouge par ton univers Sylvanor ! Et parceque ça faisait partie des mots-clefs de mon prompt, à côté d'autres RPG.
@trotter : Merci beaucoup pour toutes ces infos, ce n'est pas si évident de regrouper toutes ces choses de manière claire !
Edit : @Sylvanor : Posé après une bonne semaine de taff, j'y repense et je me dis que ça pourrait être normal que cela te dérange que j'eusse tapé Aëdemphia au milieu d'un prompt.
Je ne l'ai fait qu'une fois car Dalle3 m'amuse bien trop et parceque ça me faisait plaisir de donner un peu de visibilité à Aë aussi. Mon prompt était bien plus long et diverse que "Fait moi du Aë" ; et je ne cite plus aussi directement des sources après 2 semaines 7j/7 de Chat GPT4 C'est un peu long désolé mais je voulais juste être clair à ce propos vu que je redébarque comme ça.
En fait aujourd'hui si je dois citer, je cite plutôt des artistes talentueux décédés depuis au moins 100 ans (ou le nom de leur style) et je lui fais mélanger avec un style manga/anime (pas toujours), et bien sûr les petits détails de mon humble imaginaire. Dalle3 est bien plus simple d'accès que Stable Diffusion là dessus ! J'espère que pour une prochaine version ils mettront les features de Stable Diffusion que trotter à présenté, car ça me manque beaucoup de pouvoir retoucher le rendu.
Sylvanor -
posté le 24/11/2023 à 22:51:09 (24806 messages postés)
-
❤ 0
Le gars chiant qui rigole jamais (il paraît)
Ah ah aucun problème Keilrod j'en suis très honoré et les images sont super cool j'aurais même aimé les voir en plus grand, tu peux utiliser du #aedemphia autant que tu veux!
Citation:
Le petit mannequin (sur AUTOMATIC1111 en tout cas) c'est juste une image à drag and dropper. Il y a des packs de pose à télécharger :
Vraiment? Il me semblait que sur Automatic1111 on pouvait le régler directement dans l'interface?
Bref en tous cas ça marche pas quand j'active Openpose et que je mets le png importé j'ai "Error model not found exception", ouah super, je google, aucun résultat.
Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ
Keilrod -
posté le 24/11/2023 à 23:47:56 (2236 messages postés)
❤ 0
Sylvanor a dit:
Ah ah aucun problème Keilrod j'en suis très honoré et les images sont super cool j'aurais même aimé les voir en plus grand, tu peux utiliser du #aedemphia autant que tu veux!
Ça me fait plaisir alors.
Merci beaucoup pour les images et moi aussi j'aimerais les avoir en plus grand en fait.
C'est un autre défaut de Dalle3 pour l'instant, j'ai oublié d'en parler mais la résolution est limité à 1024px de largeur et 1792px en hauteur (moi je reste quasiment tout le temps en 1024*1024).
Là dessus Stable Diffusion est meilleur ; Midjourney c'est aussi du 1024px de largeur.
trotter -
posté le 25/11/2023 à 00:20:27 (10744 messages postés)
-
❤ 0
Sylvanor a dit:
Bref en tous cas ça marche pas quand j'active Openpose et que je mets le png importé j'ai "Error model not found exception", ouah super, je google, aucun résultat.
The easiest way to install them is to use the InvokeAI model installer application. Use the invoke.sh/invoke.bat launcher to select item [4] and then navigate to the CONTROLNETS section. Select the models you wish to install and press "APPLY CHANGES". You may also enter additional HuggingFace repo_ids in the "Additional models" textbox.
Using the "Add Model" function of the model manager, enter the HuggingFace Repo ID of the ControlNet. The ID is in the format "author/repoName"
ౡ
Adalia -
posté le 25/11/2023 à 01:26:57 (3455 messages postés)
❤ 0
[insert queer propaganda]
question sur les IA mais pas graphiques, en particulier pour Trotter vu que t'as l'air de t'y connaître à donf ;
j'utilise au quotidien un logiciel "à l'ancienne" pour féminiser ma voix, mais la qualité est pas ouf et met plusieurs secondes de délai par rapport à quand je parle. j'imagine qu'il y a des outils utilisant une IA pour faire ça mieux ? au moins niveau qualité.. tout ce que j'ai trouvé jusque-là c'est soit pour prendre une voix de célébrité, ce que je ne veux pas, soit ça ne fonctionne pas correctement en français :/
Sylvanor -
posté le 25/11/2023 à 04:58:49 (24806 messages postés)
-
Je sais pas mais c'est censé être fourni depuis InvokeAI 3.
Bon j'ai mis à jour InvokeAI, évidemment ça a tout détruit y a plus rien qui marchait il a fallu refaire une install propre ça a mis 3h putain je les hais.
Résultat ça marche. Ok c'est cool. Ouais plutôt impressionnant. Par contre on peut pas orienter le regard c'est moyen, ça fait des images un peu bizarres du coup quand il faudrait que celui-ci soit orienté.
J'ai voulu tester ton truc avec la webcam là qui remplace les visages, Roop cam.
Bon ben après une demie heure d'install boum plein d'erreurs python pytorch machin rien compris. J'essaie de lancer le truc y a rien qui marche ça fait rien ça se lance même pas.
Ça m'a gavé j'ai tout viré de toute façon c'était juste pour rigoler j'ai pas besoin de prendre la tête d'Elon Musk.
Sérieusement leurs installeurs c'est pas possible tellement c'est fait avec les pieds, ça buggue tout le temps, tu démarres t'as aucune idée du temps que ça prendra et de l'espace que ça bouffera sur le disque, t'as 3000 messages d'erreur incompréhensibles en plein milieu... Mais c'est fou ça les mecs te pondent des IA/logiciels de dingos qui font des trucs incroyables à la pointe du truc et ils sont pas foutus de faire des installeurs corrects.
Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ
trotter -
posté le 25/11/2023 à 11:50:07 (10744 messages postés)
-
❤ 0
Je confirme que c'est une merde intersidérale à installer.
Adalia j'ai fais quelques tests et le max que j'arrive à faire c'est ça :
trotter -
posté le 25/11/2023 à 12:34:56 (10744 messages postés)
-
❤ 0
Doit y avoir moyen...
J'ai essayé 4 ou 5 autres voix du site weight gg, j'aime bien celle-là :
En Français il y a celle de Alizée mais elle est ultra robotique avec moi
Pareil pour les 2 Angèle du site, dont une entrainée sur 15 MINUTES d'audio d'un de ses CD Bordel avec si peu de données normal que ça ne marche pas.
Il faudrait cloner les voix de cette émission :
.....mais j'ai pas trop trop la motiv de me lancer là dedans.
ౡ
Sylvanor -
posté le 25/11/2023 à 16:15:23 (24806 messages postés)
-
❤ 3Crystal Kenetec Keilrod
Le gars chiant qui rigole jamais (il paraît)
Ok je joue un peu avec Dall-E 3 aussi, c'est vrai que c'est impressionnant, je me suis amusé à reprendre les mêmes prompts que j'avais testés depuis Midjourney v3:
"portrait of a dreaming adorable lady, long hair, underwater, surrounded by fishes, by rembrandt"
Pas très adorable mais superbe image.
"a cosmic goddess futuristic by kris kuksi, extreme detail, volumetric, hyper realistic"
Très cool on dirait la pochette d'un album de psybient mais il connait pas Kris Kuksi visiblement.
"old man walking on a cube floating above a giant abandoned medieval city, deep night, black and white, concept art, digital painting, insane detail"
Ouais pas mal! J'aurais préféré des noirs plus profonds cependant.
"a little sailboat surrounded by 12 giant demons in dark outer space with a white cube and two big white columns in the background, digital painting, black and white, insane detail"
Super bien, je préfère la compo des images de Midjourney mais Midjourney n'arrivait vraiment pas à respecter ce genre de prompts complexes, ici je retrouve beaucoup mieux le sujet!
"gigantic corridor with ruins of a dead city on each side, underwater, giant jellyfishes, flying cubes, outer space, dead branchs reaching from the walls, black and white, digital painting, insane detail, intricate illustration"
On retrouve un peu l'ambiance des rendus Midjourney v3 mais avec beaucoup plus de cohérence. Je suis pas totalement fan cependant de celle-là je la trouve un peu brouillonne.
"(cybernetic robot ghosts) staring at a pretty girl dancing in a white frilly dress with long wavy hair, extreme detail, atmospheric, underwater, black and white, drawing, by gustave dore"
Celle-là c'était une catastrophe sur Midjourney il comprenait rien, la fille qui danse ressemblait à rien, les fantômes étaient pas du tout cybernétiques, ouah ici les images sont ultra ultra cool je suis totalement fan des deux dernières.
"a beautiful young girl with long wavy blonde hair, white dress, hugging a skeleton, in the cosmos, closed eyes, oil painting, renaissance, dark"
Beaucoup plus de cohérence ici aussi que sur Midjourney v4, qui n'arrivait pas à proposer ces deux personnages entrelacés sans plein de problèmes.
"walls of faces with big volcanos and smoke, strange machines flying, horrific big cubes, black and white, extremely detailed, 4k, towers of eternity in the background, creative"
"a young girl is sitting at the edge of the world, contemplating the frightening void, dark, intricate, by rembrandt"
J'ai une petite préférence pour les images qu'avait généré Midjourney v4 mais plus de cohérence ici quand même, surtout qu'il m'a fallu plein d'essais sur MJ.
Midjourney v5 j'aime pas, pour moi ça a été une déception, je trouve les images fades, mal composées, c'est pourquoi je compare toujours à la v4.
"gigantic magical ruins in the night, big floating bubbles and giant dead trees, gustave dore style, black and white, intricate details"
Plus fidèle que MJ v4 même si pas spécialement plus beau. Sur la v4 les bulles ne s'affichaient pas il me semble.
"gods heads in the sky looking down, mad city, black and white, drawing, creative, angels, intricate details, strange organic cubes, death dancing, chaotic sky"
Très différent de ce que j'avais sur MJ v4 mais tout aussi cool.
Vous pouvez retrouver mes résultats avec ces prompts sur Midjourney v4 en pages 2 et 3 de ce topic.
Dommage qu'on puisse pas les upscaler en plus grand.
Par contre il m'a bloqué un rendu "emma watson by rembrandt" en me disant que ça violait les conditions d'utilisation et que si je recommençais je pouvais être suspendu de compte, c'est un coup dur je suis très triste.
Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ
Adalia -
posté le 25/11/2023 à 18:28:24 (3455 messages postés)
❤ 0
[insert queer propaganda]
C'est quoi ton truc avec les cubes Nonor ? xd
trotter -
posté le 25/11/2023 à 19:06:41 (10744 messages postés)
-
❤ 0
Citation:
Par contre il m'a bloqué un rendu "emma watson by rembrandt" en me disant que ça violait les conditions d'utilisation et que si je recommençais je pouvais être suspendu de compte, c'est un coup dur je suis très triste.
Voilà pourquoi Stable Diffusion c'est supérieurzz !!!! Très joli sinon.
ౡ
Nemau -
posté le 25/11/2023 à 22:09:45 (53222 messages postés)
- -
❤ 0
Narrer l'autocatégorème
trotter a dit:
J'ai essayé 4 ou 5 autres voix du site weight gg, j'aime bien celle-là
xD
J'imagine bien Adalia ensuite :
- J'ai la voix d'une célébrité !
- Ah ouais ? Qui ça ?
- Heu... Une meuf...
Citation:
Il faudrait cloner les voix de cette émission
Moi qui croyait qu'on allait l'entendre lire le bouquin avec la voix de notre Alka, je suis déçu ! =>[]
Nonor aucune de tes images ne s'affiche chez moi. :c (je les vois seulement si je récupère leur lien et que je les ouvre dans un nouvel onglet)
trotter -
posté le 26/11/2023 à 18:43:37 (10744 messages postés)
-
❤ 3Nemau Roi of the Suisse Adalia
trotter a dit:
Il faudrait cloner les voix de cette émission...
.....mais j'ai pas trop trop la motiv de me lancer là dedans.
Finalement je l'ai fais :
C'est assez rapide, 1h de conversion.
Le plus dur est de passer les 12 cercles de l'enfer de l'installation de logiciel Python que connaît maintenant bien Nonor.
J'écris un tuto
ౡ
Sylvanor -
posté le 26/11/2023 à 19:25:29 (24806 messages postés)
-
❤ 0
Le gars chiant qui rigole jamais (il paraît)
Impressionnant!
Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ
trotter -
posté le 27/11/2023 à 02:54:05 (10744 messages postés)
-
❤ 3Nemau Roi of the Suisse Adalia
Mon beau tuto :
ౡ
Keilrod -
posté le 28/11/2023 à 11:23:43 (2236 messages postés)
❤ 0
Sylvanor a dit:
Par contre il m'a bloqué un rendu "emma watson by rembrandt" en me disant que ça violait les conditions d'utilisation et que si je recommençais je pouvais être suspendu de compte, c'est un coup dur je suis très triste.
Un peu violent comme message de la part de ChatGPT mais ça peut se comprendre ! Les mauvaises utilisations de "fakes" sont malheureusement légion ; donc ils se protègent (même si ton prompt était innocent).
J'aime beaucoup les visages intégrés aux structures cubiques ! Les autres sont cool aussi.