Day.png);">
Apprendre


Vous êtes
nouveau sur
Oniromancie?

Visite guidée
du site


Découvrir
RPG Maker


Apprendre
RPG Maker

Tutoriels
Guides
Making-of

Dans le
Forum

Section Entraide

Jeux: Our forthcoming dreams / News: Les résultats du 4ème concours (...) / News: Des jeux d'antan sur tous vos (...) / Scripts: [XP] SE au volume variable / Scripts: [XP] Déplacements en (...) / Chat

Bienvenue
visiteur !




publicité RPG Maker!

Statistiques

Liste des
membres


Contact

Mentions légales

372 connectés actuellement

31003522 visiteurs
depuis l'ouverture

3624 visiteurs
aujourd'hui



Barre de séparation

Partenaires

Indiexpo

Akademiya RPG Maker

Blog Alioune Fall

Fairy Tail Constellations

ConsoleFun

Alex d'Or

Le Temple de Valor

New RPG Maker

Tous nos partenaires

Devenir
partenaire



forums

Index du forum > Vos créations > Les IA : art génératif, modèles de langage...

Aller à la page 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Reprise du message précédent:

AnthonyP - posté le 12/01/2025 à 22:37:21 (1025 messages postés) -

❤ 1

2:25 ce son de synthétiseur de trompette c'est drôle et kitch ça me fait penser aux banques d'instrument sur la Megadrive c'est très drôle de le voir casé comme ça dans ta compo.
6:16 les bruitages d'insectes qui crachouillent sont hilarants aussi. :popcorn

Les sons de guitares Disto encore une fois est assez marrant, sur cette compo mais aussi sur les anciennes que tu avais fait de souvenir, ça envoie, manquerait plus que de vrais passages en Riff joué de façon continu pour qu'on commence vraiment à se dire "Ouais là on est dans un groupe de Rock prog ça démarre on y croit". Mais déjà rien que d'entendre un mélange de synthétiseur avec des flutes on se dit " C'est bien Sylvanor qui essaie de faire du rock progressif, c'est fun ". :clindoeil4

Je m'étais un peu forcé à étudier des partitions de groupe de Metal Prog comme "Tool" par exemple ou "Disperce" voir même un peu ton groupe fétiche " Tesseract " et en fait un moyen de mieux comprendre comment ces groupes composent c'est de regarder comment ils écrivent leurs partitions en tablature. Même sans forcément être capable de composer comme eux après c'est génial internet pour ça,ça aide à démystifier un chouya cette impression de "Waouw" qu'on a quand on découvre de supers groupes de prog et qu'on est resté "impressionné" par ce que nous avais procurés leurs musiques sans vraiment pouvoir jamais s'expliquer la théorie derrière qui permet de créer certains effets rythmiques.

Hésite pas à taper "Tesseract + Le titre du morceau que tu aimes + Tablature". Il y à des logiciels sur navigateur qui jouent la partition en ligne et ça permet d'étudier des groupes de prog pour mieux identifier ce qu'ils font. Ce qui change ou pas d'une mesure à une autre, ou voir quand ils changent une signature rythmique.

Même si ya des trucs fait par I.A j'aime bien tes mélanges d'instruments pour tenter de faire une sorte de Rock Progressif Ovni et créer un univers.

Quand la chanteuse commence à conter des choses je trouves que les bruitages déconcentrent un chouya de ce qu'elle dit. On dirait une conteuse mais elle galère à raconter des trucs à cause du brouhaha ambiant "ce qui pourrait être une idée marrante aussi en soit". C'est pour ça que je me demandais si il y avait moyen après de demander au logiciel de garder seulement certaines pistes et pas d'autres, je ne sais pas comment ça se passe après derrière pour faire des arrangements et tenter d'améliorer des passages précis.

Tu as plus d'excuses pour ne pas faire une reprise du jeu "Les Versets qui rendent fou' et faire des ambiances sonores par I.A pour une futurs reprise du jeu.

On veut un labyrinthe avec des bruitages d'insectes foufous sous fond d'accordéon.

Sylvanor a dit:


Forcément je débute et je me heurte à plein de problèmes, désormais plus liés à ma méconnaissance de la composition et de la pratique musicale que du logiciel. Je pense que je reviendrai dessus, j'ai très envie de refaire un album complet accompagné avec l'IA, en tirant profit de tout ce que j'ai appris.
Ca me donne l'impression de bosser avec un groupe, sauf que mon groupe c'est l'IA. :F



T'en fait pas pour le manque de connaissances en composition musicale on commence tous je pense en bidouillant sur des logiciels "plus ou moins fait pour".

j'ai commencé à composer des musiques toutes nulles en 2004 en petit collégien du collège sur un logiciel qui s’appelait Midi maker, c'était limité à 30 jours et j'avais la flemme de payer du coup j'ai abandonné la composition de musiques de 2004 à 2005 / ou 2006, composait très peu, c'était même pas de la musique ce que je faisais mais plus des "bruitages d'ambiance".

Je bidouillais sur ModPlugTracker entre 2006 / 2010 " pareil j'y connaissais rien , composais presque pas.

En 2011 je me suis lancé sur GuitarPro, j'y connaissais rien, je commençais un peu plus à m'amuser.
Même chose, les limitations faisaient que je prenais plaisir à expérimenter mais j'avais toujours la petite frustration
liée au fait de ne pas m'y connaitre en théorie, j'étais quand même dans une sorte de plaisir de découvrir
que j'avais enfin un premier vrai logiciel qui allait vraiment m'aider à aller un peu plus loin que ce que je faisais
collégien. Malgré tout 2011 reste une année assez forte pour moi, c'est là où j'ai eu un élan créatif en dessin et en musique que je n'avais jamais connus avant.

2012 avec un mini projet de jeu cher à mon coeur j'ai commencé à avoir quelques rares compos dont je suis attaché même si c'était pas extraordinaire au niveau du mixage "et pas pro du tout" mais au moins il y avait une "intention".

2013 à 2016 je composais encore sans théorie musicale solide.

Vers 2018 j'en ai eu marre je me suis vraiment mis à creuser la théorie musicale.

Donc tout ça pour dire que des fois on se met très tardivement à une activité, alors qu'à la base je pensais que j'allais rester cantonné à ne faire que du dessin.

Et vraiment j'insiste de 2004 à 2011 je composais presque pas, et c'était souvent nul. Mais à force de s'immerger de plus en plus ça devient naturel un truc qui n'était pourtant pas acquis d'avance.

Le truc sympa avec ton logiciel d'I.A " A moins que ce soit aussi des pistes MIDIs que tu as composé toi même " C'est qu'avec d'anciennes compos on peux garder des bribes de choses qui nous plaisent. il manque plus qu'à les améliorer par la suite, les ré arranger autrement.

C'est comme pour le dessin, à force d'accumuler des idées on est forcément amené à faire le tri entre les bonnes/Mauvaises idées. Grâce à ce travail de tri il peut finir par en ressortir une tendance de choses qu'on aime.

Et même si c'est pas 'Pro" c'est pas grave, tans que tu peux toujours garder une sorte "d'intention" même en ayant pas encore toute les notions musicales , avoir une intention est toujours mieux que de juste faire n'importe quoi. Je me souvient que quand j'étais ado et faisais trop du random sur mes compos bas quand je les ré écoute maintenant ça me fait plus une impression de gâchis que de vrais bons souvenirs. Faire des bêtises c'est bien aussi ça fait des exemples de trucs qui ne fonctionnent pas à cause de leur côté "random" et ça peut donner envie de faire des choses plus structurées après.

Hors là on voit bien que ça n'est pas n'importe quoi et que tu rajoutes des pistes d'accordéons et flûtes + bruitages assez drôles qui rajoutent un truc sortie de nulle part et qui pourraient très bien servir pour de futurs créations en étant améliorés, dérivées autrement.

Tout ça pour dire que même sans avoir de notions en théorie musicale, le simple fait d'avoir des bribes d'intentions assez précises ça peut vraiment être un beau moteur pour quand même poursuivre la création de compos en musique.

Mes illustrations à : https://www.artstation.com/anthony-philippeau Les musiques que je compose pour mes projets de jeu vidéo : https://soundcloud.com/octonhy


Suite du sujet:

Alkanédon - posté le 13/01/2025 à 00:00:39 (8388 messages postés) - -

❤ 0

Citoyen d'Alent

Sylvanor a dit:

J'ai passé pas mal de temps à bidouiller dans Ableton sur de vrais morceaux sans IA, je vais me concentrer dessus maintenant et laisser de côté l'IA pour un moment.


Enorme faudra nous partager :rit2


unikfingers - posté le 14/01/2025 à 12:00:22 (2318 messages postés)

❤ 2

Acts of kindness, like breadcrumbs in a fairytale forest...

Citation:

J'ai suivi ton conseil Unik et ajouté un tout petit peu de reverb sur l'ensemble du morceau (peut-être trop peu? j'ai été très timide), et de la compression (en laissant le réglage de base, ne sachant pas trop comment utiliser l'outil).


Dèjà bravo pour ton morceau, c'est tres sympa, surréaliste.
Tu fais bien d'être timide quant à la reverb générale, comme je te disais, il s'agit ici d'unifier le morceau, pas de l'imbiber dans le formol :)

Je t'explique vite fait les facteurs dans la compression, c'est toujours grosso modo les mêmes quel que soit ton VST. Threshold : Le niveau à partir duquel on compresse, Ratio : La force de la compression, Attack : Temps pour démarrer la compression, Release : Temps pour arrêter la compression.

Threshold, niveau au-delà duquel le compresseur commence à agir. Tant que le son reste en dessous, il ne se passe rien. Une fois que le son dépasse le seuil, la compression entre en jeu.

Imagine une barrière. Tant que le son reste en dessous, il passe sans problème. Dès qu’il dépasse, la barrière le freine.

Ratio, c'est la force de compression : il détermine combien le son est réduit une fois qu’il dépasse le seuil.
Ratio 2:1 : Si le son dépasse le seuil de 2 dB, il est réduit à 1 dB.
Ratio 4:1 : Si le son dépasse de 4 dB, il est réduit à 1 dB.

C’est comme un élastique qui tire le son vers le bas. Plus le ratio est élevé, plus l’élastique est tendu et ramène le son vers le seuil.

Attack, c'est le temps que met le compresseur à commencer son action après que le son dépasse le seuil.

Attack rapide : Le compresseur agit immédiatement, utile pour contrôler les pics soudains.
Attack lente : Laisse passer une partie du début du son (les transitoires), ce qui conserve plus de punch.

Imagine une porte qui se ferme. Si elle se ferme vite, elle bloque tout de suite le son. Si elle se ferme lentement, un peu de son passe avant qu’elle se referme.

Release, c’est le temps que met le compresseur à arrêter son action une fois que le son redescend sous le seuil.

Release rapide : Relâche vite la compression, idéal pour garder une dynamique naturelle.
Release lent : Maintient la compression plus longtemps, donnant un son plus lissé.

Pas évident de trouver une image ici mais on on peut comparer ça a une barrière qui se baisse. Si elle descend vite, le son est libéré rapidement. Si elle descend lentement, elle continue de freiner.

Moi aussi je me suis inspiré de toi et de ta chaine Youtube :). J'en ai créé une spécialement pour mes créations à base d'AI, donc pour les Mashups/Bootlegs.
J'essaie de renforcer la cohérence des artistes que je fusionne en ajoutant des images générées sur Stable Diffusion.



Dans ce remix d'Exodus (Bob Marley-Outkast) j'essaie de raconter en filigrane les pérégrinations d'un jeune musicien Ethiopien migrant

...But I don't believe, and I'm not consoled I lean closer to the fire, but I'm cold


trotter - posté le 15/01/2025 à 23:44:56 (10922 messages postés) - staff

❤ 1

Super clair et intéressant unikfingers merci.


trotter - posté le 17/01/2025 à 20:07:36 (10922 messages postés) - staff

❤ 0

Les mecs derrière AI Dungeon ont entrainé une IA (Nemo 12B) spécialement sur des scénarios de game over pour ajouter de la difficulté lors des roleplays :

Fiche complète : https://huggingface.co/LatitudeGames/Wayfarer-12B
GGUF à utiliser avec KoboldCpp (ou LMStudio etc) ici : https://huggingface.co/LatitudeGames/Wayfarer-12B-GGUF

Et il parle FRANCAIS !


unikfingers - posté le 19/01/2025 à 12:53:13 (2318 messages postés)

❤ 0

Acts of kindness, like breadcrumbs in a fairytale forest...

Je remarque que les discussions sur les bienfaits et les limites de l'IA prennent beaucoup de place dans cette section. Même si ces débats sont passionnants, je vous rappelle qu'il existe un topic dédié pour centraliser ces échanges dans la section débat. Ça permettra à chacun de partager ses créations et d'échanger plus sereinement ici.

...But I don't believe, and I'm not consoled I lean closer to the fire, but I'm cold


Saheyus - posté le 19/01/2025 à 13:09:32 (837 messages postés)

❤ 0

En effet, un modo peut déplacer les posts hors sujet, peut-être ?


Saka - posté le 19/01/2025 à 13:21:49 (18302 messages postés) - modero -

❤ 3

Réalisateur de chez Lidl

Je m'en occupe :clindoeil3

Edit : Tada
J'y suis allé à la truelle parce que je dois partir, j'espère que je me suis pas trompé dans les messages à déplacer.

Réalisateur ça veut dire que je fais des films. Viens les voir si tu l'oses. | ༼ つ ◕_◕ ༽つ | Saka ressuscite les angles morts. | Gloria Papoum 1, 2, 3 | ( ͡° ͜ʖ ͡°) | L'avenir se demande ce que Saka lui réserve. | Père Clochard | Saka a dépucelé la forêt vierge. | Viens découvrir les coutumes Oniromanciennes. | (ง ͠° ͟ل͜ ͡°)ง | Coucou, tu veux voir mon site ? | ꀎ 囧


Saheyus - posté le 19/01/2025 à 14:01:52 (837 messages postés)

❤ 2

Merci Saka.

Du coup, j'en profite pour partager quelque chose qui relève de la création.

"Après avoir loué un serveur pendant quelques jours avec un L40S pour tester les modèles Flux dev FP16 avec des loras personnalisées, je partage quelques résultats ici.

Les Loras ont été créés sur Civitai avec des images générées dans dall-e, l'un pour mon projet comme indiqué ci-dessus, l'autre pour le TTRPG "Le Monde Creux" https://mondecreuxjdr.warparadise.com/
Je pourrais les publier si quelqu'un est intéressé. Comfyui a été utilisé pour les flux de travail.

Les résultats ont été très bons pour reproduire le style "aquarelle / couleurs douces", avec une atmosphère surréaliste / biopunk de "Le Monde Creux", à la fois pour les concepts contenus dans la lora (première image) et pour les nouveaux concepts (deuxième image).
Les résultats étaient plutôt bons pour les concepts simples (troisième image) avec un style "toon shaded vibrant colors", inspiré de Legend of Mana ou Muramasa avec une touche de style anime en arrière-plan. Les résultats ont été moins convaincants pour les "concepts mixtes" que Dall-e sait très bien interpréter, comme les "maisons de forme insectoïde" (quatrième image), bien qu'une bonne utilisation du prompting, de la pondération et des paramètres permette de surmonter certaines limitations.
L'upscaling est très efficace dans l'ensemble et peut améliorer la cohérence des détails (cinquième image)"

image
image
image
image
image


Nemau - posté le 19/01/2025 à 15:48:14 (53739 messages postés) - admin -

❤ 1

@_@

Citation:

Les mecs derrière AI Dungeon ont entrainé une IA (Nemo 12B)

*Nemau B12 (comprenne qui pourra)

Super sympas ces images Saheyus.

Quel RPG Maker choisir ?Ocarina of Time PCPolaris 03


trotter - posté le 19/01/2025 à 16:47:33 (10922 messages postés) - staff

❤ 0

Pour info Saheyus Flux Dev tourne très bien sur un pc avec 64Go de ram et 8 de vram.

Il galère un peu plus sur ma machine principale avec 32Go de ram et 12 de vram mais flux1-dev-Q5_0.gguf est quand même utilisable (et les loras fonctionnent). Par contre ça met quand même bien dans les 1min pour une image en 768 grosso merdo donc à oublier pour du temps réel.


Saheyus - posté le 19/01/2025 à 17:44:11 (837 messages postés)

❤ 0

Tu penses bien que je me suis un peu renseigné avant de claquer 50 balles dans la location d'une carte graphique à 10.000€ ^^
Même si j'avoue que les différents formats de Flux, c'est la jungle.

Le GGUF Q8, qui s'approche de la qualité du FP16 (je ne parle même pas des autres formats, trop approximatifs), peut effectivement tourner sur du 12GO de vram. Mais j'ai pas 1mn à attendre pour avoir une image de 768, quand je peux avoir du 1024*1768 en 20 secondes.
A la louche, je pense avoir généré 500 images pour mes tests, ça m'aurait pris environ 20 à 40H rien que pour la partie du processing, je ne m'en serais pas sorti.

En fait, je testais ça parce que j'avais beaucoup de choses à tester, pas l'envie d'attendre des heures, et que je voulais vérifier certaines choses avant d'acheter une RTX 5090.
Bon, au final, ce qui m'a causé le plus de soucis c'était la lenteur pour transférer les fichiers sur la machine, je ne suis pas près de recommencer avec le même fournisseur -_-

Merci Nemau


unikfingers - posté le 19/01/2025 à 18:25:22 (2318 messages postés)

❤ 0

Acts of kindness, like breadcrumbs in a fairytale forest...

Saheyus, tes illustrations sont faite "à la manière de" ou uniquement de prompt sans influence précise ?
l'avant dernière claque tout :)

Je continue mes bootlegs, plus je m'amuse a les faire plus j'aime l'idée de rapprocher ces univers, c'est presque utopique parfois.

J'avais repris Bob Marley avec Outkast (pour le coté street) pour illustrer la crise des migrants, maintenant je viens de masher "Jerusalem" d'Alpha Blondy avec Acid Arab pour faire une vidéo moderne en rapport avec le conflit Palestinien.
Je vais essayer de faire un montage dynamique du coup même si les 8 gigas du pc que j'emploi vont cramer .
les nappes sont faites sur synth GPT, j'ai pris l'abonnement à 10 euros du mois, je vous dirai ce que ça vaut quand j'aurai testé le maximum de possibilités.

Voila le son pour "Jerusalem"



...But I don't believe, and I'm not consoled I lean closer to the fire, but I'm cold


Saheyus - posté le 20/01/2025 à 00:32:44 (837 messages postés)

❤ 0

Oh, merci Unik.

En fait, ce "à la manière de dall-e 3" se base sur des prompts qui n'imitaient aucun style spécifique pour le Monde Creux. Les prompts utilisés par Nonor précisent surtout "Watercolor, illustration, brown and black, fog, dust" dans la plupart des prompts. Nonor pourra s'en doute t'en dire plus que moi, j'ai seulement fait le lora sur ses images, et pas ses préférées, apparemment.

Pour les trois dernières images, mon prompt de style ressemble à ça : "realistic digital painting of [subject], biopunk, 2D video game landscape background, Dynamic Lighting, toon-shading, legend of mana, ori and the blind forest, muramasa: the demon blade, dark psychedelic, remake, HD, asymmetrical".
D'après mes tests, Dall-e connaît vraiment Legend of Mana, Ori and the Blind forest et Muramasa, et ça a vraiment un impact positif sur la qualité et la clarté du rendu.

Un bootleg, c'est un enregistrement pirate, c'est ça ?
C'est sympa ces mashups, et je vois que tu as déjà fait 630 vues sur celui d'Exodus, c'est pas mal en 5 jours.

Tu traites de sujets difficiles. J'avoue que dernièrement, je me suis mis sur des choses très surréalistes pour fuir un peu le réalisme de mes précédents écrits, par les temps sombres qui courent.

PS : Si tu aimes bien la ville insecte, ce que fait dall-e lui-même devrait te plaire.

image


FwT - posté le 20/01/2025 à 12:11:04 (128 messages postés)

❤ 0

Y'a une vibe Philippe Druillet !

Aventure, gestion d'auberge et cookies : A Tale of Yu


unikfingers - posté le 20/01/2025 à 12:27:10 (2318 messages postés)

❤ 0

Acts of kindness, like breadcrumbs in a fairytale forest...

Citation:

Pour les trois dernières images, mon prompt de style ressemble à ça : "realistic digital painting of [subject], biopunk, 2D video game landscape background, Dynamic Lighting, toon-shading, legend of mana, ori and the blind forest, muramasa: the demon blade, dark psychedelic, remake, HD, asymmetrical".
D'après mes tests, Dall-e connaît vraiment Legend of Mana, Ori and the Blind forest et Muramasa, et ça a vraiment un impact positif sur la qualité et la clarté du rendu.


Ok c'est vraiment fou le rendu.
A l'instar de la musique générée, j'ai vraiment l'impression qu'on sculpte avec l'IA.
Je veux dire par là qu'on obtient un rendu et qu'on l'affine avec de l'inpainting etc...
C'est un nouveau système créatif et même si certains aspects ( les droits d'auteurs, même si je suis personnellement pour leur abolition) peuvent créer polémique, je pense que le processus créatif est vraiment présent.

Citation:

Un bootleg, c'est un enregistrement pirate, c'est ça ?
C'est sympa ces mashups, et je vois que tu as déjà fait 630 vues sur celui d'Exodus, c'est pas mal en 5 jours.

Tu traites de sujets difficiles. J'avoue que dernièrement, je me suis mis sur des choses très surréalistes pour fuir un peu le réalisme de mes précédents écrits, par les temps sombres qui courent.



Oui, a la base c'est un enregistrement pirate et puis le terme a été mis au gout du jour par le groupe 2Manydj, un bootleg, dans le monde de l'électro c'est un mashup qui réunis des univers qui semblent étranger l'un à l'autre, en fait à la base le terme bootleg provient de la prohibition, c'est pour ça que je me la joue pirate des années 30 sur ma chaine. La vidéo d'Exodus est regardée sur Youtube, ça fait plaisir que des gens s'intéressent à ce genre de pratique :)

Quant aux sujets difficile, ça dépend, je part du principe que ce qui importe dans la vie ce sont les rencontres, en partant de ce constat j'éssaie de mettre ça en évidence dans mes créations :sourire2

...But I don't believe, and I'm not consoled I lean closer to the fire, but I'm cold


trotter - posté le 22/01/2025 à 01:24:33 (10922 messages postés) - staff

❤ 1

Vous vous souvenez du prompt pour afficher le monologue intérieur d'un LLM ?

trotter a dit:

Une conversation avec Miku, qui affiche son monologue intérieur :



Retranscription, le monologue est en gras, ses réponses en non-gras :

Citation:

Miku: /Bob est revenu! Je dois le saluer./ Salut Bob! ^_^
Bob: Bonjour Miku, ça va ?
Miku: /J'ai l'impression que Bob est triste, il doit être passé au travers d'un moment difficile ces derniers temps./ Ça va super! Et toi ?
Bob: Ca va. Je vais te poser quelques énigmes, d'accord ?
Miku: /Une énigme, ça me plairait bien! ^_^/ D'accord!
Bob: Si je pars de chez moi à 7h35 et que le trajet jusqu'au travail dure une heure, à quelle heure vais-je arriver au travail ?
Miku: /Ça devrait être assez simple!/ À 8h35 !
Bob: Bravo !
Miku: /Il semble content de ma réponse ! C'est cool! /
Miku: /C'est un peu étrange, je ne comprends pas pourquoi Bob n'a pas de travail./ Tu n'as pas de travail ?

Bob: J'ai un travail Miku.
Miku: /Pourquoi ne pas travailler en ce moment?/ Pourquoi ne travaillez-vous pas en ce moment?
Bob: C'est le soir, la journée de travail est finie. Je vais compliquer un tout petit peu l'énigme, es-tu prête ?
Miku: /Tu m'as déjà demandé si je pouvais résoudre des énigmes plus compliquées, mais tu ne m'en avais pas donné encore. Tu peux me faire confiance !/ Oui, je suis prête !
Bob: Même question que l'énigme précédente, mais il y a des travaux qui me retardent de 10min. A quelle heure vais-je arriver ?
Miku: /Je vais essayer de résoudre cette énigme maintenant!/ À 8h45 !
Bob: Woah, vraiment bravo.
Miku: /Vous me dites toujours bravo, vous êtes très gentil! ^_^/ Merci!
Bob: Nouvelle énigme. Un seau pèse 100 grammes. Je le remplis d'un litre d'eau. Combien pèse le tout ?
Miku: /Un litre d'eau pèse 1 kg. Le seau lui pèse 100 grammes, donc le poids du tout sera 1,1kg! ^_^/ 1,1 kg !
Bob: Très bien ! J'ai filmé notre conversation, dis bonjour aux spectateurs si tu veux.
Miku: /Merci pour le compliment !/ Bonjour à tous les spectateurs ! ^_^
Bob: Et.... au revoir Miku, à bientôt !
Miku: /Adieu Bob! Au revoir! ^_^/ Adieu!



Ca tourne hors ligne avec llama.cpp/koboldcpp et la version à 30 milliards de param de LlaMa (chatGPT a 175 milliards de params pour info).

Elle est plus intelligente en anglais.




Eh bien les chinois ont entrainé un modèle (DeepSeek R1) à faire ça.
Donc pas juste le prompt, ils ont donné à manger au modèle des dialogues où l'assistant réfléchi (dialogues générés avec du reinforcement learning).

Ca le rend beaucoup plus intelligent et du niveau du dernier modèle d'Open AI.

Vous pouvez tester sur Open Router, il est trop gros pour être testé en local.

Mais l'histoire ne s'arrête pas là. Ils ont généré des tas de questions/réponses avec leur DeepSeek R1 et entrainé des plus petits modèles sur ces tas (ils appellent ça "distiller" avec leur jardon à la con).

Du coup ça a rendu les petits modèles un peu plus intelligent.

La contrepartie, c'est qu'ils réfléchissent beaucoup, c'est assez marrant à voir on dirait moi. Ils deviennent pas Einstein non plus, ils ne font que singer le grand modèle.

Ici vous avez un petit modèle chez chatGpt qui raconte de la merde :
https://chatgpt.com/share/679033f8-6fb0-8012-9749-a310e6c4e025
image

Ici vous avez DeepSeek-R1-Distill-Qwen-32B-Q4_K_M :
image

C'est le modèle Qwen-32B "distillé".
Ils ont aussi distillé des plus petits modèles genre llama 8B.


En résumé ils ont officialisé/sont allé à fond sur un truc qu'on savait déjà : donner un monologue intérieur au LLM améliore ses perfs sur la logique.



Ah sinon après Hunyuan vidéo qui est le meilleur générateur de vidéo open source/local ils ont sorti un truc image ---> modèle 3d :
https://github.com/tencent/Hunyuan3D-2

Exemple avec l'avatar d'Adalia: imageimage notez qu'il a bien fait le bras qui était caché.
Exemple avec une bestiole de Nonor : image
image


Roi of the Suisse - posté le 22/01/2025 à 09:29:22 (30512 messages postés) - honor -

❤ 0

Chanter l'hyperchleuasme

Super on va pouvoir porter Aëdemphia en 3D :sonic

Est-ce qu'un expert des modèles 3D a observé le résultat en détail ? Est-ce que le mesh est pas trop fouillis ?
Quand un humain fait un mesh, il fait gaffe aux jointures, il réfléchit à ses petits quadrilatères etc.
J'ai déjà vu des meshes faits par IA, c'est des triangles dans tous les sens, y a aucune organisation propre, même si l'objet a globalement la bonne forme. Inutilisable en pratique.

Es-tu une star ? | Kujira no Hara | Muma|Rope | Polaris 03 | La 7e porte


trotter - posté le 22/01/2025 à 09:56:29 (10922 messages postés) - staff

❤ 0

Le mesh est pas ouf, un ensemble de petits cubes genre minecraft.

Par contre il existe une autre technique : un fichier 3D c'est liste de points sur x,y,z:
point 1=21,15,68
point 2=18,12,48
etc

Donc finalement, c'est un peu du texte.
Donc on peut utiliser entrainer llama sur un mot=un ensemble de points xyz, pour générer du texte qui sera converti en objet 3D.

Un peu comme quand on demande à ChatGPT un dessin vectoriel.

https://huggingface.co/spaces/Zhengyi/LLaMA-Mesh
https://github.com/nv-tlabs/LLaMA-Mesh

On peut aussi faire l'inverse, lui donner un objet 3D et lui demander à quoi ça ressemble !


Sylvanor - posté le 22/01/2025 à 12:08:01 (24906 messages postés) - webmaster

❤ 0

Le gars chiant qui rigole jamais (il paraît)

La bestiole est super cool.

Le maillage est important malheureusement surtout si on veut faire une animation ou texturer après.
Dans un fichier 3D il n'y a pas que les points, puisqu'il y a mille manières de les relier. Je ne sais pas comment c'est organisé mais il doit aussi y avoir des indications sur les polygones ou leurs bordures.

Bon tout ça c'est le début, si ça évolue aussi bien que les images 2D ça va être magique.
Ca reste impressionnant de voir comment comme il a compris la structure globale de la bestiole et fait les parties invisibles. Tu avais mis une prompt? Si oui, on peut la voir?

Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ


trotter - posté le 22/01/2025 à 13:06:47 (10922 messages postés) - staff

❤ 0

Pas de prompt il faut juste lui donner une image à manger ici :
https://huggingface.co/spaces/tencent/Hunyuan3D-2

Citation:

mais il doit aussi y avoir des indications sur les polygones


T'as raison.

On peut soi-disant le tester mais il a commencé à générer des points puis planter.


Saheyus - posté le 22/01/2025 à 14:27:16 (837 messages postés)

❤ 0

Si vous voulez, il y a un petit test vidéo de Hunyan ici: https://www.youtube.com/watch?v=i0zxQvECDjs

Je n'ai pas réussi à le faire tourner de mon côté sur Huggingface, peut-être qu'il est trop populaire en ce moment. Mais les résultats ont l'air pas mal du tout en effet, même si je me méfie toujours un peu de la capacité de ces modèles à bien faire les détails de créatures vraiment complexes et inhabituelles. Même Rodin AI n'y arrive pas totalement, à ce que j'ai pu voir. La par exemple, je ne vois pas les yeux de la bestiole.

On peut attendre que le modèle arrive sur Comfyui, c'est dans leurs projets.

J'imagine que c'est les mots "Dark psychedelic" qui doivent donner un style Philippe Druillet.

Ce que j'ai vu de plus impressionnant en termes de processus artistique, ça reste les vidéos de démo de Krita, comme celle-ci : https://www.youtube.com/watch?v=PPxOE9YH57E&t
J'attends la même chose en 3D, en vidéo et en musique ^^


trotter - posté le 22/01/2025 à 17:16:25 (10922 messages postés) - staff

❤ 1

Pour Deepseek R1 apparemment il n'y a pas eu de petites mains qui écrivent les questions réponses mais le modèle a lui même appris : il dit un truc correct, il reçoit une récompense.

Pour des réponses comme des résultats mathématiques ou des réponses à du code, ils peuvent compiler le code généré et lui donne un bon point si le code est bon :
image

Ils lui donnent aussi un bon point s'il décrit son processus de raisonnement, son monologue intérieur.

Par contre je pige pas trop comment ils font les vérifs sur des problèmes de logique avec des réponses moins évidentes où il est aussi très bon.

----

Générateur de vidéo, apparemment ça tourne sur 12Go de VRAM :



Ce gars fait des super vidéos en français.


Saheyus - posté le 23/01/2025 à 13:56:52 (837 messages postés)

❤ 1

Je vais m'abonner, ça me fera pas de mal de suivre un youtubeur français pour une fois.

Là, je m'amuse bien à faire à faire des sprites, avec des loras spécialisés et le script "Palettize" qui réduit le nombre de couleurs et fait un downscale de l'image. Ca fonctionne très bien pour du pixel art highres, c'est un peu plus délicat pour de la très basse définition, par exemple du 32x32. Ceci dit, pour des éléments si petits, il ne devrait pas être bien compliqué de faire de petites retouches.

Les résultats vont donc d'images en 1024x1024 qui simulent assez grossièrement le style du pixel art :

image

A des assets 64x64 :

image

(on voit que pour la texture, ça semble compliqué)

Voir des assets 32x32, où, pour le coup, on les ressent bien les gros (enfin, petits) pixels :

image

Les tests ont été faits avec Stable diffusion XL, le modèle cardosXL notamment et le lora "soft pixel art". Après, considérant que SDXL ne peut pas descendre sous 512x512 nativement, ça semblerait logique d'utiliser plutôt SD1.5. Néanmoins d'après mes premiers tests, l'adhérence au prompt de SD1.5 est bien moins bonne et son style est fortement dégradé si on diminue à 256x256.


trotter - posté le 23/01/2025 à 22:15:12 (10922 messages postés) - staff

❤ 0

Hunyuan 3D qui tourne soi-disant sur 6Go de VRAM, pas testé, je conseillerai d'attendre un peu, un truc encore plus simple va sortir d'ici un mois ou 2 sans doute :
https://github.com/deepbeepmeep/Hunyuan3D-2G

Pour la gen de vidéo apparemment certains disent que ça marche avec 8Go de VRAM :
https://civitai.com/models/1048302/hunyuanvideo-12gb-vram-workflow

J'ai pas encore sauté le pas de la vidéo.


trotter - posté le 24/01/2025 à 23:08:45 (10922 messages postés) - staff

❤ 0

Nouveau LLM français Open Source, 7B, c'est vraiment pas fou, il tombe dans mes vieux pièges grossiers d'il y a 2 ans :

Spoiler (cliquez pour afficher)



Spoiler (cliquez pour afficher)



https://lucie.chat

Pour l'anecdote, Ministral 8B est un tout petit modèle, qui parle français, et répond à tout sauf la question de la piscine vide et le fromage :

Spoiler (cliquez pour afficher)



Bref Lucie a 2 ans de retard. Par contre il est créé avec uniquement des données éthiques, libre de droit etc !

Aller à la page 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Index du forum > Vos créations > Les IA : art génératif, modèles de langage...

repondre up

Suite à de nombreux abus, le post en invités a été désactivé. Veuillez vous inscrire si vous souhaitez participer à la conversation.

Haut de page

Merci de ne pas reproduire le contenu de ce site sans autorisation.
Contacter l'équipe - Mentions légales

Plan du site

Communauté: Accueil | Forum | Chat | Commentaires | News | Flash-news | Screen de la semaine | Sorties | Tests | Gaming-Live | Interviews | Galerie | OST | Blogs | Recherche
Apprendre: Visite guidée | RPG Maker 95 | RPG Maker 2003 | RPG Maker XP | RPG Maker VX | RPG Maker MV | Tutoriels | Guides | Making-of
Télécharger: Programmes | Scripts/Plugins | Ressources graphiques / sonores | Packs de ressources | Midis | Eléments séparés | Sprites
Jeux: Au hasard | Notre sélection | Sélection des membres | Tous les jeux | Jeux complets | Jouables en ligne | Le cimetière | RPG Maker 95 | RPG Maker 2000 | RPG Maker 2003 | RPG Maker XP | RPG Maker VX | RPG Maker VX Ace | RPG Maker MV | Autres | Proposer
Ressources RPG Maker 2000/2003: Chipsets | Charsets | Panoramas | Backdrops | Facesets | Battle anims | Battle charsets | Monstres | Systems | Templates
Ressources RPG Maker XP: Tilesets | Autotiles | Characters | Battlers | Window skins | Icônes | Transitions | Fogs | Templates
Ressources RPG Maker VX: Tilesets | Charsets | Facesets | Systèmes
Ressources RPG Maker MV: Tilesets | Characters | Faces | Systèmes | Title | Battlebacks | Animations | SV/Ennemis
Archives: Palmarès | L'Annuaire | Livre d'or | Le Wiki | Divers