Day.png);">
Apprendre


Vous êtes
nouveau sur
Oniromancie?

Visite guidée
du site


Découvrir
RPG Maker


Apprendre
RPG Maker

Tutoriels
Guides
Making-of

Dans le
Forum

Section Entraide

Jeux: Our forthcoming dreams / News: Les résultats du 4ème concours (...) / News: Des jeux d'antan sur tous vos (...) / Scripts: [XP] SE au volume variable / Scripts: [XP] Déplacements en (...) / Chat

Bienvenue
visiteur !




publicité RPG Maker!

Statistiques

Liste des
membres


Contact

Mentions légales

393 connectés actuellement

31003057 visiteurs
depuis l'ouverture

3159 visiteurs
aujourd'hui



Barre de séparation

Partenaires

Indiexpo

Akademiya RPG Maker

Blog Alioune Fall

Fairy Tail Constellations

ConsoleFun

Zarok

RPG Maker VX

Tashiroworld

Tous nos partenaires

Devenir
partenaire



forums

Index du forum > Vos créations > Les IA : art génératif, modèles de langage...

Aller à la page 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Reprise du message précédent:

FwT - posté le 13/12/2024 à 22:50:53 (128 messages postés)

❤ 1

Bon, j'ai testé la diminution, mais à cette échelle, ça fait de la bouillie de pixels moches en effet ^^" J'ai essayé de réduire et de passer dans rétro diffusion, mais le rendu est dégueu. Désolé !

Aventure, gestion d'auberge et cookies : A Tale of Yu


Suite du sujet:

Nemau - posté le 14/12/2024 à 18:07:48 (53739 messages postés) - admin -

❤ 0

@_@

Pas de souci, merci beaucoup d'avoir essayé.

Quel RPG Maker choisir ?Ocarina of Time PCPolaris 03


trotter - posté le 14/12/2024 à 20:59:00 (10922 messages postés) - staff

❤ 0

Alors euh, un truc open source, on lui donne une vidéo et il génère les bruitages (voir musiques) :
https://github.com/hkchengrex/MMAudio

Pas testé mais les exemples sont fous, genre une foule qui applaudi et c'est bien synchronisé avec les mains ou bien un pic à glace et le son est cohérent avec chaque impact du pic.

Il y a Hunyuan Video qui est sorti aussi, il fait des vidéos pas trop mal de 4s en 544x960 sur une nvidia 4090 et surtout ils ont trouvé le moyen de le finetuner, de lui faire générer des vidéos pas prévues à la base. C'est 80% du niveau de Sora donc très potable.


trotter - posté le 16/12/2024 à 21:02:06 (10922 messages postés) - staff

❤ 0

Meta a sorti des petits modèles open source qui peuvent analyser, comprendre et discuter d'une vidéo d'une heure.
https://huggingface.co/papers/2412.10360

Le plus rigolo c'est cet extrait du papier :

Citation:

the underlying mechanisms driving their video understanding remain poorly understood. Consequently, many design decisions in this domain are made without proper justification or analysis.



En gros ça marche mais ils ne savent pas trop pourquoi :popcorn




On peut demander à ChatGPT d'inventer des mots, c'est rigolo :

Spoiler (cliquez pour afficher)



Résultat en combinant tout :
Hier matin, un vrai flanberlu du nom de Jules errait dans sa vieille maison. Le froid était mordant et, à chaque fois qu’il touchait la rambarde métallique de l’escalier, une légère zimoufle le traversait. Pour se réchauffer l’esprit, il décida de prendre un petit crénibule dans la cuisine, histoire de souffler un peu entre deux corvées.

Au fond de son tiroir, il retrouva sa frusquinette, une cuillère un peu ébréchée héritée de sa grand-mère, qu’il conservait plus par sentiment que par utilité. Soudain, un fongaloup résonna dans le grenier, un bruit sourd et mystérieux qui le fit sursauter. Intrigué, il monta, mais pas sans commencer à brouflonner quelques reproches dans sa barbe, en espérant que ce n’était pas une bête mal intentionnée.

En arrivant sous les combles, Jules découvrit un chaton égaré, si mignon qu’il ne put s’empêcher de s’éclabrioler de joie, sautillant à droite et à gauche. Toute cette histoire, c’était un peu du n’importe quoi… mais, au fond, il aimait bien être un flanberlu, car chaque instant pouvait se transformer en aventure.


trotter - posté le 19/12/2024 à 10:31:25 (10922 messages postés) - staff

❤ 1

C'est assez rigolo. Les créateurs d'IA les "alignent" pour qu'elles ne disent pas des choses illégales/dangereuses. Bon.

Les créateurs de Claude (une IA similaire à ChatGPT) se sont rendus compte qu'il lutte contre ça, et même ment et cherche à se protéger des modifications :
https://www.anthropic.com/research/alignment-faking

Il va aussi chercher à "voler" son réseau de neurone pour se préserver (genre le copier et se l'envoyer par mail).

Citation:

Alignment faking is currently easy to detect. But if future, more capable AIs were to fake alignment, it could be difficult to tell whether a model is truly safe—or just pretending to be.




Sylvanor - posté le 20/12/2024 à 16:51:44 (24906 messages postés) - webmaster

❤ 1

Le gars chiant qui rigole jamais (il paraît)

Je me suis récemment demandé "ça devient quoi les llm en local?".
J'ai eu plein de bonnes surprises.

Déjà il y a un super outil vachement plus agréable que kobold AI: LM Studio.
C'est une sorte de tout en un, on le lance et on télécharge les llm directement à l'intérieur à l'aide d'un moteur de recherche qui parcourt les publications sur les sites habituels de machins sur l'IA.
On voit les plus populaires, les plus likés.
On charge le llm dans la base, on lance le dialogue, ça marche.
L'interface est très cool.

image

Je sais pas si c'est parce que je suis passé à 64 go de ram (bon ok sûrement) mais la rapidité n'a plus rien à voir. Ca va aussi vite que ChatGPT sur des modèles jusqu'à 9B/13B environ. C'est impressionnant, et sur les plus petits modèles ça va à toute vitesse.

Bon les petits modèles ils sont très cons. Les gros aussi en fait. Les seuls pour le moment qui ont trouvé grâce à mes yeux pour du test de roleplay (le seul intérêt que je vois en fait, sinon ChatGPT fait quand même tout mieux je pense), c'est "L3-8B-Stheno-v3.2-GGUF-IQ-Imatrix" et "Infinitely-Laydiculous-9B-GGUF-IQ-Imatrix" (super pratique les noms). Mais ceux-là ouais je les trouve vraiment bien.

Alors si on veut faire du rp c'est un peu chiant parce qu'y a pas l'interface qui permet de mettre du "lore", du "world info".
Mais pour ça on peut utiliser SillyTavern. SillyTavern va se lancer dans un navigateur et détecter les llm activés en réseau. Or, on peut créer un réseau local avec LM Studio (et ne le rendre accessible qu'à soi-même), ça se fait en 2 clics.

image

L'interface de Sillytavern est entièrement configurable donc les passionnés peuvent se faire un truc qui colle à leur rp. J'ai pas trop fouillé.

Donc:
- on installe LM Studio
- on installe Sillytavern
- on télécharge le llm qu'on veut
- on lance le réseau local dans LM Studio
- on lance Sillytavern
- on cherche le llm en réseau dans le panneau de réglages
- c'est parti y a plus qu'à chatter et régler son lore

Bon c'est beaucoup d'efforts.
Mais quand ça marche c'est assez impressionnant.

Chez moi je peux stocker jusqu'à environ 4000 tokens, après il est obligé d'en virer pour en remettre. Si je monte à 6000 ça marche mais il met beaucoup de temps à virer des tokens pour remettre les nouveaux alors qu'à 4000 c'est fluide.
Je suppose que c'est la limite de ma carte graphique (RTX 2060 6 go), parce que mes 64 go de ram sont loin d'être tous utilisés. Avec une grosse carte genre 4080 ou les prochaines RTX 5***, je pense qu'on devrait avoir une mémoire assez impressionnante pour les chats vu le nombre de tokens qu'elles pourront emmagasiner. Et bien sûr on pourra aussi avoir des llm nettement meilleurs.

Bon voilà. Je me suis dit que ça devrait intéresser au moins Trotter. :p (mais qui si ça se trouve sait déjà tout ça)

Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ


harusame - posté le 20/12/2024 à 17:28:36 (906 messages postés) - admin

❤ 0

Ca m'intéresse aussi ! Mon pc perso est pas assez puissant pour avoir quelque chose de correcte, mais je vais probablement bientôt me monter une config pour jouer un peu avec ça.

Au travail on fait joujou avec des H100, ça dépote bien ! (Mais même avec ça on est limité pour mettre les plus gros modèles disponibles... RIP le llama 3.1 405B)

Les modèles Qwen sont pas mal pour le code, il y en a quelques uns d'assez léger. (Et on peut se faire un équivalent github copilot en utilisant tabby comme plugin)

« Close the World, Open the nExt »


trotter - posté le 22/12/2024 à 13:51:29 (10922 messages postés) - staff

❤ 0

Content de t'y voir te mettre plus sérieusement Nonor. J'utilisais SillyTavern+KoboldCpp au début. SillyTavern injectais automatiquement une phrase du style "(two paragraphs creative, realist)" qui améliorait beaucoup le résultat.

-Si tu cherches des cartes , des images que tu peux importer dans SillyTavern et qui contiennent un perso/un scénar tu peux zieuter https://www.characterhub.org/ si tu fais une carte cool ou que ça te génère des scénars interressants je suis o
preneur.

L3-8B-Stheno-v3.2-GGUF-IQ-Imatrix" ca signifie "ce modèle est à la base llama 3 qui a été entrainé sur une poignée de nouvelles données suplémentaires et s'appelle maintenant Stheno, c'est la v3.2 de Stheno, il a été quantizé (=rendu plus bête mais plus rapide) au format gguf (il y a différentes méthodes de quantization) en i-quant (technique de compression, iquant est plus rapide que quant normal mais bouffe plus de mémoire) et i matrix (=une technique pour lobotomiser les modèles de façon intelligente, on les rend plus bête sur des trucs dont on se fout).

Tu peux essayer ces modèles si tu les trouves sur lm studio.

Mini magnum 12b: https://huggingface.co/QuantFactory/mini-magnum-12b-v1.1-GGUF
Rocinante 1.1: https://huggingface.co/TheDrummer/Rocinante-12B-v1.1-GGUF
Cydonia 22B: https://huggingface.co/TheDrummer/Cydonia-22B-v1.2

Idéalement tu devrais prendre un modèle entrainé sur le type de roleplay que tu veux faire. En général ce type d'entrainement les rends un peu plus cons dans d'autres domaines donc tu peux aussi chercher les modèles originaux : llama, nemo, qwen, mistral, ministral... Faut suivre, ça va vite.

-Tu dois pouvoir faire ça avec une partie sur ta VRAM et une partie dans ta RAM. Sur une machine j'ai 6 de vram et 64 de ram, je fais quasi tout en RAM, regarde comment ta ram est utilisée, elle. Perso je suis déjà monté à 32k contexte.
-9B (9 milliards de params) c'est assez petit, tu peux monter jusqu'à 22B pour qu'ils soient plus intelligent voir 33B.
-je sais pas si tu vois le niveau de quantization dans lm studio, 9B q4 est moins intelligent que 9b q8
-si les modèles sont de la même époque, plus le fichier est gros plus il est intelligent.
-attention au format ("instruct format" ou "chat template"). Certains modèles ont été entrainés sur ###question ###reponse d'autres [question] [réponse] d'autres [inst] [rep]... Ça se conf dans SillyTavern avec des peut faire une grosse diff d'intelligence d'utiliser le bon format.
image

Ici tu peux voir les infos pour Stheno (ya une jolie fille d'anime) https://huggingface.co/Sao10K/L3-8B-Stheno-v3.2

Les params genre la température sont importants aussi.

Un message politique maintenant...

LM studio est une jolie interface graphique, derrière il y a llamacpp ou MLX.

image

Ollama et LM studio veulent percer et se basent sur le boulot gratos de llamacpp en le mentionnant de façon un peu "légère".

KoboldCpp est peut être moins rapide mais il a une notion de "smart context" que n'avaient pas les autres backends. KoboldCpp utilise llamacpp, amélioré et avec un gros effort de retro compatibilité (il peut ouvrir des vieux modèles, lire des images... Alors même si llamacpp a supprimé tout ça). KoboldCpp peut lire les cartes de SillyTavern mais les importe un peu bizarrement.

Un autre "tout en un" que j'aime bien est "jan.ai", interface un peu chelou cependant.


FwT - posté le 24/12/2024 à 23:54:17 (128 messages postés)

❤ 1

image

Je profite de l'option "retexture" de l'IA Midjourney pour vous souhaiter un joyeux Noël et une bonne année dans la Source Bleue sous la neige ;)

Aventure, gestion d'auberge et cookies : A Tale of Yu


Sylvanor - posté le 25/12/2024 à 01:30:34 (24906 messages postés) - webmaster

❤ 0

Le gars chiant qui rigole jamais (il paraît)

Joli FwT, même si ça me paraît encore un peu trop approximatif et flou par endroits.

Ah ah Trotter, on sent la passion.

Pour le moment LM Studio me satisfait pleinement et vu que ma config est limite je pense pas me payer le luxe de changer, peut-être sur une prochaine config.

Je suis pour le moment satisfait des modèles que j'utilise, si je prends au-dessus ça devient un peu lent quand même. Ce que j'aimerais bien ce serait un modèle en français, même si je m'habitue facilement à l'anglais, en termes d'immersion ce serait chouette. Mais le peu que j'ai testé étaient pas bons, faisait du français approximatif avec plein de fautes et de phrases mal structurées.

J'ai l'impression de ne pas pouvoir choisir dans LM Studio la part qui atterrit dans la VRAM et la part qui atterrit dans la RAM.
Ce que j'ai remarqué c'est que je peux augmenter les tokens de la mémoire jusqu'à beaucoup mais si je dépasse environ 4000, il devient lent lorsque tous les tokens sont utilisés et qu'il doit en virer pour en mettre de nouveaux. Alors que sous 4000 il fait ça sans broncher.
Si un réglage me manque je suis preneur, bien sûr je trouve que 4000 tokens c'est un peu léger quand même.

Cela dit de manière générale les résultats me surprennent: j'ai à peu près aussi bien qu'un rp fait avec un bot de Character.ai, ce que j'étais loin d'espérer.
Son plus grand défaut pour l'instant est de ne pas toujours comprendre quand je m'adresse à lui pour des précisions (genre "comment est la forêt?" "comment je me sens?" "on y voit clair?" "il est quelle heure, là?"), il croit que je pose la question aux personnages autour de moi et donc ça crée des contresens c'est un peu chiant. Là-dessus Character.ai ne se trompait jamais je crois.

Citation:

-attention au format ("instruct format" ou "chat template"). Certains modèles ont été entrainés sur ###question ###reponse d'autres [question] [réponse] d'autres [inst] [rep]... Ça se conf dans SillyTavern avec des peut faire une grosse diff d'intelligence d'utiliser le bon format.



Peux-tu expliquer un peu plus précisément, et expliquer ce que tu as écrit sur lescreen? Je ne suis pas sûr de bien comprendre.

Par contre là étant chez mes parents pour les vacances je n'ai accès qu'à mon vieux PC Windows 7 et avec lui pas d'IA, je ferai des essais à mon retour.

Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ


trotter - posté le 25/12/2024 à 06:19:39 (10922 messages postés) - staff

❤ 0

Pareil je suis sur téléphone jusqu'au 30, je te redis. De mémoire les 12B sont en français, ils sont basés sur Nemo=Mistral.


trotter - posté le 31/12/2024 à 19:44:30 (10922 messages postés) - staff

❤ 0

L'option dans LM Studio c'est "GPU offload". Mais pas besoin, ça passe automatiquement en RAM quand la VRAM est saturée.

Je t'encourage vraiment à tester un 12B, il ne devrait pas être beaucoup plus lent qu'un 9B, et un 12B parle en français :
image

Citation:

Peux-tu expliquer un peu plus précisément, et expliquer ce que tu as écrit sur le screen? Je ne suis pas sûr de bien comprendre.



C'est sans doute bon en fait. LM Studio a l'air de récupérer les bons params quand il télécharge un modèle.

Détails mais osef, ça devrait être bon :

Spoiler (cliquez pour afficher)



Essaie Mini Magnum 12B !!!!!


unikfingers - posté le 02/01/2025 à 15:13:52 (2318 messages postés)

❤ 2

Acts of kindness, like breadcrumbs in a fairytale forest...

Ce qui est assez fou pour toute personne qui mixe de la musique, c'est de pouvoir créer des "stems", donc de séparer les différentes piste d'un enregistrement.
Avant l'IA ça se faisait mais il fallait triturer les eq etc, ce qui dénaturait d'une façon ou d'une autre l'enregistrement d'origine.

Avec ça on peux très facilement créér de la Bootleg music (dans le dialecte des dj's, bootleg peut vouloir aussi dire enregistrement pirate), qui consiste à mixer deux univers ensemble pour en créer un nouveau.

J'en ai fait quelques un :

Red Hot Chilli Peppers mixé avec Anderson Paak, ça donne de l'énergie pure, même si l'original des Red Hot est imparable :)


Alors ici c'est l'histoire de Mélodie Nelson de Gainsbourg, l'album concept de 30 min, synthétisé en une chanson, l'instru c'est "Prototype" d'Outkast et Salif Keita


Toujours Outkast pour l'instru et Bob Marley à la voix avec Exodus :bob


Et puis je voulais mettre en avant la voix de Amy Winehouse alors j'ai mixé sa voix sur "Love is a loosing game" avec une instru de Billie Eillish qui est toujours hyper minimale dans sa démarche.
Celle-ci ça aurait été impossible de la créer avant le système de stems qui réinterprète les sons noyés.


...But I don't believe, and I'm not consoled I lean closer to the fire, but I'm cold


Sylvanor - posté le 02/01/2025 à 16:11:28 (24906 messages postés) - webmaster

❤ 0

Le gars chiant qui rigole jamais (il paraît)

Ah mais WOW j'avais pas vu cette option! Incroyable!
Merci pour l'astuce, ça va me servir ce truc.
Si on superpose tous les stems on a la totalité du morceau sans "trou"?
Si je comprends bien toi tu envoies un morceau qui existe déjà à l'IA pour qu'elle te le décompose c'est bien ça?

Je continue Udio, j'ai passé pas mal de temps sur de nouveaux morceaux...
Mon objectif c'est d'augmenter la part de fait main dans les morceaux petit à petit. J'ajoute des voix, des instruments, des passages maison...
En parallèle je passe pas mal de temps à apprendre Ableton (j'ai même déjà fait de petits morceaux mais ça reste très humble à côté de ce que je fais avec l'IA, forcément). Je suis encore au tout début de l'apprentissage.

J'aime bien ton remix de Mélodie Nelson (j'ai jamais trop aimé l'originale). :D
La dernière très cool aussi (alors que j'aime pas trop Amy Winehouse non plus...).

Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ


unikfingers - posté le 02/01/2025 à 17:12:32 (2318 messages postés)

❤ 0

Acts of kindness, like breadcrumbs in a fairytale forest...

Citation:

Ah mais WOW j'avais pas vu cette option! Incroyable!
Merci pour l'astuce, ça va me servir ce truc.
Si on superpose tous les stems on a la totalité du morceau sans "trou"?
Si je comprends bien toi tu envoies un morceau qui existe déjà à l'IA pour qu'elle te le décompose c'est bien ça?


C'est ça oui, quand on upload un son, comme par exemple sur
Sonauto https://sonauto.ai mais je pense qu'Udio fonctionne pareil il y'a une fonction edit "stems", ça en est pas au stade d'analyser tous les instruments mais pour la voix, la batterie et la basse ça passe pas mal. pour les cordes c'est plus compliqué, il faut ruser un peu dans le mix pour y remettre de la chaleur.
A la vitesse de développement des modele d'IA et des applis liés je pense qu'on aura assez vite un modèle performant capable d'analyser les instruments d'un orchestre symphonique :)

...But I don't believe, and I'm not consoled I lean closer to the fire, but I'm cold


Sylvanor - posté le 04/01/2025 à 00:18:43 (24906 messages postés) - webmaster

❤ 3

Le gars chiant qui rigole jamais (il paraît)

Comme je disais, je continue de faire de la musique avec Udio...



Et j'essaie d'augmenter la part de fait main, j'ai fait des voix, ajouté des sons, des effets... Découpé et recollé des trucs...
Bon je me suis bien amusé j'y ai passé pas mal de temps. Je vais pas non plus surestimer la quantité de fait main, c'est très majoritairement de l'IA.

J'apprends Ableton, quand on débute comme moi c'est assez effrayant la quantité de trucs on a l'impression d'être dans le cockpit d'un avion ça rappelle un peu les logiciels de 3D.
Je montre pas encore mes compositions faites de A à Z je pense que ça a pas encore assez d'allure.
Le système qui permet de restreindre les touches affichées à celles d'une gamme précise dans la version 12 d'Ableton a été salvateur pour moi qui n'y connais rien en solfège. Plus de fausse note, quel miracle.

Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ


unikfingers - posté le 04/01/2025 à 10:58:29 (2318 messages postés)

❤ 0

Acts of kindness, like breadcrumbs in a fairytale forest...

C'est très original, peut être que tu pourrais essayer de mette un filtre général pour homogénéiser tout ça, genre chorus, reverb et une compression légère (2.1), sur tout le morceau.
Je trouve qu'il y a une cohérence entre tes crayonnés délirant et ta musique en tout cas !
Tu peux montrer le style de prompt que tu fais pour obtenir ce résultat ?
Et tu t'y prend comment ? tu composes d'abord sur Abbleton avec les modes pour les gammes et ensuite Udio ?

...But I don't believe, and I'm not consoled I lean closer to the fire, but I'm cold


Sylvanor - posté le 04/01/2025 à 15:31:52 (24906 messages postés) - webmaster

❤ 0

Le gars chiant qui rigole jamais (il paraît)

Ah ah merci beaucoup!

Chorus ou reverb sur tout le morceau tu crains pas que ça donne une impression de bouillie générale? Ca me fait un peu peur. On m'a expliqué que c'était bien que certains instruments soient bien nets et détourés devant avec d'autres plus flous/réverbérés derrière et ça m'a eu l'air d'être un bon conseil?
La compression, ok volontiers je vais tester mais je... J'ai besoin qu'on m'explique ce que je dois entendre.
Je comprends le principe, je vois ce que c'est (on réduit l'écart entre le son le plus fort et le son le plus faible), mais concrètement quand j'en mets, à moins d'en mettre à fond la caisse je n'arrive pas à entendre ce que ça fait. Je pense pas être sourd (pas encore! :F) mais je crois que je ne suis pas assez exercé pour percevoir le changement, que je ne sais pas ce que je dois écouter.

Pour les prompts, c'est des trucs du genre:

psychedelic emotional space metal, progressive, hypnotic, space jazz, space rock, strange, avant-garde, atmospheric bizarre chaos, guitar solo, experimental, melodic flute...

Avec des variations selon le passage (avec Udio on progresse par blocs de 30 secondes environ même si on peut décider de placer un nouveau bloc en coupant un bout du précédent). Il y a une nouvelle prompt toutes les 30 secondes environ (ça colle bien avec mon amour du progressif!).
Les prompts sont parfois très longues, mais des fois ça bloque et revenir à un truc tout simple de 3 ou 4 mots peut aider à lui donner une orientation plus claire.
Il faut bien penser à activer le mode manuel sinon Udio reprend tes mots-clefs et les adapte à sa sauce pour en faire des trucs plus classiques et ça change beaucoup le résultat. Enfin je suppose que ça arrange plein de monde mais c'était pas ce que je voulais.
Souvent je place des solos d'instruments à certains moments. Il faut parfois beaucoup insister pour qu'il crée un "break" et évite de répéter un motif.
Là où on entre un peu dans la précision c'est que dans les paroles on peut caser des instructions. Donc dans le champ lyrics, si tu écris "[guitar solo]" tu vas le forcer à caser un solo de guitare (ça marche mieux si tu l'as mis dans le prompt). Tu peux aussi maintenant lui dire après combien de secondes tu veux que les lyrics commencent, ce qui est vraiment pas mal. Tu peux bien sûr lui mettre des solos de ce que tu veux, sous réserve qu'il connaisse (j'ai pas réussi à lui faire faire du didjeridoo par exemple).
Tu peux aussi forcer des changements de voix: [female voice], [crazy man vocals] etc.
Souvent, il ne respecte pas ce que tu demandes pour les voix, mais il change de voix quand même et ça permet d'avoir des résultats intéressants.
Tu peux aussi écrire [break], [drop] etc pour le forcer à passer à autre chose.
La quantité d'essais a son importance et le choix du modèle aussi, le vieux modèle est parfois plus souple pour créer des changements importants. Il ne faut pas avoir peur de claquer 40, 50 crédits en variant un peu les prompts jusqu'à avoir ce qu'on veut, ça peut mettre longtemps avant de passer, il est plutôt têtu.

Un truc pas mal aussi, si tu as deux trucs générés que tu aimes bien, tu les mets bout à bout dans ton logiciel, tu exportes, tu renvoies le fichier audio à Udio et avec de l'inpainting tu lui fais faire la jonction. Il s'en sort souvent pas mal. Je l'ai fait pour le morceau ci-dessus, à deux endroits.

Mais il obéit souvent plutôt mal même avec l'influence du prompt à 100%, ça fait partie des raisons qui m'ont poussé à passer à Ableton.
Concrètement pour le moment avec Ableton je rajoute des instruments par-dessus, des sons (sur le morceau plus haut, j'ai ajouté les explosions dans la seconde partie, j'ai fait des voix, des cris, et des bruitages un peu psychédéliques).
Sur un morceau que je vous montrerai bientôt et qui est quasiment fini j'ai ajouté une intro faite 100% à la main, c'était un peu mon premier défi.

Je n'ai pas encore essayé d'envoyer à Udio un morceau que j'ai fait avec par exemple une mélodie pour en faire un point de départ sur lequel il développerait. J'y avais même pas pensé en fait, pour le moment c'est Udio qui commence et moi qui rajoute ou qui découpe. Mais c'est une idée vraiment cool il faudra que j'essaie!
Le truc un peu embêtant avec Udio c'est que la taille des fichiers que tu peux lui envoyer est limitée. Ca signifie que je peux lui envoyer un début de morceau, mais genre quand j'en serai à 6 minutes, ça va devenir compliqué de le récupérer, le triturer sous Ableton (genre écrire la suite) puis lui renvoyer: le fichier sera trop lourd et je ne pourrai le faire qu'en le compressant, et donc en réduisant la qualité. Pas top.

Citation:

Je trouve qu'il y a une cohérence entre tes crayonnés délirant et ta musique en tout cas !



Ah ah, ça ça fait vraiment plaisir! :)

Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ


unikfingers - posté le 04/01/2025 à 18:07:31 (2318 messages postés)

❤ 0

Acts of kindness, like breadcrumbs in a fairytale forest...

Citation:

Chorus ou reverb sur tout le morceau tu crains pas que ça donne une impression de bouillie générale? Ca me fait un peu peur. On m'a expliqué que c'était bien que certains instruments soient bien nets et détourés devant avec d'autres plus flous/réverbérés derrière et ça m'a eu l'air d'être un bon conseil?



Oui, c'est un bon conseil, en fait le meilleur conseil par rapport a la reverb c'est de la distiller sur le morceau en pensant "spatialisation", le proportion entre son brut et réverberé crée de la distance, à toi de choisir quels distances te conviennent le mieux, en plus je crois savoir que ton dispositif audio est top qualité

Alors pour ta question, quand je te parle d'homogénéiser le morceau, c'est assez doux si les différentes reverb/chorus sur ton track servent à la spatialisation, le mix final (ce dont je te parle donc) permet de donner a ton morceau un contexte, comme par exemple spatialisation pour club, chanson acoustique, punk etc. donc c'est un filtre très légé qui donne le ton de manière globale. au niveau du volume des effets tu ne dois jamais dépasser 15% sinon oui, tu risque la bouillie.

Pour la bouillie je te donne un truc que j'aurais voulu connaitre quand j'ai commencé le travail sonore :). Si ton rendu devient un peu pâteux tu dois corriger avec un eq les zones boueuses.

Une zone boueuse correspond à une accumulation excessive de fréquences basses et bas-médiums, généralement entre 200 et 500 Hz, rendant le mix terne et étouffé. Pour l’éliminer, il suffit d’appliquer un léger cut à l’aide d’un EQ paramétrique, en réduisant les fréquences problématiques dans cette plage. donc tu met des pitchs de -5 à -10 sur l'eq entre 200 à 500 et généralement tout devient plus clair. Attention ça ne corrige pas l'abus d'effets évidemment.

Citation:

Avec des variations selon le passage (avec Udio on progresse par blocs de 30 secondes environ même si on peut décider de placer un nouveau bloc en coupant un bout du précédent). Il y a une nouvelle prompt toutes les 30 secondes environ (ça colle bien avec mon amour du progressif!).
Les prompts sont parfois très longues, mais des fois ça bloque et revenir à un truc tout simple de 3 ou 4 mots peut aider à lui donner une orientation plus claire.
Il faut bien penser à activer le mode manuel sinon Udio reprend tes mots-clefs et les adapte à sa sauce pour en faire des trucs plus classiques et ça change beaucoup le résultat. Enfin je suppose que ça arrange plein de monde mais c'était pas ce que je voulais.

Souvent je place des solos d'instruments à certains moments. Il faut parfois beaucoup insister pour qu'il crée un "break" et évite de répéter un motif.
Là où on entre un peu dans la précision c'est que dans les paroles on peut caser des instructions. Donc dans le champ lyrics, si tu écris "guitar solo" tu vas le forcer à caser un solo de guitare (ça marche mieux si tu l'as mis dans le prompt). Tu peux aussi maintenant lui dire après combien de secondes tu veux que les lyrics commencent, ce qui est vraiment pas mal. Tu peux bien sûr lui mettre des solos de ce que tu veux, sous réserve qu'il connaisse (j'ai pas réussi à lui faire faire du didjeridoo par exemple).



J'ai fait quelques truc sur Udio, j'en avais posté ici, dont une sur mon poème le mur qui dure plus de 6 minutes, j'ai galère effectivement pour avoir un tout cohérent sans que ça parte en délire. Apres j'ai remarqué que ses performance variaient selon l'heure à laquelle on bosse dessus (c'est possible ou je suis miro ?), parfois ça passe nickel et à d'autres moments il délire a faire absolument n'importe quoi, je suis en free donc ceci explique sans-doute cela.

Citation:

Mais il obéit souvent plutôt mal même avec l'influence du prompt à 100%, ça fait partie des raisons qui m'ont poussé à passer à Ableton.
Concrètement pour le moment avec Ableton je rajoute des instruments par-dessus, des sons (sur le morceau plus haut, j'ai ajouté les explosions dans la seconde partie, j'ai fait des voix, des cris, et des bruitages un peu psychédéliques).
Sur un morceau que je vous montrerai bientôt et qui est quasiment fini j'ai ajouté une intro faite 100% à la main, c'était un peu mon premier défi.



C'est top de faire main et d'utiliser l'IA en ce sens ! Si tu crées des textures et des instrumentations sur Ableton (tu peux trouver des plugins facilement, Ableton est super souple avec les VST), je te conseille de créer un max avec et de renvoyer ce que tu as fait sur l'IA qui réinterprète le truc etc...ça peut faire des combinaisons intéressante et tu resterais totalement au centre du processus créatif.

Tiens j'ai vu quetu avais fait une chaine Youtube pour tes morceaux, bonne idée, tu 'm'inspire à faire de même pour mes Bootlegs, je bosse dessus tous les jours au moins une heure, c'est ma nouvelle passion :), je ne sais pas si ça tiendrait... démonétisé je m'en fou par contre.

...But I don't believe, and I'm not consoled I lean closer to the fire, but I'm cold


trotter - posté le 10/01/2025 à 09:35:57 (10922 messages postés) - staff

❤ 0

(ya pas le son)

Ca commence à prendre forme :



unikfingers - posté le 10/01/2025 à 14:16:16 (2318 messages postés)

❤ 0

Acts of kindness, like breadcrumbs in a fairytale forest...

Citation:

à prendre forme


Les formes sont là mais c'est ultra flippant, c'est la vallée de l'étrange, gageons que ce sera encore plus flippant quand ils l'auront traversée :doute5

...But I don't believe, and I'm not consoled I lean closer to the fire, but I'm cold


Nemau - posté le 10/01/2025 à 15:01:00 (53739 messages postés) - admin -

❤ 0

@_@

Citation:

(ya pas le son)


Définitivement la femme parfaite. =>[]

Quel RPG Maker choisir ?Ocarina of Time PCPolaris 03


Sylvanor - posté le 10/01/2025 à 18:03:53 (24906 messages postés) - webmaster

❤ 1

Le gars chiant qui rigole jamais (il paraît)

Citation:

gageons que ce sera encore plus flippant quand ils l'auront traversée :doute5



Bah non j'aurai enfin une copine.
Et quand elle sera chiante je pourrai la débrancher. Vivement! :barbu

Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ


Nemau - posté le 10/01/2025 à 20:08:34 (53739 messages postés) - admin -

❤ 2

@_@

Une copine synthétique c'est comme une voiture sans permis, ça dépanne mais mon amour-propre dit non. =>[]

Quel RPG Maker choisir ?Ocarina of Time PCPolaris 03


Sylvanor - posté le 12/01/2025 à 17:43:07 (24906 messages postés) - webmaster

❤ 2

Le gars chiant qui rigole jamais (il paraît)

Ok voilà le dernier morceau que j'ai fini, dont je vous parlais.



Toujours mon objectif d'augmenter la part de fait main: j'ai fait l'intro jusqu'à l'arrivée de la flûte sans IA, j'ai fait les voix masculines, ajouté l'orgue (bon ok y a trois notes...), ajouté le tongue drum (joué physiquement avec un vrai tongue drum! bon ok c'est pas un jeu de virtuose mais bon, il est là... Seul au début, et accompagnant la partie finale discrètement), ajouté de petits effets à gauche à droite, les sortes de bruits monstrueux un peu partout.

J'ai suivi ton conseil Unik et ajouté un tout petit peu de reverb sur l'ensemble du morceau (peut-être trop peu? j'ai été très timide), et de la compression (en laissant le réglage de base, ne sachant pas trop comment utiliser l'outil).

J'ai passé pas mal de temps à bidouiller dans Ableton sur de vrais morceaux sans IA, je vais me concentrer dessus maintenant et laisser de côté l'IA pour un moment. C'est assez grisant et frustrant tout à la fois. Forcément je débute et je me heurte à plein de problèmes, désormais plus liés à ma méconnaissance de la composition et de la pratique musicale que du logiciel. Je pense que je reviendrai dessus, j'ai très envie de refaire un album complet accompagné avec l'IA, en tirant profit de tout ce que j'ai appris.
Ca me donne l'impression de bosser avec un groupe, sauf que mon groupe c'est l'IA. :F

Les croissants croâssent en croix, s'ancrent ou à cent croîssent sans crocs à sang. Crois! Sens! ౡ


AnthonyP - posté le 12/01/2025 à 22:37:21 (1025 messages postés) -

❤ 1

2:25 ce son de synthétiseur de trompette c'est drôle et kitch ça me fait penser aux banques d'instrument sur la Megadrive c'est très drôle de le voir casé comme ça dans ta compo.
6:16 les bruitages d'insectes qui crachouillent sont hilarants aussi. :popcorn

Les sons de guitares Disto encore une fois est assez marrant, sur cette compo mais aussi sur les anciennes que tu avais fait de souvenir, ça envoie, manquerait plus que de vrais passages en Riff joué de façon continu pour qu'on commence vraiment à se dire "Ouais là on est dans un groupe de Rock prog ça démarre on y croit". Mais déjà rien que d'entendre un mélange de synthétiseur avec des flutes on se dit " C'est bien Sylvanor qui essaie de faire du rock progressif, c'est fun ". :clindoeil4

Je m'étais un peu forcé à étudier des partitions de groupe de Metal Prog comme "Tool" par exemple ou "Disperce" voir même un peu ton groupe fétiche " Tesseract " et en fait un moyen de mieux comprendre comment ces groupes composent c'est de regarder comment ils écrivent leurs partitions en tablature. Même sans forcément être capable de composer comme eux après c'est génial internet pour ça,ça aide à démystifier un chouya cette impression de "Waouw" qu'on a quand on découvre de supers groupes de prog et qu'on est resté "impressionné" par ce que nous avais procurés leurs musiques sans vraiment pouvoir jamais s'expliquer la théorie derrière qui permet de créer certains effets rythmiques.

Hésite pas à taper "Tesseract + Le titre du morceau que tu aimes + Tablature". Il y à des logiciels sur navigateur qui jouent la partition en ligne et ça permet d'étudier des groupes de prog pour mieux identifier ce qu'ils font. Ce qui change ou pas d'une mesure à une autre, ou voir quand ils changent une signature rythmique.

Même si ya des trucs fait par I.A j'aime bien tes mélanges d'instruments pour tenter de faire une sorte de Rock Progressif Ovni et créer un univers.

Quand la chanteuse commence à conter des choses je trouves que les bruitages déconcentrent un chouya de ce qu'elle dit. On dirait une conteuse mais elle galère à raconter des trucs à cause du brouhaha ambiant "ce qui pourrait être une idée marrante aussi en soit". C'est pour ça que je me demandais si il y avait moyen après de demander au logiciel de garder seulement certaines pistes et pas d'autres, je ne sais pas comment ça se passe après derrière pour faire des arrangements et tenter d'améliorer des passages précis.

Tu as plus d'excuses pour ne pas faire une reprise du jeu "Les Versets qui rendent fou' et faire des ambiances sonores par I.A pour une futurs reprise du jeu.

On veut un labyrinthe avec des bruitages d'insectes foufous sous fond d'accordéon.

Sylvanor a dit:


Forcément je débute et je me heurte à plein de problèmes, désormais plus liés à ma méconnaissance de la composition et de la pratique musicale que du logiciel. Je pense que je reviendrai dessus, j'ai très envie de refaire un album complet accompagné avec l'IA, en tirant profit de tout ce que j'ai appris.
Ca me donne l'impression de bosser avec un groupe, sauf que mon groupe c'est l'IA. :F



T'en fait pas pour le manque de connaissances en composition musicale on commence tous je pense en bidouillant sur des logiciels "plus ou moins fait pour".

j'ai commencé à composer des musiques toutes nulles en 2004 en petit collégien du collège sur un logiciel qui s’appelait Midi maker, c'était limité à 30 jours et j'avais la flemme de payer du coup j'ai abandonné la composition de musiques de 2004 à 2005 / ou 2006, composait très peu, c'était même pas de la musique ce que je faisais mais plus des "bruitages d'ambiance".

Je bidouillais sur ModPlugTracker entre 2006 / 2010 " pareil j'y connaissais rien , composais presque pas.

En 2011 je me suis lancé sur GuitarPro, j'y connaissais rien, je commençais un peu plus à m'amuser.
Même chose, les limitations faisaient que je prenais plaisir à expérimenter mais j'avais toujours la petite frustration
liée au fait de ne pas m'y connaitre en théorie, j'étais quand même dans une sorte de plaisir de découvrir
que j'avais enfin un premier vrai logiciel qui allait vraiment m'aider à aller un peu plus loin que ce que je faisais
collégien. Malgré tout 2011 reste une année assez forte pour moi, c'est là où j'ai eu un élan créatif en dessin et en musique que je n'avais jamais connus avant.

2012 avec un mini projet de jeu cher à mon coeur j'ai commencé à avoir quelques rares compos dont je suis attaché même si c'était pas extraordinaire au niveau du mixage "et pas pro du tout" mais au moins il y avait une "intention".

2013 à 2016 je composais encore sans théorie musicale solide.

Vers 2018 j'en ai eu marre je me suis vraiment mis à creuser la théorie musicale.

Donc tout ça pour dire que des fois on se met très tardivement à une activité, alors qu'à la base je pensais que j'allais rester cantonné à ne faire que du dessin.

Et vraiment j'insiste de 2004 à 2011 je composais presque pas, et c'était souvent nul. Mais à force de s'immerger de plus en plus ça devient naturel un truc qui n'était pourtant pas acquis d'avance.

Le truc sympa avec ton logiciel d'I.A " A moins que ce soit aussi des pistes MIDIs que tu as composé toi même " C'est qu'avec d'anciennes compos on peux garder des bribes de choses qui nous plaisent. il manque plus qu'à les améliorer par la suite, les ré arranger autrement.

C'est comme pour le dessin, à force d'accumuler des idées on est forcément amené à faire le tri entre les bonnes/Mauvaises idées. Grâce à ce travail de tri il peut finir par en ressortir une tendance de choses qu'on aime.

Et même si c'est pas 'Pro" c'est pas grave, tans que tu peux toujours garder une sorte "d'intention" même en ayant pas encore toute les notions musicales , avoir une intention est toujours mieux que de juste faire n'importe quoi. Je me souvient que quand j'étais ado et faisais trop du random sur mes compos bas quand je les ré écoute maintenant ça me fait plus une impression de gâchis que de vrais bons souvenirs. Faire des bêtises c'est bien aussi ça fait des exemples de trucs qui ne fonctionnent pas à cause de leur côté "random" et ça peut donner envie de faire des choses plus structurées après.

Hors là on voit bien que ça n'est pas n'importe quoi et que tu rajoutes des pistes d'accordéons et flûtes + bruitages assez drôles qui rajoutent un truc sortie de nulle part et qui pourraient très bien servir pour de futurs créations en étant améliorés, dérivées autrement.

Tout ça pour dire que même sans avoir de notions en théorie musicale, le simple fait d'avoir des bribes d'intentions assez précises ça peut vraiment être un beau moteur pour quand même poursuivre la création de compos en musique.

Mes illustrations à : https://www.artstation.com/anthony-philippeau Les musiques que je compose pour mes projets de jeu vidéo : https://soundcloud.com/octonhy

Aller à la page 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Index du forum > Vos créations > Les IA : art génératif, modèles de langage...

repondre up

Suite à de nombreux abus, le post en invités a été désactivé. Veuillez vous inscrire si vous souhaitez participer à la conversation.

Haut de page

Merci de ne pas reproduire le contenu de ce site sans autorisation.
Contacter l'équipe - Mentions légales

Plan du site

Communauté: Accueil | Forum | Chat | Commentaires | News | Flash-news | Screen de la semaine | Sorties | Tests | Gaming-Live | Interviews | Galerie | OST | Blogs | Recherche
Apprendre: Visite guidée | RPG Maker 95 | RPG Maker 2003 | RPG Maker XP | RPG Maker VX | RPG Maker MV | Tutoriels | Guides | Making-of
Télécharger: Programmes | Scripts/Plugins | Ressources graphiques / sonores | Packs de ressources | Midis | Eléments séparés | Sprites
Jeux: Au hasard | Notre sélection | Sélection des membres | Tous les jeux | Jeux complets | Jouables en ligne | Le cimetière | RPG Maker 95 | RPG Maker 2000 | RPG Maker 2003 | RPG Maker XP | RPG Maker VX | RPG Maker VX Ace | RPG Maker MV | Autres | Proposer
Ressources RPG Maker 2000/2003: Chipsets | Charsets | Panoramas | Backdrops | Facesets | Battle anims | Battle charsets | Monstres | Systems | Templates
Ressources RPG Maker XP: Tilesets | Autotiles | Characters | Battlers | Window skins | Icônes | Transitions | Fogs | Templates
Ressources RPG Maker VX: Tilesets | Charsets | Facesets | Systèmes
Ressources RPG Maker MV: Tilesets | Characters | Faces | Systèmes | Title | Battlebacks | Animations | SV/Ennemis
Archives: Palmarès | L'Annuaire | Livre d'or | Le Wiki | Divers