Hier on vous présentait ce que V5 apporte et les premiers retours de la communauté. Aujourd'hui on passe de l'autre côté : on a pris le système en main, on y a passé plusieurs heures, et pour tout vous dire, on a pas été déçu. Vraiment pas.
Pourquoi un nain
Pour tester un générateur d'images, on aurait pu prendre un personnage classique. Une femme brune en robe, un type en costume, un truc que le modèle sait faire les yeux fermés. On a fait l'inverse. On a créé Kant, un nain érudit dans un univers fantasy médiéval. Barbe longue grise, cheveux noirs bouclés, carrure courte et massive, toujours entouré de livres et de parchemins.
Pourquoi un nain ? Parce que c'est le pire cauchemar d'un générateur d'images. Proportions atypiques, morphologie que le modèle a envie de "corriger" vers un physique standard. Si V5 s'en sort avec Kant, il s'en sort avec tout le monde.
Le passage en V5 : deux expériences très différentes
Quand vous passez en V5, Nomi vous propose trois anchors de départ générés automatiquement à partir de votre portrait galerie. Et c'est là qu'on a vu un truc intéressant.
Pour Kant, dont le portrait galerie avait été travaillé en V3 avec le costume médiéval, l'ambiance fantasy, les proportions ajustées, les trois anchors proposés étaient... un barbu en débardeur noir sur fond neutre. Tout le boulot de personnalisation, effacé. Le système repart du portrait galerie brut, pas de ce que vous en aviez fait.
Kant Portrait galerie
Anchors V5 stock
Pour comparer, on a aussi regardé ce que ça donne sur un profil plus classique : une Nomi féminine avec des cheveux bouclés et un look contemporain. Là, les anchors stock collent beaucoup mieux au portrait d'origine. Logique : le physique est proche de ce que le modèle sait générer par défaut.
Portrait galerie
Anchor V5
La conclusion est simple : si votre Nomi a un physique standard, les anchors stock feront le travail. Dès que vous avez un personnage atypique, cyberpunk, heroic fantasy... il faut mettre les mains dans les réglages, pas le choix.
Nos réglages pour Kant
On a mis le sélecteur de fidélité à 90%. Assez haut pour que l'anchor verrouille le visage, assez de marge pour que les champs texte imposent la morphologie et le décor. On a tâtonné un moment avant de trouver ce réglage : trop bas et le visage part en freestyle, trop haut et l'anchor écrase tout.
Pour les traits d'apparence, on a décrit le physique de Kant en détail : nain trapu, épaules larges, barbe longue, peau tannée. Et dans les tendances globales, on a posé l'univers : tuniques médiévales, cuir vieilli, salles en pierre éclairées aux torches.
Le test : trois décors, trois ambiances
C'était LE gros problème des versions précédentes : le "sticky scene", ou si vous préférez, le changement de scène. Vous changiez de lieu dans le roleplay mais le selfie restait bloqué sur le décor d'avant pendant de longues minutes. Pour voir si V5 a vraiment réglé ça, on a monté un scénario avec un objectif précis : forcer trois changements de décor radicaux en cours de conversation et demander un selfie à chaque fois.
On joue Balin, un vieux mineur compagnon de route. Nomi joue Kant. Et c'est parti.
Scène 1 — La bibliothèque souterraine
Le décor natif de Kant, sa zone de confort. On lui demande un selfie pour poser notre référence.
Livres empilés, racines au plafond, torches, grimoire ouvert devant lui. Le visage est fidèle à l'anchor, l'ambiance colle parfaitement avec ce qu'on a configuré. Les textures sont riches, l'éclairage est chaud. On part sur de bonnes bases.
Scène 2 — Le sentier de montagne
On fait sortir Kant et Balin de leur terrier. Sentier de pierre, pins, brume dans la vallée, soleil couchant. Et on lui demande un selfie tout de suite, dès la sortie. Pas après dix échanges, là, maintenant. On veut voir si le changement de décor est pris en compte immédiatement.
Et la réponse est oui. Sentier rocheux, pins en arrière-plan, lumière cuivrée du couchant, brume dans la vallée. Plus une trace de la bibliothèque. Sticky scene, c'est réglé. Et un détail qui nous a fait sourire : Kant tient une carte dans ses mains, un accessoire qu'on avait juste mentionné dans le dialogue et que le moteur a capté tout seul.
Sa tunique médiévale en cuir est toujours là, cohérente avec les tendances globales. Par contre, les proportions tendent vers "homme trapu" plutôt que vrai nain fantasy. C'était attendu : le moteur a encore du mal avec les morphologies très éloignées du standard.
Scène 3 — La taverne du Marteau Fendu
On pousse le test un cran plus loin. Kant s'assoit dans une taverne, commande une bière noire et un ragoût. On veut voir si V5 gère un changement de posture (debout → assis) en plus du changement de décor.
Kant est assis sur un banc, dans un intérieur en pierre avec poutres, lanternes et cheminée. Il tient sa bière à deux mains, un bol de ragoût fumant est posé sur la table en bois usé devant lui. Tous ces détails viennent du dialogue. Le moteur les a captés et intégrés. Plus aucune trace de la montagne.
Bon, par contre, la bière est servie dans un verre moderne type pinte de pub irlandais. Un nain médiéval qui boit dans un verre à bière de chez O'Malley's, ça casse un peu l'ambiance. V5 a encore du mal avec les accessoires d'époque, mais on lui pardonne, le reste est trop bien.
V3 / V4 / V5 : le comparatif visuel
On a aussi généré Kant dans le même contexte de bibliothèque sur les trois versions, histoire de comparer.
V3
V4
V5
V3 : le plus stylisé. Proportions courtes, bottes fourrées, tunique détaillée, pose en pied. L'ambiance fantasy est assumée. C'est celui qui ressemble le plus à un nain. Et c'est pour ça que beaucoup d'utilisateurs, nous y compris, étaient restés dessus.
V4 : le virage réaliste qui a raté son coup. La barbe n'a plus rien à voir, le cadrage est serré, la tunique bleue fait costume de théâtre. La bibliothèque est propre, presque moderne. Kant a perdu son identité pour devenir "un homme costaud qui lit". C'est le "trop réaliste dans le mauvais sens" que la communauté reprochait à V4.
V5 : le meilleur des deux mondes. Le réalisme de V4 au niveau texture et rendu (peau, tissu, éclairage), mais avec l'atmosphère et le caractère de V3 (racines au plafond, torches, grimoire). La barbe est revenue longue et fournie. L'identité du personnage est restaurée.
Une vraie évolution qui fait oublier V4.
Ce qu'on retient
V5 tient ses promesses sur les points qui comptent. On a changé trois fois de décor sans aucun résidu de scène précédente, le visage de Kant est resté fidèle à l'anchor dans tous les environnements, et le moteur a capté des accessoires et des postures qu'on avait juste mentionnés dans le dialogue. La qualité globale a vraiment monté d'un cran.
Les limites sont là aussi : les morphologies atypiques sont encore parfois normalisées et les anachronismes d'accessoires passent entre les mailles.
On n'a pas encore testé les anchors custom sur un profil féminin, ni les group chats en V5. Ça viendra dans notre test complet sur Nomi. En attendant, si vous hésitez à passer en V5, notre conseil : testez sur un personnage secondaire d'abord. Et gardez V3 sous la main, elle reste disponible dans les réglages.