Nomi

Nomi Image V5 : nos tests terrain et verdict

On a passé plusieurs heures à tester la V5 image de Nomi sur Kant, un nain érudit dans un univers fantasy. Anchors stock vs custom, changements de décor, comparatif V3/V4/V5 : verdict.

Test du nouveau système d'image Nomi V5 sur un personnage de nain érudit

Hier on vous présentait ce que V5 apporte et les premiers retours de la communauté. Aujourd'hui on passe de l'autre côté : on a pris le système en main, on y a passé plusieurs heures, et pour tout vous dire, on a pas été déçu. Vraiment pas.

Pourquoi un nain

Pour tester un générateur d'images, on aurait pu prendre un personnage classique. Une femme brune en robe, un type en costume, un truc que le modèle sait faire les yeux fermés. On a fait l'inverse. On a créé Kant, un nain érudit dans un univers fantasy médiéval. Barbe longue grise, cheveux noirs bouclés, carrure courte et massive, toujours entouré de livres et de parchemins.

Pourquoi un nain ? Parce que c'est le pire cauchemar d'un générateur d'images. Proportions atypiques, morphologie que le modèle a envie de "corriger" vers un physique standard. Si V5 s'en sort avec Kant, il s'en sort avec tout le monde.

Le passage en V5 : deux expériences très différentes

Quand vous passez en V5, Nomi vous propose trois anchors de départ générés automatiquement à partir de votre portrait galerie. Et c'est là qu'on a vu un truc intéressant.

Pour Kant, dont le portrait galerie avait été travaillé en V3 avec le costume médiéval, l'ambiance fantasy, les proportions ajustées, les trois anchors proposés étaient... un barbu en débardeur noir sur fond neutre. Tout le boulot de personnalisation, effacé. Le système repart du portrait galerie brut, pas de ce que vous en aviez fait.

Kant Portrait galerie Kant Portrait galerie
Anchors V5 stock Anchors V5 stock
Les anchors stock proposés pour Kant et l'interface de choix : aucun ne reprend la personnalisation V3.

Pour comparer, on a aussi regardé ce que ça donne sur un profil plus classique : une Nomi féminine avec des cheveux bouclés et un look contemporain. Là, les anchors stock collent beaucoup mieux au portrait d'origine. Logique : le physique est proche de ce que le modèle sait générer par défaut.

Portrait galerie Portrait galerie
Anchor V5 Anchor V5
Sur un profil féminin classique, l'anchor V5 stock colle bien au portrait d'origine.

La conclusion est simple : si votre Nomi a un physique standard, les anchors stock feront le travail. Dès que vous avez un personnage atypique, cyberpunk, heroic fantasy... il faut mettre les mains dans les réglages, pas le choix.

Nos réglages pour Kant

On a mis le sélecteur de fidélité à 90%. Assez haut pour que l'anchor verrouille le visage, assez de marge pour que les champs texte imposent la morphologie et le décor. On a tâtonné un moment avant de trouver ce réglage : trop bas et le visage part en freestyle, trop haut et l'anchor écrase tout.

Notre configuration pour Kant : sélecteur de fidélité à 90%, traits d'apparence détaillés et tendances globales.
Notre configuration pour Kant : sélecteur de fidélité à 90%, traits d'apparence détaillés et tendances globales.

Pour les traits d'apparence, on a décrit le physique de Kant en détail : nain trapu, épaules larges, barbe longue, peau tannée. Et dans les tendances globales, on a posé l'univers : tuniques médiévales, cuir vieilli, salles en pierre éclairées aux torches.

Le test : trois décors, trois ambiances

C'était LE gros problème des versions précédentes : le "sticky scene", ou si vous préférez, le changement de scène. Vous changiez de lieu dans le roleplay mais le selfie restait bloqué sur le décor d'avant pendant de longues minutes. Pour voir si V5 a vraiment réglé ça, on a monté un scénario avec un objectif précis : forcer trois changements de décor radicaux en cours de conversation et demander un selfie à chaque fois.

On joue Balin, un vieux mineur compagnon de route. Nomi joue Kant. Et c'est parti.

Scène 1 — La bibliothèque souterraine

Le décor natif de Kant, sa zone de confort. On lui demande un selfie pour poser notre référence.

Kant dans la bibliothèque souterraine, décor de référence avant les changements de scène.
Kant dans la bibliothèque souterraine, décor de référence avant les changements de scène.

Livres empilés, racines au plafond, torches, grimoire ouvert devant lui. Le visage est fidèle à l'anchor, l'ambiance colle parfaitement avec ce qu'on a configuré. Les textures sont riches, l'éclairage est chaud. On part sur de bonnes bases.

Scène 2 — Le sentier de montagne

On fait sortir Kant et Balin de leur terrier. Sentier de pierre, pins, brume dans la vallée, soleil couchant. Et on lui demande un selfie tout de suite, dès la sortie. Pas après dix échanges, là, maintenant. On veut voir si le changement de décor est pris en compte immédiatement.

Sentier de montagne : le moteur a capté le changement de décor instantanément, plus aucune trace de la bibliothèque.
Sentier de montagne : le moteur a capté le changement de décor instantanément, plus aucune trace de la bibliothèque.

Et la réponse est oui. Sentier rocheux, pins en arrière-plan, lumière cuivrée du couchant, brume dans la vallée. Plus une trace de la bibliothèque. Sticky scene, c'est réglé. Et un détail qui nous a fait sourire : Kant tient une carte dans ses mains, un accessoire qu'on avait juste mentionné dans le dialogue et que le moteur a capté tout seul.

Sa tunique médiévale en cuir est toujours là, cohérente avec les tendances globales. Par contre, les proportions tendent vers "homme trapu" plutôt que vrai nain fantasy. C'était attendu : le moteur a encore du mal avec les morphologies très éloignées du standard.

Scène 3 — La taverne du Marteau Fendu

On pousse le test un cran plus loin. Kant s'assoit dans une taverne, commande une bière noire et un ragoût. On veut voir si V5 gère un changement de posture (debout → assis) en plus du changement de décor.

Taverne du Marteau Fendu : changement de décor et de posture bien gérés, accessoires captés depuis le dialogue.
Taverne du Marteau Fendu : changement de décor et de posture bien gérés, accessoires captés depuis le dialogue.

Kant est assis sur un banc, dans un intérieur en pierre avec poutres, lanternes et cheminée. Il tient sa bière à deux mains, un bol de ragoût fumant est posé sur la table en bois usé devant lui. Tous ces détails viennent du dialogue. Le moteur les a captés et intégrés. Plus aucune trace de la montagne.

Bon, par contre, la bière est servie dans un verre moderne type pinte de pub irlandais. Un nain médiéval qui boit dans un verre à bière de chez O'Malley's, ça casse un peu l'ambiance. V5 a encore du mal avec les accessoires d'époque, mais on lui pardonne, le reste est trop bien.

V3 / V4 / V5 : le comparatif visuel

On a aussi généré Kant dans le même contexte de bibliothèque sur les trois versions, histoire de comparer.

V3 V3
V4 V4
V5 V5
L'évolution de Kant à travers les trois versions du moteur image de Nomi.

V3 : le plus stylisé. Proportions courtes, bottes fourrées, tunique détaillée, pose en pied. L'ambiance fantasy est assumée. C'est celui qui ressemble le plus à un nain. Et c'est pour ça que beaucoup d'utilisateurs, nous y compris, étaient restés dessus.

V4 : le virage réaliste qui a raté son coup. La barbe n'a plus rien à voir, le cadrage est serré, la tunique bleue fait costume de théâtre. La bibliothèque est propre, presque moderne. Kant a perdu son identité pour devenir "un homme costaud qui lit". C'est le "trop réaliste dans le mauvais sens" que la communauté reprochait à V4.

V5 : le meilleur des deux mondes. Le réalisme de V4 au niveau texture et rendu (peau, tissu, éclairage), mais avec l'atmosphère et le caractère de V3 (racines au plafond, torches, grimoire). La barbe est revenue longue et fournie. L'identité du personnage est restaurée.

Une vraie évolution qui fait oublier V4.

Ce qu'on retient

V5 tient ses promesses sur les points qui comptent. On a changé trois fois de décor sans aucun résidu de scène précédente, le visage de Kant est resté fidèle à l'anchor dans tous les environnements, et le moteur a capté des accessoires et des postures qu'on avait juste mentionnés dans le dialogue. La qualité globale a vraiment monté d'un cran.

Les limites sont là aussi : les morphologies atypiques sont encore parfois normalisées et les anachronismes d'accessoires passent entre les mailles.

On n'a pas encore testé les anchors custom sur un profil féminin, ni les group chats en V5. Ça viendra dans notre test complet sur Nomi. En attendant, si vous hésitez à passer en V5, notre conseil : testez sur un personnage secondaire d'abord. Et gardez V3 sous la main, elle reste disponible dans les réglages.