Pourquoi vos prompts SD produisent de mauvaises vidéos
Copier des prompts Stable Diffusion dans Wan 2.2 donne des résultats rigides, saccadés ou partiellement habillés. Les modèles traitent le texte de manières complètement différentes.
beautiful woman, nude, bedroom, lingerie removal, slow, sensual, long hair, perfect body, masterpiece, 8k, best quality
CLIP tokenise cela comme un sac de mots. Sans syntaxe, sans trajectoire — la sortie bouge à peine.
A woman in black lingerie slowly reaches for her shoulder strap, letting it fall as she turns slightly toward the camera, soft candlelight from the right, intimate handheld framing
T5 lit cela comme une phrase. La grammaire crée la direction du mouvement et le flux temporel.
Règle : écrivez une phrase qui décrit ce qui se passe dans le temps, pas une liste de ce que vous voulez voir.
T5 vs CLIP — Pourquoi la structure de phrase compte
Traite les tokens comme un sac désordonné. La position des mots et leurs relations sont largement ignorées. Les tags séparés par des virgules fonctionnent car l'ordre n'a pas d'importance.
Lit la phrase entière. Comprend sujet, verbe et objet. La grammaire active des relations sémantiques que le modèle d'image ne voit jamais — y compris les relations temporelles.
Règle pratique : écrivez "Une femme fait lentement glisser ses mains le long de son corps" — pas "femme, mains, corps, lent, sensuel".
Votre Prompt est un Chemin, pas une Image
La diffusion vidéo génère une trajectoire dans l'espace latent, pas des images individuelles. Une description statique donne une trajectoire presque plate — à peine de mouvement. Une description impliquant du mouvement définit un état initial et final, donnant au modèle une destination.
Description statique → trajectoire plate
Description de mouvement → trajectoire dirigée
woman lying on bed, nude, beautiful, soft light, perfect body
A woman lying on white sheets slowly arches her back, fingers trailing down her stomach, warm morning light from a window casting long shadows across the bed
Conseil : les verbes et adverbes de mouvement sont vos vrais leviers. "Lentement", "progressivement", "en s'arquant", "taquinement" font plus que "chef-d'œuvre" ou "8k".
Le Point Optimal CFG pour l'Activation NSFW
Le fine-tune NSFW s'active dans une plage CFG spécifique. En dehors, aucun prompt ne sauve la sortie.
Le modèle de base domine. Les activations NSFW sont faibles. La sortie paraît générique ou habillée.
Le fine-tune NSFW et le modèle de base s'équilibrent correctement. Commencez à 6,5.
Valeur par défaut recommandée : 6,5Le fine-tune sur-corrige. L'anatomie se déforme, des artefacts apparaissent, les visages se brisent.
Cadre d'Ancrage I2V — Ce qu'il ne faut pas prompter
En mode I2V, votre image de départ est encodée comme ancre dans l'espace latent. Le modèle trouve une trajectoire de mouvement qui part de l'ancre sans la détruire. Cela change tout dans la façon d'écrire le prompt.
beautiful red-haired woman lying in bed, nude, soft lighting, sensual expression, perfect body, long hair spread across pillow
Le modèle voit déjà l'image. Répéter son contenu crée des signaux concurrents — la sortie bégaie ou reste figée.
she slowly leans forward, lips parting slightly, one hand reaching toward the camera, hair falling across her face
L'ancre gère l'apparence. Votre prompt gère la trajectoire. Décrivez seulement ce qui change.
Vocabulaire de Mouvement
Mots et phrases qui produisent un vrai mouvement dans Wan 2.2. Cliquez sur un chip pour copier.
Mouvement Corporel
Mouvement de Caméra
Vitesse et Intensité
Atmosphère de Scène
Modèles de Scène par Catégorie
Points de départ copiables pour quatre types de scènes courants. Le texte du prompt est toujours en anglais — Wan 2.2 est un modèle à prompts anglais.
A woman in sheer white lingerie sits on the edge of a white-sheeted bed, slowly reaching back to unhook her bra, soft warm lamplight from the right, shallow depth of field, intimate close-up framing
she slowly slides the fabric off her shoulder, body turning slightly toward the light, hair falling forward
stiff, static, no movement, clothed, extra limbs, distorted anatomy, blurry face, low quality, watermark
