Perché i tuoi prompt SD producono video scadenti
Copiare prompt di Stable Diffusion in Wan 2.2 produce risultati rigidi, tremolanti o parzialmente vestiti. I modelli elaborano il testo in modi completamente diversi.
beautiful woman, nude, bedroom, lingerie removal, slow, sensual, long hair, perfect body, masterpiece, 8k, best quality
CLIP tokenizza questo come un bag of words. Nessuna sintassi, nessuna traiettoria — l'output si muove appena.
A woman in black lingerie slowly reaches for her shoulder strap, letting it fall as she turns slightly toward the camera, soft candlelight from the right, intimate handheld framing
T5 legge questo come una frase. La grammatica crea direzione del movimento e flusso temporale.
Regola: scrivi una frase che descriva cosa accade nel tempo, non un elenco di ciò che vuoi vedere.
T5 vs CLIP — Perché la struttura della frase conta
Elabora i token come un bag non ordinato. La posizione delle parole e le relazioni vengono ampiamente ignorate. I tag separati da virgole funzionano perché l'ordine non importa.
Legge l'intera frase. Comprende soggetto, verbo e oggetto. La grammatica attiva relazioni semantiche che il modello di immagine non vede mai — incluse quelle temporali.
Regola pratica: scrivi "Una donna fa scorrere lentamente le mani lungo il corpo" — non "donna, mani, corpo, lento, sensuale".
Il tuo Prompt è un Percorso, non un'Immagine
La diffusione video genera una traiettoria nello spazio latente, non singoli fotogrammi. Una descrizione statica produce una traiettoria quasi piatta — pochissimo movimento. Una descrizione che implica movimento definisce uno stato iniziale e finale, dando al modello una destinazione.
Descrizione statica → traiettoria piatta
Descrizione di movimento → traiettoria diretta
woman lying on bed, nude, beautiful, soft light, perfect body
A woman lying on white sheets slowly arches her back, fingers trailing down her stomach, warm morning light from a window casting long shadows across the bed
Consiglio: i verbi e avverbi di movimento sono i tuoi veri strumenti. "Lentamente", "gradualmente", "arcuando", "provocatoriamente" fanno più di "capolavoro" o "8k".
Il Punto Ottimale CFG per l'Attivazione NSFW
Il fine-tune NSFW si attiva in un intervallo CFG specifico. Al di fuori, nessun prompt salva l'output.
Il modello base domina. Le attivazioni NSFW sono deboli. L'output appare generico o vestito.
Il fine-tune NSFW e il modello base si bilanciano correttamente. Inizia con 6,5.
Valore predefinito consigliato: 6,5Il fine-tune sovra-corregge. L'anatomia si distorce, compaiono artefatti, i volti si rompono.
Fotogramma Ancoraggio I2V — Cosa non includere nel Prompt
In modalità I2V, la tua immagine iniziale viene codificata come ancora nello spazio latente. Il modello trova una traiettoria di movimento che parte dall'ancora senza distruggerla. Questo cambia tutto nel modo in cui scrivi il prompt.
beautiful red-haired woman lying in bed, nude, soft lighting, sensual expression, perfect body, long hair spread across pillow
Il modello vede già l'immagine. Ripetere il suo contenuto crea segnali in competizione — l'output balbetta o rimane congelato.
she slowly leans forward, lips parting slightly, one hand reaching toward the camera, hair falling across her face
L'ancora gestisce l'aspetto. Il tuo prompt gestisce la traiettoria. Descrivi solo ciò che cambia.
Vocabolario di Movimento
Parole e frasi che producono vero movimento in Wan 2.2. Clicca su qualsiasi chip per copiare.
Movimento Corporeo
Movimento di Macchina
Velocità e Intensità
Atmosfera della Scena
Template di Scena per Categoria
Punti di partenza copiabili per quattro tipi di scene comuni. Il testo del prompt è sempre in inglese — Wan 2.2 è un modello a prompt in inglese.
A woman in sheer white lingerie sits on the edge of a white-sheeted bed, slowly reaching back to unhook her bra, soft warm lamplight from the right, shallow depth of field, intimate close-up framing
she slowly slides the fabric off her shoulder, body turning slightly toward the light, hair falling forward
stiff, static, no movement, clothed, extra limbs, distorted anatomy, blurry face, low quality, watermark
