Por que meu vídeo NSFW do Wan 2.2 parece rígido ou com pouco movimento?

Você provavelmente está usando uma descrição estática — uma lista de atributos em vez de uma trajetória de movimento. O Wan 2.2 precisa saber o que muda ao longo do tempo. Adicione verbos de movimento (lentamente, arqueando, deslizando) e descreva uma ação que se desenrola.

Qual valor de CFG devo usar para o Wan 2.2 NSFW?

Comece com 6,5. O fine-tune NSFW se ativa melhor entre CFG 6 e 7,5. Abaixo de 4 o modelo base domina. Acima de 9 a anatomia se distorce.

O Wan 2.2 é sem censura por padrão neste site?

Sim. nsfwwan.video usa uma versão com fine-tune NSFW sem restrições de conteúdo. Você não precisa de frases de contorno — o modelo já é sem censura no nível de inferência.

Qual é a diferença entre prompts I2V e T2V?

No T2V, seu prompt descreve toda a cena do zero. No I2V, sua imagem inicial já define a aparência; seu prompt só precisa descrever a trajetória de movimento. Redescrever a imagem em um prompt I2V cria sinais concorrentes.

Como corrigir artefatos anatômicos na saída NSFW?

Reduza o CFG para 6–7. Adicione um prompt negativo direcionado ao artefato específico (ex.: "membros extras, anatomia distorcida, dedos fundidos"). Simplifique seu prompt positivo — prompts muito complexos com escalas de guidance altas são a causa mais comum.

Guia de Prompts NSFW Wan 2.2 — Técnicas do Modelo de Vídeo

O Problema

Por que seus prompts de SD produzem vídeos ruins

Copiar prompts do Stable Diffusion para o Wan 2.2 produz resultados rígidos, trêmulos ou parcialmente vestidos. Os modelos processam texto de maneiras completamente diferentes.

Prompt estilo SD

beautiful woman, nude, bedroom, lingerie removal, slow, sensual, long hair, perfect body, masterpiece, 8k, best quality

O CLIP tokeniza isso como um bag of words. Sem sintaxe, sem trajetória — a saída mal se move.

Prompt Wan 2.2

A woman in black lingerie slowly reaches for her shoulder strap, letting it fall as she turns slightly toward the camera, soft candlelight from the right, intimate handheld framing

O T5 lê isso como uma frase. A gramática cria direção de movimento e fluxo temporal.

Regra: escreva uma frase que descreva o que acontece ao longo do tempo, não uma lista do que você quer ver.

Codificação de Texto

T5 vs CLIP — Por que a estrutura da frase importa

🪣CLIP (Stable Diffusion)

womannudeslowsensualbedroomperfect body8k

Processa tokens como um bag desordenado. A posição das palavras e relações são amplamente ignoradas. Tags separadas por vírgulas funcionam porque a ordem não importa.

📖T5 (Wan 2.2)

A womanslowly reachesfor her shoulder strapletting it fall

Lê a frase completa. Entende sujeito, verbo e objeto. A gramática ativa relações semânticas que o modelo de imagem nunca vê — incluindo as temporais.

Regra prática: escreva "Uma mulher desliza lentamente as mãos pelo corpo" — não "mulher, mãos, corpo, lento, sensual".

Ciência do Movimento

Seu Prompt é um Caminho, não uma Imagem

A difusão de vídeo gera uma trajetória no espaço latente, não quadros individuais. Uma descrição estática produz uma trajetória quase plana — quase nenhum movimento. Uma descrição que implica movimento define um estado inicial e final, dando ao modelo um destino.

Descrição estática → trajetória plana

Descrição de movimento → trajetória dirigida

Descrição estática → trajetória plana

woman lying on bed, nude, beautiful, soft light, perfect body

Descrição de movimento → trajetória dirigida

A woman lying on white sheets slowly arches her back, fingers trailing down her stomach, warm morning light from a window casting long shadows across the bed

Dica: verbos e advérbios de movimento são suas alavancas reais. "Lentamente", "gradualmente", "arqueando", "de forma sedutora" fazem mais do que "obra-prima" ou "8k".

Configurações

O Ponto Ideal de CFG para Ativação NSFW

O fine-tune NSFW se ativa dentro de um intervalo específico de CFG. Fora dele, nenhum prompt salva a saída.

Muito baixo (<4)

O modelo base domina. As ativações NSFW são fracas. A saída parece genérica ou vestida.

Ponto ideal (6 – 7,5)

O fine-tune NSFW e o modelo base se equilibram corretamente. Comece com 6,5.

Padrão recomendado: 6,5

Muito alto (>9)

O fine-tune supercorrige. A anatomia se distorce, surgem artefatos, os rostos se quebram.

Imagem para Vídeo

Quadro Âncora I2V — O que não incluir no Prompt

No modo I2V, sua imagem inicial é codificada como âncora no espaço latente. O modelo encontra uma trajetória de movimento que parte da âncora sem destruí-la. Isso muda tudo na forma como você escreve o prompt.

Errado — redescrever a imagem

beautiful red-haired woman lying in bed, nude, soft lighting, sensual expression, perfect body, long hair spread across pillow

O modelo já vê a imagem. Repetir seu conteúdo cria sinais concorrentes — a saída gagueja ou fica congelada.

Correto — descrever o movimento

she slowly leans forward, lips parting slightly, one hand reaching toward the camera, hair falling across her face

A âncora gerencia a aparência. Seu prompt gerencia a trajetória. Descreva apenas o que muda.

Referência

Vocabulário de Movimento

Palavras e frases que produzem movimento real no Wan 2.2. Clique em qualquer chip para copiar.

Movimento Corporal

Movimento de Câmera

Velocidade e Intensidade

Atmosfera da Cena

Templates

Templates de Cena por Categoria

Pontos de partida copiáveis para quatro tipos comuns de cena. O texto do prompt é sempre em inglês — Wan 2.2 é um modelo de prompts em inglês.

T2V — Texto para Vídeo

A woman in sheer white lingerie sits on the edge of a white-sheeted bed, slowly reaching back to unhook her bra, soft warm lamplight from the right, shallow depth of field, intimate close-up framing

I2V — Imagem para Vídeo

she slowly slides the fabric off her shoulder, body turning slightly toward the light, hair falling forward

Prompt Negativo

stiff, static, no movement, clothed, extra limbs, distorted anatomy, blurry face, low quality, watermark

Perguntas Frequentes

Prompts NSFW Wan 2.2: O Guia do Modelo de Vídeo