Wan NSFW
プロンプトエンジニアリング

Wan 2.2 NSFWプロンプト:動画モデルガイド

NSFWプロンプトガイドのほとんどは、静止画モデルのStable Diffusion向けに書かれています。Wan 2.2は動きを生成します。このガイドでは仕組みを解説します。なぜ文章形式のプロンプトがタグリストより優れているのか、CFGがNSFW活性化をどう制御するのか、I2Vプロンプトが根本的に異なる理由とは。

8分で読めるJune 2026
問題点

SDのプロンプトが悪い動画を生む理由

Stable DiffusionのプロンプトをWan 2.2にそのまま使うと、硬直した、震える、または半分服を着た出力になります。両モデルはテキストを全く異なる方法で処理します。

SDスタイルのプロンプト

beautiful woman, nude, bedroom, lingerie removal, slow, sensual, long hair, perfect body, masterpiece, 8k, best quality

CLIPはこれを単語の袋として処理します。構文なし、軌跡なし — 出力はほとんど動きません。

Wan 2.2プロンプト

A woman in black lingerie slowly reaches for her shoulder strap, letting it fall as she turns slightly toward the camera, soft candlelight from the right, intimate handheld framing

T5はこれを文として読みます。文法が動きの方向と時間的な流れを生み出します。

ルール:時間の経過とともに何が起きるかを描写する文を書きましょう。見たいものの列挙リストではなく。

テキストエンコーディング

T5 vs CLIP — 文の構造がなぜ重要か

🪣CLIP(Stable Diffusion)
womannudeslowsensualbedroomperfect body8k

トークンを順不同の袋として処理します。単語の位置や関係性はほぼ無視されます。順序が関係ないため、カンマ区切りのタグが機能します。

📖T5(Wan 2.2)
A womanslowly reachesfor her shoulder strapletting it fall

文全体を読み取ります。主語・動詞・目的語を理解します。文法により、画像モデルには見えない意味的関係(時間的関係を含む)が活性化します。

実践ルール:「女性がゆっくりと体に手を這わせる」と書く。「女性、手、体、ゆっくり、官能的」ではなく。

モーションサイエンス

プロンプトは経路であり、絵ではない

動画拡散は個々のフレームではなく、潜在空間の軌跡を生成します。静的な描写はほぼ平坦な軌跡を生み出し、ほとんど動きがありません。動きを示す描写は開始状態と終了状態を定義し、モデルが向かう目的地を与えます。

静的な描写 → 平坦な軌跡

動きの描写 → 方向のある軌跡

静的な描写 → 平坦な軌跡

woman lying on bed, nude, beautiful, soft light, perfect body

動きの描写 → 方向のある軌跡

A woman lying on white sheets slowly arches her back, fingers trailing down her stomach, warm morning light from a window casting long shadows across the bed

ヒント:動作動詞と副詞が本当のレバーです。「ゆっくり」「徐々に」「反らせながら」「じらすように」は「傑作」や「8k」より効果的です。

設定

NSFW活性化のためのCFGスイートスポット

NSFWファインチューンは特定のCFG範囲内で活性化します。その範囲外では、どんなプロンプトも出力を救えません。

低すぎる(<4)

ベースモデルが支配します。NSFW活性化が弱く、出力が一般的または服を着た状態になります。

スイートスポット(6〜7.5)

NSFWファインチューンとベースモデルが適切にバランスします。6.5から始めましょう。

推奨デフォルト値:6.5
高すぎる(>9)

ファインチューンが過剰補正します。解剖学的歪み、アーティファクト、顔の崩壊が起きます。

画像から動画

I2Vアンカーフレーム — プロンプトに書いてはいけないこと

I2Vモードでは、開始画像が潜在空間にアンカーとしてエンコードされます。モデルはアンカーを破壊せずに離れる動きの軌跡を見つけます。これによりプロンプトの書き方が根本的に変わります。

誤り — 画像を再描写する

beautiful red-haired woman lying in bed, nude, soft lighting, sensual expression, perfect body, long hair spread across pillow

モデルはすでに画像を見ています。内容を繰り返すと競合シグナルが生じ、出力がカクついたり固まったりします。

正しい — 動きを描写する

she slowly leans forward, lips parting slightly, one hand reaching toward the camera, hair falling across her face

アンカーが外見を担います。プロンプトが軌跡を担います。変化するものだけを描写してください。

リファレンス

モーションボキャブラリー

Wan 2.2で本物の動きを生み出す単語とフレーズ。チップをクリックでコピー。

身体の動き

カメラの動き

スピードと強度

シーンの雰囲気

テンプレート

カテゴリ別シーンテンプレート

4種類のシーンのコピー可能な出発点。プロンプトのテキストは常に英語です — Wan 2.2は英語プロンプトモデルです。

T2V — テキストから動画

A woman in sheer white lingerie sits on the edge of a white-sheeted bed, slowly reaching back to unhook her bra, soft warm lamplight from the right, shallow depth of field, intimate close-up framing

I2V — 画像から動画

she slowly slides the fabric off her shoulder, body turning slightly toward the light, hair falling forward

ネガティブプロンプト

stiff, static, no movement, clothed, extra limbs, distorted anatomy, blurry face, low quality, watermark

よくある質問

よくある質問

今得た知識でWan 2.2 NSFWを試してみよう

動画を生成する