Por qué tus prompts de SD producen malos videos
Copiar prompts de Stable Diffusion en Wan 2.2 produce resultados rígidos, temblorosos o parcialmente vestidos. Los modelos procesan el texto de maneras completamente diferentes.
beautiful woman, nude, bedroom, lingerie removal, slow, sensual, long hair, perfect body, masterpiece, 8k, best quality
CLIP tokeniza esto como una bolsa de palabras. Sin sintaxis, sin trayectoria — la salida apenas se mueve.
A woman in black lingerie slowly reaches for her shoulder strap, letting it fall as she turns slightly toward the camera, soft candlelight from the right, intimate handheld framing
T5 lee esto como una oración. La gramática crea dirección de movimiento y flujo temporal.
Regla: escribe una oración que describa lo que sucede a lo largo del tiempo, no una lista de lo que quieres ver.
T5 vs CLIP — Por qué importa la estructura de la oración
Procesa tokens como una bolsa desordenada. La posición de las palabras y sus relaciones se ignoran en gran medida. Las etiquetas separadas por comas funcionan porque el orden no importa.
Lee la oración completa. Entiende sujeto, verbo y objeto. La gramática activa relaciones semánticas que el modelo de imagen nunca ve, incluyendo las temporales.
Regla práctica: escribe "Una mujer lentamente desliza sus manos por su cuerpo" — no "mujer, manos, cuerpo, lento, sensual".
Tu Prompt es un Camino, no una Imagen
La difusión de video genera una trayectoria a través del espacio latente, no fotogramas individuales. Una descripción estática produce una trayectoria casi plana — apenas hay movimiento. Una descripción que implica movimiento define un estado inicial y final, por lo que el modelo tiene a dónde ir.
Descripción estática → trayectoria plana
Descripción de movimiento → trayectoria dirigida
woman lying on bed, nude, beautiful, soft light, perfect body
A woman lying on white sheets slowly arches her back, fingers trailing down her stomach, warm morning light from a window casting long shadows across the bed
Consejo: los verbos y adverbios de movimiento son tus verdaderas palancas. "Lentamente", "gradualmente", "arqueando", "tentadoramente" hacen más que "obra maestra" o "8k".
El Punto Óptimo de CFG para Activación NSFW
El fine-tune NSFW se activa dentro de un rango específico de CFG. Fuera de él, ningún prompt salva la salida.
El modelo base domina. Las activaciones NSFW son débiles. La salida parece genérica o vestida.
El fine-tune NSFW y el modelo base se equilibran correctamente. Comienza con 6,5.
Valor predeterminado recomendado: 6,5El fine-tune sobrecompensa. La anatomía se distorsiona, aparecen artefactos, los rostros se deforman.
Fotograma Ancla I2V — Qué no incluir en el Prompt
En modo I2V, tu imagen inicial se codifica como ancla en el espacio latente. El modelo encuentra una trayectoria de movimiento que parte del ancla sin destruirla. Esto cambia todo sobre cómo escribes el prompt.
beautiful red-haired woman lying in bed, nude, soft lighting, sensual expression, perfect body, long hair spread across pillow
El modelo ya ve la imagen. Repetir su contenido crea señales en competencia — la salida tartamudea o se queda congelada.
she slowly leans forward, lips parting slightly, one hand reaching toward the camera, hair falling across her face
El ancla gestiona la apariencia. Tu prompt gestiona la trayectoria. Describe solo lo que cambia.
Vocabulario de Movimiento
Palabras y frases que producen movimiento real en Wan 2.2. Haz clic en cualquier chip para copiar.
Movimiento Corporal
Movimiento de Cámara
Velocidad e Intensidad
Atmósfera de Escena
Plantillas de Escena por Categoría
Puntos de partida copiables para cuatro tipos de escena comunes. El texto del prompt siempre está en inglés — Wan 2.2 es un modelo de prompts en inglés.
A woman in sheer white lingerie sits on the edge of a white-sheeted bed, slowly reaching back to unhook her bra, soft warm lamplight from the right, shallow depth of field, intimate close-up framing
she slowly slides the fabric off her shoulder, body turning slightly toward the light, hair falling forward
stiff, static, no movement, clothed, extra limbs, distorted anatomy, blurry face, low quality, watermark
