Institution

KAIST

South Korea's flagship science and engineering institute; its vision lab (cvlab-kaist) works on generative video, diffusion models, and computer vision.

Video Generation · KAIST

Lip Forcing: Few-Step Autoregressive Diffusion for Real-time Lip Sync

First autoregressive-diffusion lip-sync method: distills a 14B bidirectional teacher into causal 1.3B/14B students that generate each chunk in 2 steps, hitting 31.58 FPS with sub-millisecond time-to-first-frame.