DISCO: Disentangled Control for Realistic Human Dance Generation

时间：2024-06-02 16:45:26

给出

f, g

作为参考图片的前背景，然后给出单个pose

p=p_t

或者pose序列

\{p_1,p_2,\cdots,p_T\}

，目标是生成对应的单张图片

I_t

或者视频

\{I_1,I_2,\cdots,I_T\}

，生成的结果需要同时和提供的

f, g, p

相符合，并且具有泛化性，以可以生成训练数据之外的场景，并且可以任意组合上面三种条件；



秒客网