基于扩散模型的视频生成

📖

術語

时空扩散模型

深度学习架构，将二维扩散模型扩展以捕捉空间和时间依赖性，实现逐帧生成连贯的视频序列。

📖

術語

视频扩散去噪

迭代过程，其中扩散模型学习逆向添加高斯噪声到视频序列，从而从损坏数据中重建清晰的视频。

📖

術語

潜时空空间

视频扩散模型中的压缩表示空间，同时编码空间特征和时间演变，以实现高效生成。

📖

術語

时间条件化

通过在扩散过程中注入时间信息（时间嵌入、运动掩码）来指导视频生成的技术，以控制动作的发展。

📖

術語

基于分数的视频生成建模

模型学习视频数据对数概率分布的梯度（分数）的范式，用于指导扩散采样过程。

📖

術語

时空噪声张量

在模型的前向扩散阶段逐步添加到视频数据中的四维（时间、高度、宽度、通道）结构化高斯噪声。

📖

術語

扩散时间分辨率

视频扩散模型以高帧率（fps）生成序列的能力，同时保持运动的流畅性和一致性。

📖

術語

视频无分类器引导

一种视频生成控制方法，使用单个模型在有条件和无条件（文本、图像）情况下训练，无需外部分类器即可实现精确引导。

📖

術語

用于视频扩散的3D U-Net

一种具有三维残差连接的卷积神经网络架构，专门适用于扩散模型中的视频数据去噪。

📖

術語

潜在轨迹插值

一种视频生成技术，通过在潜在空间中插值点来创建不同状态或动作之间流畅且合乎逻辑的过渡。

📖

術語

扩散时间一致性

旨在确保生成的物体和场景在视频的连续帧中保持其身份和物理属性的目标。

📖

術語

视频到视频扩散模型

将扩散模型应用于将输入视频转换为风格化、修改或增强的输出视频，同时保持时间结构。

📖

術語

扩散时间调度

一种定义视频扩散过程中每个时间步添加噪声方差的策略，影响生成质量和速度。

📖

術語

运动分解扩散

一种方法，其中扩散模型学习独立分离和建模视频序列中的静态背景和物体运动。

📖

術語

视频扩散自回归

一种混合方法，结合自回归生成（第N+1帧依赖于第N帧）与扩散去噪，以提高长期一致性。

AI 詞彙表