AI 词汇表
人工智能完整词典
扩散模型
一种生成式架构,通过逐步添加和移除噪声的过程,将数据转换为纯噪声,然后重建出逼真的样本。这些模型在生成高质量图像方面表现出色,且训练稳定性优于GAN。
前向扩散过程
训练阶段,在此阶段中,高斯噪声在多个时间步中逐步添加到原始数据,直至达到纯噪声分布。这个马尔可夫过程在数学上被设计为可逆且可预测的。
反向扩散过程
生成阶段,在此阶段中,神经网络学习逐步对纯噪声分布进行去噪,以重建出连贯的数据。该过程由对数据分布的得分梯度估计所引导。
DDPM (去噪扩散概率模型)
由Ho等人于2020年引入的基础扩散模型类别,使用线性方差调度和噪声预测目标。DDPM为现代扩散架构奠定了数学基础。
噪声调度
控制在前向扩散过程的每一步中添加的噪声量的时间参数化设置。一个设计良好的调度可以优化信息保留与去噪效率之间的平衡。
无分类器引导
一种生成控制技术,它结合了条件预测和非条件预测,以提高对文本的保真度,而无需外部分类器。该方法允许对生成进行精细控制,同时保持多样性。
潜在扩散模型
通过在压缩的潜在空间而非直接在像素空间中工作来优化扩散模型的架构。这种方法在保持高生成质量的同时,显著降低了计算成本。
祖先采样
一种随机采样方法,它结合了确定性去噪和受控的噪声添加,以提高生成样本的多样性。该技术在生成中平衡了质量与创造性。
扩散时间步
扩散过程中使用的离散步数,通常在100到1000步之间,以实现最佳的质量与性能平衡。时间步的选择直接影响生成细节的精细度。
去噪U-Net
一种具有残差连接和注意力机制的神经网络架构,专门设计用于在每一步扩散中预测和去除噪声。U-Net结构在捕获全局依赖性的同时,有效地保留了空间信息。
随机微分方程
一种连续的数学公式,它在一个严谨的理论框架下统一了前向和逆向扩散过程。这种方法允许进行理论分析并开发新的采样算法。
条件扩散
扩散模型的扩展,它集成了文本、图像或类别等外部条件来引导生成过程。这种方法可以精确控制生成样本的特征。
引导比例
控制条件对生成过程影响的参数,用于调整忠实度与创造性之间的权衡。高引导比例会增强对指令的遵循,而低引导比例则有利于多样性。
渐进式重采样
一种迭代改进技术,通过应用多次去噪循环来细化细节并修正伪影。该方法以增加计算时间为代价,优化了最终生成的质量。
交叉自注意力
一种注意力机制,允许扩散模型在去噪过程中有效地融合文本和视觉信息。这种架构对于文本到图像生成中的语义连贯性至关重要。
DDIM (去噪扩散隐式模型)
扩散模型的一种确定性变体,允许在保持质量的同时用更少的步数进行加速采样。DDIM将随机过程转变为一个非马尔可夫的确定性映射。