AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
引导去噪推理
扩散模型中的推理过程,其中渐进式去噪由外部信息(例如:源图像)引导,以确保最终结果符合所施加的约束。
術語
语义结构编码
旨在捕获并表示源图像中物体的空间构成和关系的技术,通常通过轮廓图、深度图或分割图来引导生成。
術語
祖先重采样(Ancestral Sampling)
去噪过程中的一种随机采样方法,每一步都会添加从上一阶段继承的噪声量,以引入变异性并避免结果过于确定性。
術語
潜在嵌入(Latent Embedding)
源图像的低维向量表示,由编码器(例如:VAE)生成,用作扩散模型潜在空间中的条件,以实现高效的图像到图像转换。
術語
朗之万分数去噪
一种迭代优化算法,利用对数概率密度的梯度(即分数)逐步将噪声样本优化至目标数据分布,构成扩散模型采样的基础。
術語
交叉注意力图
Transformer中的一种机制,允许模型在生成的每个步骤中动态加权条件不同部分(例如:文本token或源图像的patch)的重要性来生成图像。
術語
潜在扩散管道(LDM)
一种完全在通过VAE获得的压缩潜在空间中运行的扩散模型架构,以降低计算复杂度同时保持高图像生成质量。
術語
Prompt-to-Prompt
一种通过扩散进行图像编辑的方法,允许通过修改初始文本提示来修改生成的图像,同时通过对齐注意力图来保留原始图像的结构。
術語
即插即用(PnP)扩散
一种逆问题求解范式(例如:去噪、超分辨率),使用预训练的扩散模型作为图像先验,并将其与任务特定的数据模型相结合,而无需重新训练扩散器。
🔍