🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

潜在扩散模型

在通过自编码器获得的低维潜在空间中运行的扩散架构,显著降低计算成本的同时保持高质量的图像生成。

📖
个术语

感知编码器

LDM中自编码器的组成部分,将高维图像(像素)转换为低维表示(潜在),捕获本质的语义信息。

📖
个术语

交叉注意力机制

注意力机制,使潜在扩散模型能够整合异构信息(如CLIP文本嵌入),以灵活精确的方式引导图像生成。

📖
个术语

噪声调度器

定义前向过程中每个时间步添加噪声方差的算法,影响LDM中生成的收敛速度和最终质量。

📖
个术语

噪声回归(去噪)

U-Net扩散模型的主要任务,预测在给定时间步添加到潜在表示的噪声,通过相减逐步对信号进行去噪。

📖
个术语

分层U-Net

U形神经网络架构,具有残差连接和注意力机制,作为扩散模型的核心,用于预测每个去噪步骤的噪声。

📖
个术语

无分类器引导(CFG)

一种条件方法,利用模型自身的对数概率梯度来增强对提示的遵循,避免需要外部分类器并提高对文本的保真度。

📖
个术语

Stable Diffusion

潜在扩散模型架构的著名开源实现,结合VAE、U-Net和通过CLIP的文本条件,实现可访问且高性能的图像生成。

📖
个术语

随机分数匹配(SDE)

扩散模型的替代理论框架,将其解释为通过求解随机微分方程来学习数据密度梯度(分数)的过程。

📖
个术语

潜在重采样(Latent Resampling)

一种推理技术,动态修改潜在空间中的去噪轨迹,通过调整时间步长或引导强度来提高生成结果的一致性和质量。

📖
个术语

时间蒸馏

模型压缩过程,利用大型慢速扩散模型训练更小更快的模型,使其能在更少的去噪步骤中生成质量相当的图像。

📖
个术语

一致性去噪

一类推理方法,通过求解常微分方程(ODE)来近似去噪过程,实现单步或极少步骤的高质量生成。

📖
个术语

提示词分词

预处理步骤,将输入文本转换为数字标识符序列(token),随后由语言模型(如CLIP)转换为嵌入向量用于条件控制。

📖
个术语

KL重建损失

LDM的VAE训练中的正则化项,衡量学习到的潜在分布与先验分布(通常为标准高斯分布)之间的KL散度。

📖
个术语

文本嵌入空间

高维向量空间,其中文本(提示词)以嵌入向量形式表示,通过交叉注意力机制为扩散模型提供条件控制。

🔍

未找到结果