AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
多模态模型
能够同时处理和整合多种数据类型(如文本、图像、音频和视频)的统一人工智能架构
術語
早期融合
在多模态集成策略中,不同模态在主要模型处理之前就在原始特征层面进行组合
術語
晚期融合
多模态方法,其中每种模态独立处理直到模型的最后层,然后在最终决策前融合表示
術語
跨模态对齐
旨在共同表示空间中建立不同模态间语义对应关系的学习过程
術語
视觉语言编码
将视觉和文本输入同时转换为兼容的向量表示以进行联合处理的机制
術語
跨模态注意力
允许模型动态权衡一种模态信息相对于另一种模态重要性的注意力机制
術語
多模态嵌入
在共享语义空间中编码来自多种模态信息的密集向量表示
術語
多模态零样本学习
多模态模型在没有特定训练示例的情况下泛化到新任务或模态组合的能力
術語
多模态分词
将不同模态(图像、音频、视频)转换为与Transformer架构兼容的标记序列的过程。
術語
多模态对比预训练
一种自监督方法,最大化正多模态对之间的相似性,同时最小化负对之间的相似性。
術語
公共潜在空间投影
线性或非线性变换,将不同模态的表示空间对齐到统一的向量空间中。
術語
混合编码器-解码器架构
结合了按模态专门化的编码器与统一解码器的结构,用于生成多模态输出。
術語
多模态微调
将预训练的多模态模型适应特定任务的过程,同时保留其跨模态处理能力。
術語
多模态提示工程
优化结合文本和其他模态的输入的技术,以有效引导多模态模型产生期望输出。
術語
多模态思维链推理
模型生成明确推理步骤的能力,整合来自多个模态的证据。
術語
多模态条件生成
基于其他模态提供的条件或约束,在目标模态中创建内容的过程。
術語
中级融合
一种多模态集成策略,其中模态在神经网络的多个中间层级进行融合。
術語
多模态Transformer
Transformer架构的扩展,能够同时处理来自不同模态的序列,并配备适应的注意力机制。
🔍