AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
模态对齐
训练过程,旨在将不同模态的表示空间对齐到共同的向量空间中,以促进跨模态迁移。
个术语
感知器
通用的Transformer架构,能够使用输入和潜在瓶颈之间的交叉注意力机制处理任意的多模态数据。
个术语
统一多模态预训练
一种方法,同时在多个任务和模态上预训练单个模型,以获得更通用和可迁移的表示。
个术语
图像描述Transformer
编码器-解码器Transformer架构,自动为输入图像生成描述性且连贯的文本描述。
个术语
视听Transformer
同时处理音频和视频流的Transformer模型,用于视听识别或同步生成等任务。
个术语
视频Transformer
适应于视频帧序列处理的Vision Transformer变体,通过时空注意力机制整合时间信息。
个术语
基于Transformer的多模态融合
利用Transformer的注意力机制在语义层面智能融合多种模态特征的技术。
🔍