AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个子类别
数值变量变换
对连续变量应用数学变换以改善其分布及其与目标变量的关系。
17 个术语
个子类别
分类变量编码
将文本或分类数据转换为机器学习算法可用的数值格式。
16 个术语
个子类别
缺失值处理
用于维护数据集完整性的数据填补与缺失数据处理技术。
18 个术语
个子类别
时间特征创建
从时间或序列数据中提取和生成基于时间的变量。
18 个术语
个子类别
文本特征提取
通过TF-IDF、词嵌入和n-gram等技术将非结构化文本转换为数值向量。
2 个术语
个子类别
地理空间工程
基于位置数据和地理坐标创建变量以捕捉空间关系。
20 个术语
个子类别
归一化与标准化
变量缩放以实现可比性及优化学习算法的收敛性。
13 个术语
个子类别
特征选择
识别并保留最相关的变量,以提高性能并降低复杂性。
14 个术语
个子类别
降维
如PCA和t-SNE等技术,用于压缩信息同时保留重要变化。
18 个术语
个子类别
交互特征创建
通过现有变量之间的乘法或加法组合生成新特征
19 个术语
个子类别
分布变换
应用对数变换、Box-Cox或Yeo-Johnson变换来归一化偏态分布。
14 个术语
个子类别
图像特征提取
通过直方图、纹理和局部描述符将视觉数据转换为数字描述符。
18 个术语
个子类别
音频特征工程
从音频信号中提取频谱和时间特征,如MFCC、色度和频谱图。
20 个术语
个子类别
时间聚合
创建滚动统计和时间窗口聚合以捕捉趋势和模式。
17 个术语
个子类别
多项式特征
生成高阶项以捕捉变量间的非线性关系。
13 个术语
个子类别
分箱与离散化
将连续变量划分为离散区间,以捕捉非线性效应并减少噪声。
19 个术语
个子类别
时间序列工程
创建滞后特征、移动平均和季节性分解以建模时间依赖性。
13 个术语
个子类别
图特征提取
从网络结构中生成描述符,如中心性、聚类和节点嵌入。
20 个术语
🔍