AI 詞彙表
人工智能完整詞典
三维边界框
与坐标轴对齐或定向的长方体,用于界定三维空间中物体的位置和空间范围。它由其中心坐标(或一个角点坐标)、尺寸(长度、宽度、高度)和方向(欧拉角或四元数)定义。
传感器融合
整合来自多个传感器(例如:激光雷达、摄像头、雷达)数据的过程,以产生比单一来源更稳健、准确和完整的环境表示。它允许结合每种模态的优势来克服各自的弱点。
体素网格检测
一种3D检测方法,将空间离散化为体素(基本体积)的三维网格。从该网格中提取特征来预测物体的存在和位置,通常通过3D卷积神经网络(3D CNN)实现。
多视角投影
将3D点云投影到多个2D平面(鸟瞰图、正视图等)以利用成熟的2D物体检测架构的方法。然后,将2D预测重新投影到3D空间以获得最终的边界框。
三维锚点
具有特定尺寸、方向和位置的预定义3D边界框,用作基于锚点的检测方法中的参考。网络预测相对于这些锚点的偏移量,以细化检测到的物体的定位和几何形状。
无锚检测
不依赖于预定义参考框集合的3D检测范式。它直接从关键点或热图预测物体的属性(中心、尺寸、方向),简化了过程并提高了对不同尺寸物体的泛化能力。
占据栅格地图
环境的离散表示,其中空间被划分为规则单元,每个单元具有被占据、空闲或未知的概率。它常用于机器人和从3D传感器数据进行路径规划。
多边形网格
定义多面体3D物体形状的顶点、边和面的集合。用作3D分割或重建模型的输出,以提供比边界框更精细、更逼真的几何表示。
点网络(PointNet)
深度神经网络架构,设计用于直接处理点云,保持点的置换不变性。它使用对称函数(如最大池化)来聚合整个点云的信息。
光线投射检测(Ray-casting Detection)
模拟从视点(传感器)通过3D网格的体素投射光线以确定交点并推断物体存在的技术。它通常用于建模激光雷达的视场并提高检测精度。
3D语义分割(3D Semantic Segmentation)
为3D点云中的每个点或体素分配语义类别标签(如'汽车'、'行人'、'建筑')的任务。它提供了场景的密集且详细的理解,超出了简单的物体定位。
实时3D物体检测(Real-time 3D Object Detection)
系统在足够低的延迟下检测和定位3D物体的能力,适用于自动驾驶等动态应用。它对模型复杂度和计算效率提出了严格要求。
外部标定(Extrinsic Calibration)
确定传感器相对于参考坐标系(如车辆)的相对位置和方向的过程。精确的标定对于多模态数据融合和将检测结果正确投影到公共空间至关重要。
方向四元数(Orientation Quaternion)
使用四个数字(w, x, y, z)表示三维空间中旋转的数学表示。相比欧拉角,它更受青睐用于描述3D边界框的方向,因为它避免了万向节死锁问题。
特征传播检测(Feature Propagation Detection)
在分层架构(如PointNet++)中使用的策略,其中特征在越来越粗的分辨率下提取,然后传播和插值回原始点,用于每个点的精细预测。