AI用語集
人工知能の完全辞典
Frustum PointNets
2Dバウンディングボックスから投影された視錐台(フラスタム)内で動作し、正確な3Dバウンディングボックスを予測するニューラルネットワークアーキテクチャ。
Bird's-Eye-View (BEV) 投影
オブジェクトの検出と位置特定を簡素化するために、センサーデータ(画像、点群)を上から見た地図表現に変換する技術。
Multi-View Fusion
整合的で堅牢な3Dシーンまたはオブジェクトを再構築するために、複数の視点(カメラ)からの情報を集約するプロセス。
Ray Casting
観測点から仮想の光線を発射し、3Dシーン内のオブジェクトとの交差を判定するアルゴリズム。レンダリングや投影において基本的な手法である。
3Dバウンディングボックス
3Dオブジェクトを囲むために、位置、寸法(長さ、幅、高さ)、および向き(ヨー、ピッチ、ロール角)によってパラメータ化された直方体。
IoU 3D (Intersection over Union)
3D検出の評価指標であり、予測されたバウンディングボックスと実際のバウンディングボックスの交差体積と和集合体積の比率を計算する。
LiDAR (Light Detection and Ranging)
レーザーパルスを発射し、その反射の戻り時間を計測して、環境の正確な3D点群を生成するアクティブな測距技術。
Monocular 3D Object Detection
幾何学的および文脈的な手がかりに基づいて、単一の2D画像からオブジェクトの3D位置、サイズ、および向きを推定するタスク。
ステレオビジョン
キャリブレーションされた2つ以上のカメラを使用して人間の視覚をシミュレートし、画像の視差から三角測量によって奥行きを計算する手法。
PointNet
構造化されていない点群を直接処理するために設計された、点の集合に対して対称関数を学習する先駆的なディープニューラルネットワーク。
レンジイメージ
各ピクセルが測定された距離を格納する深度センサーデータの2D表現であり、画像に似ているが、強度の代わりに距離(レンジ)が用いられる。
アンカーベース3D検出
空間内の異なるサイズと向きを持つ3Dボックス(アンカー)の事前定義されたグリッドに対するオフセットを予測する検出アプローチ。
センターベース3D検出
各オブジェクトの中心とそのプロパティ(サイズ、向き)を直接予測する検出パラダイムであり、後処理を簡素化し、複雑なIoU計算を回避する。