AI用語集
人工知能の完全辞典
空洞畳み込み (または Atrous Convolution)
カーネルの要素間に空白を挿入する畳み込み演算で、パラメータ数や計算量を増やすことなく受容野を拡大することができます。
膨張率 (Dilation Rate)
空洞畳み込みのパラメータで、畳み込みカーネルのピクセル間の間隔を定義し、受容野の拡大を直接制御します。
Atrous Convolutionを用いたエンコーダ-デコーダ
DeepLabv3+のアーキテクチャで、強力なエンコーダ(例:ResNet)とシンプルかつ効率的なデコーダを組み合わせ、エッジの詳細を保ちながらセグメンテーションの予測を微調整します。
解像度低減率 (Output Stride)
入力画像の解像度と最終的な特徴マップの解像度の比率。DeepLabでは、精度と速度のバランスを取るために、通常16または8の'output stride'が使用されます。
画像レベルの特徴量 (Image-Level Features)
画像全体から抽出されるグローバルな特徴量で、多くの場合グローバルプーリングを通じて行われ、DeepLabのASPPモジュールに統合されてコンテキストクラスの分類を向上させます。
DeepLabv1
DeepLabの最初のバージョンで、セマンティックセグメンテーションのために完全畳み込みネットワーク(FCN)における空洞畳み込みの使用を導入し、解像度を損なうことなく受容野を拡大しました。
DeepLabv2
マルチスケールのコンテキストを効果的に捉えるためにAtrous Spatial Pyramid Pooling (ASPP)モジュールを統合したDeepLabのバージョンで、セマンティックセグメンテーションの標準的な手法となりました。
DeepLabv3
グローバルプーリングと1x1畳み込みを追加してASPPモジュールを改良し、より良いパフォーマンスのために空洞畳み込みのカスケード適用を検討したバージョンです。
DeepLabv3+
DeepLabv3のアーキテクチャにシンプルかつ効果的なデコーダを追加し、低レベルおよび高レベルの特徴を融合させることでセグメンテーションの予測を精緻化した、最新のメジャーバージョン。
全結合条件付き確率場 (CRF)
画像内の全ピクセル間の関係をモデル化することで、セグメンテーション予測の境界線を精緻化するために、DeepLabの初期バージョンで使用された後処理手法。
バイリニア補間によるアップサンプリング
拡張畳み込みの後に特徴マップの空間解像度を復元し、入力画像と同じサイズのセグメンテーションマップを生成するためにDeepLabで使用される手法。
コンテキストの集約
拡張畳み込みとASPPモジュールを用いて、様々な空間的範囲のコンテキスト情報を集約し、より堅牢な予測を実現するためのDeepLabの基本原理。