DeepLabによるセグメンテーション

📖

用語

空洞畳み込み (または Atrous Convolution)

カーネルの要素間に空白を挿入する畳み込み演算で、パラメータ数や計算量を増やすことなく受容野を拡大することができます。

📖

用語

膨張率 (Dilation Rate)

空洞畳み込みのパラメータで、畳み込みカーネルのピクセル間の間隔を定義し、受容野の拡大を直接制御します。

📖

用語

Atrous Convolutionを用いたエンコーダ-デコーダ

DeepLabv3+のアーキテクチャで、強力なエンコーダ（例：ResNet）とシンプルかつ効率的なデコーダを組み合わせ、エッジの詳細を保ちながらセグメンテーションの予測を微調整します。

📖

用語

解像度低減率 (Output Stride)

入力画像の解像度と最終的な特徴マップの解像度の比率。DeepLabでは、精度と速度のバランスを取るために、通常16または8の'output stride'が使用されます。

📖

用語

画像レベルの特徴量 (Image-Level Features)

画像全体から抽出されるグローバルな特徴量で、多くの場合グローバルプーリングを通じて行われ、DeepLabのASPPモジュールに統合されてコンテキストクラスの分類を向上させます。

📖

用語

DeepLabv1

DeepLabの最初のバージョンで、セマンティックセグメンテーションのために完全畳み込みネットワーク（FCN）における空洞畳み込みの使用を導入し、解像度を損なうことなく受容野を拡大しました。

📖

用語

DeepLabv2

マルチスケールのコンテキストを効果的に捉えるためにAtrous Spatial Pyramid Pooling (ASPP)モジュールを統合したDeepLabのバージョンで、セマンティックセグメンテーションの標準的な手法となりました。

📖

用語

DeepLabv3

グローバルプーリングと1x1畳み込みを追加してASPPモジュールを改良し、より良いパフォーマンスのために空洞畳み込みのカスケード適用を検討したバージョンです。

📖

用語

DeepLabv3+

DeepLabv3のアーキテクチャにシンプルかつ効果的なデコーダを追加し、低レベルおよび高レベルの特徴を融合させることでセグメンテーションの予測を精緻化した、最新のメジャーバージョン。

📖

用語

全結合条件付き確率場 (CRF)

画像内の全ピクセル間の関係をモデル化することで、セグメンテーション予測の境界線を精緻化するために、DeepLabの初期バージョンで使用された後処理手法。

📖

用語

バイリニア補間によるアップサンプリング

拡張畳み込みの後に特徴マップの空間解像度を復元し、入力画像と同じサイズのセグメンテーションマップを生成するためにDeepLabで使用される手法。

📖

用語

コンテキストの集約

拡張畳み込みとASPPモジュールを用いて、様々な空間的範囲のコンテキスト情報を集約し、より堅牢な予測を実現するためのDeepLabの基本原理。

AI用語集