AI用語集
人工知能の完全辞典
完全畳み込みネットワーク (FCN)
全結合層を畳み込み層に置き換え、入力画像と同じサイズのセグメンテーションマップを生成する畳み込みニューラルネットワークのアーキテクチャ。
DeepLab
空間解像度を損失することなく受容野を拡張するために拡張(atrous)畳み込みを使用するセマンティックセグメンテーションモデルのファミリー。
拡張畳み込み (Dilated Convolution)
カーネルのピクセル間にスペースを挿入して受容野を増やし、より大規模な文脈を捉える畳み込み操作。
ピラミッドシーン解析ネットワーク (PSPNet)
最終的な予測の前にピラミッドプーリングモジュールを使用して、異なるスケールでグローバルなコンテキスト情報を統合するモデル。
ピクセル精度
画像内の全ピクセル数に対して正しく分類されたピクセルの比率を計算する単純なパフォーマンスメトリック。
平均IoU (mIoU)
全セグメンテーションクラスで計算されたIoUの平均値で、モデルのパフォーマンスの包括的な評価を提供する。
Softmax活性化
最終層に適用され、各ピクセルのクラススコアを確率分布に変換する活性化関数。
Dice損失
Dice係数に基づいた代替損失関数で、セグメンテーションタスクでのクラス不均衡を扱うのに特に効果的。
コンテキストモジュール
長距離の文脈情報を捉えるために設計されたネットワークコンポーネントで、正確なセマンティックセグメンテーションに不可欠。
境界の洗練
セグメント化されたオブジェクトの輪郭の精度を向上させることを目指す追加の技術またはモジュール。標準的な方法の弱点となることが多い。
クラス不均衡
セグメンテーションにおける一般的な問題で、一部のクラスが他のクラスよりはるかに少ないピクセルしか占めない場合、適応したトレーニング戦略が必要になる。
難しいピクセルマイニング
収束を加速させ、パフォーマンスを向上させるために、分類が困難なピクセル(不正確に予測されたもの)に焦点を当てるトレーニング戦略。
セマンティックあいまいさ
同じピクセルがセマンティック的に近い複数のクラスに属する可能性がある課題で、一意の分類を問題にする。
パノプティックセグメンテーション
セマンティックセグメンテーション(クラス)とインスタンスセグメンテーション(個別のオブジェクト)を一貫した単一の予測に統合する統合タスク。