AI用語集
人工知能の完全辞典
線形重み付け
スカラー化手法の一種で、目的関数を重み付き和で組み合わせる。重みは意思決定者の好みに応じて各目的の相対的重要性を表す。
多目的Q学習
従来のQ学習の拡張版で、各アクションがスカラー値の代わりにQ値ベクトルを持つ。トレードオフに特化したアクション選択基準が必要。
非支配ポリシー
ポリシー空間における行動戦略で、その性能が他のどのポリシーによっても全ての目的で同時に上回られないもの。パレート最適性を保証する。
スカラー化超平面
目的空間で超平面を使用して解をスカラー次元に射影する技術。定義済みの方向に従ってトレードオフの構造的探索を可能にする。
チェビシェフスカラー化
基準点からの重み付きチェビシェフ距離に基づくスカラー化手法。非凸問題であってもパレート最適解の取得を保証する。
多目的リワードシェーピング
最終的な多目的ポリシーの最適性を維持しつつ、学習を加速するためにベクトル報酬関数を変更する技術。
動的トレードオフ
学習中に目的間の重みや好みを適応させる方法。環境の進化に応じてトレードオフ空間の柔軟な探索を可能にする。
事前好み
意思決定者の好みが最適化プロセスの前に指定されるアプローチ。探索をパレートフロントの特定領域へ導く。
事後的選好
まず完全なパレート最適解集合を生成し、可視化と分析の後に意思決定者が好ましい解を選択できるようにする戦略。
参照点法
目的空間内の参照点を使用して、望ましい性能レベルに達するまたは超える解へと探索を導く技術。
ユートピアベクトル
個々の目的を同時に最適化する目的空間内の理論的点で、スカラー化法におけるトレードオフを評価するための参照として使用される。
チェビシェフ距離
成分間の絶対差の最大値を使用するメトリクスで、特に多目的最適化における目標への偏差を測定するのに適している。
増強スカラー化
目標への最小偏差に基づく罰則項を追加した線形重み付けの拡張で、厳密にパレート最適な解の取得を保証する。
集約関数
複数の目的値を1つのスカラー値に組み合わせる数学的演算で、多目的空間内の解を評価・比較する基準として機能する。
妥協方策
定義された選好に従って矛盾する目的を明示的に均衡させる行動戦略で、多くの場合適応的重みまたは動的制約を通じて実装される。
多目的ナッシュ均衡
各エージェントが相互均衡制約の下で自身の目的ベクトルを最適化する多目的文脈にナッシュ均衡を拡張した概念。