AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
サブカテゴリ
POMDP(部分観測マルコフ決定過程)
エージェントがシステムの実際の状態を部分的にしか観測できない環境をモデル化する形式的数学的枠組み。
13 用語
サブカテゴリ
信念状態
エージェントの観測と行動の履歴に基づく、システムの可能な状態の確率的表現。
13 用語
サブカテゴリ
粒子フィルター
POMDPにおける信念分布を近似するために重み付けサンプルを使用する逐次推定法。
12 用語
サブカテゴリ
部分的観察可能Q学習
完全な状態が直接観察できない環境に適応したQ学習アルゴリズムの拡張
16 用語
サブカテゴリ
POMDPのためのリカレントニューラルネットワーク
履歴情報を維持する内部メモリを使用したニューラルネットワークアーキテクチャによる意思決定
13 用語
サブカテゴリ
POMDPにおける探索
部分観測可能環境における状態の不確実性を管理するために特別に設計された探索戦略。
16 用語
サブカテゴリ
POMDPのための階層的強化学習
複雑なPOMDP問題を階層的なサブタスクに分解し、学習効率を向上させるアプローチ。
20 用語
サブカテゴリ
メモリベースモデル
関連する過去の情報を格納・取得するために明示的な外部メモリを使用するシステム。
10 用語
サブカテゴリ
部分的観察可能なマルチエージェント学習
複数のエージェントが部分的に観察可能な環境で相互作用するシナリオへのPOMDPの拡張
17 用語
サブカテゴリ
POMDPのための政策近似
高次元信念状態空間における最適または準最適な政策を計算するための近似手法
19 用語
サブカテゴリ
Deep POMDP
複雑で高次元な環境を扱うために、深層学習とPOMDPを組み合わせたもの。
17 用語
サブカテゴリ
POMDPのためのトランスフォーマー
部分観測可能環境における長期的時間依存性をモデル化するためのトランスフォーマーアーキテクチャの応用
9 用語
🔍