MARL 部分観測可能
POMDP(部分観測マルコフ決定過程)
エージェントが実際の状態の部分的な観測しか知覚できない環境をモデル化する理論的枠組み。最適な意思決定を行うために、隠れた状態に関する確率的推論が必要とされる。
← 戻るエージェントが実際の状態の部分的な観測しか知覚できない環境をモデル化する理論的枠組み。最適な意思決定を行うために、隠れた状態に関する確率的推論が必要とされる。
← 戻る