RLのためのグラフィカルモデル

📖

用語

状態遷移グラフ

環境の状態をノードとし、有向エッジが状態間の可能な遷移を表すグラフ表現。通常、確率によって重み付けされる。

📖

用語

グラフベースの動力学モデル

環境の動力学（遷移関数と報酬関数）をグラフ構造に直接エンコードし、軌道のシミュレーションを可能にするモデル。

📖

用語

RLのための因果グラフ

状態変数、行動、報酬間の因果関係を表現する有向非巡回グラフ（DAG）。意思決定の影響を理解するのに役立つ。

📖

用語

計画のための信念ネットワーク

環境の不確実性をベイジアンネットワークでモデル化し、エージェントの計画が最適な行動を推論することからなる。

📖

用語

オブジェクト関係グラフ

環境内のオブジェクトをノードとし、エッジがそれらの空間的または意味的関係を記述するグラフ。より構造化された学習に使用される。

📖

用語

グラフ後継者マップ

各状態-行動に対して可能な後続状態とその確率を保存するグラフ構造。グラフベースのモデルにおける計画の基礎を形成する。

📖

用語

状態値グラフ

ノードが状態で、各ノードの重みがその推定値（V(s)）に対応するグラフ。環境全体での値の伝播を視覚化できる。

📖

用語

シーングラフ形式の世界モデル

環境をシーングラフとして表現。各ノードがオブジェクトの構成で、エッジがこれらの構成間の可能な変換を表す。

📖

用語

変数相互依存グラフ

状態遷移時に異なる状態変数が互いにどのように影響し合うかを捉えるグラフで、動力学の正確なモデリングに不可欠です。

📖

用語

グラフィカル決定木

アクションシーケンスのための決定木と各決定の複雑な結果を表現するためのサブグラフを組み合わせたハイブリッド構造です。

📖

用語

エージェントナビゲーショングラフ

ノードが領域や関心点、エッジがナビゲート可能な経路となる状態空間の抽象グラフで、高レベルの計画を簡略化します。

📖

用語

強化学習のための情報フローネットワーク

報酬や隠れ状態に関する情報などが、時間と状態空間を通じてどのように伝播するかをモデル化する有向グラフです。

📖

用語

方策グラフ

確率的方策π(a|s)をグラフ形式で表現したもので、ノードが状態、出力エッジが可能なアクションとその確率です。

📖

用語

強化学習のための因子グラフィカルモデル

遷移関数や報酬関数を、それぞれサブグラフで表現される局所的因子の積に分解し、学習効率を向上させるモデルです。

📖

用語

イベント共起グラフ

特定のイベントや状態遷移が同時に発生する確率を捉える無向グラフで、構造的パターンの特定に役立ちます。

📖

用語

反事実的推論グラフ

ノードやエッジを変更して実行されなかった代替アクションの影響をシミュレートし、仮説シナリオ（もしも）を探索するために使用されるグラフです。

📖

用語

階層的タスク分解グラフ

ノードがサブタスクを表し、エッジが依存関係を定義する有向非巡回グラフ（DAG）で、RLにおける複雑な問題の解決を構造化するもの。

AI用語集