連続的で微分可能なモデル

📖

用語

微分可能遷移モデル

連続システムの状態の変化を記述する数学的関数であり、強化学習アルゴリズムにおける勾配降下法による最適化を可能にするために微分可能に設計されています。

📖

用語

確率常微分方程式

ランダムノイズ項を統合した微分方程式のシステムであり、学習に必要な微分可能性を保ちながら、連続環境の不確実なダイナミクスをモデル化するために使用されます。

📖

用語

微分可能数値積分器

実装が微分可能な数値計算手法（例：オイラー法、ルンゲ・クッタ法）であり、時間シミュレーションのステップを通じて勾配を伝播させ、ダイナミクスモデルの最適化を可能にします。

📖

用語

放射基底関数（RBF）ニューラルネットワーク

放射基底関数を活性化関数として使用するニューラルネットワークアーキテクチャであり、ダイナミクスモデリングのための連続的で微分可能な関数の近似に特に適しています。

📖

用語

最適化軌道計画法

微分可能なモデルを使用してアクションシーケンスを直接最適化し、期待報酬の勾配に基づいて更新を行う軌道空間での計画手法です。

📖

用語

ハミルトンシステムによるモデリング

ハミルトンシステムのエネルギー保存原理に基づいた連続ダイナミクスのモデリング手法であり、長期的な安定性と微分可能性の特性を保証します。

📖

用語

時間を超えた自動微分

連続シミュレーションの時間ステップを通じて逆伝播を伝播させる勾配計算手法であり、微分可能なダイナミクスモデルの訓練に不可欠です。

📖

用語

時間ガウス過程モデル（TGPM）

連続時系列のモデリングのためのガウス過程の拡張であり、強化学習における最適化のために微分可能性を維持しながら、較正された不確実性を提供します。

📖

用語

微分可能ニューラルコントローラー

入力状態の微分可能な関数として出力を持つ制御ポリシーを実装するニューラルネットワークで、モデルベースの枠組みで動力学モデルとの共同最適化を可能にします。

📖

用語

微分可能マルチシューティング法

連続システムの境界値問題を解くアルゴリズムで、微分可能になるように適応され、強化学習の軌道におけるパラメータ最適化を可能にします。

📖

用語

基底関数状態空間モデル

状態遷移が微分可能な基底関数の線形結合によって近似される連続力学の表現で、モデルパラメータの解析的最適化を容易にします。

📖

用語

微分可能モデルによる政策最適化（DMPO）

微分可能な動力学モデルを通じて勾配が計算される政策最適化の変種で、連続環境においてモデルベースとモデルフリーの両方の利点を組み合わせます。

📖

用語

学習された動力学方程式（LDE）

システムの動力学を記述する微分方程式のパラメータが最適化によって学習される数学的定式化で、元の方程式の微分可能な構造を維持します。

📖

用語

微分可能ハイブリッド連続・離散モデル

微分可能な連続成分と離散イベントを組み合わせるモデリングアーキテクチャで、遷移が滑らかにされ、システム全体の微分可能性を維持します。

📖

用語

微分可能積分による状態予測

操作自体が微分可能な数値積分を使用して将来の状態を予測するプロセスで、モデルパラメータに関する予測の勾配を計算できます。

📖

用語

物理インフォームドニューラルネットワーク（PINN）

物理学から得られた微分方程式を損失関数に統合するニューラルアーキテクチャで、学習されたモデルが保存法則を尊重しながら微分可能なままであることを保証します。

📖

用語

微分可能配置法

連続システムにおける制約付き最適化問題を解決するための技術で、配置制約を微分可能な関数として定式化し、ポリシー学習に使用します。

📖

用語

ナビエ・ストークス方程式による遷移モデル

適切な離散化によって微分可能にされたナビエ・ストークス方程式を使用して、連続的な強化学習環境における流体力学をモデリングします。

📖

用語

微分可能拡張ラグランジュ法

状態変数と制御変数に対して拡張ラグランジュ関数が微分可能である制約付き最適化手法で、強化学習ループでの使用を可能にします。

AI用語集