深層強化学習 - AI用語集

📂

サブカテゴリ

ディープQネットワーク（DQN）

複雑な状態空間でQ値関数を近似するために、Q学習と深層ニューラルネットワークを組み合わせた画期的なアルゴリズム。

18 用語

📂

サブカテゴリ

政策勾配法

期待報酬の勾配に従って直接方策を最適化する強化学習アプローチ

18 用語

📂

サブカテゴリ

アクター・クリティック手法

ポリシーを学習するアクターと状態や行動の価値を評価するクリティックを組み合わせたハイブリッドアーキテクチャ。

8 用語

📂

サブカテゴリ

ディープ・ディターミニスティック・ポリシー・グラディエント (DDPG)

連続行動空間を持つ環境のための、ディープニューラルネットワークを使用するActor-Criticオフポリシーアルゴリズム

9 用語

📂

サブカテゴリ

近接方策最適化 (PPO)

信頼領域内で更新を維持することで学習の安定性を確保する方策最適化手法。

11 用語

📂

サブカテゴリ

信頼領域方策最適化 (TRPO)

新しい方策が古い方策からあまり離れすぎないことを保証する制約最適化アルゴリズム。

8 用語

📂

サブカテゴリ

マルチエージェント深層強化学習

深層強化学習の拡張版で、複数のエージェントが共有環境で協力または競争しながら同時に学習するものです。

20 用語

📂

サブカテゴリ

階層的強化学習

階層レベルで学習を構造化するアプローチで、メタポリシーが専門化されたサブポリシーを制御します。

20 用語

📂

サブカテゴリ

モデルベース深層強化学習

エージェントが環境のモデルを学習し、より効果的に計画・意思決定を行う技術。

19 用語

📂

サブカテゴリ

分布強化学習

リターンの期待値だけでなく、完全な分布を学習することでより良い堅牢性を実現するパラダイム。

18 用語

📂

サブカテゴリ

好奇心駆動型強化学習

好奇心に基づいて内在的報酬を受け取り、効率的に環境を探索するアプローチ

16 用語

📂

サブカテゴリ

強化学習におけるメタ学習

少量の経験で新しいタスクを迅速に学習できるようにエージェントに学習させる技術。

18 用語

AI用語集

ディープQネットワーク（DQN）

政策勾配法

アクター・クリティック手法

ディープ・ディターミニスティック・ポリシー・グラディエント (DDPG)

近接方策最適化 (PPO)

信頼領域方策最適化 (TRPO)

マルチエージェント深層強化学習

階層的強化学習

モデルベース深層強化学習

分布強化学習

好奇心駆動型強化学習

強化学習におけるメタ学習

結果が見つかりません