🏠 ホーム
ベンチマーク
📊 すべてのベンチマーク 🦖 恐竜 v1 🦖 恐竜 v2 ✅ To-Doリストアプリ 🎨 クリエイティブフリーページ 🎯 FSACB - アルティメットショーケース 🌍 翻訳ベンチマーク
モデル
🏆 トップ10モデル 🆓 無料モデル 📋 すべてのモデル ⚙️ 🛠️ Kilo Code モード
リソース
💬 💬 プロンプトライブラリ 📖 📖 AI用語集 🔗 🔗 有用なリンク

AI用語集

人工知能の完全辞典

236
カテゴリ
3,245
サブカテゴリ
39,334
用語
📖
用語

微分可能モデルベース強化学習

微分可能な環境モデルを通じて勾配を逆伝播させ、ポリシーを直接最適化する強化学習アプローチ。

📖
用語

ニューラルネットワーク動力学モデル

アクションに基づいて環境の状態遷移を予測するよう訓練されたニューラルネットワークで、微分可能なシミュレーションを可能にする。

📖
用語

微分可能最適化

最適化層が微分可能であり、入れ子になった最適化プロセスのエンドツーエンド学習を可能にする手法。

📖
用語

想像エクスペリエンスリプレイ

実際の対話なしに学習エクスペリエンスを豊かにするため、微分可能モデルを通じて合成軌跡を生成すること。

📖
用語

微分可能プランニング

各ステップが微分可能で、勾配降下法による計画の連続的最適化を可能にするプランニングアルゴリズム。

📖
用語

微分可能シミュレータ

微分可能な操作で実装されたシミュレーション環境で、シミュレーション全体を通じて勾配計算を可能にする。

📖
用語

モデルを通じたポリシーグラディエント

微分可能な環境モデルを通じて報酬を伝播させ、ポリシーの勾配を計算する手法。

📖
用語

微分可能環境モデル

内部操作を通じて勾配の逆伝播をサポートするよう特別に設計された環境モデル。

📖
用語

微分可能ゲームエンジン

微分化をサポートするために変更されたゲームエンジンで、複雑な環境で強化学習を可能にします。

📖
用語

強化学習におけるニューラルODE

環境の連続力学を微分可能な方法でモデリングするために、ニューラル常微分方程式を使用します。

📖
用語

微分可能制御理論

エンドツーエンドのコントローラ学習のために、微分可能な方法で実装された理論的制御原理の適用です。

🔍

結果が見つかりません