🏠 ホーム
ベンチマーク
📊 すべてのベンチマーク 🦖 恐竜 v1 🦖 恐竜 v2 ✅ To-Doリストアプリ 🎨 クリエイティブフリーページ 🎯 FSACB - アルティメットショーケース 🌍 翻訳ベンチマーク
モデル
🏆 トップ10モデル 🆓 無料モデル 📋 すべてのモデル ⚙️ 🛠️ Kilo Code モード
リソース
💬 💬 プロンプトライブラリ 📖 📖 AI用語集 🔗 🔗 有用なリンク
📖
Batch Constrained Q-learning (BCQ)

暗黙的Q学習

分布外の行動の直接評価を回避することで、暗黙的にQ関数を学習する手法。IQLは、オフラインデータの不確実性をより適切に扱うために、期待値分位点学習問題として学習を定式化する。

← 戻る