🏠 Trang chủ
Benchmark
📊 Tất cả benchmark 🦖 Khủng long v1 🦖 Khủng long v2 ✅ Ứng dụng To-Do List 🎨 Trang tự do sáng tạo 🎯 FSACB - Trình diễn cuối cùng 🌍 Benchmark dịch thuật
Mô hình
🏆 Top 10 mô hình 🆓 Mô hình miễn phí 📋 Tất cả mô hình ⚙️ Kilo Code
Tài nguyên
💬 Thư viện prompt 📖 Thuật ngữ AI 🔗 Liên kết hữu ích

Thuật ngữ AI

Từ điển đầy đủ về Trí tuệ nhân tạo

162
danh mục
2.032
danh mục con
23.060
thuật ngữ
📂
danh mục con

Conservative Q-Learning (CQL)

Method that penalizes overestimated Q-values to keep the policy close to the data distribution.

18 thuật ngữ
📂
danh mục con

Batch Constrained Q-learning (BCQ)

Approach that constrains actions to remain close to those observed in the dataset to avoid distribution shift.

17 thuật ngữ
📂
danh mục con

Decision Transformer

Transformer architecture that treats offline reinforcement learning as a sequence-to-sequence problem.

11 thuật ngữ
📂
danh mục con

Implicit Q-Learning (IQL)

Method that implicitly learns the Q function without requiring an explicit max operator.

13 thuật ngữ
📂
danh mục con

Model-Based Offline RL

Approach using learned models of the environment to improve out-of-distribution sampling.

10 thuật ngữ
📂
danh mục con

Offline-to-Online Transfer Learning

Techniques for effectively transferring offline learnings to online settings.

6 thuật ngữ
📂
danh mục con

Distributional Offline RL

Methods modeling the full distribution of returns rather than just their mathematical expectation.

13 thuật ngữ
📂
danh mục con

Safe Offline Reinforcement Learning

Approaches ensuring safety when deploying policies learned solely on static data.

11 thuật ngữ
📂
danh mục con

Uncertainty-Aware Offline RL

Methods quantifying epistemic uncertainty to avoid out-of-distribution actions.

17 thuật ngữ
📂
danh mục con

Trajectory Transformer

Transformer model that generates complete trajectories by learning the distribution of state-action-reward sequences.

6 thuật ngữ
📂
danh mục con

Advantage-Weighted Regression (AWR)

Approach weighting regressions based on advantage to improve out-of-distribution action selection.

11 thuật ngữ
📂
danh mục con

Offline Multi-Task Reinforcement Learning

Paradigm for simultaneous learning of multiple tasks from shared batch datasets.

18 thuật ngữ
🔍

Không tìm thấy kết quả