🏠 Trang chủ
Benchmark
📊 Tất cả benchmark 🦖 Khủng long v1 🦖 Khủng long v2 ✅ Ứng dụng To-Do List 🎨 Trang tự do sáng tạo 🎯 FSACB - Trình diễn cuối cùng 🌍 Benchmark dịch thuật
Mô hình
🏆 Top 10 mô hình 🆓 Mô hình miễn phí 📋 Tất cả mô hình ⚙️ Kilo Code
Tài nguyên
💬 Thư viện prompt 📖 Thuật ngữ AI 🔗 Liên kết hữu ích

Thuật ngữ AI

Từ điển đầy đủ về Trí tuệ nhân tạo

162
danh mục
2.032
danh mục con
23.060
thuật ngữ
📖
thuật ngữ

Covariance Function

Kernel function defining similarity between points in a Gaussian process, determining the correlation structure and smoothing properties of the model.

📖
thuật ngữ

GP-MDP

Markov decision process where rewards or transitions are modeled by Gaussian processes, integrating uncertainty into the RL problem formulation.

📖
thuật ngữ

Thompson Sampling with GP

Action sampling method based on draws from the Gaussian process posterior, enabling exploration guided by uncertainty.

📖
thuật ngữ

GP-SARSA

Variant of the SARSA algorithm using Gaussian processes to model the Q-value function with uncertainty in reinforcement learning.

📖
thuật ngữ

RBF Kernel

Gaussian radial basis function used as covariance in GPs, ensuring continuity and differentiability of modeled functions.

📖
thuật ngữ

GPQ

Q-function approximated by Gaussian process, allowing quantification of uncertainty on value estimates in reinforcement learning.

📖
thuật ngữ

GP-PILCO

RL framework using Gaussian processes to learn system dynamics with analytical propagation of uncertainty.

📖
thuật ngữ

Contextual Bandit with GP

Bandit problem where rewards depend on a context, modeled by Gaussian processes to capture spatial uncertainty.

📖
thuật ngữ

GP-MCTS

Monte Carlo Tree Search utilisant des processus gaussiens pour évaluer les nœuds avec incertitude, améliorant la recherche dans RL.

📖
thuật ngữ

GP-MAE

Maximum a Posteriori avec estimation de l'incertitude par processus gaussiens pour l'estimation de politique en apprentissage par renforcement.

🔍

Không tìm thấy kết quả