🏠 홈
벤치마크
📊 모든 벤치마크 🦖 공룡 v1 🦖 공룡 v2 ✅ 할 일 목록 앱 🎨 창의적인 자유 페이지 🎯 FSACB - 궁극의 쇼케이스 🌍 번역 벤치마크
모델
🏆 톱 10 모델 🆓 무료 모델 📋 모든 모델 ⚙️ 킬로 코드 모드
리소스
💬 프롬프트 라이브러리 📖 AI 용어 사전 🔗 유용한 링크

AI 용어집

인공지능 완전 사전

162
카테고리
2,032
하위 카테고리
23,060
용어
📂
하위 카테고리

Stochastic Markov Decision Processes

MDP where transitions and rewards follow probabilistic distributions, modeling environmental uncertainty.

17 용어
📂
하위 카테고리

Monte Carlo Methods in RL

Algorithms using repeated random sampling to estimate state-action values in stochastic environments.

14 용어
📂
하위 카테고리

Stochastic Policies

Strategies returning probability distributions over actions rather than deterministic actions.

11 용어
📂
하위 카테고리

Bayesian Reinforcement Learning

Approach handling uncertainty over model parameters using probability distributions.

9 용어
📂
하위 카테고리

Multi-armed Stochastic Bandits

Exploration-exploitation problem where each arm has an unknown stochastic reward distribution.

7 용어
📂
하위 카테고리

Bootstrap Methods in RL

Techniques using resampling to quantify uncertainty in value estimates.

15 용어
📂
하위 카테고리

Gaussian Processes for RL

Using Gaussian processes to model uncertainty in the value or transition function.

10 용어
📂
하위 카테고리

Ensemble Methods in Stochastic RL

Combination of multiple estimators to capture epistemic uncertainty in learning.

19 용어
📂
하위 카테고리

Distributional Reinforcement Learning

Learning the full distribution of returns rather than only their expected value.

5 용어
📂
하위 카테고리

Quantile Regression DRL

Specific approach of distributional RL using quantile regression to model uncertainty.

8 용어
📂
하위 카테고리

Partially Observable Stochastic MDPs

Extension of stochastic MDPs with partial observation, increasing uncertainty about the state.

8 용어
📂
하위 카테고리

Stochastic Optimization in RL

Optimization methods accounting for noise and uncertainty in gradients and updates.

10 용어
🔍

결과를 찾을 수 없습니다