🏠 홈
벤치마크
📊 모든 벤치마크 🦖 공룡 v1 🦖 공룡 v2 ✅ 할 일 목록 앱 🎨 창의적인 자유 페이지 🎯 FSACB - 궁극의 쇼케이스 🌍 번역 벤치마크
모델
🏆 톱 10 모델 🆓 무료 모델 📋 모든 모델 ⚙️ 킬로 코드 모드
리소스
💬 프롬프트 라이브러리 📖 AI 용어 사전 🔗 유용한 링크

AI 용어집

인공지능 완전 사전

162
카테고리
2,032
하위 카테고리
23,060
용어
📂
하위 카테고리

Multi-Armed Bandits

Fundamental problem where an agent chooses among several options with random rewards to maximize cumulative gain.

16 용어
📂
하위 카테고리

Contextual Bandits

Extension of bandits where rewards depend on an observable context, enabling personalized adaptive decisions.

15 용어
📂
하위 카테고리

Combinatorial Bandits

Variant where the agent must select combinations of actions simultaneously with complex constraints and rewards.

16 용어
📂
하위 카테고리

Linear Bandits

Approach where rewards are modeled as linear functions of action features or context.

11 용어
📂
하위 카테고리

Non-Stationary Bandits

Scenario where reward distributions change over time, requiring adaptive algorithms.

12 용어
📂
하위 카테고리

Bandits with Delay

Problem where rewards are only observed after a delay, complicating the attribution of actions to outcomes.

17 용어
📂
하위 카테고리

Adversarial Bandits

Model where rewards are generated by an adversary rather than a stochastic process.

16 용어
📂
하위 카테고리

Bayesian Bandits

Approach using Bayesian inference to model uncertainty about reward distributions.

12 용어
📂
하위 카테고리

Hierarchical Bandits

Multi-level structure where decisions are organized hierarchically to efficiently explore large action spaces.

17 용어
📂
하위 카테고리

Bandits with Constraints

Constrained optimization where the agent must maximize rewards while respecting certain limitations.

20 용어
📂
하위 카테고리

Bandits for Recommendation

Specific application to recommendation systems for balancing exploration and exploitation of content.

8 용어
📂
하위 카테고리

Online Bandits

Continuous learning where the agent adapts in real-time to new information without a prior training phase.

9 용어
🔍

결과를 찾을 수 없습니다