🏠 홈
벤치마크
📊 모든 벤치마크 🦖 공룡 v1 🦖 공룡 v2 ✅ 할 일 목록 앱 🎨 창의적인 자유 페이지 🎯 FSACB - 궁극의 쇼케이스 🌍 번역 벤치마크
모델
🏆 톱 10 모델 🆓 무료 모델 📋 모든 모델 ⚙️ 킬로 코드 모드
리소스
💬 프롬프트 라이브러리 📖 AI 용어 사전 🔗 유용한 링크

AI 용어집

인공지능 완전 사전

162
카테고리
2,032
하위 카테고리
23,060
용어
📂
하위 카테고리

Deep Q-Networks (DQN)

Pioneering algorithm combining Q-learning with deep neural networks to approximate the Q-value function in complex state spaces.

18 용어
📂
하위 카테고리

Policy Gradient Methods

Reinforcement learning approaches that directly optimize the policy by following the gradient of expected rewards.

18 용어
📂
하위 카테고리

Actor-Critic Methods

Hybrid architecture combining an actor that learns the policy and a critic that evaluates the value of states or actions.

8 용어
📂
하위 카테고리

Deep Deterministic Policy Gradient (DDPG)

Off-policy actor-critic algorithm for environments with continuous action spaces using deep neural networks.

9 용어
📂
하위 카테고리

Proximal Policy Optimization (PPO)

Policy optimization method that maintains updates in a trust region to ensure learning stability.

11 용어
📂
하위 카테고리

Trust Region Policy Optimization (TRPO)

Constrained optimization algorithm that ensures new policies do not deviate too much from old policies.

8 용어
📂
하위 카테고리

Multi-Agent Deep RL

Extension of deep RL where multiple agents learn simultaneously, in cooperation or competition in a shared environment.

20 용어
📂
하위 카테고리

Hierarchical Reinforcement Learning

Approach structuring learning in hierarchical levels with meta-policies controlling specialized sub-policies.

20 용어
📂
하위 카테고리

Model-Based Deep RL

Technique where the agent learns a model of the environment to plan and make more efficient decisions.

19 용어
📂
하위 카테고리

Distributional RL

Paradigm learning the complete distribution of returns rather than just their expectation for better robustness.

18 용어
📂
하위 카테고리

Curiosity-Driven RL

Approach where the agent receives intrinsic rewards based on its curiosity to efficiently explore the environment.

16 용어
📂
하위 카테고리

Meta-Learning in RL

Technique that allows agents to learn to learn quickly on new tasks with few experiences.

18 용어
🔍

결과를 찾을 수 없습니다