🏠 홈
벤치마크
📊 모든 벤치마크 🦖 공룡 v1 🦖 공룡 v2 ✅ 할 일 목록 앱 🎨 창의적인 자유 페이지 🎯 FSACB - 궁극의 쇼케이스 🌍 번역 벤치마크
모델
🏆 톱 10 모델 🆓 무료 모델 📋 모든 모델 ⚙️ 킬로 코드 모드
리소스
💬 프롬프트 라이브러리 📖 AI 용어 사전 🔗 유용한 링크

AI 용어집

인공지능 완전 사전

162
카테고리
2,032
하위 카테고리
23,060
용어
📖
용어

Apprentissage par Renforcement Quantique

Paradigme d'apprentissage qui intègre les principes de la mécanique quantique, comme la superposition et l'intrication, pour améliorer l'efficacité et la vitesse de convergence des algorithmes de renforcement classique.

📖
용어

Variational Quantum Algorithm (VQA) pour le RL

Approche hybride utilisant un circuit quantique paramétré (VQC) pour approximer la politique ou la fonction de valeur, avec les paramètres optimisés par un algorithme classique basé sur le gradient.

📖
용어

Amplitude Amplification en RL

Technique inspirée de l'algorithme de Grover utilisée pour amplifier les amplitudes de probabilité des actions ou des états les plus prometteurs, accélérant ainsi la découverte de la politique optimale.

📖
용어

Quantum State Value Function

Fonction qui associe une valeur scalaire à chaque état quantique possible de l'environnement, encodée dans l'amplitude ou la phase d'un qubit, et évaluée via des opérations quantiques.

📖
용어

Quantum Action-Value Function (Q-fonction quantique)

Généralisation de la Q-fonction classique où les valeurs sont représentées et manipulées dans un registre quantique, permettant une évaluation et une mise à jour plus efficaces sur un espace d'actions potentiellement exponentiel.

📖
용어

Quantum Policy Gradient (QPG)

Algorithme de type gradient de politique où le calcul du gradient et la mise à jour des paramètres de la politique quantique sont effectués sur un ordinateur quantique, exploitant la différentiation quantique.

📖
용어

Hamiltonien de Récompense

Opérateur hermitien en mécanique quantique dont les valeurs propres correspondent aux récompenses associées aux états ou aux transitions, utilisé pour guider l'évolution de l'agent quantique.

📖
용어

Quantum Approximate Optimization Algorithm (QAOA) pour le RL

Application du QAOA pour résoudre le problème de l'optimisation de la politique, en encodant l'objectif de maximisation de la récompense cumulative dans un Hamiltonien de coût à minimiser.

📖
용어

State-Action Superposition

Fundamental principle of quantum RL where an agent can simultaneously evaluate a linear combination of state-action pairs, instead of processing them sequentially, to accelerate learning.

📖
용어

Quantum Speedup for Convergence

Acceleration of the convergence rate of an RL algorithm toward the optimal policy, made possible by parallel quantum operations such as quantum search or quantum sampling.

📖
용어

Noise and Decoherence in Quantum RL

Major challenges where errors due to quantum hardware imperfections and loss of quantum properties (decoherence) can degrade the performance and stability of RL algorithms.

🔍

결과를 찾을 수 없습니다