🏠 Ana Sayfa
Benchmarklar
📊 Tüm Benchmarklar 🦖 Dinozor v1 🦖 Dinozor v2 ✅ To-Do List Uygulamaları 🎨 Yaratıcı Serbest Sayfalar 🎯 FSACB - Nihai Gösteri 🌍 Çeviri Benchmarkı
Modeller
🏆 En İyi 10 Model 🆓 Ücretsiz Modeller 📋 Tüm Modeller ⚙️ Kilo Code
Kaynaklar
💬 Prompt Kütüphanesi 📖 YZ Sözlüğü 🔗 Faydalı Bağlantılar

YZ Sözlüğü

Yapay Zekanın tam sözlüğü

162
kategoriler
2.032
alt kategoriler
23.060
terimler
📖
terimler

Apprentissage par Renforcement Quantique

Paradigme d'apprentissage qui intègre les principes de la mécanique quantique, comme la superposition et l'intrication, pour améliorer l'efficacité et la vitesse de convergence des algorithmes de renforcement classique.

📖
terimler

Variational Quantum Algorithm (VQA) pour le RL

Approche hybride utilisant un circuit quantique paramétré (VQC) pour approximer la politique ou la fonction de valeur, avec les paramètres optimisés par un algorithme classique basé sur le gradient.

📖
terimler

Amplitude Amplification en RL

Technique inspirée de l'algorithme de Grover utilisée pour amplifier les amplitudes de probabilité des actions ou des états les plus prometteurs, accélérant ainsi la découverte de la politique optimale.

📖
terimler

Quantum State Value Function

Fonction qui associe une valeur scalaire à chaque état quantique possible de l'environnement, encodée dans l'amplitude ou la phase d'un qubit, et évaluée via des opérations quantiques.

📖
terimler

Quantum Action-Value Function (Q-fonction quantique)

Généralisation de la Q-fonction classique où les valeurs sont représentées et manipulées dans un registre quantique, permettant une évaluation et une mise à jour plus efficaces sur un espace d'actions potentiellement exponentiel.

📖
terimler

Quantum Policy Gradient (QPG)

Algorithme de type gradient de politique où le calcul du gradient et la mise à jour des paramètres de la politique quantique sont effectués sur un ordinateur quantique, exploitant la différentiation quantique.

📖
terimler

Hamiltonien de Récompense

Opérateur hermitien en mécanique quantique dont les valeurs propres correspondent aux récompenses associées aux états ou aux transitions, utilisé pour guider l'évolution de l'agent quantique.

📖
terimler

Quantum Approximate Optimization Algorithm (QAOA) pour le RL

Application du QAOA pour résoudre le problème de l'optimisation de la politique, en encodant l'objectif de maximisation de la récompense cumulative dans un Hamiltonien de coût à minimiser.

📖
terimler

State-Action Superposition

Fundamental principle of quantum RL where an agent can simultaneously evaluate a linear combination of state-action pairs, instead of processing them sequentially, to accelerate learning.

📖
terimler

Quantum Speedup for Convergence

Acceleration of the convergence rate of an RL algorithm toward the optimal policy, made possible by parallel quantum operations such as quantum search or quantum sampling.

📖
terimler

Noise and Decoherence in Quantum RL

Major challenges where errors due to quantum hardware imperfections and loss of quantum properties (decoherence) can degrade the performance and stability of RL algorithms.

🔍

Sonuç bulunamadı