🏠 Strona Główna
Benchmarki
📊 Wszystkie benchmarki 🦖 Dinozaur v1 🦖 Dinozaur v2 ✅ Aplikacje To-Do List 🎨 Kreatywne wolne strony 🎯 FSACB - Ostateczny pokaz 🌍 Benchmark tłumaczeń
Modele
🏆 Top 10 modeli 🆓 Darmowe modele 📋 Wszystkie modele ⚙️ Kilo Code
Zasoby
💬 Biblioteka promptów 📖 Słownik AI 🔗 Przydatne linki

Słownik AI

Kompletny słownik sztucznej inteligencji

162
kategorie
2 032
podkategorie
23 060
pojęcia
📖
pojęcia

Apprentissage par Renforcement Quantique

Paradigme d'apprentissage qui intègre les principes de la mécanique quantique, comme la superposition et l'intrication, pour améliorer l'efficacité et la vitesse de convergence des algorithmes de renforcement classique.

📖
pojęcia

Variational Quantum Algorithm (VQA) pour le RL

Approche hybride utilisant un circuit quantique paramétré (VQC) pour approximer la politique ou la fonction de valeur, avec les paramètres optimisés par un algorithme classique basé sur le gradient.

📖
pojęcia

Amplitude Amplification en RL

Technique inspirée de l'algorithme de Grover utilisée pour amplifier les amplitudes de probabilité des actions ou des états les plus prometteurs, accélérant ainsi la découverte de la politique optimale.

📖
pojęcia

Quantum State Value Function

Fonction qui associe une valeur scalaire à chaque état quantique possible de l'environnement, encodée dans l'amplitude ou la phase d'un qubit, et évaluée via des opérations quantiques.

📖
pojęcia

Quantum Action-Value Function (Q-fonction quantique)

Généralisation de la Q-fonction classique où les valeurs sont représentées et manipulées dans un registre quantique, permettant une évaluation et une mise à jour plus efficaces sur un espace d'actions potentiellement exponentiel.

📖
pojęcia

Quantum Policy Gradient (QPG)

Algorithme de type gradient de politique où le calcul du gradient et la mise à jour des paramètres de la politique quantique sont effectués sur un ordinateur quantique, exploitant la différentiation quantique.

📖
pojęcia

Hamiltonien de Récompense

Opérateur hermitien en mécanique quantique dont les valeurs propres correspondent aux récompenses associées aux états ou aux transitions, utilisé pour guider l'évolution de l'agent quantique.

📖
pojęcia

Quantum Approximate Optimization Algorithm (QAOA) pour le RL

Application du QAOA pour résoudre le problème de l'optimisation de la politique, en encodant l'objectif de maximisation de la récompense cumulative dans un Hamiltonien de coût à minimiser.

📖
pojęcia

State-Action Superposition

Fundamental principle of quantum RL where an agent can simultaneously evaluate a linear combination of state-action pairs, instead of processing them sequentially, to accelerate learning.

📖
pojęcia

Quantum Speedup for Convergence

Acceleration of the convergence rate of an RL algorithm toward the optimal policy, made possible by parallel quantum operations such as quantum search or quantum sampling.

📖
pojęcia

Noise and Decoherence in Quantum RL

Major challenges where errors due to quantum hardware imperfections and loss of quantum properties (decoherence) can degrade the performance and stability of RL algorithms.

🔍

Nie znaleziono wyników