🏠 Ana Sayfa
Benchmarklar
📊 Tüm Benchmarklar 🦖 Dinozor v1 🦖 Dinozor v2 ✅ To-Do List Uygulamaları 🎨 Yaratıcı Serbest Sayfalar 🎯 FSACB - Nihai Gösteri 🌍 Çeviri Benchmarkı
Modeller
🏆 En İyi 10 Model 🆓 Ücretsiz Modeller 📋 Tüm Modeller ⚙️ Kilo Code
Kaynaklar
💬 Prompt Kütüphanesi 📖 YZ Sözlüğü 🔗 Faydalı Bağlantılar

YZ Sözlüğü

Yapay Zekanın tam sözlüğü

162
kategoriler
2.032
alt kategoriler
23.060
terimler
📖
terimler

Fonction de Valeur Multi-Objectifs

Extension vectorielle de la fonction de valeur classique qui estime les retours attendus pour chaque objectif considéré séparément. Permet l'évaluation simultanée des performances d'une politique selon plusieurs critères.

📖
terimler

Politique d'Équilibre

Stratégie de décision qui maintient un compromis stable entre différents objectifs antagonistes au fil du temps. Représente une solution durable dans les environnements où les objectifs entrent en conflit.

📖
terimler

Vecteur de Récompense

Structure de données multidimensionnelle contenant les valeurs de récompense pour chaque objectif à chaque étape d'interaction. Constitue l'élément fondamental de feedback dans les systèmes MORL.

📖
terimler

Frontière de Pareto

Ensemble complet des solutions non-dominées représentant tous les compromis optimaux possibles entre objectifs. Visualise l'espace des solutions candidates dans l'apprentissage par renforcement multi-objectifs.

📖
terimler

Politique Stochastique Multi-Objectifs

Distribution de probabilités sur les actions qui optimise simultanément plusieurs objectifs selon différents poids. Permet l'exploration de compromis variés entre objectifs lors de la prise de décision.

📖
terimler

Hyperplan de Pondération

Sous-espace vectoriel définissant les poids relatifs accordés à chaque objectif dans la scalarisation. Détermine l'orientation de l'optimisation dans l'espace multi-objectifs.

📖
terimler

Espaces d'Action Multi-Objectifs

Structures où chaque action peut avoir des impacts différents sur chaque objectif considéré. Nécessitent des algorithmes spécialisés pour gérer la complexité des décisions multi-critères.

📖
terimler

Apprentissage par Renforcement Scalarisé

Paradigme transformant le problème multi-objectifs en série de problèmes mono-objectifs via différentes scalarisations. Permet l'utilisation d'algorithmes standards pour découvrir l'ensemble de Pareto.

📖
terimler

Optimisation Convexe Multi-Objectifs

Classe de problèmes où les fonctions objectif sont convexes, garantissant des propriétés théoriques fortes sur les solutions optimales. Facilite la convergence et l'analyse des politiques multi-objectifs.

📖
terimler

Métrique d'Hypervolume

Indicateur de performance mesurant le volume de l'espace objectif dominé par un ensemble de solutions. Permet la comparaison quantitative d'ensembles de politiques multi-objectifs.

📖
terimler

Politique Contextuelle Multi-Objectifs

Approche où les poids des objectifs dépendent du contexte ou de l'état de l'environnement. Permet une adaptation fine des compromis selon les situations rencontrées.

🔍

Sonuç bulunamadı