🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis
📖
Otimização Evolutiva Multiobjetivo

Gradiente de Política Multiobjetivo

Método de aprendizagem por reforço que otimiza diretamente os parâmetros de política para maximizar um vetor de recompensas multiobjetivo utilizando técnicas de gradiente estocástico.

← Voltar