🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📖
termos

RL^2 (Reinforcement Learning Squared)

Estrutura de meta-aprendizagem onde a própria rede neural implementa um algoritmo de aprendizagem por reforço, aprendendo a se adaptar a novas tarefas a partir de sequências de transições.

📖
termos

Proximal Meta-Policy Optimization (ProMP)

Algoritmo de meta-aprendizagem baseado em PPO que mantém um conjunto de meta-parâmetros otimizados para uma rápida adaptação a novas tarefas por reforço.

📖
termos

Inner Loop/Outer Loop

Estrutura de otimização de dois níveis onde o loop interno se adapta a tarefas específicas e o loop externo meta-otimiza os parâmetros para uma melhor adaptação.

📖
termos

Exploration Strategies

Mecanismos que permitem ao agente de meta-aprendizagem explorar eficientemente novas tarefas para coletar rapidamente informações relevantes para a adaptação.

📖
termos

Few-shot Reinforcement Learning

Cenário onde o agente deve aprender uma nova tarefa com muito poucos exemplos ou interações, tipicamente de 1 a 10 episódios.

📖
termos

Meta-Actor-Critic

Arquitetura que combina meta-aprendizagem com métodos ator-crítico, onde ambos os componentes são otimizados para uma rápida adaptação a novas tarefas.

📖
termos

Task-Agnostic Exploration

Abordagem de exploração que não requer conhecimento prévio da distribuição das tarefas, permitindo a adaptação a tarefas inesperadas.

📖
termos

Meta-Value Function

Função de valor parametrizada para estimar o desempenho esperado de uma política adaptada a uma dada nova tarefa.

🔍

Nenhum resultado encontrado