🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📂
subcategorias

Redes Q Profundas (DQN)

Algoritmo pioneiro que combina Q-learning com redes neurais profundas para aproximar a função de valor Q em espaços de estado complexos.

18 termos
📂
subcategorias

Métodos de Gradiente de Política

Abordagens de aprendizado por reforço que otimizam diretamente a política seguindo o gradiente das recompensas esperadas.

18 termos
📂
subcategorias

Actor-Critic Methods

Architecture hybride combinant un acteur qui apprend la politique et un critique qui évalue la valeur des états ou des actions.

8 termos
📂
subcategorias

Deep Deterministic Policy Gradient (DDPG)

Algorithme actor-critic off-policy pour les environnements avec espaces d'action continus utilisant des réseaux de neurones profonds.

9 termos
📂
subcategorias

Proximal Policy Optimization (PPO)

Método de otimização de política que mantém as atualizações em uma região de confiança para garantir a estabilidade do aprendizado.

11 termos
📂
subcategorias

Trust Region Policy Optimization (TRPO)

Algoritmo de otimização com restrição que garante que as novas políticas não se afastem muito das políticas antigas.

8 termos
📂
subcategorias

Multi-Agent Deep RL

Extensão do deep RL onde múltiplos agentes aprendem simultaneamente, em cooperação ou competição em um ambiente compartilhado.

20 termos
📂
subcategorias

Aprendizagem por Reforço Hierárquico

Abordagem que estrutura o aprendizado em níveis hierárquicos com metapolíticas controlando subpolíticas especializadas.

20 termos
📂
subcategorias

Deep RL Baseado em Modelo

Técnica em que o agente aprende um modelo do ambiente para planejar e tomar decisões de forma mais eficiente.

19 termos
📂
subcategorias

RL Distribucional

Paradigma que aprende a distribuição completa dos retornos em vez de apenas sua expectativa para melhor robustez.

18 termos
📂
subcategorias

RL Guiado pela Curiosidade

Abordagem onde o agente recebe recompensas intrínsecas baseadas em sua curiosidade para explorar eficientemente o ambiente

16 termos
📂
subcategorias

Meta-Learning in RL

Técnica que permite aos agentes aprender a aprender rapidamente novas tarefas com poucas experiências.

18 termos
🔍

Nenhum resultado encontrado