🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📖
termos

Transformer Pós-LN

Arquitetura original de transformador onde a normalização de camada é aplicada após as camadas de atenção e feed-forward, exigindo um ajuste mais preciso da taxa de aprendizado.

📖
termos

Gamma e Beta

Parâmetros treináveis da normalização de camada que permitem, respectivamente, escalar (scale) e deslocar (shift) os valores normalizados para preservar o poder de representação da rede.

📖
termos

Centralização em Zero

Processo de subtração da média das ativações na normalização de camada para centralizar os dados em torno de zero, facilitando a otimização dos gradientes.

📖
termos

Variância Unitária

Padronização das ativações para ter uma variância unitária na normalização de camada, garantindo estabilidade numérica e gradientes constantes através das camadas.

📖
termos

Estabilidade do Gradiente

Propriedade da normalização de camada que mantém gradientes estáveis durante a retropropagação, evitando problemas de gradiente explosivo ou evanescente em transformadores profundos.

📖
termos

Parâmetro Epsilon

Pequena constante adicionada ao denominador na normalização de camada para evitar a divisão por zero e garantir a estabilidade numérica ao calcular a variância normalizada.

📖
termos

Distribuição de Ativação

Distribuição dos valores de ativação em uma camada que a normalização de camada mantém constante, facilitando a convergência e a otimização das redes de transformadores.

📖
termos

Invariância de Escala

Propriedade da normalização de camada que torna o modelo insensível a mudanças de escala das entradas, melhorando a robustez do modelo diante das variações de dados.

📖
termos

Velocidade de Treinamento

Aceleração significativa do treinamento de transformadores através da normalização de camadas, permitindo taxas de aprendizado mais altas e uma convergência mais rápida.

📖
termos

Normalização de Estado Oculto

Aplicação da normalização de camadas aos estados ocultos dos transformadores para manter ativações estáveis através das diferentes camadas de codificação e decodificação.

🔍

Nenhum resultado encontrado