Transformers e Arquiteturas de Atenção

📂

subcategorias

Autoatenção

Mecanismo fundamental que permite aos transformers calcular dinamicamente a importância relativa de cada elemento em uma sequência em relação aos outros.

2 termos

📂

subcategorias

Atenção Multi-Cabeça

Extensão da autoatenção onde múltiplas cabeças de atenção operam em paralelo para capturar diferentes tipos de relações nos dados.

4 termos

📂

subcategorias

Codificação Posicional

Técnica que incorpora a informação de posição sequencial nos embeddings para compensar a ausência de recorrência nos transformers.

6 termos

📂

subcategorias

Arquitetura Codificador-Decodificador

Estrutura fundamental dos transformadores originais que combina um codificador para processar a entrada e um decodificador para gerar a saída.

8 termos

📂

subcategorias

BERT (Representações de Codificador Bidirecional)

Família de modelos pré-treinados baseados na arquitetura apenas de codificador com compreensão bidirecional do contexto.

10 termos

📂

subcategorias

GPT (Generative Pre-trained Transformer)

Arquitetura somente decodificador otimizada para a geração de texto autorregressiva, formando a base dos grandes modelos de linguagem.

5 termos

📂

subcategorias

Vision Transformers (ViT)

Aplicação de arquiteturas transformer no processamento de imagens, dividindo as imagens em patches e tratando-as como sequências.

11 termos

📂

subcategorias

Mecanismos de Atenção Esparsa

Variantes de atenção que reduzem a complexidade computacional limitando as conexões entre elementos da sequência.

2 termos

📂

subcategorias

Cross-Attention

Mecanismo de atenção onde as queries vêm de uma sequência enquanto as chaves e os valores vêm de outra sequência diferente.

2 termos

📂

subcategorias

Leis de Escala de Transformers

Princípios empíricos que descrevem como o desempenho dos transformers evolui com o tamanho do modelo, dos dados e do cálculo.

18 termos

📂

subcategorias

Análise das Cabeças de Atenção

Estudo dos papéis especializados das diferentes cabeças de atenção nos transformers para compreender o seu funcionamento interno.

19 termos

📂

subcategorias

Atenção Hierárquica

Arquitetura de atenção organizada em múltiplos níveis hierárquicos para processar dados estruturados complexos.

9 termos

Glossário IA

Autoatenção

Atenção Multi-Cabeça

Codificação Posicional

Arquitetura Codificador-Decodificador

BERT (Representações de Codificador Bidirecional)

GPT (Generative Pre-trained Transformer)

Vision Transformers (ViT)

Mecanismos de Atenção Esparsa

Cross-Attention

Leis de Escala de Transformers

Análise das Cabeças de Atenção

Atenção Hierárquica

Nenhum resultado encontrado