Glossário IA
O dicionário completo da Inteligência Artificial
Limite de Tokens
Restrição técnica que especifica o número máximo de tokens que podem ser incluídos em uma solicitação ou resposta do modelo. Esta limitação impacta diretamente a quantidade de informação contextual que pode ser usada em sistemas RAG.
Compressão de Contexto
Técnica de redução semântica do contexto para preservar informações essenciais enquanto respeita os limites de tokens. Utiliza métodos como sumarização ou extração para otimizar o espaço disponível.
Contexto Hierárquico
Estrutura organizacional do contexto em múltiplos níveis hierárquicos para otimizar o espaço e melhorar a relevância das informações. Permite uma gestão eficaz das relações entre diferentes partes do contexto.
Fragmentação de Contexto
Segmentação inteligente do contexto em blocos coerentes para otimizar o processamento e a integração das informações recuperadas. Esta técnica melhora a relevância e reduz a redundância em sistemas RAG.
Janela de Contexto Dinâmica
Janela de contexto adaptativa cujo tamanho se ajusta dinamicamente com base na complexidade e relevância das informações. Esta abordagem otimiza o uso de recursos computacionais.
Pontuação de Relevância de Contexto
Mecanismo de avaliação quantitativa da relevância de cada segmento de contexto em relação à consulta do usuário. Esta pontuação orienta a seleção e priorização das informações a incluir na janela.
Poda de Contexto
Processo de eliminação seletiva de informações contextuais menos relevantes para otimizar o espaço disponível. Esta técnica mantém os dados mais úteis enquanto respeita as restrições de tokens.
Tratamento de Transbordamento de Contexto
Estratégia de gestão quando o contexto excede a capacidade máxima da janela, incluindo técnicas de truncamento, compressão ou reorganização. Estes mecanismos asseguram a continuidade do processamento.
Gestão de Contexto Multiturno
Gestão sofisticada do contexto em múltiplas trocas conversacionais para manter coerência e relevância. Requer otimização contínua da janela para integrar novos elementos.
Embutimento de Contexto
Representação vetorial do contexto permitindo avaliação semântica eficaz e integração otimizada em sistemas RAG. Esta técnica facilita a busca e similaridade contextual.
Recuperação de Contexto Semântico
Processo de recuperação contextual baseado na compreensão semântica em vez de correspondência exata de palavras-chave. Esta abordagem melhora a relevância das informações integradas na janela.
Preenchimento de Janela de Contexto
Técnica de adição estratégica de informações contextuais para otimizar o uso do espaço disponível sem exceder os limites. O preenchimento garante melhor coerência e continuidade contextual.
Atenção na Janela de Contexto
Mecanismo de atenção ponderada aplicado especificamente à janela de contexto para identificar os segmentos mais relevantes. Esta técnica otimiza a seleção de informações em sistemas RAG.
Dimensionamento Adaptativo de Contexto
Ajuste dinâmico do tamanho da janela de contexto conforme os requisitos específicos de cada consulta. Esta abordagem personalizada maximiza a eficiência do processamento contextual.
Estratégia de Cache de Contexto
Método de armazenamento em cache do contexto para otimizar desempenho e reduzir carga computacional em sistemas RAG. Permite recuperação rápida de informações contextuais relevantes.
Transformador de Contexto Longo
Arquitetura de modelo otimizada para processamento eficaz de contextos muito longos que excedem limites tradicionais. Utiliza mecanismos de atenção eficientes para gerenciar expansão contextual.
Fusão de Contexto
Processo de integração inteligente de múltiplas fontes contextuais para criar uma representação unificada e coerente. Esta técnica otimiza o uso do espaço na janela de contexto.
Otimização de Janela de Contexto
Conjunto de técnicas e algoritmos que visam maximizar a eficiência e relevância das informações contidas na janela de contexto. Combina compressão, seleção e organização estratégica de dados.