Glossário IA
O dicionário completo da Inteligência Artificial
Base de conhecimento vetorial
Armazenamento especializado otimizado para embeddings, permitindo buscas rápidas de similaridade semântica em larga escala através de índices como HNSW ou IVF.
HyDE (Embeddings de Documentos Hipotéticos)
Técnica avançada onde o LLM primeiro gera um documento hipotético ideal e depois usa seu embedding para guiar a busca por documentos realmente relevantes.
Reranking cruzado
Método de avaliação de relevância onde o modelo processa simultaneamente a consulta e o documento candidato, ao contrário da abordagem padrão de bi-encoder.
Decomposição de consulta
Estratégia onde uma consulta complexa é automaticamente decomposta em subconsultas mais simples para melhorar a precisão da recuperação de informações multifacetadas.
RAG síncrono vs assíncrono
Distinção entre a abordagem síncrona (busca e geração na mesma chamada) e assíncrona (pré-indexação e recuperação em tempo real) de acordo com as restrições de latência.
Modelagem de Prompt (Prompt Shaping)
Arte de otimizar a estrutura do prompt RAG, incluindo o posicionamento dos contextos recuperados, as instruções de formatação e as restrições de citação para maximizar a qualidade da resposta.
RAG de múltiplos saltos
Arquitetura avançada onde o modelo realiza múltiplos ciclos de recuperação-geração, utilizando as respostas intermediárias para refinar e aprofundar a busca por informações.
Base de conhecimento dinâmica
Sistema RAG onde a base de documentos é continuamente atualizada em tempo real, permitindo respostas sempre atuais sem a necessidade de retreinamento do modelo.
RAG agnóstico ao domínio
Abordagem onde o sistema de recuperação é projetado para funcionar eficazmente em qualquer domínio sem adaptação específica, graças a embeddings e estratégias de busca generalistas.
Citação de fontes
RAG hierárquico
Arquitetura multinível onde a recuperação é realizada primeiro em resumos ou metadados, e depois nos documentos detalhados relevantes para otimizar a velocidade e a relevância.
Fusão de contextos
Processo de integração inteligente de múltiplos documentos recuperados em um prompt coerente, evitando redundâncias e maximizando a complementaridade das informações.
RAG com memória
Extensão do RAG padrão onde o sistema mantém uma memória das interações anteriores para contextualizar as recuperações futuras e garantir uma coerência conversacional.