RAG - Geração Aumentada por Recuperação

📖

termos

Base de conhecimento vetorial

Armazenamento especializado otimizado para embeddings, permitindo buscas rápidas de similaridade semântica em larga escala através de índices como HNSW ou IVF.

📖

termos

HyDE (Embeddings de Documentos Hipotéticos)

Técnica avançada onde o LLM primeiro gera um documento hipotético ideal e depois usa seu embedding para guiar a busca por documentos realmente relevantes.

📖

termos

Reranking cruzado

Método de avaliação de relevância onde o modelo processa simultaneamente a consulta e o documento candidato, ao contrário da abordagem padrão de bi-encoder.

📖

termos

Decomposição de consulta

Estratégia onde uma consulta complexa é automaticamente decomposta em subconsultas mais simples para melhorar a precisão da recuperação de informações multifacetadas.

📖

termos

RAG síncrono vs assíncrono

Distinção entre a abordagem síncrona (busca e geração na mesma chamada) e assíncrona (pré-indexação e recuperação em tempo real) de acordo com as restrições de latência.

📖

termos

Modelagem de Prompt (Prompt Shaping)

Arte de otimizar a estrutura do prompt RAG, incluindo o posicionamento dos contextos recuperados, as instruções de formatação e as restrições de citação para maximizar a qualidade da resposta.

📖

termos

RAG de múltiplos saltos

Arquitetura avançada onde o modelo realiza múltiplos ciclos de recuperação-geração, utilizando as respostas intermediárias para refinar e aprofundar a busca por informações.

📖

termos

Base de conhecimento dinâmica

Sistema RAG onde a base de documentos é continuamente atualizada em tempo real, permitindo respostas sempre atuais sem a necessidade de retreinamento do modelo.

📖

termos

RAG agnóstico ao domínio

Abordagem onde o sistema de recuperação é projetado para funcionar eficazmente em qualquer domínio sem adaptação específica, graças a embeddings e estratégias de busca generalistas.

📖

termos

Citação de fontes

📖

termos

RAG hierárquico

Arquitetura multinível onde a recuperação é realizada primeiro em resumos ou metadados, e depois nos documentos detalhados relevantes para otimizar a velocidade e a relevância.

📖

termos

Fusão de contextos

Processo de integração inteligente de múltiplos documentos recuperados em um prompt coerente, evitando redundâncias e maximizando a complementaridade das informações.

📖

termos

RAG com memória

Extensão do RAG padrão onde o sistema mantém uma memória das interações anteriores para contextualizar as recuperações futuras e garantir uma coerência conversacional.

Glossário IA

Base de conhecimento vetorial

HyDE (Embeddings de Documentos Hipotéticos)

Reranking cruzado

Decomposição de consulta

RAG síncrono vs assíncrono

Modelagem de Prompt (Prompt Shaping)

RAG de múltiplos saltos

Base de conhecimento dinâmica

RAG agnóstico ao domínio

Citação de fontes

RAG hierárquico

Fusão de contextos

RAG com memória

Nenhum resultado encontrado