Glossário IA
O dicionário completo da Inteligência Artificial
Indexação B-Tree
Estrutura de indexação hierárquica auto-balanceada otimizada para pesquisas por intervalo e consultas de igualdade. Permite acesso logarítmico O(log n) aos dados, mantendo a árvore equilibrada durante inserções e exclusões.
Particionamento Horizontal
Técnica de distribuição de dados que divide uma tabela em várias partições físicas com base em critérios de distribuição de linhas. Permite paralelizar consultas e melhorar o desempenho, escaneando apenas as partições relevantes.
Particionamento Vertical
Estratégia de separação das colunas de uma tabela em várias partições físicas para otimizar o acesso a atributos frequentemente utilizados. Reduz a E/S (Entrada/Saída) carregando apenas as colunas necessárias durante a execução das consultas.
Índice Bitmap
Estrutura de indexação que utiliza bitmaps para representar a presença de valores em colunas de baixa cardinalidade. Otimiza consultas complexas com múltiplas condições AND/OR, realizando operações bit a bit rápidas.
Visão Materializada
Pré-cálculo persistente do resultado de uma consulta complexa, armazenado fisicamente para acelerar o acesso a dados agregados. Manutenção automatizada ou manual de acordo com as políticas de atualização definidas (completas, incrementais ou rápidas).
Otimização do Plano de Execução
Processo pelo qual o SGBD determina a estratégia mais eficiente para executar uma consulta, avaliando múltiplos planos de acesso. Utiliza estatísticas e heurísticas para minimizar o custo computacional global da operação.
Predicate Pushdown
Técnica de otimização que move os filtros o mais próximo possível da fonte de dados para reduzir o volume de dados transferidos. Aplica os predicados o mais cedo possível no pipeline de execução para minimizar o processamento de dados não relevantes.
Armazenamento Colunar
Arquitetura de armazenamento que organiza os dados por colunas em vez de por linhas para otimizar consultas analíticas. Permite alta compressão e leituras sequenciais rápidas ao acessar um subconjunto de colunas.
Gerenciamento de Desvio de Dados
Técnicas de distribuição equilibrada de dados para evitar partições desequilibradas que criam gargalos. Utiliza estratégias de particionamento adaptativas e redistribuição dinâmica para manter um desempenho ótimo.
Otimização de Joins
Conjunto de estratégias que visam minimizar o custo das operações de junção, escolhendo os algoritmos apropriados (hash join, merge join, nested loops). Otimiza a ordem de junção e as técnicas de broadcast/shuffle de acordo com o tamanho e a distribuição dos dados.
Índice Composto
Estrutura de indexação multi-colunas criada para acelerar consultas que filtram em múltiplos atributos simultaneamente. A ordem das colunas no índice é crucial para a eficiência das buscas por prefixo e por intervalo.
Particionamento por Intervalo
Método de divisão de tabelas baseado em intervalos de valores predefinidos para colunas contínuas como datas ou IDs numéricos. Facilita o arquivamento e a purga de dados históricos, otimizando as consultas temporais.
Particionamento por Hash
Técnica de distribuição uniforme de dados que utiliza uma função de hash para distribuir os registros entre as partições. Garante uma distribuição equilibrada para esquemas chave-valor e acessos aleatórios aos dados.
Filtro de Bloom
Estrutura probabilística compacta que permite testar rapidamente a ausência de um elemento em um conjunto com zero falsos negativos. Utilizada em sistemas distribuídos para evitar transferências de dados desnecessárias durante as operações de junção.
Cache de Consultas
Mecanismo de armazenamento temporário dos resultados de consultas frequentemente executadas para evitar recálculos custosos. Implementa estratégias de invalidação baseadas nas modificações dos dados de origem e políticas de despejo LRU/LFU.
Execução Paralela de Consultas
Técnica de processamento distribuído que divide uma consulta em tarefas paralelas executadas simultaneamente em múltiplos nós ou núcleos. Explora o paralelismo intra-consulta (pipeline, partição) e inter-consultas para maximizar o throughput do sistema.
Otimização Baseada em Custos
Abordagem de otimização de consultas que avalia os custos de CPU, I/O e rede de cada plano de execução potencial. Utiliza estatísticas detalhadas sobre os dados e os recursos do sistema para selecionar a estratégia globalmente ótima.
Coleta de Estatísticas
Processo de análise periódica dos dados para gerar métricas sobre distribuição, cardinalidade e correlações. Indispensável para o otimizador de consultas estimar a seletividade dos predicados e o custo das operações.
Índice GiST
Infraestrutura de indexação genérica extensível que suporta diferentes tipos de dados e operadores de comparação. Particularmente eficaz para indexações espaciais, textuais e hierárquicas em sistemas de bancos de dados modernos.
Indexação Espacial
Técnicas de otimização especializadas para consultas geométricas que utilizam estruturas como R-Tree ou Quad-Tree. Acelera as operações de proximidade, interseção e inclusão em dados geoespaciais multidimensionais.