Glossário IA
O dicionário completo da Inteligência Artificial
Apache Spark SQL
Módulo Spark que oferece uma interface SQL e DataFrame para executar consultas distribuídas com otimização Catalyst e execução Tungsten para maior desempenho.
Presto
Mecanismo de consulta SQL distribuído de código aberto projetado para análise interativa de dados em larga escala em diversas fontes sem movimentação de dados.
Apache Drill
Mecanismo de consulta distribuído sem esquema que permite a análise SQL de dados NoSQL e arquivos estruturados sem um esquema pré-definido, com suporte JSON nativo.
HiveQL
Linguagem de consulta semelhante ao SQL para Apache Hive, transformando consultas em jobs MapReduce ou Tez para análise de dados distribuídos no Hadoop.
Apache Impala
Mecanismo de consulta SQL massivamente paralelo para Hadoop, oferecendo análises de baixa latência com arquitetura nativa que contorna o MapReduce para acesso direto aos dados.
Trino
Mecanismo de consulta SQL distribuído de alto desempenho, anteriormente PrestoSQL, otimizado para análise federada de dados em múltiplas fontes com execução paralela.
Otimização Baseada em Custo
Estratégia de otimização que utiliza estatísticas sobre volumes e distribuições de dados para avaliar e selecionar o plano de execução mais eficiente.
Apache Calcite
Framework de gerenciamento de dados dinâmico que oferece parsing SQL, validação, otimização e execução de consultas para muitos mecanismos de bancos de dados distribuídos.
Execução de Consulta Vetorizada
Técnica de execução de consultas que processa dados em lotes (batches) em vez de linha por linha, melhorando a utilização do cache da CPU e o desempenho.
Junção Distribuída
Operação de junção de dados distribuídos por vários nós, exigindo estratégias de particionamento e embaralhamento (shuffle) para combinar eficientemente os conjuntos de dados distribuídos.
Execução Adaptativa de Consulta
Abordagem de otimização dinâmica que ajusta o plano de execução em tempo real com base nas estatísticas coletadas durante a execução para melhorar o desempenho.