Glosario IA
El diccionario completo de la Inteligencia Artificial
Apache Spark SQL
Módulo de Spark que ofrece una interfaz SQL y DataFrame para ejecutar consultas distribuidas con optimización Catalyst y ejecución Tungsten para un rendimiento mejorado.
Presto
Motor de consulta SQL distribuido de código abierto diseñado para el análisis interactivo de datos a gran escala en diversas fuentes sin movimiento de datos.
Apache Drill
Motor de consulta distribuido sin esquema que permite el análisis SQL de datos NoSQL y archivos estructurados sin esquema predefinido, con soporte nativo para JSON.
HiveQL
Lenguaje de consulta similar a SQL para Apache Hive, transformando consultas en trabajos MapReduce o Tez para el análisis de datos distribuidos en Hadoop.
Apache Impala
Motor de consulta SQL masivamente paralelo para Hadoop, ofreciendo análisis de baja latencia con arquitectura nativa que evita MapReduce para un acceso directo a los datos.
Trino
Motor de consulta SQL distribuido de alto rendimiento, anteriormente PrestoSQL, optimizado para el análisis federado de datos a través de múltiples fuentes con ejecución paralela.
Optimización Basada en Costos
Estrategia de optimización que utiliza estadísticas sobre volúmenes y distribuciones de datos para evaluar y seleccionar el plan de ejecución más eficiente.
Apache Calcite
Framework de gestión de datos dinámico que ofrece análisis SQL, validación, optimización y ejecución de consultas para muchos motores de bases de datos distribuidas.
Ejecución de Consultas Vectorizada
Técnica de ejecución de consultas que procesa datos por lotes (batches) en lugar de fila por fila, mejorando la utilización de la caché de la CPU y el rendimiento.
Join Distribuido
Operación de unión de datos distribuidos en varios nodos, que requiere estrategias de particionamiento y shuffle para combinar eficientemente los conjuntos de datos distribuidos.
Ejecución de Consultas Adaptativa
Enfoque de optimización dinámica que ajusta el plan de ejecución en tiempo real basado en estadísticas recopiladas durante la ejecución para mejorar el rendimiento.