🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Apache Spark SQL

Módulo de Spark que ofrece una interfaz SQL y DataFrame para ejecutar consultas distribuidas con optimización Catalyst y ejecución Tungsten para un rendimiento mejorado.

📖
términos

Presto

Motor de consulta SQL distribuido de código abierto diseñado para el análisis interactivo de datos a gran escala en diversas fuentes sin movimiento de datos.

📖
términos

Apache Drill

Motor de consulta distribuido sin esquema que permite el análisis SQL de datos NoSQL y archivos estructurados sin esquema predefinido, con soporte nativo para JSON.

📖
términos

HiveQL

Lenguaje de consulta similar a SQL para Apache Hive, transformando consultas en trabajos MapReduce o Tez para el análisis de datos distribuidos en Hadoop.

📖
términos

Apache Impala

Motor de consulta SQL masivamente paralelo para Hadoop, ofreciendo análisis de baja latencia con arquitectura nativa que evita MapReduce para un acceso directo a los datos.

📖
términos

Trino

Motor de consulta SQL distribuido de alto rendimiento, anteriormente PrestoSQL, optimizado para el análisis federado de datos a través de múltiples fuentes con ejecución paralela.

📖
términos

Optimización Basada en Costos

Estrategia de optimización que utiliza estadísticas sobre volúmenes y distribuciones de datos para evaluar y seleccionar el plan de ejecución más eficiente.

📖
términos

Apache Calcite

Framework de gestión de datos dinámico que ofrece análisis SQL, validación, optimización y ejecución de consultas para muchos motores de bases de datos distribuidas.

📖
términos

Ejecución de Consultas Vectorizada

Técnica de ejecución de consultas que procesa datos por lotes (batches) en lugar de fila por fila, mejorando la utilización de la caché de la CPU y el rendimiento.

📖
términos

Join Distribuido

Operación de unión de datos distribuidos en varios nodos, que requiere estrategias de particionamiento y shuffle para combinar eficientemente los conjuntos de datos distribuidos.

📖
términos

Ejecución de Consultas Adaptativa

Enfoque de optimización dinámica que ajusta el plan de ejecución en tiempo real basado en estadísticas recopiladas durante la ejecución para mejorar el rendimiento.

🔍

No se encontraron resultados