Almacenamiento Columnar

📖

términos

Familia de Columnas

Agrupación lógica de columnas relacionadas en bases de datos columnar, permitiendo una organización jerárquica de datos para un acceso más eficiente.

📖

términos

Grupo de Filas

Unidad de procesamiento en formatos columnar que contiene un conjunto de filas almacenadas verticalmente, optimizando operaciones de E/S y compresión.

📖

términos

Fragmento de Columna

Fragmento físico de datos que contiene los valores de una columna específica, comprimido y almacenado independientemente para permitir acceso selectivo a los datos.

📖

términos

Formato Parquet

Formato de almacenamiento columnar de código abierto optimizado para cargas de trabajo analíticas, utilizando codificación eficiente y técnicas de compresión avanzadas.

📖

términos

Formato ORC

Formato columnar optimizado para Apache Hive, proporcionando alta compresión y rendimiento rápido de consultas con tipado de datos estricto.

📖

términos

Ejecución Vectorizada

Técnica de procesamiento donde las operaciones se aplican a lotes de datos en paralelo, reduciendo sobrecarga y mejorando el rendimiento de consultas columnar.

📖

términos

Pushdown de Predicados

Optimización que empuja los filtros de consultas hacia la fuente de datos, reduciendo la cantidad de datos leídos y procesados en sistemas columnar.

📖

términos

Poda de Columnas

Técnica que elimina la lectura de columnas no requeridas en una consulta, explotando la organización columnar para minimizar accesos a disco.

📖

términos

Codificación de Diccionario

Método de compresión que reemplaza valores repetidos por identificadores cortos, particularmente eficaz para datos categóricos en sistemas columnar.

📖

términos

Mapas de Zonas

Metadatos que indican los valores mínimos y máximos en segmentos de datos, permitiendo la eliminación rápida de bloques irrelevantes durante las consultas.

📖

términos

Codificación Delta

Técnica de compresión que almacena las diferencias entre valores sucesivos en lugar de los valores absolutos, óptima para datos ordenados y temporales.

📖

términos

Codificación RLE

Codificación de Longitud de Ejecución que comprime secuencias de valores idénticos almacenando el valor y el número de ocurrencias consecutivas.

📖

términos

Filtros de Bloom

Estructuras de datos probabilísticas que permiten determinar rápidamente la ausencia de un valor en un conjunto, optimizando búsquedas en sistemas columnar.

📖

términos

Índice de Salto

Metadatos que permiten saltar directamente a los bloques de datos relevantes durante la lectura secuencial de columnas, acelerando los escaneos de datos.

📖

términos

Segmentación Vertical

Proceso de división física de datos en particiones basadas en columnas, permitiendo una distribución y paralelismo eficientes en clusters columnar.

📖

términos

Pushdown de Agregación

Optimización que desplaza los cálculos de agregación hacia la capa de almacenamiento, reduciendo el volumen de datos transferidos en arquitecturas columnar.

Glosario IA

Familia de Columnas

Grupo de Filas

Fragmento de Columna

Formato Parquet

Formato ORC

Ejecución Vectorizada

Pushdown de Predicados

Poda de Columnas

Codificación de Diccionario

Mapas de Zonas

Codificación Delta

Codificación RLE

Filtros de Bloom

Índice de Salto

Segmentación Vertical

Pushdown de Agregación

No se encontraron resultados