Glosario IA
El diccionario completo de la Inteligencia Artificial
Indexación B-Tree
Estructura de indexación jerárquica autoequilibrada optimizada para búsquedas por rango y consultas de igualdad. Permite un acceso logarítmico O(log n) a los datos manteniendo el árbol equilibrado durante las inserciones y eliminaciones.
Particionamiento Horizontal
Técnica de distribución de datos que divide una tabla en múltiples particiones físicas basadas en criterios de distribución de filas. Permite paralelizar las consultas y mejorar el rendimiento al escanear solo las particiones relevantes.
Particionamiento Vertical
Estrategia de separación de las columnas de una tabla en múltiples particiones físicas para optimizar el acceso a los atributos utilizados con frecuencia. Reduce la E/S al cargar solo las columnas necesarias durante la ejecución de las consultas.
Índice Bitmap
Estructura de indexación que utiliza mapas de bits para representar la presencia de valores en columnas de baja cardinalidad. Optimiza las consultas complejas con múltiples condiciones AND/OR realizando operaciones bit a bit rápidas.
Vista Materializada
Precálculo persistente del resultado de una consulta compleja almacenado físicamente para acelerar el acceso a los datos agregados. Mantenimiento automatizado o manual según las políticas de actualización definidas (completas, incrementales o rápidas).
Optimización del Plan de Ejecución
Proceso mediante el cual el SGBD determina la estrategia más eficiente para ejecutar una consulta evaluando múltiples planes de acceso. Utiliza estadísticas y heurísticas para minimizar el costo computacional global de la operación.
Predicate Pushdown
Técnica de optimización que mueve los filtros lo más cerca posible de la fuente de datos para reducir el volumen de datos transferidos. Aplica los predicados lo antes posible en el pipeline de ejecución para minimizar el procesamiento de datos no relevantes.
Almacenamiento Columnar
Arquitectura de almacenamiento que organiza los datos por columnas en lugar de por filas para optimizar las consultas analíticas. Permite una alta compresión y lecturas secuenciales rápidas al acceder a un subconjunto de columnas.
Gestión de la Asimetría de Datos
Técnicas de distribución equilibrada de datos para evitar particiones desequilibradas que crean cuellos de botella. Utiliza estrategias de particionamiento adaptativas y de redistribución dinámica para mantener un rendimiento óptimo.
Optimización de Uniones
Conjunto de estrategias destinadas a minimizar el costo de las operaciones de unión (join) eligiendo los algoritmos apropiados (hash join, merge join, nested loops). Optimiza el orden de unión y las técnicas de broadcast/shuffle según el tamaño y la distribución de los datos.
Índice Compuesto
Estructura de indexación multi-columna creada para acelerar las consultas que filtran sobre múltiples atributos simultáneamente. El orden de las columnas en el índice es crucial para la eficiencia de las búsquedas de prefijo y de rango.
Particionamiento por Rango
Método de división de tablas basado en intervalos de valores predefinidos para columnas continuas como fechas o IDs numéricos. Facilita el archivo y la purga de datos históricos al tiempo que optimiza las consultas temporales.
Particionamiento por Hash
Técnica de distribución uniforme de datos que utiliza una función hash para repartir los registros entre las particiones. Garantiza una distribución equilibrada para esquemas clave-valor y accesos aleatorios a los datos.
Filtro de Bloom
Estructura probabilística compacta que permite probar rápidamente la ausencia de un elemento en un conjunto con cero falsos negativos. Utilizada en sistemas distribuidos para evitar transferencias de datos innecesarias durante las operaciones de unión.
Caché de Consultas
Mecanismo de almacenamiento temporal de los resultados de consultas ejecutadas frecuentemente para evitar recálculos costosos. Implementa estrategias de invalidación basadas en las modificaciones de los datos fuente y políticas de desalojo LRU/LFU.
Ejecución Paralela de Consultas
Técnica de procesamiento distribuido que divide una consulta en tareas paralelas ejecutadas simultáneamente en múltiples nodos o núcleos. Explota el paralelismo intra-consulta (pipeline, partición) e inter-consultas para maximizar el rendimiento del sistema.
Optimización Basada en Costos
Enfoque de optimización de consultas que evalúa los costos de CPU, E/S y red de cada plan de ejecución potencial. Utiliza estadísticas detalladas sobre los datos y los recursos del sistema para seleccionar la estrategia globalmente óptima.
Recopilación de Estadísticas
Proceso de análisis periódico de datos para generar métricas sobre distribución, cardinalidad y correlaciones. Indispensable para el optimizador de consultas para estimar la selectividad de los predicados y el costo de las operaciones.
Índice GiST
Infraestructura de indexación genérica extensible que soporta diferentes tipos de datos y operadores de comparación. Particularmente eficaz para indexaciones espaciales, textuales y jerárquicas en sistemas de bases de datos modernos.
Indexación Espacial
Técnicas de optimización especializadas para consultas geométricas que utilizan estructuras como R-Tree o Quad-Tree. Acelera las operaciones de proximidad, intersección e inclusión sobre datos geoespaciales multidimensionales.