Słownik AI
Kompletny słownik sztucznej inteligencji
Indexation B-Tree
Structure d'indexation hiérarchique auto-équilibrée optimisée pour les recherches par plage et les requêtes d'égalité. Permet un accès logarithmique O(log n) aux données en maintenant l'arbre équilibré lors des insertions et suppressions.
Partitionnement Horizontal
Technique de distribution des données divisant une table en plusieurs partitions physiques basées sur des critères de répartition des lignes. Permet de paralléliser les requêtes et d'améliorer les performances en ne scannant que les partitions pertinentes.
Partitionnement Vertical
Stratégie de séparation des colonnes d'une table en plusieurs partitions physiques pour optimiser l'accès aux attributs fréquemment utilisés. Réduit l'I/O en ne chargeant que les colonnes nécessaires lors de l'exécution des requêtes.
Index Bitmap
Structure d'indexation utilisant des bitmaps pour représenter la présence de valeurs dans les colonnes à faible cardinalité. Optimise les requêtes complexes avec multiples conditions AND/OR en effectuant des opérations bit à bit rapides.
Vue Matérialisée
Pré-calcul persistant du résultat d'une requête complexe stocké physiquement pour accélérer l'accès aux données agrégées. Maintenance automatisée ou manuelle selon les politiques de rafraîchissement définies (complètes, incrémentales ou rapides).
Optimisation de Plan d'Exécution
Processus par lequel le SGBD détermine la stratégie la plus efficace pour exécuter une requête en évaluant multiples plans d'accès. Utilise des statistiques et des heuristiques pour minimiser le coût computationnel global de l'opération.
Predicate Pushdown
Technique d'optimisation déplaçant les filtres le plus près possible de la source de données pour réduire le volume de données transférées. Applique les prédicats le plus tôt possible dans le pipeline d'exécution pour minimiser le traitement des données non pertinentes.
Stockage Columnar
Architecture de stockage organisant les données par colonnes plutôt que par lignes pour optimiser les requêtes analytiques. Permet une compression élevée et des lectures séquentielles rapides lors de l'accès à un sous-ensemble de colonnes.
Gestion du Data Skew
Techniques de distribution équilibrée des données pour éviter les partitions déséquilibrées qui créent des goulots d'étranglement. Utilise des stratégies de partitionnement adaptatives et de redistribution dynamique pour maintenir une performance optimale.
Optimisation des Joins
Ensemble de stratégies visant à minimiser le coût des opérations de jointure en choisissant les algorithmes appropriés (hash join, merge join, nested loops). Optimise l'ordre de jointure et les techniques de broadcast/shuffle selon la taille et distribution des données.
Index Composite
Structure d'indexation multi-colonnes créée pour accélérer les requêtes filtrant sur plusieurs attributs simultanément. L'ordre des colonnes dans l'index est crucial pour l'efficacité des recherches de préfixe et de plage.
Partitionnement par Plage
Méthode de division des tables basée sur des intervalles de valeurs prédéfinis pour des colonnes continues comme les dates ou les IDs numériques. Facilite le archivage et la purge des données historiques tout en optimisant les requêtes temporelles.
Partitionnement par Hash
Technique de distribution uniforme des données utilisant une fonction de hash pour répartir les enregistrements entre les partitions. Garantit une distribution équilibrée pour les schémas clés-valeurs et les accès aléatoires aux données.
Filtre de Bloom
Structure probabiliste compacte permettant de tester rapidement l'absence d'un élément dans un ensemble avec zéro faux négatif. Utilisée dans les systèmes distribués pour éviter les transferts de données inutiles lors des opérations de jointure.
Cache de Requêtes
Mécanisme de stockage temporaire des résultats de requêtes fréquemment exécutées pour éviter les recalculs coûteux. Implémente des stratégies d'invalidation basées sur les modifications des données source et des politiques d'éviction LRU/LFU.
Exécution Parallèle de Requêtes
Technique de traitement distribué divisant une requête en tâches parallèles exécutées simultanément sur plusieurs nœuds ou cœurs. Exploite le parallélisme intra-requête (pipeline, partition) et inter-requêtes pour maximiser le débit du système.
Optimisation Basée sur les Coûts
Approche d'optimisation de requêtes évaluant les coûts CPU, I/O et réseau de chaque plan d'exécution potentiel. Utilise des statistiques détaillées sur les données et les ressources système pour sélectionner la stratégie globalement optimale.
Collecte de Statistiques
Processus d'analyse périodique des données pour générer des métriques sur distribution, cardinalité et corrélations. Indispensable à l'optimiseur de requêtes pour estimer sélectivité des prédicats et coût des opérations.
Index GiST
Infrastructure d'indexation générique extensible supportant différents types de données et opérateurs de comparaison. Particulièrement efficace pour les indexations spatiales, textuelles et hiérarchiques dans les systèmes de bases de données modernes.
Indexation Spatiale
Techniques d'optimisation spécialisées pour les requêtes géométriques utilisant des structures comme R-Tree ou Quad-Tree. Accélère les opérations de proximité, intersection et inclusion sur les données géospatiales multidimensionnelles.