एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
Famille de Colonnes
Regroupement logique de colonnes apparentées dans les bases de données columnar, permettant une organisation hiérarchique des données pour un accès plus efficace.
Groupe de Lignes
Unité de traitement dans les formats columnar contenant un ensemble de lignes stockées verticalement, optimisant les opérations d'E/S et la compression.
Chunk de Colonne
Fragment physique de données contenant les valeurs d'une colonne spécifique, compressé et stocké indépendamment pour permettre un accès sélectif aux données.
Format Parquet
Format de stockage columnar open-source optimisé pour les charges de travail analytiques, utilisant un encodage efficace et des techniques de compression avancées.
Format ORC
Format columnar optimisé pour Apache Hive, fournissant une compression élevée et des performances d' interrogation rapides avec un typage de données strict.
Exécution Vectorisée
Technique de traitement où les opérations sont appliquées à des lots de données en parallèle, réduisant la surcharge et améliorant le débit des requêtes columnar.
Prédicat Pushdown
Optimization poussant les filtres de requêtes vers la source de données, réduisant la quantité de données lues et traitées dans les systèmes columnar.
Élagage de Colonnes
Technique éliminant la lecture de colonnes non requises dans une requête, exploitant l'organisation columnar pour minimiser les accès disque.
Encodage Dictionnaire
Méthode de compression remplaçant les valeurs répétées par des identifiants courts, particulièrement efficace pour les données catégorielles dans les systèmes columnar.
Cartes de Zones
Métadonnées indiquant les valeurs minimales et maximales dans des segments de données, permettant l'élimination rapide des blocs non pertinents lors des requêtes.
Encodage Delta
Technique de compression stockant les différences entre valeurs successives plutôt que les valeurs absolues, optimales pour les données ordonnées et temporelles.
Encodage RLE
Run Length Encoding compressant les séquences de valeurs identiques en stockant la valeur et le nombre d'occurrences consécutives.
Filtres de Bloom
Structures de données probabilistes permettant de déterminer rapidement l'absence d'une valeur dans un ensemble, optimisant les recherches dans les systèmes columnar.
Index de Saut
Métadonnées permettant de sauter directement aux blocs de données pertinents lors de la lecture séquentielle de colonnes, accélérant les balayages de données.
Segmentation Verticale
Processus de division physique des données en partitions basées sur les colonnes, permettant une distribution et un parallélisme efficaces dans les clusters columnar.
Agrégation Pushdown
Optimization déplaçant les calculs d'agrégation vers la couche de stockage, réduisant le volume de données transférées dans les architectures columnar.