AI用語集
人工知能の完全辞典
データウェアハウス
分析と意思決定のために最適化された集中型データリポジトリで、複数のソースから業務データと履歴データを収集します。構造化された大量のデータに対する複雑な分析クエリをサポートするように設計されています。
データマート
特定のビジネス領域や部門に焦点を当てたデータウェアハウスのサブセット。クエリの複雑さを軽減しながら、対象を絞った分析のための関連データへのアクセスを容易にします。
ETL(抽出、変換、ロード)
異種ソースから情報を抽出し、ビジネスルールに従って変換してからデータウェアハウスにロードするデータ統合プロセス。データ分析前のデータ品質と一貫性を保証します。
ELT(抽出、ロード、変換)
生データを最初にターゲットシステムにロードし、その後その場で変換する現代的なデータ統合アプローチ。クラウドプラットフォームと分散アーキテクチャでのパフォーマンスを最適化します。
OLAP(オンライン分析処理)
大量の履歴データに対する複雑なクエリを可能にする多次元分析技術。データ探索のためのドリルダウン、ロールアップ、スライス、ダイス操作をサポートします。
OLTP(オンライントランザクション処理)
CRUD操作(作成、読み取り、更新、削除)に最適化されたリアルタイムトランザクション管理システム。高い同時実行性を持つ多数の短いアトミックトランザクションを処理するように設計されています。
スタースキーマ
非正規化されたディメンションテーブルに囲まれた中央のファクトテーブルを持つデータウェアハウスのデータモデリング。結合を最小限に抑えて分析クエリのパフォーマンスを最適化します。
スノーフレークスキーマ
ディメンションテーブルが複数のテーブルの階層に正規化されているスタースキーマの変形。データの冗長性を減らしますが、分析クエリの複雑さを増します。
ファクトテーブル
ディメンショナルスキーマの中核となるテーブルで、数値メジャーとディメンションへの外部キーを含む。売上、取引、パフォーマンス指標などの定量的なビジネス事実を格納する。
ディメンションテーブル
ファクトテーブルのメジャーに対する文脈を記述するテーブルで、質的な記述属性を含む。時間、地理、製品などの様々な軸に沿ったデータ分析を可能にする。
データボルト
3NFとスタースキーマの利点を組み合わせた、スケーラブルなデータウェアハウスのためのハイブリッドモデリング手法。ハブ、リンク、サテライトを分離することで、監査可能性と拡張性を保証する。
カラムナー型データベース
行単位ではなく列単位でデータを格納するデータベースで、列のサブセットに対する分析クエリを最適化する。BIワークロードにおける応答時間とストレージスペースを大幅に削減する。
インメモリデータベース
データを主にRAMに格納し、ほぼ瞬時のアクセス性能を実現するデータベースシステム。データウェアハウス上の複雑な分析とインタラクティブなレポートを劇的に高速化する。
分散クエリ処理
大規模なデータボリュームを処理するために、複数の計算ノードでクエリを並列実行する技術。処理を分散タスクに分割し、リソース利用を最適化して応答時間を短縮する。
データフェデレーション
物理的な複製なしに、異種ソースからのデータを統合した仮想的なビューを提供する統合アプローチ。ソースデータを保持しながら、分散システム上でのリアルタイム分析を可能にする。
集計テーブル
繰り返し発生するクエリを高速化するために、様々な粒度レベルで事前計算された要約データを含むテーブル。大規模ボリュームに対するBIレポートのパフォーマンス向上に不可欠な最適化戦略。
スローレイチェンジディメンション (SCD)
ディメンションテーブルにおける変更を管理し、属性の履歴的変化を追跡する技術。データの時間的追跡性の必要性に応じて、異なる戦略(タイプ1、2、3)を実装する。
データパイプライン
ソースから最終目的地までデータを捕捉、変換、配信する自動化されたプロセスの連鎖。分析システムやBIアプリケーションを供給するための継続的なデータフローを調整する。