AI用語集
人工知能の完全辞典
ストリームクラスタリング
継続的かつ潜在的に無限に到着するデータを、リアルタイムかつ限られたリソースで分割することを目的とする手法の集合。
マクロクラスタ
クラスターの安定した長期的な表現であり、ストリームの持続的な傾向を捉えるために、マイクロクラスタの統合や進化から導出されることが多い。
ランドマークウィンドウ
時間内の固定された開始点からすべてのデータを処理するメモリモデルであり、重要なイベントからの変化を分析するのに役立つ。
密度ベースストリームクラスタリング
ストリーム内のデータポイントの密集領域を識別するクラスタリング手法であり、任意の形状のクラスタを扱ったり、ノイズを検出したりすることができる。
DBSTREAMアルゴリズム
メモリの効率的な管理とドリフトの迅速な検出のために、高密度グリッドとマイクロクラスタを使用する密度ベースのストリームクラスタリングアルゴリズム。
密度係数
一部のストリームクラスタリングアルゴリズムで使用される指標であり、マイクロクラスタの密度を評価して、その作成、統合、または削除に影響を与える。
減衰重み
より古いデータポイントに低下する重要性を割り当てるメカニズムであり、モデルがストリームの最近の傾向に集中できるようにする。
オンラインクラスタリング
データセット全体を必要とせず、各新しいデータポイントを増分的に処理してマイクロクラスタに割り当てるプロセスの段階。
オフラインクラスタリング (Offline Clustering)
既存のマイクロクラスタから最終的なマクロクラスタを生成するオプションのフェーズで、多くの場合、特定の時点での分析のためにユーザーの要求に応じて実行されます。
動的グリッド (Dynamic Grid)
セルを分割または結合することでデータストリーム内のデータ分布の変化を追跡し、メモリ使用量を最適化する適応型の空間データ構造。
ストリーム異常検知 (Stream Anomaly Detection)
ストリームクラスタリングに統合されたプロセスであり、どの高密度クラスタにも属さないデータポイントを識別し、それらを異常値またはノイズとして通知します。
クラスタ要約 (Cluster Synopsis)
中心、半径、重みなどの重要な統計情報を含むクラスタ(またはマイクロクラスタ)の簡潔な表現であり、効率的な計算を可能にします。
DenStreamアルゴリズム
ポテンシャルマイクロクラスタとコアマイクロクラスタを区別し、出現中のクラスタや安定したクラスタをモデル化する、密度ベースのストリームクラスタリングアルゴリズムです。
タイムホライズン (Time Horizon)
ストリームクラスタリングモデルにおけるデータの有効期間を定義するパラメータであり、モデルが古い情報を忘れる速度に影響を与えます。