AI用語集
人工知能の完全辞典
Cross-Encoder 再ランキング
クエリと各ドキュメントを単一の入力シーケンスとして同時に処理し、相互の関連性を評価する再ランキングアーキテクチャ。このアプローチは計算複雑性の高さを犠牲にして高い精度を提供する。
MonoT5 再ランキング
特別なトークン「True」と「False」を使用してランキングタスクをテキスト生成問題として再定式化するT5ベースの再ランキングモデル。このアプローチは自然言語理解能力を活用して、取得されたドキュメントを効率的に再ランキングする。
ColBERT 再ランキング
ドキュメントとクエリを各トークンの文脈化ベクトルにエンコードするトークンレベルの遅延相互作用に基づく再ランキングシステム。この方法は、許容可能な計算効率を維持しながら、きめ細かいマッチングを捉える。
BGE ランカー
セマンティック検索タスク向けに最適化された再ランキングモデルで、大規模な関連性データコーパスでクロスエンコーダアーキテクチャを用いて学習。RAGシステムにおいて関連文書と非関連文書の微細な識別に優れる。
リストワイズ損失
個々のペアではなく、取得された文書リストの完全な順序を直接最適化する損失関数。このアプローチは全体の関連性分布を考慮して再ランキングの品質を向上させる。
ペアワイズ損失
より関連性の高い文書と低い文書を識別することを学習するために文書ペアを比較する学習関数。この方法は教師あり学習の再ランキングシステムで特に効果的。
マルチステージ検索
広範な初期検索と、段階的に精度を高める1つ以上の再ランキングレベルを含む複数の連続的なフェーズから構成される検索アーキテクチャ。このアプローチは大規模RAGシステムにおいて効率性と精度のバランスを取る。
パッセージ再ランキング
関連コンテンツ選択の粒度を高めるために、全文書ではなく特定のパッセージやテキストセグメントに適用される再ランキングプロセス。この技術はRAGにおける生成入力の品質を最適化する。
ランキング学習 (LTR)
情報のランキングに適用される機械学習のパラダイムで、モデルが関連性に基づいてアイテムを順序付けるように訓練される。LTRはNDCGやMAPなどのランキング指標を最適化するために多様な特徴を組み合わせる。
ニューラル情報検索
ニューラルネットワークを使用して、クエリとドキュメント間の関連性を密なベクトル表現でモデル化する情報検索アプローチ。この手法は、単純なキーワードマッチングを超えた複雑な意味的関係を捉える。
密な検索による再ランキング
密な埋め込みに基づく再ランキング技術で、意味空間におけるベクトル類似度を使用して、最初に検索されたドキュメントの関連性を再評価する。この手法は最終的な品質を向上させるために初期検索結果を洗練する。
クエリ-ドキュメント相互作用
再ランキングシステムにおける基本的なメカニズムで、クエリの用語とドキュメントの用語間の相互作用を明示的にモデル化して関連性スコアを計算する。このアプローチは独立した表現を超えた複雑な依存関係を捉える。
関連性フィードバックループ
ランキングされた結果に対する関連性判断を使用して、再ランキングモデルまたはクエリ自体を洗練する反復プロセス。この適応学習技術はシステムのパフォーマンスを継続的に改善する。
アテンションベース再ランキング
クエリに関連するドキュメントの最も関連性の高い部分を特定し重み付けするために注意メカニズムを使用する再ランキングアーキテクチャ。このアプローチは文脈的に細かいドキュメント関連性評価を可能にする。