AI用語集

人工知能の完全辞典

236

カテゴリ

3,245

サブカテゴリ

39,334

用語

モデルの大部分の重みを凍結したまま、パラメータの小さなサブセットのみを変更するファインチューニング手法で、計算コストとストレージコストを削減する。

4ビット量子化と低ランク適応を組み合わせたLoRAの変種で、限られたハードウェアリソースで非常に大規模なモデルのファインチューニングを可能にする。

モデルの重みを変更せずに、入力シーケンスに追加された連続的なプレフィックスのみを最適化し、特定のタスクにモデルの動作を適応させる手法。

事前学習済みモデルの内部パラメータを変更せずに、その動作を導くために特別に学習されたプロンプト埋め込みを最適化する手法。

指示と応答のペアで追加学習を行い、モデルが指示を正確に理解し、適切な応答を生成することを学習させるプロセス。

中間的な報酬モデルを必要とせず、人間の選好データから直接モデルを最適化するRLHFの代替手法で、アライメントプロセスを簡素化する。

🔍