AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
用語
パラメータ効率の良いファインチューニング (PEFT)
モデルの大部分の重みを凍結したまま、パラメータの小さなサブセットのみを変更するファインチューニング手法で、計算コストとストレージコストを削減する。
用語
QLoRA (量子化LoRA)
4ビット量子化と低ランク適応を組み合わせたLoRAの変種で、限られたハードウェアリソースで非常に大規模なモデルのファインチューニングを可能にする。
用語
プレフィックスチューニング
モデルの重みを変更せずに、入力シーケンスに追加された連続的なプレフィックスのみを最適化し、特定のタスクにモデルの動作を適応させる手法。
用語
プロンプトチューニング
事前学習済みモデルの内部パラメータを変更せずに、その動作を導くために特別に学習されたプロンプト埋め込みを最適化する手法。
用語
指示ファインチューニング
指示と応答のペアで追加学習を行い、モデルが指示を正確に理解し、適切な応答を生成することを学習させるプロセス。
用語
DPO (直接選好最適化)
中間的な報酬モデルを必要とせず、人間の選好データから直接モデルを最適化するRLHFの代替手法で、アライメントプロセスを簡素化する。
🔍