評価と指標
アライメント(整合性)
LLMの振る舞いが人間の意図、倫理的価値、および与えられた指示と一致していることを保証するためのプロセスおよび指標です。アライメントの評価では、モデルが有用(Helpful)、無害(Harmless)、正直(Honest)であるかどうか(HHHフレームワーク)が確認されます。
← 戻るLLMの振る舞いが人間の意図、倫理的価値、および与えられた指示と一致していることを保証するためのプロセスおよび指標です。アライメントの評価では、モデルが有用(Helpful)、無害(Harmless)、正直(Honest)であるかどうか(HHHフレームワーク)が確認されます。
← 戻る