評価と指標
BLEU (Bilingual Evaluation Understudy)
機械翻訳の品質を評価するための自動指標で、生成されたテキストのn-gram適合率を1つ以上の人間の参照訳と比較して評価します。モデルの出力と参照テキスト間のテキストセグメントの重なりを測定します。
← 戻る機械翻訳の品質を評価するための自動指標で、生成されたテキストのn-gram適合率を1つ以上の人間の参照訳と比較して評価します。モデルの出力と参照テキスト間のテキストセグメントの重なりを測定します。
← 戻る