BenchVibe AI Ecosystem

VIP 👤

🏠 ホーム

ベンチマーク

📊 すべてのベンチマーク 🦖 恐竜 v1 🦖 恐竜 v2 ✅ To-Doリストアプリ 🎨 クリエイティブフリーページ 🎯 FSACB - アルティメットショーケース 🌍 翻訳ベンチマーク

モデル

🏆 トップ10モデル 🆓 無料モデル 📋 すべてのモデル ⚙️ 🛠️ Kilo Code モード

リソース

💬 💬 プロンプトライブラリ 📖 📖 AI用語集 🔗 🔗 有用なリンク

📖

評価と指標

BLEU (Bilingual Evaluation Understudy)

機械翻訳の品質を評価するための自動指標で、生成されたテキストのn-gram適合率を1つ以上の人間の参照訳と比較して評価します。モデルの出力と参照テキスト間のテキストセグメントの重なりを測定します。

← 戻る