BenchVibe AI Ecosystem

VIP 👤

🏠 Beranda

Benchmark

📊 Semua Benchmark 🦖 Dinosaurus v1 🦖 Dinosaurus v2 ✅ Aplikasi To-Do List 🎨 Halaman Bebas Kreatif 🎯 FSACB - Showcase Utama 🌍 Benchmark Terjemahan

Model

🏆 Top 10 Model 🆓 Model Gratis 📋 Semua Model ⚙️ Kilo Code

Sumber Daya

💬 Perpustakaan Prompt 📖 Glosarium AI 🔗 Tautan Berguna

📖

Benchmarks et Évaluation

MATH (Mathematical Reasoning)

Dataset de problèmes mathématiques de niveau compétition évaluant les capacités de raisonnement mathématique des LLM, incluant algèbre, géométrie et théorie des nombres pour mesurer la résolution de problèmes complexes.

← Kembali