বেঞ্চমার্ক এবং মূল্যায়ন
ম্যাথ (গাণিতিক যুক্তি)
প্রতিযোগিতামূলক স্তরের গাণিতিক সমস্যার একটি ডেটাসেট যা এলএলএম-এর গাণিতিক যুক্তির ক্ষমতা মূল্যায়ন করে, যার মধ্যে রয়েছে বীজগণিত, জ্যামিতি এবং সংখ্যাতত্ত্ব, যা জটিল সমস্যা সমাধানের দক্ষতা পরিমাপ করে।
← ফিরে যান