বেঞ্চমার্ক এবং মূল্যায়ন
হিউম্যানইভাল
ওপেনএআই দ্বারা তৈরি ১৬৪টি পাইথন প্রোগ্রামিং সমস্যার একটি সেট যা এলএলএম-এর কার্যকরী কোড তৈরি করার ক্ষমতা মূল্যায়ন করার জন্য তৈরি করা হয়েছে। এটি স্বয়ংক্রিয় ইউনিট টেস্টের মাধ্যমে সিনট্যাক্টিক এবং অ্যালগরিদমিক বোঝাপড়া পরিমাপ করে।
← ফিরে যান