🏠 হোম
বেঞ্চমার্ক
📊 সমস্ত বেঞ্চমার্ক 🦖 ডাইনোসর v1 🦖 ডাইনোসর v2 ✅ টু-ডু লিস্ট অ্যাপস 🎨 সৃজনশীল ফ্রি পেজ 🎯 FSACB - চূড়ান্ত শোকেস 🌍 অনুবাদ বেঞ্চমার্ক
মডেল
🏆 সেরা ১০টি মডেল 🆓 ফ্রি মডেল 📋 সমস্ত মডেল ⚙️ কিলো কোড
রিসোর্স
💬 প্রম্পট লাইব্রেরি 📖 এআই গ্লসারি 🔗 দরকারী লিঙ্ক
📖
RL মাল্টি-অবজেক্টিভস কন্টিনিউ

পছন্দ-ভিত্তিক আরএল

একটি পদ্ধতি যেখানে উদ্দেশ্যগুলির মধ্যে ট্রেড-অফ সম্পর্কে মানুষের পছন্দগুলি শেখার প্রক্রিয়ায় সংহত করা হয়, যাতে এজেন্টকে প্যারেটো ফ্রন্টের কাঙ্খিত সমাধানের দিকে পরিচালিত করা যায়।

← ফিরে যান