Efficient Transformers
সিনথেসাইজার
ভেরিয়েন্ট যেখানে অ্যাটেনশন ওয়েট টোকেনের বিষয়বস্তুর উপর নির্ভর না করে সরাসরি পজিশন এম্বেডিং থেকে শেখা হয় বা ছোট নেটওয়ার্ক দ্বারা উৎপন্ন হয়। এই পদ্ধতি কিউকে সাদৃশ্য গণনার প্রয়োজন দূর করে।
← ফিরে যান