ভিশন ট্রান্সফরমার্স (ViT)
ডিইআইটি (ডেটা-এফিশিয়েন্ট ইমেজ ট্রান্সফরমার)
ভিআইটি-এর একটি রূপ যা কম পরিমাণ ডেটা দিয়ে প্রশিক্ষণযোগ্য, জ্ঞান ডিস্টিলেশন কৌশলের মাধ্যমে যেখানে একটি ডিস্টিলেশন টোকেন যোগ করা হয় যাতে একটি সিএনএন শিক্ষকের কাছ থেকে শেখা যায়।
← ফিরে যান