ভিশন ট্রান্সফরমার্স (ViT)
প্যাচ মার্জিং
হায়ারার্কিক্যাল ট্রান্সফরমারগুলিতে একটি অপারেশন যা ২x২ সংলগ্ন প্যাচের গ্রুপগুলিকে একত্রিত করে নিম্ন রেজোলিউশনের টোকেন তৈরি করে, ফলে গভীরতা এবং রিসেপ্টিভ ফিল্ড বৃদ্ধি পায়।
← ফিরে যান