ভিশন ট্রান্সফরমার (ViT)
বৃহৎ স্কেল ডেটাসেটে প্রি-ট্রেনিং
ImageNet-21k বা JFT-300M-এর মতো বিশাল কর্পাসে ViT-এর প্রাথমিক প্রশিক্ষণ পর্যায়, যা এর দুর্বল ইন্ডাকটিভ বায়াস কাটিয়ে উঠতে এবং ভাল পারফরম্যান্স অর্জনের জন্য অপরিহার্য।
← ফিরে যান