এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
238
বিভাগ
3,112
উপ-বিভাগ
36,890
শব্দ
শব্দ
ভিজ্যুয়াল সেলফ-অ্যাটেনশন
প্রতিটি ইমেজ প্যাচের জন্য অন্যান্য সকল প্যাচের সাথে আপেক্ষিক গুরুত্ব মূল্যায়নের প্রক্রিয়া, যা কনভোলিউশন ছাড়াই গ্লোবাল নির্ভরতা ক্যাপচার করে।
শব্দ
ক্রস-অ্যাটেনশন ডিটেকশন
দ্বিমুখী প্রক্রিয়া যেখানে অবজেক্ট কুয়েরিগুলো ইমেজ ফিচারগুলোর সাথে ইন্টারঅ্যাক্ট করে একইসাথে অবজেক্ট লোকালাইজ ও ক্লাসিফাই করার জন্য।
শব্দ
টোকেন-টু-টোকেন ViT
একটি ভেরিয়েন্ট যা টোকেনগুলোর মধ্যে ধাপে ধাপে ট্রানজিশন প্রবর্তন করে, রিসাইজিং ও রিকম্বিনেশনের মাধ্যমে লোকাল স্ট্রাকচারাল ইনফরমেশন সংরক্ষণ করে।
শব্দ
ট্রান্সফরমার ডিকোডার হেড
DETR আর্কিটেকচারের ফাইনাল মডিউল যা এনকোডার ফিচারগুলোকে অবজেক্ট কুয়েরিতে অ্যাটেনশনের মাধ্যমে বাউন্ডিং বক্স ও ক্লাস প্রেডিকশনে রূপান্তর করে।
🔍