এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
মড্যালিটি অ্যালাইনমেন্ট
ক্রস-মড্যাল স্থানান্তর সহজতর করার জন্য বিভিন্ন মড্যালিটির উপস্থাপনা স্থানগুলিকে একটি সাধারণ ভেক্টর স্থানে সারিবদ্ধ করার লক্ষ্যে প্রশিক্ষণ প্রক্রিয়া।
পারসিভার
একটি সাধারণ ট্রান্সফরমার আর্কিটেকচার যা ইনপুট এবং লেটেন্ট বটলনেকের মধ্যে ক্রস-অ্যাটেনশন মেকানিজম ব্যবহার করে নির্বিচারে মাল্টিমড্যাল ডেটা প্রক্রিয়া করতে সক্ষম।
ইউনিফাইড মাল্টিমড্যাল প্রি-ট্রেনিং
একই সময়ে একাধিক কাজ এবং মড্যালিটিতে একটি একক মডেল প্রি-ট্রেনিং করার পদ্ধতি যাতে আরও সাধারণ এবং স্থানান্তরযোগ্য উপস্থাপনা পাওয়া যায়।
ইমেজ ক্যাপশনিং ট্রান্সফরমার
এনকোডার-ডিকোডার ট্রান্সফরমার আর্কিটেকচার যা ইনপুট ইমেজের জন্য স্বয়ংক্রিয়ভাবে বর্ণনামূলক এবং সামঞ্জস্যপূর্ণ টেক্সটুয়াল বিবরণ তৈরি করে।
অডিও-ভিজুয়াল ট্রান্সফরমার
ট্রান্সফরমার মডেল যা অডিওভিজুয়াল রিকগনিশন বা সিঙ্ক্রোনাইজড জেনারেশনের মতো কাজের জন্য একই সাথে অডিও এবং ভিডিও স্ট্রিম প্রক্রিয়া করে।
ভিডিও ট্রান্সফরমার
ভিশন ট্রান্সফরমারের একটি বৈকল্পিক যা স্পেসিও-টেম্পোরাল অ্যাটেনশনের মাধ্যমে টেম্পোরাল তথ্য অন্তর্ভুক্ত করে ভিডিও ফ্রেমের সিকোয়েন্সিয়াল প্রসেসিংয়ের জন্য অভিযোজিত।
ট্রান্সফরমার-ভিত্তিক মাল্টিমড্যাল ফিউশন
ট্রান্সফরমারের অ্যাটেনশন মেকানিজম ব্যবহার করে একাধিক মড্যালিটির বৈশিষ্ট্যগুলিকে সেমান্টিক স্তরে বুদ্ধিমত্তার সাথে একত্রিত করার কৌশল।