মাল্টিমোডাল ট্রান্সফরমার
PaLI (পাথওয়েজ ল্যাঙ্গুয়েজ অ্যান্ড ইমেজ মডেল)
পাথওয়েজ ভিত্তিক বিশাল মাল্টিমোডাল মডেল, যা ভিজুয়াল ট্রান্সলেশন এবং ভিজুয়াল প্রশ্নোত্তর টাস্কের জন্য একটি ইমেজ এনকোডার এবং টেক্সট এনকোডার-ডিকোডারকে একত্রিত করে।
← ফিরে যান