Transformers Multimodaux
ALIGN
স্বয়ংক্রিয়ভাবে ফিল্টার করা এক বিলিয়ন নয়েজি জোড়ার উপর প্রশিক্ষিত একটি কনট্রাস্টিভ ইমেজ-টেক্সট মডেল। প্রদর্শন করে যে বৃহৎ-স্কেল বহু-মডাল শেখার ক্ষেত্রে ডেটার পরিমাণ নয়েজের ক্ষতিপূরণ দিতে পারে।
← ফিরে যান