🏠 হোম
বেঞ্চমার্ক
📊 সমস্ত বেঞ্চমার্ক 🦖 ডাইনোসর v1 🦖 ডাইনোসর v2 ✅ টু-ডু লিস্ট অ্যাপস 🎨 সৃজনশীল ফ্রি পেজ 🎯 FSACB - চূড়ান্ত শোকেস 🌍 অনুবাদ বেঞ্চমার্ক
মডেল
🏆 সেরা ১০টি মডেল 🆓 ফ্রি মডেল 📋 সমস্ত মডেল ⚙️ কিলো কোড
রিসোর্স
💬 প্রম্পট লাইব্রেরি 📖 এআই গ্লসারি 🔗 দরকারী লিঙ্ক

এআই গ্লসারি

কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান

238
বিভাগ
3,112
উপ-বিভাগ
36,890
শব্দ
📖
শব্দ

মাল্টিমোডাল ট্রান্সফরমার

ট্রান্সফরমার-ভিত্তিক নিউরাল নেটওয়ার্ক আর্কিটেকচার যা একইসাথে একাধিক মোডালিটির ডেটা প্রক্রিয়া ও সংহত করার জন্য ডিজাইন করা হয়েছে, যেমন টেক্সট, ইমেজ, অডিও বা ভিডিও, একটি সাধারণ রিপ্রেজেন্টেশন স্পেসে।

📖
শব্দ

ইউনিফাইড রিপ্রেজেন্টেশন স্পেস

একটি অনন্য লেটেন্ট ভেক্টর স্পেস যেখানে সমস্ত মোডালিটির এমবেডিং (টেক্সট, ইমেজ ইত্যাদি) প্রজেক্ট করা হয়, যা সরাসরি সেমান্টিক তুলনা এবং মাল্টিমোডাল রিজনিং অপারেশন সম্ভব করে।

📖
শব্দ

ভিশন-ল্যাঙ্গুয়েজ মডেল (VLM)

মাল্টিমোডাল ট্রান্সফরমারের একটি নির্দিষ্ট শ্রেণী যা টেক্সট এবং ইমেজের যৌথ বোঝাপড়ায় বিশেষায়িত, ইমেজ ক্যাপশনিং, VQA বা টেক্সট দ্বারা ইমেজ সার্চের মতো কাজে ব্যবহৃত হয়।

📖
শব্দ

ALBEF (এলাইন বিফোর ফিউজ)

একটি ভিশন-ল্যাঙ্গুয়েজ মডেল যা টেক্সট এবং ইমেজ রিপ্রেজেন্টেশনকে ফিউজ করার আগে এলাইন করার জন্য কনট্রাস্টিভ প্রি-ট্রেনিং ব্যবহার করে, ইন্টারঅ্যাকশনের গুণমান উন্নত করে।

📖
শব্দ

মোডালিটি-অ্যাগনস্টিক এমবেডিং

একটি মাল্টিমোডাল মডেল দ্বারা শেখা ভেক্টর রিপ্রেজেন্টেশন যা মূল মোডালিটি থেকে স্বাধীন সেমান্টিক্স ক্যাপচার করে, উদাহরণস্বরূপ একটি টেক্সচুয়াল কুয়েরি থেকে ইমেজ খুঁজে পাওয়া সম্ভব করে।

📖
শব্দ

মাল্টিমোডাল ফাউন্ডেশন মডেল

বৃহৎ এবং বৈচিত্র্যময় ডেটা (টেক্সট, ইমেজ, অডিও ইত্যাদি) উপর প্রি-ট্রেন করা বড় মডেল, যা ন্যূনতম প্রচেষ্টায় ডাউনস্ট্রিম টাস্কগুলির বিস্তৃত পরিসরে অ্যাডাপ্ট করার জন্য ডিজাইন করা হয়েছে।

📖
শব্দ

ইউনিফাইড-আইও

একটি ইউনিফাইড মডেল যা ইনপুট (টেক্সট, ইমেজ, অডিও ইত্যাদি) এবং আউটপুট (টেক্সট জেনারেশন, ড্রয়িং ইত্যাদি) এর বিস্তৃত পরিসর প্রক্রিয়া করে একটি একক ট্রান্সফরমার আর্কিটেকচার এবং ইউনিফাইড সিকোয়েন্স ফরম্যাট ব্যবহার করে।

📖
শব্দ

ভিজুয়াল প্যাচ এমবেডিং

ভিশন ট্রান্সফরমার (ViT) দ্বারা জনপ্রিয়কৃত টেকনিক যেখানে একটি ইমেজকে ওভারল্যাপিং ছাড়া প্যাচের গ্রিডে কাটা হয়, প্রতিটি প্যাচ লিনিয়ারাইজড এবং একটি টোকেন হিসেবে প্রক্রিয়া করার জন্য এমবেডিং ভেক্টরে প্রজেক্ট করা হয়।

📖
শব্দ

মাল্টিটাস্ক মাল্টিমোডাল প্রি-ট্রেনিং

প্রি-ট্রেনিং কৌশল যেখানে মডেলটি বিভিন্ন মোডালিটি থেকে একই সাথে একাধিক উদ্দেশ্যে অপ্টিমাইজ করা হয় (যেমন: ভাষা মাস্কিং, ইমেজ প্রেডিকশন, অডিও-টেক্সট অ্যালাইনমেন্ট) যাতে শক্তিশালী উপস্থাপনা শেখা যায়।

🔍

কোন ফলাফল পাওয়া যায়নি