এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
ক্রস-মডাল অ্যাটেনশন
একটি অ্যাটেনশন মেকানিজম যা মডেলকে বিভিন্ন মডালিটি (টেক্সট-ইমেজ, অডিও-টেক্সট) থেকে উপাদানগুলির মধ্যে সম্পর্ক স্থাপন করতে দেয়, প্রাসঙ্গিক বোঝাপড়া সমৃদ্ধ করার জন্য। এই পদ্ধতিটি প্রাসঙ্গিক শব্দার্থিক পারস্পরিক সম্পর্ক চিহ্নিত করতে প্রতিটি মডালিটির বৈশিষ্ট্যগুলির মধ্যে অ্যাটেনশন ওজন গণনা করে।
ক্রস-ডোমেন জেনারেশন
এক বা একাধিক ভিন্ন সোর্স মডালিটি থেকে ইনপুট নিয়ে টার্গেট মডালিটিতে কনটেন্ট তৈরি করার জন্য একটি AI মডেলের ক্ষমতা। এই রূপান্তর উদাহরণস্বরূপ টেক্সচুয়াল বর্ণনা থেকে ইমেজ জেনারেট করা, ভিডিও থেকে অডিও তৈরি করা, বা ইমেজ থেকে টেক্সট সিন্থেসাইজ করার অনুমতি দেয়।
মাল্টিমডাল ডিফিউশন মডেল
একই সময়ে একাধিক মডালিটি জুড়ে সামঞ্জস্যপূর্ণ কনটেন্ট তৈরি করতে ডিফিউশন প্রসেসগুলিকে একত্রিত করে একটি জেনারেটিভ পদ্ধতি। এই মডেলগুলি জটিল আউটপুট যেমন অডিওর সাথে সিঙ্ক্রোনাইজড ভিডিও বা বিস্তারিত বর্ণনা সহ ইমেজ জেনারেট করতে প্রগ্রেসিভ নয়েজ এবং ক্রস-মডাল কন্ডিশন ব্যবহার করে।
শেয়ার্ড প্রজেকশন
যৌথভাবে শেখা প্রজেকশন নেটওয়ার্কের মাধ্যমে বিভিন্ন মডালিটির রিপ্রেজেন্টেশনগুলিকে একটি কমন ভেক্টর স্পেসে ম্যাপ করার কৌশল। এই পদ্ধতি মডালিটিগুলির মধ্যে সরাসরি তুলনা সহজ করে এবং ক্রস-মডাল রিট্রিভাল এবং কন্ডিশনাল জেনারেশনের মতো অপারেশনগুলির অনুমতি দেয়।
মাল্টিমডাল কনট্রাস্টিভ মডেল
পজিটিভ মডালিটি জোড়ার মধ্যে সাদৃশ্য সর্বাধিক করার সময় নেগেটিভ জোড়াগুলির সাদৃশ্য হ্রাস করতে কনট্রাস্টিভ লার্নিং অবজেক্টিভ ব্যবহার করে মডেলগুলির একটি ক্লাস। এই মডেলগুলি শব্দার্থিকভাবে সমৃদ্ধ রিপ্রেজেন্টেশন শেখার ক্ষমতার জন্য অ্যালাইনমেন্ট এবং রিট্রিভাল টাস্কগুলিতে উত্কৃষ্ট।
মাল্টিমডাল লেটেন্ট রিপ্রেজেন্টেশন
একাধিক মডালিটির প্রয়োজনীয় তথ্যগুলিকে কমপ্যাক্ট এবং ব্যাখ্যাযোগ্য উপায়ে এনকোড করে হ্রাসকৃত মাত্রার স্পেস। এই রিপ্রেজেন্টেশনগুলি ক্রস-মডাল পারস্পরিক সম্পর্ক ক্যাপচার করার সময় নয়েজ ফিল্টার করে, দক্ষ জেনারেশন, ক্লাসিফিকেশন এবং রিট্রিভাল টাস্কগুলির অনুমতি দেয়।
মাল্টিমডাল এনকোডিং-ডিকোডিং মডেল
হেটেরোজিনিয়াস ইনপুট প্রসেস করে একটি মাল্টিমডাল এনকোডার এবং টার্গেট মডালিটিতে আউটপুট জেনারেট করে একটি ডিকোডার নিয়ে গঠিত আর্কিটেকচার। এই মডেলগুলি ক্রস-মডাল সিকোয়েন্স-টু-সিকোয়েন্স টাস্ক যেমন ইমেজ-টু-টেক্সট ট্রান্সলেশন বা অডিও-ভিডিও সিন্থেসিসের জন্য বিশেষভাবে কার্যকর।
মাল্টিমডাল অ্যাডাপ্টার
একটি লাইটওয়েট নিউরাল মডিউল যা একটি নির্দিষ্ট মডালিটিতে প্রি-ট্রেইন্ড মডেলগুলিকে সম্পূর্ণ রি-ট্রেনিং ছাড়াই মাল্টিমডাল ইনপুট দক্ষতার সাথে প্রসেস করার জন্য অ্যাডাপ্ট করতে দেয়। এই কম্পোনেন্টগুলি বেস মডেলের ক্ষমতা সংরক্ষণ করার সময় লার্নিং ট্রান্সফার সহজ করে।