এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
মাস্কড অ্যাটেনশন
ডিকোডারে ব্যবহৃত সেল্ফ-অ্যাটেনশনের একটি বৈকল্পিক যা প্রতিটি অবস্থানকে পরবর্তী অবস্থানগুলিতে মনোযোগ দেওয়া থেকে বিরত রাখে, স্বয়ংক্রিয় রিগ্রেসিভ জেনারেশন নিশ্চিত করে এবং তথ্য ফাঁস প্রতিরোধ করে।
বাইডিরেকশনাল এনকোডার-ডিকোডার
একটি আর্কিটেকচার যেখানে এনকোডার ইনপুট সিকোয়েন্সকে উভয় দিকে (বাম ও ডান প্রসঙ্গ) প্রক্রিয়া করে একটি সম্পূর্ণ উপস্থাপনা তৈরি করে, অন্যদিকে ডিকোডার স্বয়ংক্রিয় রিগ্রেসিভভাবে আউটপুট তৈরি করে।
টোকেন এম্বেডিং
প্রতিটি ইনপুট টোকেনের ঘন ভেক্টর উপস্থাপনা যা প্রশিক্ষণের সময় শেখা হয়, যার মাধ্যমে শব্দার্থিক ও বাক্য গঠন সংক্রান্ত তথ্য ধারণ করা হয় এবং অ্যাটেনশন স্তরগুলির জন্য প্রারম্ভিক বিন্দু হিসেবে কাজ করে।
কোসাইন লার্নিং রেট
শেখার হার নির্ধারণের একটি কৌশল যা একটি কোসাইন ফাংশন অনুসারে হ্রাস পায়, প্রাথমিক ওয়ার্ম-আপ পর্যায় সহ, যা ট্রান্সফরমার মডেলগুলির জন্য উন্নত কনভারজেন্স পারফরম্যান্স প্রদর্শন করে।
কী-ভ্যালু-কোয়েরি মেকানিজম
অ্যাটেনশন মেকানিজমের মৌলিক বিমূর্ততা যেখানে প্রতিটি টোকেন তিনটি ভেক্টরে প্রক্ষেপিত হয়: কোয়েরি (আমি কী খুঁজছি), কী (আমার কী আছে) এবং ভ্যালু (আমি কী ফেরত দিই), অ্যাটেনশন ওজন গণনা করার জন্য।