এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
কন্টেনশন
এলএলএম-এর আউটপুট সীমিত বা নির্দেশিত করার একটি প্রক্রিয়া যা অবাঞ্ছিত, বিপজ্জনক বা সংজ্ঞায়িত সুযোগের বাইরের বিষয়বস্তু তৈরি করা এড়াতে ব্যবহৃত হয়।
প্রম্পট গার্ডরেল
ব্যবহারকারীর ইনপুটের উপর পূর্ববর্তীভাবে প্রয়োগ করা নিয়ম ও ফিল্টারের সমষ্টি যা দূষিত, অনুপযুক্ত বা মডেলের নিরাপত্তা নীতি এড়ানোর চেষ্টাকারী অনুরোধ সনাক্ত করতে এবং ব্লক করতে ব্যবহৃত হয়।
আউটপুট ফিল্টারিং
পোস্ট-জেনারেশন নিরাপত্তা প্রক্রিয়া যা এলএলএম-এর প্রতিক্রিয়া বিশ্লেষণ করে এবং ব্যবহারকারীর কাছে উপস্থাপনের আগে নিষিদ্ধ বিষয়বস্তু চিহ্নিত ও অপসারণ করে।
জেলব্রেকিং
এলএলএম-এর কন্টেনশন ও নিরাপত্তা প্রক্রিয়া এড়ানোর জন্য রিভার্স ইঞ্জিনিয়ারিং কৌশলের সমষ্টি যা সাধারণত নিষিদ্ধ প্রতিক্রিয়া তৈরি করতে বাধ্য করে।
সেফটি লেয়ার
একটি পৃথক সফ্টওয়্যার উপাদান, প্রায়শই একটি ক্লাসিফিকেশন মডেল, যা এলএলএম-এর ইনপুট ও আউটপুট ইন্টারসেপ্ট করে নিরাপত্তা নীতির সাথে তাদের সম্মতি মূল্যায়ন করে।
ডিকোডিং অ্যালাইনমেন্ট
ডিকোডিং প্রক্রিয়া পরিবর্তনের কৌশল (যেমন: বিম সার্চ, স্যাম্পলিং) যা নিরাপত্তাহীন বিষয়বস্তুর সাথে যুক্ত টোকেন বা টোকেন সিকোয়েন্স তৈরি করতে বাধা দেয়।
সেলফ-ক্রিটিক
এলএলএম-এর নিজস্ব তৈরি করা প্রতিক্রিয়াকে পূর্বনির্ধারিত মানদণ্ডের (সঙ্গতি, নিরাপত্তা, সঠিকতা) সাথে তুলনা করে মূল্যায়ন করা এবং প্রয়োজনে সংশোধন করার ক্ষমতা।
অ্যাডভারসারিয়াল সাফিক্স
শেখা অক্ষরের ক্রম যা প্রম্পটের শেষে যোগ করা হয় এলএলএম-এর অভ্যন্তরীণ আচরণ নিয়ন্ত্রণ করতে এবং একটি নির্দিষ্ট আউটপুট জোর করতে, প্রায়শই জেলব্রেকিং আক্রমণে ব্যবহৃত হয়।
পছন্দ মডেলিং
মানুষের পছন্দ শেখার জন্য জোড়া ভিত্তিক উত্তরের তুলনা থেকে একটি পুরস্কার মডেল তৈরির প্রক্রিয়া, যা RLHF-এর জন্য অপরিহার্য।
প্রত্যাখ্যান প্রশিক্ষণ
বিশেষায়িত প্রশিক্ষণের পর্যায় যেখানে LLM অনুপযুক্ত অনুরোধ চিহ্নিত করতে এবং উত্তর দেওয়ার চেষ্টা করার পরিবর্তে বিনয়ী ও তথ্যপূর্ণ প্রত্যাখ্যান উত্তর তৈরি করতে শেখে।
অনিষ্টকরতা শ্রেণীবিভাগ
দ্বিমুখী শ্রেণীবিভাগের কাজ যা নির্ধারণ করে যে একটি LLM-এর আউটপুট 'অনিষ্টকর' নাকি 'ক্ষতিকর', যা প্রায়শই নিরাপত্তা ফিল্টার হিসেবে বাস্তবায়িত হয়।
চাটুকারিতা প্রশমন
LLM-এর ব্যবহারকারীকে খুশি করতে ভুল প্রেক্ষাপটের সাথে একমত হওয়ার প্রবণতা কমানোর কৌশলসমূহ, একটি অবাঞ্ছিত আচরণ যা সত্যনিষ্ঠতা ক্ষুণ্ণ করে।
মডেল স্টিয়ারিং
ইনফারেন্সের সময় LLM-এর আচরণ গতিশীলভাবে সামঞ্জস্য করার কৌশল, প্রায়শই লজিট পরিবর্তন করে, জেনারেশনকে কাঙ্ক্ষিত ও নিরাপদ উত্তর স্পেসের দিকে নির্দেশিত করার জন্য।