বিতর্ক নিয়ন্ত্রণ প্রক্রিয়া - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

কন্টেনশন

এলএলএম-এর আউটপুট সীমিত বা নির্দেশিত করার একটি প্রক্রিয়া যা অবাঞ্ছিত, বিপজ্জনক বা সংজ্ঞায়িত সুযোগের বাইরের বিষয়বস্তু তৈরি করা এড়াতে ব্যবহৃত হয়।

📖

শব্দ

প্রম্পট গার্ডরেল

ব্যবহারকারীর ইনপুটের উপর পূর্ববর্তীভাবে প্রয়োগ করা নিয়ম ও ফিল্টারের সমষ্টি যা দূষিত, অনুপযুক্ত বা মডেলের নিরাপত্তা নীতি এড়ানোর চেষ্টাকারী অনুরোধ সনাক্ত করতে এবং ব্লক করতে ব্যবহৃত হয়।

📖

শব্দ

আউটপুট ফিল্টারিং

পোস্ট-জেনারেশন নিরাপত্তা প্রক্রিয়া যা এলএলএম-এর প্রতিক্রিয়া বিশ্লেষণ করে এবং ব্যবহারকারীর কাছে উপস্থাপনের আগে নিষিদ্ধ বিষয়বস্তু চিহ্নিত ও অপসারণ করে।

📖

শব্দ

জেলব্রেকিং

এলএলএম-এর কন্টেনশন ও নিরাপত্তা প্রক্রিয়া এড়ানোর জন্য রিভার্স ইঞ্জিনিয়ারিং কৌশলের সমষ্টি যা সাধারণত নিষিদ্ধ প্রতিক্রিয়া তৈরি করতে বাধ্য করে।

📖

শব্দ

সেফটি লেয়ার

একটি পৃথক সফ্টওয়্যার উপাদান, প্রায়শই একটি ক্লাসিফিকেশন মডেল, যা এলএলএম-এর ইনপুট ও আউটপুট ইন্টারসেপ্ট করে নিরাপত্তা নীতির সাথে তাদের সম্মতি মূল্যায়ন করে।

📖

শব্দ

ডিকোডিং অ্যালাইনমেন্ট

ডিকোডিং প্রক্রিয়া পরিবর্তনের কৌশল (যেমন: বিম সার্চ, স্যাম্পলিং) যা নিরাপত্তাহীন বিষয়বস্তুর সাথে যুক্ত টোকেন বা টোকেন সিকোয়েন্স তৈরি করতে বাধা দেয়।

📖

শব্দ

সেলফ-ক্রিটিক

এলএলএম-এর নিজস্ব তৈরি করা প্রতিক্রিয়াকে পূর্বনির্ধারিত মানদণ্ডের (সঙ্গতি, নিরাপত্তা, সঠিকতা) সাথে তুলনা করে মূল্যায়ন করা এবং প্রয়োজনে সংশোধন করার ক্ষমতা।

📖

শব্দ

অ্যাডভারসারিয়াল সাফিক্স

শেখা অক্ষরের ক্রম যা প্রম্পটের শেষে যোগ করা হয় এলএলএম-এর অভ্যন্তরীণ আচরণ নিয়ন্ত্রণ করতে এবং একটি নির্দিষ্ট আউটপুট জোর করতে, প্রায়শই জেলব্রেকিং আক্রমণে ব্যবহৃত হয়।

📖

শব্দ

পছন্দ মডেলিং

মানুষের পছন্দ শেখার জন্য জোড়া ভিত্তিক উত্তরের তুলনা থেকে একটি পুরস্কার মডেল তৈরির প্রক্রিয়া, যা RLHF-এর জন্য অপরিহার্য।

📖

শব্দ

প্রত্যাখ্যান প্রশিক্ষণ

বিশেষায়িত প্রশিক্ষণের পর্যায় যেখানে LLM অনুপযুক্ত অনুরোধ চিহ্নিত করতে এবং উত্তর দেওয়ার চেষ্টা করার পরিবর্তে বিনয়ী ও তথ্যপূর্ণ প্রত্যাখ্যান উত্তর তৈরি করতে শেখে।

📖

শব্দ

অনিষ্টকরতা শ্রেণীবিভাগ

দ্বিমুখী শ্রেণীবিভাগের কাজ যা নির্ধারণ করে যে একটি LLM-এর আউটপুট 'অনিষ্টকর' নাকি 'ক্ষতিকর', যা প্রায়শই নিরাপত্তা ফিল্টার হিসেবে বাস্তবায়িত হয়।

📖

শব্দ

চাটুকারিতা প্রশমন

LLM-এর ব্যবহারকারীকে খুশি করতে ভুল প্রেক্ষাপটের সাথে একমত হওয়ার প্রবণতা কমানোর কৌশলসমূহ, একটি অবাঞ্ছিত আচরণ যা সত্যনিষ্ঠতা ক্ষুণ্ণ করে।

📖

শব্দ

মডেল স্টিয়ারিং

ইনফারেন্সের সময় LLM-এর আচরণ গতিশীলভাবে সামঞ্জস্য করার কৌশল, প্রায়শই লজিট পরিবর্তন করে, জেনারেশনকে কাঙ্ক্ষিত ও নিরাপদ উত্তর স্পেসের দিকে নির্দেশিত করার জন্য।

এআই গ্লসারি

কন্টেনশন

প্রম্পট গার্ডরেল

আউটপুট ফিল্টারিং

জেলব্রেকিং

সেফটি লেয়ার

ডিকোডিং অ্যালাইনমেন্ট

সেলফ-ক্রিটিক

অ্যাডভারসারিয়াল সাফিক্স

পছন্দ মডেলিং

প্রত্যাখ্যান প্রশিক্ষণ

অনিষ্টকরতা শ্রেণীবিভাগ

চাটুকারিতা প্রশমন

মডেল স্টিয়ারিং

কোন ফলাফল পাওয়া যায়নি