এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
সাংবিধানিক এআই
একটি সংবিধান বা পূর্বনির্ধারিত নীতিমালার সেট অনুসরণ করে মডেলগুলিকে সারিবদ্ধ করার পদ্ধতি, যা তাদের নৈতিক নিয়ম অনুযায়ী স্ব-মূল্যায়ন এবং সংশোধন করতে সক্ষম করে।
রেড টিমিং
দুর্বলতা শনাক্ত করতে এবং সংশোধন করতে বিশেষজ্ঞদের দ্বারা মডেলের দুর্বলতা মূল্যায়নের পদ্ধতিগত প্রক্রিয়া, যা সক্রিয়ভাবে অবাঞ্ছিত বা বিপজ্জনক আচরণ উদ্দীপিত করে।
নিরাপত্তা সারিবদ্ধকরণ
প্রযুক্তির একটি সেট যা নিশ্চিত করে যে ভাষা মডেলগুলি তাদের সামগ্রিক কর্মক্ষমতা বজায় রাখার সময় ক্ষতিকর, বিপজ্জনক বা অনুপযুক্ত বিষয়বস্তু তৈরি করা এড়ায়।
মূল্যবোধ সারিবদ্ধকরণ
এআই সিস্টেমের লক্ষ্য এবং আচরণকে মৌলিক মানবিক মূল্যবোধের সাথে সারিবদ্ধ করার প্রক্রিয়া, যা মানবিক পছন্দ এবং নৈতিকতার সূক্ষ্ম বোঝার প্রয়োজন।
মডেল জেলব্রেকিং
মডেলের নিরাপত্তা এবং সারিবদ্ধকরণ প্রক্রিয়া এড়ানোর জন্য ডিজাইন করা আক্রমণ কৌশল, যা সাধারণত সীমাবদ্ধ বা নিষিদ্ধ বিষয়বস্তু তৈরি করতে বাধ্য করে।
পুরস্কার মডেলিং
একটি পদ্ধতি যেখানে একটি পুরস্কার মডেল মানবিক পছন্দগুলি ভবিষ্যদ্বাণী করতে শেখে, যা প্রধান ভাষা মডেলগুলির জন্য শক্তিশালীকরণ শিক্ষার জন্য গাইড হিসেবে কাজ করে।
সাংবিধানিক নীতি
মৌলিক নিয়ম এবং নীতিমালার সেট যা স্পষ্টভাবে সংজ্ঞায়িত করা হয় এবং এআই মডেলের আচরণকে নির্দেশনা দেয়, যা কাঙ্ক্ষিত মূল্যবোধের সাথে সামঞ্জস্য এবং সারিবদ্ধতা নিশ্চিত করে।
পছন্দ শিক্ষণ
মেশিন লার্নিংয়ের একটি ক্ষেত্র যেখানে মডেলগুলি বিভিন্ন বিকল্পের মধ্যে তুলনা থেকে শেখে যাতে মানবিক পছন্দগুলি ক্যাপচার করে এবং তাদের সাথে সারিবদ্ধ হয়।
Harmlessness Training
ক্ষতিকারকতা এড়ানোর প্রশিক্ষণ - একটি নির্দিষ্ট প্রশিক্ষণ প্রক্রিয়া যা মডেলগুলিকে ব্যবহারকারীদের জন্য সম্ভাব্য ক্ষতিকারক, বিপজ্জনক বা ক্ষতিকর বিষয়বস্তু তৈরি করা এড়াতে শেখানোর লক্ষ্যে পরিচালিত হয়।
Truthfulness Alignment
সত্যতা সমন্বয় - একটি সমন্বয় লক্ষ্য যা নিশ্চিত করে যে মডেলগুলি সত্যিকারের সঠিক তথ্য প্রদান করে এবং বিভ্রান্তি বা অযাচিত দাবি এড়িয়ে চলে।
Bias Mitigation
পক্ষপাত হ্রাস - ভাষা মডেলগুলিতে পদ্ধতিগত পক্ষপাত চিহ্নিত, পরিমাপ এবং হ্রাস করার জন্য কৌশলগুলির সমষ্টি, যা ন্যায্য ও বৈষম্যমুক্ত উপস্থাপনা নিশ্চিত করে।
Guardrails
সুরক্ষা বেষ্টনী - কৃত্রিম বুদ্ধিমত্তা সিস্টেমে প্রয়োগকৃত নিরাপত্তা ব্যবস্থা যা ইনপুট/আউটপুট নিরীক্ষণ ও ফিল্টার করে, রিয়েল-টাইমে বিপজ্জনক বা অনুপযুক্ত মিথস্ক্রিয়া প্রতিরোধ করে।
Constitutional Supervision
সাংবিধানিক তত্ত্বাবধান - একটি তত্ত্বাবধান পদ্ধতি যেখানে মডেলগুলি একটি স্পষ্ট সংবিধান দ্বারা পরিচালিত হয়, যা তাদের স্ব-সমালোচনা করতে এবং এই নির্দেশিকা নীতিমালা অনুযায়ী তাদের প্রতিক্রিয়া উন্নত করতে সক্ষম করে।
Human Preference Data
মানব পছন্দের ডেটা - বিভিন্ন মডেল প্রতিক্রিয়ার মধ্যে তুলনামূলক মানব মূল্যায়ন থেকে সংগ্রহ করা ডেটাসেট, যা সমন্বয় প্রশিক্ষণ এবং অপ্টিমাইজেশনের ভিত্তি হিসেবে কাজ করে।
Safety Fine-tuning
নিরাপত্তা সূক্ষ্ম সমন্বয় - প্রাথমিক প্রাক-প্রশিক্ষণের পর নির্দিষ্ট পরিমার্জনের পর্যায়, যা নিরাপত্তা ও নৈতিক সীমাবদ্ধতা মেনে চলার জন্য মডেলের আচরণ সূক্ষ্মভাবে সামঞ্জস্য করার লক্ষ্যে পরিচালিত হয়।
Alignment Taxonomy
সমন্বয় শ্রেণীবিন্যাস - কৃত্রিম বুদ্ধিমত্তায় বিভিন্ন ধরনের এবং মাত্রার সমন্বয়ের কাঠামোগত শ্রেণীবিভাগ, যাতে মান সমন্বয়, নিরাপত্তা, দৃঢ়তা এবং মডেলের ব্যাখ্যাযোগ্যতা অন্তর্ভুক্ত থাকে।