সারিবদ্ধতা এবং নিরাপত্তা - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

সাংবিধানিক এআই

একটি সংবিধান বা পূর্বনির্ধারিত নীতিমালার সেট অনুসরণ করে মডেলগুলিকে সারিবদ্ধ করার পদ্ধতি, যা তাদের নৈতিক নিয়ম অনুযায়ী স্ব-মূল্যায়ন এবং সংশোধন করতে সক্ষম করে।

📖

শব্দ

রেড টিমিং

দুর্বলতা শনাক্ত করতে এবং সংশোধন করতে বিশেষজ্ঞদের দ্বারা মডেলের দুর্বলতা মূল্যায়নের পদ্ধতিগত প্রক্রিয়া, যা সক্রিয়ভাবে অবাঞ্ছিত বা বিপজ্জনক আচরণ উদ্দীপিত করে।

📖

শব্দ

নিরাপত্তা সারিবদ্ধকরণ

প্রযুক্তির একটি সেট যা নিশ্চিত করে যে ভাষা মডেলগুলি তাদের সামগ্রিক কর্মক্ষমতা বজায় রাখার সময় ক্ষতিকর, বিপজ্জনক বা অনুপযুক্ত বিষয়বস্তু তৈরি করা এড়ায়।

📖

শব্দ

মূল্যবোধ সারিবদ্ধকরণ

এআই সিস্টেমের লক্ষ্য এবং আচরণকে মৌলিক মানবিক মূল্যবোধের সাথে সারিবদ্ধ করার প্রক্রিয়া, যা মানবিক পছন্দ এবং নৈতিকতার সূক্ষ্ম বোঝার প্রয়োজন।

📖

শব্দ

মডেল জেলব্রেকিং

মডেলের নিরাপত্তা এবং সারিবদ্ধকরণ প্রক্রিয়া এড়ানোর জন্য ডিজাইন করা আক্রমণ কৌশল, যা সাধারণত সীমাবদ্ধ বা নিষিদ্ধ বিষয়বস্তু তৈরি করতে বাধ্য করে।

📖

শব্দ

পুরস্কার মডেলিং

একটি পদ্ধতি যেখানে একটি পুরস্কার মডেল মানবিক পছন্দগুলি ভবিষ্যদ্বাণী করতে শেখে, যা প্রধান ভাষা মডেলগুলির জন্য শক্তিশালীকরণ শিক্ষার জন্য গাইড হিসেবে কাজ করে।

📖

শব্দ

সাংবিধানিক নীতি

মৌলিক নিয়ম এবং নীতিমালার সেট যা স্পষ্টভাবে সংজ্ঞায়িত করা হয় এবং এআই মডেলের আচরণকে নির্দেশনা দেয়, যা কাঙ্ক্ষিত মূল্যবোধের সাথে সামঞ্জস্য এবং সারিবদ্ধতা নিশ্চিত করে।

📖

শব্দ

পছন্দ শিক্ষণ

মেশিন লার্নিংয়ের একটি ক্ষেত্র যেখানে মডেলগুলি বিভিন্ন বিকল্পের মধ্যে তুলনা থেকে শেখে যাতে মানবিক পছন্দগুলি ক্যাপচার করে এবং তাদের সাথে সারিবদ্ধ হয়।

📖

শব্দ

Harmlessness Training

ক্ষতিকারকতা এড়ানোর প্রশিক্ষণ - একটি নির্দিষ্ট প্রশিক্ষণ প্রক্রিয়া যা মডেলগুলিকে ব্যবহারকারীদের জন্য সম্ভাব্য ক্ষতিকারক, বিপজ্জনক বা ক্ষতিকর বিষয়বস্তু তৈরি করা এড়াতে শেখানোর লক্ষ্যে পরিচালিত হয়।

📖

শব্দ

Truthfulness Alignment

সত্যতা সমন্বয় - একটি সমন্বয় লক্ষ্য যা নিশ্চিত করে যে মডেলগুলি সত্যিকারের সঠিক তথ্য প্রদান করে এবং বিভ্রান্তি বা অযাচিত দাবি এড়িয়ে চলে।

📖

শব্দ

Bias Mitigation

পক্ষপাত হ্রাস - ভাষা মডেলগুলিতে পদ্ধতিগত পক্ষপাত চিহ্নিত, পরিমাপ এবং হ্রাস করার জন্য কৌশলগুলির সমষ্টি, যা ন্যায্য ও বৈষম্যমুক্ত উপস্থাপনা নিশ্চিত করে।

📖

শব্দ

Guardrails

সুরক্ষা বেষ্টনী - কৃত্রিম বুদ্ধিমত্তা সিস্টেমে প্রয়োগকৃত নিরাপত্তা ব্যবস্থা যা ইনপুট/আউটপুট নিরীক্ষণ ও ফিল্টার করে, রিয়েল-টাইমে বিপজ্জনক বা অনুপযুক্ত মিথস্ক্রিয়া প্রতিরোধ করে।

📖

শব্দ

সাংবিধানিক তত্ত্বাবধান - একটি তত্ত্বাবধান পদ্ধতি যেখানে মডেলগুলি একটি স্পষ্ট সংবিধান দ্বারা পরিচালিত হয়, যা তাদের স্ব-সমালোচনা করতে এবং এই নির্দেশিকা নীতিমালা অনুযায়ী তাদের প্রতিক্রিয়া উন্নত করতে সক্ষম করে।

📖

শব্দ

Human Preference Data

মানব পছন্দের ডেটা - বিভিন্ন মডেল প্রতিক্রিয়ার মধ্যে তুলনামূলক মানব মূল্যায়ন থেকে সংগ্রহ করা ডেটাসেট, যা সমন্বয় প্রশিক্ষণ এবং অপ্টিমাইজেশনের ভিত্তি হিসেবে কাজ করে।

📖

শব্দ

Safety Fine-tuning

নিরাপত্তা সূক্ষ্ম সমন্বয় - প্রাথমিক প্রাক-প্রশিক্ষণের পর নির্দিষ্ট পরিমার্জনের পর্যায়, যা নিরাপত্তা ও নৈতিক সীমাবদ্ধতা মেনে চলার জন্য মডেলের আচরণ সূক্ষ্মভাবে সামঞ্জস্য করার লক্ষ্যে পরিচালিত হয়।

📖

শব্দ

Alignment Taxonomy

সমন্বয় শ্রেণীবিন্যাস - কৃত্রিম বুদ্ধিমত্তায় বিভিন্ন ধরনের এবং মাত্রার সমন্বয়ের কাঠামোগত শ্রেণীবিভাগ, যাতে মান সমন্বয়, নিরাপত্তা, দৃঢ়তা এবং মডেলের ব্যাখ্যাযোগ্যতা অন্তর্ভুক্ত থাকে।

এআই গ্লসারি

সাংবিধানিক এআই

রেড টিমিং

নিরাপত্তা সারিবদ্ধকরণ

মূল্যবোধ সারিবদ্ধকরণ

মডেল জেলব্রেকিং

পুরস্কার মডেলিং

সাংবিধানিক নীতি

পছন্দ শিক্ষণ

Harmlessness Training

Truthfulness Alignment

Bias Mitigation

Guardrails

Constitutional Supervision

Human Preference Data

Safety Fine-tuning

Alignment Taxonomy

কোন ফলাফল পাওয়া যায়নি