এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
রক্ষণাবেক্ষণ নীতি (Maintenance Policy)
একটি কৌশল যা একটি সিস্টেমের প্রতিটি সম্ভাব্য অবস্থায় কী রক্ষণাবেক্ষণ পদক্ষেপ নিতে হবে তা নির্ধারণ করে, যার লক্ষ্য খরচ কমানোর মতো উদ্দেশ্য অপ্টিমাইজ করা।
রক্ষণাবেক্ষণ এজেন্ট (Maintenance Agent)
RL-এ একটি অ্যালগরিদমিক সত্তা যা সরঞ্জামের অবস্থা পর্যবেক্ষণ করে এবং রক্ষণাবেক্ষণের পদক্ষেপ (পরিদর্শন, মেরামত, প্রতিস্থাপন) নেওয়ার সিদ্ধান্ত নেয়।
খরচ পুরস্কার (Cost Reward)
RL-এ রক্ষণাবেক্ষণের জন্য একটি নেতিবাচক পুরস্কার সংকেত, যা মেরামতের খরচ, উৎপাদন বন্ধের সময় এবং অপ্রয়োজনীয় রক্ষণাবেক্ষণ কাজের জন্য জরিমানা আরোপ করে।
ক্ষয় অবস্থা (Degradation State)
MDP-তে একটি সরঞ্জামের বর্তমান অবস্থার প্রতিনিধিত্ব, যার মধ্যে ক্ষয়, কম্পন, তাপমাত্রা এবং ত্রুটির ইতিহাসের মতো সূচক অন্তর্ভুক্ত থাকে।
ব্যর্থতার সিমুলেশন (Failure Simulation)
একটি ডিজিটাল মডেল যা সরঞ্জামের ক্ষয়প্রাপ্ত আচরণ পুনরুত্পাদন করে, বাস্তব ঝুঁকি ছাড়াই RL এজেন্টের প্রশিক্ষণের জন্য ডেটা তৈরি করতে ব্যবহৃত হয়।
শিক্ষার স্থানান্তর (Transfer Learning)
একটি কৌশল যা একটি RL এজেন্ট দ্বারা একটি ধরনের সরঞ্জামে অর্জিত জ্ঞান পুনরায় ব্যবহার করে অনুরূপ সরঞ্জামে দ্রুত শিক্ষা অর্জনে সহায়তা করে।
RL-ভিত্তিক শর্তাধীন রক্ষণাবেক্ষণ (Condition-Based Maintenance Using RL)
একটি পদ্ধতি যেখানে রক্ষণাবেক্ষণের সিদ্ধান্ত পূর্বনির্ধারিত নয়, বরং RL এজেন্ট দ্বারা গতিশীলভাবে শেখা ক্ষয়প্রাপ্তির সীমার ভিত্তিতে নেওয়া হয়।
পরস্পর সংযুক্ত সিস্টেমের জন্য মাল্টি-এজেন্ট (Multi-Agents for Interconnected Systems)
RL-এর একটি সম্প্রসারণ যেখানে একাধিক এজেন্ট একটি জটিল সিস্টেমে পরস্পর নির্ভরশীল সরঞ্জামের রক্ষণাবেক্ষণ অপ্টিমাইজ করতে সহযোগিতা বা প্রতিযোগিতা করে।