এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
পরিবেশগত গতিশীলতার মডেল
এজেন্টের ক্রিয়াকলাপের উপর নির্ভর করে পরিবেশ কীভাবে বিবর্তিত হয় তা বর্ণনা করে এমন গাণিতিক মডেল শেখার প্রক্রিয়া।
এনভেলপিং দ্বারা শেখা (ওয়ার্ল্ড মডেলস)
একটি আর্কিটেকচার যেখানে এজেন্ট বিশ্বের একটি অভ্যন্তরীণ উপস্থাপনা তৈরি করে এবং ভবিষ্যতের ক্রিয়াকলাপগুলি অনুকরণ ও পরিকল্পনা করার জন্য এটি ব্যবহার করে।
মন্টে কার্লো ট্রি সার্চ পরিকল্পনা
অপ্টিমাল নীতিগুলি খুঁজে বের করার জন্য শেখা মডেলের সাথে ট্রি সার্চ অ্যালগরিদম ব্যবহার করা।
সম্ভাব্যতা এবং বেইসিয়ান মডেল
শক্তিশালী সিদ্ধান্ত গ্রহণের জন্য পরিবেশ মডেলিং-এ অনিশ্চয়তা অন্তর্ভুক্ত করার পদ্ধতি।
কল্পনা ও স্বপ্নের মাধ্যমে শেখা
কৌশল যেখানে এজেন্টটি বাস্তবে কাজ করার আগে মানসিকভাবে অনুকরণ করা দৃশ্যকল্পে প্রশিক্ষণ নেয়।
ভেরিয়েশনাল মডেল
পরিবেশের ল্যাটেন্ট রিপ্রেজেন্টেশন শেখার জন্য ভেরিয়েশনাল অটোএনকোডার ব্যবহার
মডেল দিয়ে স্থানান্তর শেখা
শেখা মডেলগুলিকে মধ্যস্থতাকারী হিসাবে ব্যবহার করে পরিবেশের মধ্যে জ্ঞান স্থানান্তর করা।
Modèles Graphiques pour RL
Représentation de l'environnement sous forme de graphes pour capturer les relations structurelles.
Apprentissage par Renforcement Hiérarchique Basé sur Modèles
Décomposition hiérarchique des tâches avec modèles à différents niveaux d'abstraction temporelle.
Modèles Continus et Différentiables
Modélisation de dynamiques continues où le modèle reste différentiable pour l'optimisation.
Calibration d'Incertitude et Exploration
Techniques pour quantifier et gérer l'incertitude du modèle afin d'optimiser l'exploration.
Apprentissage par Renforcement Inverse Basé sur Modèles
Inférence des fonctions de récompense en utilisant des modèles pour générer des trajectoires plausibles.