Q-learning
প্রাথমিক Q-মান
শেখার শুরুতে প্রতিটি অবস্থা-ক্রিয়া জুটিতে নির্ধারিত মান, যা অভিসৃতি গতি এবং প্রাথমিক অনুসন্ধান আচরণকে প্রভাবিত করতে পারে।
← ফিরে যানশেখার শুরুতে প্রতিটি অবস্থা-ক্রিয়া জুটিতে নির্ধারিত মান, যা অভিসৃতি গতি এবং প্রাথমিক অনুসন্ধান আচরণকে প্রভাবিত করতে পারে।
← ফিরে যান