تجميع بيانات DAgger
DAgger (Dataset Aggregation)
خوارزمية التعلم بالتقليد التي تجمع البيانات بشكل تكراري من خلال استجواب الخبير حول الحالات التي تتم زيارتها بواسطة السياسة الحالية. هذا النهج يقلل من الفجوة بين توزيع التدريب وتوزيع النشر.
← رجوع