モデルベースの好奇心に基づく学習
好奇心の境界
エージェントの好奇心を制限し、未知かつ制御可能/学習可能な環境の側面に誘導することを目的とするメカニズムまたは理論的制約。これにより、ランダムなテレビの問題を緩和するのに役立ちます。
← 戻るエージェントの好奇心を制限し、未知かつ制御可能/学習可能な環境の側面に誘導することを目的とするメカニズムまたは理論的制約。これにより、ランダムなテレビの問題を緩和するのに役立ちます。
← 戻る