深層強化学習マルチオブジェクト
多目的DQN
多目的問題に適応させたディープQネットワークのアーキテクチャで、深層ニューラルネットワークを使用してベクトル値Q関数を近似します。ネットワークはトレードオフの一貫性を維持しながら、各目的の戻り値を同時に推定することを学習します。
← 戻る多目的問題に適応させたディープQネットワークのアーキテクチャで、深層ニューラルネットワークを使用してベクトル値Q関数を近似します。ネットワークはトレードオフの一貫性を維持しながら、各目的の戻り値を同時に推定することを学習します。
← 戻る