強化学習におけるブートストラップ法
IQN (Implicit Quantile Networks)
リターンの分位数分布を直接学習するネットワークアーキテクチャで、分位数予測の不確実性を定量化するためにブートストラップメカニズムを統合している。
← 戻るリターンの分位数分布を直接学習するネットワークアーキテクチャで、分位数予測の不確実性を定量化するためにブートストラップメカニズムを統合している。
← 戻る