AdaDelta
整合性のある単位
AdaDeltaの基本原理で、更新がパラメータと同じ単位を持つため、グローバル学習率の必要性を排除します。このアプローチは、過去の更新の移動平均と現在の勾配の比率を使用します。
← 戻るAdaDeltaの基本原理で、更新がパラメータと同じ単位を持つため、グローバル学習率の必要性を排除します。このアプローチは、過去の更新の移動平均と現在の勾配の比率を使用します。
← 戻る