Seq2Seq (シーケンス・トゥー・シーケンス)
Teacher Forcing
デコーダが独自の予測の代わりに、前の真の値を入力として受ける学習戦略で、収束を加速させます。この手法は学習を安定化させますが、エクスポージャーバイアスとして知られる学習と推論間の乖離を生じる可能性があります。
← 戻るデコーダが独自の予測の代わりに、前の真の値を入力として受ける学習戦略で、収束を加速させます。この手法は学習を安定化させますが、エクスポージャーバイアスとして知られる学習と推論間の乖離を生じる可能性があります。
← 戻る