エンコーダー・デコーダー・アーキテクチャ
デコーダースタック
出力シーケンスをトークンごとに生成するデコーダー層の重ねで、マスク付き自己アテンションとクロスアテンションの両方を統合して時間的依存関係と入出力関係をモデル化する。
← 戻る出力シーケンスをトークンごとに生成するデコーダー層の重ねで、マスク付き自己アテンションとクロスアテンションの両方を統合して時間的依存関係と入出力関係をモデル化する。
← 戻る