人工知能の完全辞典
アテンションメカニズムの後に適用される残差正規化層。アテンションの出力を元の入力(残差接続)と組み合わせ、その合計を正規化します。
入力埋め込みに適用される線形変換(重み行列との乗算)であり、Query、Key、Valueベクトルを生成します。これにより、モデルはアテンションに特化した表現空間を学習できます。