BERTアーキテクチャ
プーリング層
分類タスクのためにトークンの表現を単一のベクトルに集約する最終層。BERTは通常、トークン[CLS]の表現を使用するか、すべてのトークンで平均プーリングを実行します。
← 戻る分類タスクのためにトークンの表現を単一のベクトルに集約する最終層。BERTは通常、トークン[CLS]の表現を使用するか、すべてのトークンで平均プーリングを実行します。
← 戻る