パラメータ正則化
CWR (Copy Weight with Reinit)
各タスクの学習後にモデルの重みを複製し、新しいタスクの学習のために一部の重みを選択的に再初期化する戦略。CWRは、重要な重みのコピーを維持しながら、新しい知識への適応を可能にします。
← 戻る各タスクの学習後にモデルの重みを複製し、新しいタスクの学習のために一部の重みを選択的に再初期化する戦略。CWRは、重要な重みのコピーを維持しながら、新しい知識への適応を可能にします。
← 戻る