Архитектура Encoder-Decoder
Маскированное Внимание
Вариант самовнимания, используемый в декодере для предотвращения фиксации каждой позиции на последующих позициях, обеспечивая авторегрессионную генерацию и предотвращение утечки информации.
← Назад