人工知能の完全辞典
ブロック単位で構成されたスパース注意アプローチで、注意行列がブロックに分割され、ハードウェアの並列処理を最適化するために特定のブロックのみを計算します。
局所性鋭敏ハッシュを使用して類似のクエリとキーをグループ化し、これらのグループ内でのみ注意を計算するメカニズム。