محولات الرؤية
محول الرؤية بالانتباه المتقاطع (Cross-Attention Vision Transformer)
بنية تستخدم آليات الانتباه المتقاطع بين أنماط أو تمثيلات مختلفة، مما يسمح بتفاعلات أغنى بين الميزات.
← رجوعبنية تستخدم آليات الانتباه المتقاطع بين أنماط أو تمثيلات مختلفة، مما يسمح بتفاعلات أغنى بين الميزات.
← رجوع