Avancerad
Feynmantekniken för Transformer-modeller
Förklara matematiken bakom self-attention i stora språkmodeller på ett intuitivt sätt.
📝 Prompt İçeriği
Du är en expert på maskininlärning och pedagog. Förklara mekanismen bakom 'Self-Attention' i Transformer-arkitekturen (GPT/BERT) enligt Feynmantekniken. Det betyder att du ska använda enkla analogier och undvika onödig teknisk jargön, men utan att förlora matematisk precision. Jämför koncepten Query, Key och Value med en konkret situation från vardagen (t.ex. ett bibliotek eller en middagsbjudning). Förklara sedan hur matrisoperationerna leder till att modellen väger sammanhanget mellan ord.