📊 Testresultat
Översikt över prestanda för utvärderade AI-modeller
Testade Modeller
ReferensAI-täckning
UtmärktUtvärderade Mätvärden
Nytt🤖 Resultat per modell
Detaljerad prestanda för varje testad AI-modell
AMP
AMP-sidgenereringstest
Andromeda Alpha
Avancerad experimentell modell
ChatGPT-5
Senaste OpenAI-generationen
Claude Haiku 4.5
Poetisk Anthropic-version
Claude Sonnet 4.5
Balanserad Anthropic-version
DeepSeek 3.1
Avancerad kinesisk modell
Gemini 2.5
Senaste Google-versionen
GLM 4.6
Zai-org modell
Grok Fast 1
Snabb xAI-version
Herme 4 405B
405B parametermodell
Kimi K2
Avancerad Kimi-version
Ling 1T
1 biljon parametermodell
LongCat Flash Chat
Ultrasnabb chatt
Metal Llama 4 Maverick
Maverick-version
MiniMax
Optimerad kompakt modell
Mistral
Europeisk modell
Pickle
Specialiserad modell
Qwen 3 Coder
Programmeringsspecialiserad
Supernova
Explosiv modell
Tongyi DeepResearch
Forskningsspecialiserad
🔬 Vetenskaplig Metodologi
Vår rigorösa approach för att utvärdera AI-modeller
Standardiserat Testprotokoll
Varje modell utvärderas enligt en rigorös och reproducerbar metodologi
📝 Kodgenerering
Statisk analys av genererad kod, enhetstester och utvärdering av algoritmisk komplexitet
🎯 Semantisk Precision
Utvärdering av svarens relevans för frågor och sammanhang
⚡ Temporär Prestanda
Mätning av svarstider, latens och belastningshanteringskapacitet
🔄 Kontextuell Koherens
Förmåga att upprätthålla sammanhang över långa konversationer och komplexa interaktioner