📊 Hasil Tes
Ikhtisar kinerja model AI yang dievaluasi
Model yang Diuji
UtamaCakupan AI
Sangat BaikMetrik yang Dievaluasi
Lengkap🤖 Hasil per Model
Kinerja detail setiap model AI yang diuji
AMP
Tes pembuatan halaman AMP
Andromeda Alpha
Model eksperimental canggih
ChatGPT-5
Generasi terbaru OpenAI
Claude Haiku 4.5
Versi puitis Anthropic
Claude Sonnet 4.5
Versi seimbang Anthropic
DeepSeek 3.1
Model Tiongkok canggih
Gemini 2.5
Versi terbaru Google
GLM 4.6
Model Zai-org
Grok Fast 1
Versi cepat xAI
Herme 4 405B
Model 405B parameter
Kimi K2
Versi canggih Kimi
Ling 1T
Model 1 triliun parameter
LongCat Flash Chat
Chat ultra-cepat
Metal Llama 4 Maverick
Versi non-konformis
MiniMax
Model kompak teroptimasi
Mistral
Model Eropa
Pickle
Model khusus
Qwen 3 Coder
Khusus pemrograman
Supernova
Model eksplosif
Tongyi DeepResearch
Khusus penelitian
🔬 Metodologi Ilmiah
Protokol ketat untuk evaluasi model kecerdasan buatan
Protokol Tes Standar
Setiap model dievaluasi menurut metodologi yang ketat dan dapat direproduksi
📝 Pembuatan Kode
Analisis statis kode yang dibuat, tes unit dan evaluasi kompleksitas algoritmik
🎯 Presisi Semantik
Evaluasi relevansi jawaban terhadap pertanyaan yang diajukan dan konteks
⚡ Kinerja Temporal
Pengukuran waktu respons, latensi dan kemampuan menangani beban simultan
🔄 Konsistensi Kontekstual
Kemampuan mempertahankan konteks dalam percakapan panjang dan interaksi kompleks