Resultats des Tests
Vue d'ensemble des performances des modeles IA evalues
Modeles Testes
PrincipalTests Complets
ExcellentFormat de Test
v2Resultats par Modele
Performance detaillee de chaque modele IA teste
Amp
Test complet avec Anthropic
Andromeda Alpha
Test complet avec Andromeda
Big Pickle
Test complet avec Community
Claude Haiku 4.5
Test complet avec Anthropic
Claude Sonnet 4.5
Test complet avec Anthropic
Code Supernova 1M
Test complet avec Community
DeepSeek TNG R1T2 Chimera
Test complet avec DeepSeek
DeepSeek V3.1
Test complet avec DeepSeek
Gemini 2.0 Flash Experimental
Test complet avec Google
Gemini 2.5 Flash Preview
Test complet avec Google
Gemini 2.5 Pro
Test complet avec Google
GLM 4.5 Air
Test complet avec Zhipu
GLM 4.6 Turbo
Test complet avec Zhipu
GPT-5 Chat
Test complet avec OpenAI
GPT-5 Codex High
Test complet avec OpenAI
GPT-5 High
Test complet avec OpenAI
Grok Fast 1
Test complet avec xAI
Hermes 4 405B
Test complet avec Nous Research
Hermes 480B
Test complet avec Nous Research
Kimi K2 Instruct
Test complet avec Moonshot
Ling 1T
Test complet avec Community
LongCat Flash Chat
Test complet avec Community
Meta Llama 4 Maverick
Test complet avec Meta
Microsoft MAI DS R1
Test complet avec Microsoft
MiniMax M2
Test complet avec MiniMax
Minimax
Test complet avec MiniMax
Mistral Devstral Medium
Test complet avec Mistral
Mistral Magistral Medium
Test complet avec Mistral
Nvidia Nemotron Nano 9B
Test complet avec Nvidia
OpenAI GPT OSS 120B
Test complet avec OpenAI
OpenAI GPT OSS 20B
Test complet avec OpenAI
OpenGVLab InternV3 78B
Test complet avec OpenGVLab
QwQ 32B RpR v1
Test complet avec Alibaba
Qwen3 Coder 480B A35B
Test complet avec Alibaba
Qwen3 Coder Flash
Test complet avec Alibaba
Qwen3 Coder Plus
Test complet avec Alibaba
Shisa V2 Llama 3.3 70B
Test complet avec Shisa
Tongyi DeepResearch 30B
Test complet avec Alibaba
Venice Uncensored
Test complet avec Venice
Xiaomi Mimo V2 Flash
Test complet avec Xiaomi
Methodologie v2
Protocole ameliore pour l'evaluation approfondie des modeles
Protocole de Test 3 Pages
Chaque modele est evalue sur 3 pages distinctes pour une analyse complete
๐ Page 1 : Generation
Evaluation de la capacite a generer du code fonctionnel et structure
๐ฏ Page 2 : Precision
Test de la precision semantique et de la pertinence des reponses
โก Page 3 : Performance
Mesure des performances, optimisation et qualite globale