Tests Dinosaure v2 - 3 Pages

📊 Resultats des Tests

Vue d'ensemble des performances des modeles IA evalues

Modeles Testes

Principal

🤖 40 modeles 📊 3 pages

Tests Complets

Excellent

36/40

🎯 90% ✅ Valide

Format de Test

3 pages

📏 Complet ⚡ Detaille

🤖 Resultats par Modele

Performance detaillee de chaque modele IA teste

Amp

Test complet avec Anthropic

🏢 Anthropic ✅ Complet 📄 3 pages

Andromeda Alpha

Test complet avec Andromeda

🏢 Andromeda ✅ Complet 📄 3 pages

Big Pickle

Test complet avec Community

🏢 Community ✅ Complet 📄 3 pages

Claude Haiku 4.5

Test complet avec Anthropic

🏢 Anthropic ✅ Complet 📄 3 pages

Claude Sonnet 4.5

Test complet avec Anthropic

🏢 Anthropic ✅ Complet 📄 3 pages

Code Supernova 1M

Test complet avec Community

🏢 Community ✅ Complet 📄 3 pages

DeepSeek TNG R1T2 Chimera

Test complet avec DeepSeek

🏢 DeepSeek ✅ Complet 📄 3 pages

DeepSeek V3.1

Test complet avec DeepSeek

🏢 DeepSeek ✅ Complet 📄 3 pages

Gemini 2.0 Flash Experimental

Test complet avec Google

🏢 Google ✅ Complet 📄 3 pages

Gemini 2.5 Flash Preview

Test complet avec Google

🏢 Google ✅ Complet 📄 3 pages

Gemini 2.5 Pro

Test complet avec Google

🏢 Google ✅ Complet 📄 3 pages

GLM 4.5 Air

Test complet avec Zhipu

🏢 Zhipu ✅ Complet 📄 3 pages

GLM 4.6 Turbo

Test complet avec Zhipu

🏢 Zhipu ✅ Complet 📄 3 pages

GPT-5 Chat

Test complet avec OpenAI

🏢 OpenAI ✅ Complet 📄 3 pages

GPT-5 Codex High

Test complet avec OpenAI

🏢 OpenAI ✅ Complet 📄 3 pages

GPT-5 High

Test complet avec OpenAI

🏢 OpenAI ✅ Complet 📄 3 pages

Grok Fast 1

Test complet avec xAI

🏢 xAI ✅ Complet 📄 3 pages

Hermes 4 405B

Test complet avec Nous Research

🏢 Nous Research ✅ Complet 📄 3 pages

Hermes 480B

Test complet avec Nous Research

🏢 Nous Research ✅ Complet 📄 3 pages

Kimi K2 Instruct

Test complet avec Moonshot

🏢 Moonshot ✅ Complet 📄 3 pages

Ling 1T

Test complet avec Community

🏢 Community ✅ Complet 📄 3 pages

LongCat Flash Chat

Test complet avec Community

🏢 Community ✅ Complet 📄 3 pages

Meta Llama 4 Maverick

Test complet avec Meta

🏢 Meta ✅ Complet 📄 3 pages

Microsoft MAI DS R1

Test complet avec Microsoft

🏢 Microsoft ✅ Complet 📄 3 pages

MiniMax M2

Test complet avec MiniMax

🏢 MiniMax ✅ Complet 📄 3 pages

Minimax

Test complet avec MiniMax

🏢 MiniMax ✅ Complet 📄 3 pages

Mistral Devstral Medium

Test complet avec Mistral

🏢 Mistral ✅ Complet 📄 3 pages

Mistral Magistral Medium

Test complet avec Mistral

🏢 Mistral ✅ Complet 📄 3 pages

Nvidia Nemotron Nano 9B

Test complet avec Nvidia

🏢 Nvidia ✅ Complet 📄 3 pages

OpenAI GPT OSS 120B

Test complet avec OpenAI

🏢 OpenAI ✅ Complet 📄 3 pages

OpenAI GPT OSS 20B

Test complet avec OpenAI

🏢 OpenAI ⚠️ Incomplet 📄 3 pages

OpenGVLab InternV3 78B

Test complet avec OpenGVLab

🏢 OpenGVLab ✅ Complet 📄 3 pages

QwQ 32B RpR v1

Test complet avec Alibaba

🏢 Alibaba ⚠️ Incomplet 📄 3 pages

Qwen3 Coder 480B A35B

Test complet avec Alibaba

🏢 Alibaba ✅ Complet 📄 3 pages

Qwen3 Coder Flash

Test complet avec Alibaba

🏢 Alibaba ⚠️ Incomplet 📄 3 pages

Qwen3 Coder Plus

Test complet avec Alibaba

🏢 Alibaba ✅ Complet 📄 3 pages

Shisa V2 Llama 3.3 70B

Test complet avec Shisa

🏢 Shisa ⚠️ Incomplet 📄 3 pages

Tongyi DeepResearch 30B

Test complet avec Alibaba

🏢 Alibaba ✅ Complet 📄 3 pages

Venice Uncensored

Test complet avec Venice

🏢 Venice ✅ Complet 📄 3 pages

Xiaomi Mimo V2 Flash

Test complet avec Xiaomi

🏢 Xiaomi ✅ Complet 📄 3 pages

🔬 Methodologie v2

Protocole ameliore pour l'evaluation approfondie des modeles

🔬

Protocole de Test 3 Pages

Chaque modele est evalue sur 3 pages distinctes pour une analyse complete

📝 Page 1 : Generation

Evaluation de la capacite a generer du code fonctionnel et structure

🎯 Page 2 : Precision

Test de la precision semantique et de la pertinence des reponses

⚡ Page 3 : Performance

Mesure des performances, optimisation et qualite globale