๐Ÿ  Beranda
Benchmark
๐Ÿ“Š Semua Benchmark ๐Ÿฆ– Dinosaurus v1 ๐Ÿฆ– Dinosaurus v2 โœ… Aplikasi To-Do List ๐ŸŽจ Halaman Bebas Kreatif ๐ŸŽฏ FSACB - Showcase Utama ๐ŸŒ Benchmark Terjemahan
Model
๐Ÿ† Top 10 Model ๐Ÿ†“ Model Gratis ๐Ÿ“‹ Semua Model โš™๏ธ Kilo Code
Sumber Daya
๐Ÿ’ฌ Perpustakaan Prompt ๐Ÿ“– Glosarium AI ๐Ÿ”— Tautan Berguna

๐Ÿ“Š Resultats des Tests

Vue d'ensemble des performances des modeles IA evalues

Modeles Testes

Principal
40
๐Ÿค– 40 modeles ๐Ÿ“Š 3 pages

Tests Complets

Excellent
36/40
๐ŸŽฏ 90% โœ… Valide

Format de Test

v2
3 pages
๐Ÿ“ Complet โšก Detaille

๐Ÿค– Resultats par Modele

Performance detaillee de chaque modele IA teste

Amp

Test complet avec Anthropic

๐Ÿข Anthropic โœ… Complet ๐Ÿ“„ 3 pages

Andromeda Alpha

Test complet avec Andromeda

๐Ÿข Andromeda โœ… Complet ๐Ÿ“„ 3 pages

Big Pickle

Test complet avec Community

๐Ÿข Community โœ… Complet ๐Ÿ“„ 3 pages

Claude Haiku 4.5

Test complet avec Anthropic

๐Ÿข Anthropic โœ… Complet ๐Ÿ“„ 3 pages

Claude Sonnet 4.5

Test complet avec Anthropic

๐Ÿข Anthropic โœ… Complet ๐Ÿ“„ 3 pages

Code Supernova 1M

Test complet avec Community

๐Ÿข Community โœ… Complet ๐Ÿ“„ 3 pages

DeepSeek TNG R1T2 Chimera

Test complet avec DeepSeek

๐Ÿข DeepSeek โœ… Complet ๐Ÿ“„ 3 pages

DeepSeek V3.1

Test complet avec DeepSeek

๐Ÿข DeepSeek โœ… Complet ๐Ÿ“„ 3 pages

Gemini 2.0 Flash Experimental

Test complet avec Google

๐Ÿข Google โœ… Complet ๐Ÿ“„ 3 pages

Gemini 2.5 Flash Preview

Test complet avec Google

๐Ÿข Google โœ… Complet ๐Ÿ“„ 3 pages

Gemini 2.5 Pro

Test complet avec Google

๐Ÿข Google โœ… Complet ๐Ÿ“„ 3 pages

GLM 4.5 Air

Test complet avec Zhipu

๐Ÿข Zhipu โœ… Complet ๐Ÿ“„ 3 pages

GLM 4.6 Turbo

Test complet avec Zhipu

๐Ÿข Zhipu โœ… Complet ๐Ÿ“„ 3 pages

GPT-5 Chat

Test complet avec OpenAI

๐Ÿข OpenAI โœ… Complet ๐Ÿ“„ 3 pages

GPT-5 Codex High

Test complet avec OpenAI

๐Ÿข OpenAI โœ… Complet ๐Ÿ“„ 3 pages

GPT-5 High

Test complet avec OpenAI

๐Ÿข OpenAI โœ… Complet ๐Ÿ“„ 3 pages

Grok Fast 1

Test complet avec xAI

๐Ÿข xAI โœ… Complet ๐Ÿ“„ 3 pages

Hermes 4 405B

Test complet avec Nous Research

๐Ÿข Nous Research โœ… Complet ๐Ÿ“„ 3 pages

Hermes 480B

Test complet avec Nous Research

๐Ÿข Nous Research โœ… Complet ๐Ÿ“„ 3 pages

Kimi K2 Instruct

Test complet avec Moonshot

๐Ÿข Moonshot โœ… Complet ๐Ÿ“„ 3 pages

Ling 1T

Test complet avec Community

๐Ÿข Community โœ… Complet ๐Ÿ“„ 3 pages

LongCat Flash Chat

Test complet avec Community

๐Ÿข Community โœ… Complet ๐Ÿ“„ 3 pages

Meta Llama 4 Maverick

Test complet avec Meta

๐Ÿข Meta โœ… Complet ๐Ÿ“„ 3 pages

Microsoft MAI DS R1

Test complet avec Microsoft

๐Ÿข Microsoft โœ… Complet ๐Ÿ“„ 3 pages

MiniMax M2

Test complet avec MiniMax

๐Ÿข MiniMax โœ… Complet ๐Ÿ“„ 3 pages

Minimax

Test complet avec MiniMax

๐Ÿข MiniMax โœ… Complet ๐Ÿ“„ 3 pages

Mistral Devstral Medium

Test complet avec Mistral

๐Ÿข Mistral โœ… Complet ๐Ÿ“„ 3 pages

Mistral Magistral Medium

Test complet avec Mistral

๐Ÿข Mistral โœ… Complet ๐Ÿ“„ 3 pages

Nvidia Nemotron Nano 9B

Test complet avec Nvidia

๐Ÿข Nvidia โœ… Complet ๐Ÿ“„ 3 pages

OpenAI GPT OSS 120B

Test complet avec OpenAI

๐Ÿข OpenAI โœ… Complet ๐Ÿ“„ 3 pages

OpenAI GPT OSS 20B

Test complet avec OpenAI

๐Ÿข OpenAI โš ๏ธ Incomplet ๐Ÿ“„ 3 pages

OpenGVLab InternV3 78B

Test complet avec OpenGVLab

๐Ÿข OpenGVLab โœ… Complet ๐Ÿ“„ 3 pages

QwQ 32B RpR v1

Test complet avec Alibaba

๐Ÿข Alibaba โš ๏ธ Incomplet ๐Ÿ“„ 3 pages

Qwen3 Coder 480B A35B

Test complet avec Alibaba

๐Ÿข Alibaba โœ… Complet ๐Ÿ“„ 3 pages

Qwen3 Coder Flash

Test complet avec Alibaba

๐Ÿข Alibaba โš ๏ธ Incomplet ๐Ÿ“„ 3 pages

Qwen3 Coder Plus

Test complet avec Alibaba

๐Ÿข Alibaba โœ… Complet ๐Ÿ“„ 3 pages

Shisa V2 Llama 3.3 70B

Test complet avec Shisa

๐Ÿข Shisa โš ๏ธ Incomplet ๐Ÿ“„ 3 pages

Tongyi DeepResearch 30B

Test complet avec Alibaba

๐Ÿข Alibaba โœ… Complet ๐Ÿ“„ 3 pages

Venice Uncensored

Test complet avec Venice

๐Ÿข Venice โœ… Complet ๐Ÿ“„ 3 pages

Xiaomi Mimo V2 Flash

Test complet avec Xiaomi

๐Ÿข Xiaomi โœ… Complet ๐Ÿ“„ 3 pages

๐Ÿ”ฌ Methodologie v2

Protocole ameliore pour l'evaluation approfondie des modeles

๐Ÿ”ฌ

Protocole de Test 3 Pages

Chaque modele est evalue sur 3 pages distinctes pour une analyse complete

1
๐Ÿ“ Page 1 : Generation

Evaluation de la capacite a generer du code fonctionnel et structure

2
๐ŸŽฏ Page 2 : Precision

Test de la precision semantique et de la pertinence des reponses

3
โšก Page 3 : Performance

Mesure des performances, optimisation et qualite globale