📊 Результаты тестов
Обзор производительности оцененных моделей ИИ
Протестированные модели
ЭталонОхват ИИ
ОтличноОцениваемые метрики
Новый🤖 Результаты по моделям
Детальная производительность каждой протестированной модели ИИ
AMP
Тест генерации страниц AMP
Andromeda Alpha
Усовершенствованная экспериментальная модель
ChatGPT-5
Последнее поколение OpenAI
Claude Haiku 4.5
Поэтическая версия Anthropic
Claude Sonnet 4.5
Сбалансированная версия Anthropic
DeepSeek 3.1
Усовершенствованная китайская модель
Gemini 2.5
Последняя версия Google
GLM 4.6
Модель Zai-org
Grok Fast 1
Быстрая версия xAI
Herme 4 405B
Модель с 405B параметров
Kimi K2
Продвинутая версия Kimi
Ling 1T
Модель с 1 триллионом параметров
LongCat Flash Chat
Ультрабыстрый чат
Metal Llama 4 Maverick
Нонконформистская версия
MiniMax
Оптимизированная компактная модель
Mistral
Европейская модель
Pickle
Специализированная модель
Qwen 3 Coder
Специализированный на программировании
Supernova
Взрывная модель
Tongyi DeepResearch
Специализированный на исследованиях
🔬 Научная методология
Наш строгий подход к оценке моделей искусственного интеллекта
Стандартизированный тестовый протокол
Каждая модель оценивается по строгой и воспроизводимой методологии
📝 Генерация кода
Статический анализ сгенерированного кода, модульные тесты и оценка алгоритмической сложности
🎯 Семантическая точность
Оценка релевантности ответов вопросам и контексту
⚡ Временная производительность
Измерение времени отклика, задержки и способности управления нагрузкой
🔄 Контекстуальная когерентность
Способность поддерживать контекст в длинных разговорах и сложных взаимодействиях