🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📂
подкатегории

Механизм внимания

Позволяет модели взвешивать важность различных частей входных данных при обработке.

10 термины
📂
подкатегории

Самовнимание

Механизм, в котором каждый элемент последовательности обращает внимание на все остальные элементы той же последовательности.

7 термины
📂
подкатегории

Многоголовое внимание

Расширение механизма самовнимания, использующее несколько голов внимания параллельно для захвата различных типов отношений.

8 термины
📂
подкатегории

Позиционное кодирование

Техника для встраивания позиционной информации в эмбеддинги без использования РНН.

19 термины
📂
подкатегории

Архитектура кодировщик-декодировщик

Фундаментальная структура трансформеров с кодировщиком для понимания и декодировщиком для генерации.

4 термины
📂
подкатегории

Масштабированное скалярное произведение внимания

Базовая математическая форма вычисления внимания с масштабированием в Трансформерах.

5 термины
📂
подкатегории

Сети прямого распространения

Полносвязные сети, применяемые после каждого слоя внимания в Трансформерах.

16 термины
📂
подкатегории

Нормализация слоя

Техника нормализации, применяемая в Трансформерах для стабилизации обучения.

6 термины
📂
подкатегории

Маски внимания

Механизм для контроля того, какие токены могут обращать внимание на другие токены.

19 термины
📂
подкатегории

Vision Transformers (ViT)

Применение архитектуры Transformer к обработке изображений путем разделения изображений на патчи.

14 термины
📂
подкатегории

Архитектура BERT

Трансформер, использующий только кодировщик, предобученный с задачами маскированного языкового моделирования

11 термины
📂
подкатегории

Архитектура GPT

Трансформер с декодером только, оптимизированный для авторегрессионной генерации текста.

8 термины
📂
подкатегории

Cross-Attention

Механизм внимания между двумя различными последовательностями в кодерах-декодерах.

5 термины
📂
подкатегории

Разреженное внимание

Вариант внимания, который уменьшает сложность, вычисляя только выборочные пары.

18 термины
📂
подкатегории

Иерархическое внимание

Многоуровневая архитектура, применяющая внимание на различных уровнях гранулярности.

12 термины
📂
подкатегории

Визуализация внимания

Техники для интерпретации и визуализации весов внимания в трансформерах.

17 термины
📂
подкатегории

Оптимизация трансформеров

Специфические методы эффективного обучения больших моделей трансформеров.

16 термины
📂
подкатегории

Мультимодальные трансформеры

Расширенная архитектура Трансформер для одновременной обработки нескольких типов данных.

18 термины
📂
подкатегории

Эффективные Трансформеры

Оптимизированные варианты Трансформеров для снижения вычислительной сложности.

9 термины
📂
подкатегории

Варианты механизмов внимания

Различные подходы и усовершенствования механизма внимания, выходящие за рамки скалярного произведения.

9 термины
🔍

Результаты не найдены