Глоссарий ИИ
Полный словарь искусственного интеллекта
Текстовый кодировщик (CLIP)
Компонент, который преобразует текст описания (промпт) в числовой вектор в латентном пространстве, направляя модель диффузии для генерации соответствующего изображения.
Img2Img
Процесс генерации, который использует исходное изображение в качестве основы, преобразуя его в соответствии с текстовым промптом, сохраняя при этом часть его исходной структуры.
Шаги (этапы денуазинга)
Количество итераций, в течение которых модель постепенно удаляет шум; большее количество шагов обычно приводит к более детализированному результату, но увеличивает время вычислений.
Масштаб CFG (направление без классификатора)
Параметр, контролирующий приверженность модели текстовому промпту; высокое значение усиливает соответствие промпту в ущерб креативности.
Зерно (семя)
Начальное числовое значение, которое инициализирует генератор случайных чисел, позволяя точно воспроизвести ту же генерацию изображения с одинаковыми параметрами.
Контрольная точка
Бинарный файл, содержащий обученные веса полной модели Stable Diffusion, определяющий её стиль, знания и способность к генерации.
Проверка безопасности
Встроенный механизм, часто основанный на модели CLIP, который анализирует и размывает сгенерированные изображения, если обнаруживает потенциально чувствительный или неподходящий контент.
Латентная диффузия
Основополагающий принцип Stable Diffusion, который применяет процесс диффузии не на пикселях изображения, а на его сжатом представлении в латентном пространстве.