Глоссарий ИИ
Полный словарь искусственного интеллекта
Эпистемическая неопределенность
Неопределенность, связанная со знанием модели, которая уменьшается с увеличением количества данных, в отличие от случайной неопределенности, присущей наблюдениям.
Распределение политики
Вероятностное распределение действий при заданной политике, важное для оценки расхождения с офлайн-данными.
Вне распределения (OOD)
Действия или состояния, не наблюдаемые в обучающем наборе данных, требующие количественной оценки неопределенности для избежания опасных экстраполяций.
Количественная оценка неопределенности
Систематический процесс оценки и измерения неопределенностей в прогнозах модели для руководства принятием решений.
Офлайн-обучение с подкреплением
Парадигма обучения на основе фиксированного набора данных без взаимодействия со средой, требующая строгого управления неопределенностью.
Ансамбли моделей
Техника использования нескольких моделей, обученных по-разному, для оценки эпистемической неопределенности через дисперсию прогнозов.
Байесовская аппроксимация
Методы аппроксимации байесовского вывода для количественной оценки эпистемической неопределенности в параметрах модели.
Эпистемическая вариабельность
Мера дисперсии прогнозов модели, вызванная ограниченным знанием обучающих данных.
Калибровка неопределенности
Процесс корректировки оценок неопределенности для точного отражения реальных вероятностей ошибок.
Эпистемическое стандартное отклонение
Метрика, количественно определяющая разброс предсказаний модели из-за неопределенности параметров, отличная от дисперсии наблюдений.
Оценка достоверности
Количественная оценка надежности предсказаний модели на основе локальной плотности обучающих данных.
Устойчивость к неопределенности
Способность алгоритма сохранять стабильную производительность при неопределенных предсказаниях или данных вне распределения.
Консервативная экстраполяция
Стратегия, ограничивающая экстраполяцию за пределы области данных с использованием консервативных верхних границ на основе неопределенности.
Эмпирическое распределение
Распределение наблюдаемых состояний-действий в офлайн-наборе данных, служащее эталоном для обнаружения расхождений политики.
Оценка неопределенности
Числовая метрика, количественно определяющая уровень эпистемической неопределенности, связанной с конкретным предсказанием или действием.
Граница распределения
Пространственная граница в пространстве состояний-действий, разделяющая регионы, хорошо покрытые обучающими данными.
Информированное принятие решений
Процесс принятия решений, явно включающий меры эпистемической неопределенности для избежания действий с высоким риском вне распределения.