Глоссарий ИИ
Полный словарь искусственного интеллекта
RoBERTa (A Robustly Optimized BERT Pretraining Approach)
Оптимизированная версия BERT, которая изменяет гиперпараметры обучения и удаляет задачу предсказания следующего предложения (Next Sentence Prediction), что приводит к лучшим результатам на многих задачах NLU.
Tâche Aval (Downstream Task)
Конкретная задача машинного обучения (например, NER, классификация текста и т.д.), для которой предобученная модель адаптируется с помощью донастройки.
Tête de Classification (Classification Head)
Финальный слой, добавляемый к предобученной модели во время донастройки, специально разработанный для отображения контекстных представлений на выходы задачи классификации или разметки последовательностей.
Étiquetage de Séquences (Sequence Labeling)
Тип задачи NLP, где каждому токену входной последовательности присваивается метка, как в NER, где токены маркируются как принадлежащие к сущности или нет.
Schéma d'Étiquetage BIO
Соглашение о разметке для NER, где каждый токен помечается как Beginning (начало сущности), Inside (внутри сущности) или Outside (вне сущности) для управления мультитокеновыми сущностями.
Masquage de Langage (Masked Language Modeling)
Цель предобучения, используемая для моделей, таких как BERT, где определённый процент входных токенов маскируется, и модель учится предсказывать их на основе контекста.
Hugging Face Transformers
Библиотека с открытым исходным кодом, предоставляющая тысячи предобученных моделей (BERT, RoBERTa и др.) для обработки естественного языка, облегчающая их использование и донастройку.
Score F1 (F1-Score)
Метрика оценки, представляющая гармоническое среднее между точностью (precision) и полнотой (recall), обеспечивающая баланс между ними для измерения производительности модели классификации.