🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Classification de textes

Tâche du TAL consistant à assigner automatiquement un document textuel à une ou plusieurs catégories prédéfinies en se basant sur son contenu sémantique.

📖
термины

Classification binaire

Type de classification où le modèle doit choisir entre deux classes mutuellement exclusives, généralement représentées comme positif/négatif ou 0/1.

📖
термины

Classification multi-classe

Problème de classification où chaque instance doit être assignée à exactement une classe parmi trois ou plus, les classes étant mutuellement exclusives.

📖
термины

Classification multi-étiquettes

Variante de classification où un document peut être associé simultanément à plusieurs étiquettes ou catégories non exclusives.

📖
термины

Naïve Bayes

Algorithme de classification probabiliste basé sur le théorème de Bayes avec une hypothèse d'indépendance conditionnelle entre les caractéristiques.

📖
термины

SVM (Support Vector Machine)

Algorithme d'apprentissage supervisé qui trouve l'hyperplan optimal séparant les classes dans un espace de grande dimension en maximisant la marge.

📖
термины

Bag-of-Words

Représentation textuelle qui décompte les occurrences des mots sans tenir compte de leur ordre ou de leur contexte grammatical.

📖
термины

TF-IDF

Métrique statistique évaluant l'importance d'un mot dans un document par rapport à un corpus, combinant fréquence term et fréquence inverse document.

📖
термины

Векторные представления слов

Плотные векторные представления слов в непрерывном пространстве, где сохраняются семантические расстояния между словами.

📖
термины

Трансформеры

Архитектура нейронных сетей на основе механизмов внимания, позволяющая захватывать дальние зависимости в последовательностях.

📖
термины

Матрица ошибок

Таблица для визуализации производительности классификатора путем сравнения предсказаний с истинными метками по классам.

📖
термины

Перекрестная проверка

Надежная техника оценки, разделяющая данные на подмножества для многократного обучения и тестирования модели на различных разделениях.

📖
термины

Точность

Метрика, измеряющая долю правильных положительных предсказаний среди всех положительных предсказаний, сделанных моделью.

📖
термины

Полнота

Метрика, оценивающая способность модели правильно идентифицировать все реальные положительные экземпляры в наборе данных.

📖
термины

F1-оценка

Гармоническое среднее между точностью и полнотой, обеспечивающее единую сбалансированную меру производительности классификации.

📖
термины

Переобучение

Явление, при котором модель слишком специфично обучается на обучающих данных и плохо обобщается на новые невидимые данные.

📖
термины

Токенизация

Процесс сегментации текста на элементарные единицы (токены), такие как слова, подслова или символы, для анализа.

📖
термины

Стемминг

Техника текстовой нормализации, сокращающая слова до их морфологической основы путем удаления суффиксов и префиксов.

📖
термины

Лемматизация

Лингвистический процесс, приводящий слова к их канонической форме (лемме) с использованием морфологического анализа и словаря.

🔍

Результаты не найдены