Глоссарий ИИ
Полный словарь искусственного интеллекта
Filtrage collaboratif
Approche de recommandation qui génère des prédictions en collectant les préférences de nombreux utilisateurs, en se basant sur le principe que les utilisateurs ayant des goûts similaires dans le passé auront des goûts similaires à l'avenir.
Matrice utilisateur-item
Structure de données fondamentale où les lignes représentent les utilisateurs, les colonnes les items, et les cellules contiennent les évaluations ou interactions, généralement très creuse car chaque utilisateur n'interagit qu'avec peu d'items.
Similarité cosinus
Métrique de similarité calculant le cosinus de l'angle entre deux vecteurs d'évaluations dans un espace multidimensionnel, variant de -1 (opposition totale) à 1 (similarité parfaite), largement utilisée pour comparer les profils utilisateurs ou items.
Corrélation de Pearson
Coefficient mesurant la corrélation linéaire entre deux vecteurs d'évaluations, centré sur la moyenne et normalisé, particulièrement efficace pour capturer les tendances relatives d'évaluation entre utilisateurs ou items.
Voisinage k-nearest neighbors
Algorithme identifiant les k utilisateurs ou items les plus similaires à une cible donnée pour former un voisinage utilisé dans le calcul des prédictions, où k est un paramètre crucial contrôlant la granularité des recommandations.
Filtrage collaboratif utilisateur
Approche basée sur la similarité entre utilisateurs, recommandant des items que des utilisateurs similaires ont appréciés, nécessitant le calcul de similarités utilisateur-utilisateur et une gestion efficace des profils évolutifs.
Filtrage collaboratif item
Méthode basée sur la similarité entre items, recommandant des items similaires à ceux déjà appréciés par l'utilisateur, généralement plus stable et scalable que l'approche utilisateur car les items évoluent moins fréquemment.
Problème du démarrage à froid
Défi majeur où le système ne peut générer de recommandations fiables pour les nouveaux utilisateurs ou items en raison du manque de données historiques, nécessitant des stratégies d'initialisation et de collecte active d'informations.
Разреженная матрица
Врожденная характеристика систем рекомендаций, где большинство ячеек матрицы пользователь-элемент пусты, что создает вычислительные трудности и требует оптимизированных структур данных и техник вменения.
Явные и неявные оценки
Различие между прямыми оценками, предоставленными добровольно пользователями (явные), и выводами о предпочтениях, основанными на наблюдаемом поведении (неявные), каждое со своими смещениями и специфическими методами обработки.
Популярность bias
Систематическая тенденция коллаборативной фильтрации к избыточной рекомендации популярных элементов в ущерб разнообразию, что может создавать циклы усиления и ограничивать обнаружение релевантных нишевых элементов.
Предсказание оценки
Процесс оценки оценки, которую пользователь дал бы неоцененному элементу, обычно рассчитываемый как взвешенная комбинация оценок соседних пользователей или похожих элементов с поправками на смещение.
Top-N рекомендации
Подход рекомендации, генерирующий упорядоченный список из N наиболее релевантных элементов для пользователя, по-разному оптимизирующий алгоритмы по сравнению с точным предсказанием оценки и требующий специфических метрик оценки.
Нормализация Z-score
Техника стандартизации оценок пользователей путем вычитания среднего и деления на стандартное отклонение, позволяющая сравнивать пользователей с разными шкалами оценок и уменьшать влияние индивидуальных смещений.
Оценка доверия
Метрика, количественно определяющая надежность вычисленного подобия или предсказания, обычно основанная на количестве общих оценок и их вариации, используемая для взвешивания вкладов в расчетах рекомендаций.
Временное взвешивание
Метод назначения большего веса недавним оценкам по сравнению со старыми, отражающий эволюцию предпочтений пользователей и обеспечивающий актуальность рекомендаций перед лицом изменений во вкусах.
Агрегация прогнозов
Процесс объединения множественных прогнозов от различных соседей или методов в итоговую рекомендацию, использующий такие техники, как взвешенное среднее, медиана или мета-обучение для оптимизации точности.
RMSE (Root Mean Square Error)
Стандартная метрика оценки, измеряющая квадратный корень из среднего квадрата ошибок между прогнозами и реальными оценками, сильно штрафующая за большие ошибки и чувствительная к выбросам.
MAE (Mean Absolute Error)
Метрика, вычисляющая среднее значение абсолютных ошибок прогнозирования, предлагающая более интуитивную интерпретацию, чем RMSE, и менее чувствительная к выбросам при оценке рекомендательных систем.