Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Filtrage collaboratif
Approche de recommandation qui génère des prédictions en collectant les préférences de nombreux utilisateurs, en se basant sur le principe que les utilisateurs ayant des goûts similaires dans le passé auront des goûts similaires à l'avenir.
Matrice utilisateur-item
Structure de données fondamentale où les lignes représentent les utilisateurs, les colonnes les items, et les cellules contiennent les évaluations ou interactions, généralement très creuse car chaque utilisateur n'interagit qu'avec peu d'items.
Similarité cosinus
Métrique de similarité calculant le cosinus de l'angle entre deux vecteurs d'évaluations dans un espace multidimensionnel, variant de -1 (opposition totale) à 1 (similarité parfaite), largement utilisée pour comparer les profils utilisateurs ou items.
Corrélation de Pearson
Coefficient mesurant la corrélation linéaire entre deux vecteurs d'évaluations, centré sur la moyenne et normalisé, particulièrement efficace pour capturer les tendances relatives d'évaluation entre utilisateurs ou items.
Voisinage k-nearest neighbors
Algorithme identifiant les k utilisateurs ou items les plus similaires à une cible donnée pour former un voisinage utilisé dans le calcul des prédictions, où k est un paramètre crucial contrôlant la granularité des recommandations.
Filtrage collaboratif utilisateur
Approche basée sur la similarité entre utilisateurs, recommandant des items que des utilisateurs similaires ont appréciés, nécessitant le calcul de similarités utilisateur-utilisateur et une gestion efficace des profils évolutifs.
Filtrage collaboratif item
Méthode basée sur la similarité entre items, recommandant des items similaires à ceux déjà appréciés par l'utilisateur, généralement plus stable et scalable que l'approche utilisateur car les items évoluent moins fréquemment.
Problème du démarrage à froid
Défi majeur où le système ne peut générer de recommandations fiables pour les nouveaux utilisateurs ou items en raison du manque de données historiques, nécessitant des stratégies d'initialisation et de collecte active d'informations.
Matrice creuse
Caractéristique inhérente des systèmes de recommandation où la majorité des cellules de la matrice utilisateur-item sont vides, posant des défis computationnels et nécessitant des structures de données optimisées et des techniques d'imputation.
Notation explicite vs implicite
Distinction entre les évaluations directes fournies volontairement par les utilisateurs (explicite) et les inférences de préférence basées sur les comportements observés (implicite), chacune avec ses biais et méthodes de traitement spécifiques.
Biais de popularité
Tendance systématique du filtrage collaboratif à sur-recommander les items populaires au détriment de la diversité, pouvant créer des boucles de renforcement et limiter la découverte d'items de niche pertinents.
Prédiction de notation
Processus d'estimation de la note qu'un utilisateur donnerait à un item non évalué, typiquement calculée comme une combinaison pondérée des évaluations des utilisateurs voisins ou des items similaires avec ajustements de biais.
Top-N recommendations
Approche de recommandation générant une liste classée des N items les plus pertinents pour un utilisateur, optimisant différemment les algorithmes par rapport à la prédiction de notation exacte et nécessitant des métriques d'évaluation spécifiques.
Normalisation Z-score
Technique de standardisation des évaluations utilisateur en soustrayant la moyenne et divisant par l'écart-type, permettant de comparer des utilisateurs avec différentes échelles d'évaluation et de réduire l'impact des biais individuels.
Score de confiance
Métrique quantifiant la fiabilité d'une similarité ou prédiction calculée, typiquement basée sur le nombre d'évaluations communes et leur variance, utilisée pour pondérer les contributions dans les calculs de recommandation.
Pondération temporelle
Méthode assignant plus de poids aux évaluations récentes par rapport aux anciennes, reflétant l'évolution des préférences utilisateur et assurant que les recommandations restent pertinentes face aux changements de goûts.
Agrégation des prédictions
Processus de combinaison de multiples prédictions de différents voisins ou méthodes en une recommandation finale, utilisant des techniques comme la moyenne pondérée, la médiane ou des méta-apprentissages pour optimiser la précision.
RMSE (Root Mean Square Error)
Métrique d'évaluation standard mesurant la racine carrée de la moyenne des carrés des erreurs entre prédictions et évaluations réelles, pénalisant fortement les grandes erreurs et étant sensible aux valeurs aberrantes.
MAE (Mean Absolute Error)
Métrique calculant la moyenne des valeurs absolues des erreurs de prédiction, offrant une interprétation plus intuitive que le RMSE et étant moins sensible aux valeurs aberrantes dans l'évaluation des systèmes de recommandation.