Glosario IA
El diccionario completo de la Inteligencia Artificial
Filtrado colaborativo
Enfoque de recomendación que genera predicciones recopilando las preferencias de numerosos usuarios, basándose en el principio de que los usuarios con gustos similares en el pasado tendrán gustos similares en el futuro.
Matriz usuario-ítem
Estructura de datos fundamental donde las filas representan los usuarios, las columnas los ítems y las celdas contienen las evaluaciones o interacciones, generalmente muy dispersa ya que cada usuario solo interactúa con pocos ítems.
Similitud coseno
Métrica de similitud que calcula el coseno del ángulo entre dos vectores de evaluaciones en un espacio multidimensional, variando de -1 (oposición total) a 1 (similitud perfecta), ampliamente utilizada para comparar perfiles de usuarios o ítems.
Correlación de Pearson
Coeficiente que mide la correlación lineal entre dos vectores de evaluaciones, centrado en la media y normalizado, particularmente efectivo para capturar las tendencias relativas de evaluación entre usuarios o ítems.
Vecindario k vecinos más cercanos
Algoritmo que identifica los k usuarios o ítems más similares a un objetivo dado para formar un vecindario utilizado en el cálculo de predicciones, donde k es un parámetro crucial que controla la granularidad de las recomendaciones.
Filtrado colaborativo de usuario
Enfoque basado en la similitud entre usuarios, recomendando ítems que usuarios similares han apreciado, requiriendo el cálculo de similitudes usuario-usuario y una gestión eficaz de perfiles evolutivos.
Filtrado colaborativo de ítem
Método basado en la similitud entre ítems, recomendando ítems similares a aquellos ya apreciados por el usuario, generalmente más estable y escalable que el enfoque de usuario ya que los ítems evolucionan con menos frecuencia.
Problema de arranque en frío
Desafío mayor donde el sistema no puede generar recomendaciones fiables para nuevos usuarios o ítems debido a la falta de datos históricos, requiriendo estrategias de inicialización y recopilación activa de información.
Matriz dispersa
Característica inherente de los sistemas de recomendación donde la mayoría de las celdas de la matriz usuario-ítem están vacías, planteando desafíos computacionales y necesitando estructuras de datos optimizadas y técnicas de imputación.
Valoración explícita vs implícita
Distinción entre las evaluaciones directas proporcionadas voluntariamente por los usuarios (explícita) y las inferencias de preferencia basadas en los comportamientos observados (implícita), cada una con sus sesgos y métodos de procesamiento específicos.
Sesgo de popularidad
Tendencia sistemática del filtrado colaborativo a sobrerrecomendar los ítems populares en detrimento de la diversidad, pudiendo crear bucles de refuerzo y limitar el descubrimiento de ítems de nicho relevantes.
Predicción de valoración
Proceso de estimación de la nota que un usuario daría a un ítem no evaluado, típicamente calculada como una combinación ponderada de las evaluaciones de los usuarios vecinos o de los ítems similares con ajustes de sesgo.
Recomendaciones Top-N
Enfoque de recomendación generando una lista clasificada de los N ítems más relevantes para un usuario, optimizando diferentemente los algoritmos respecto a la predicción de valoración exacta y necesitando métricas de evaluación específicas.
Normalización Z-score
Técnica de estandarización de las valoraciones de usuario restando la media y dividiendo por la desviación estándar, permitiendo comparar usuarios con diferentes escalas de valoración y reducir el impacto de los sesgos individuales.
Puntuación de confianza
Métrica que cuantifica la fiabilidad de una similitud o predicción calculada, típicamente basada en el número de valoraciones comunes y su varianza, utilizada para ponderar las contribuciones en los cálculos de recomendación.
Ponderación temporal
Método que asigna más peso a las valoraciones recientes respecto a las antiguas, reflejando la evolución de las preferencias del usuario y asegurando que las recomendaciones permanezcan relevantes frente a los cambios de gustos.
Agregación de predicciones
Proceso de combinación de múltiples predicciones de diferentes vecinos o métodos en una recomendación final, utilizando técnicas como el promedio ponderado, la mediana o meta-aprendizajes para optimizar la precisión.
RMSE (Root Mean Square Error)
Métrica de evaluación estándar que mide la raíz cuadrada de la media de los cuadrados de los errores entre predicciones y evaluaciones reales, penalizando fuertemente los grandes errores y siendo sensible a los valores atípicos.
MAE (Mean Absolute Error)
Métrica que calcula el promedio de los valores absolutos de los errores de predicción, ofreciendo una interpretación más intuitiva que el RMSE y siendo menos sensible a los valores atípicos en la evaluación de los sistemas de recomendación.