Glossário IA
O dicionário completo da Inteligência Artificial
Filtragem colaborativa
Abordagem de recomendação que gera previsões coletando as preferências de muitos usuários, baseada no princípio de que usuários com gostos semelhantes no passado terão gostos semelhantes no futuro.
Matriz usuário-item
Estrutura de dados fundamental onde as linhas representam os usuários, as colunas os itens, e as células contêm as avaliações ou interações, geralmente muito esparsa pois cada usuário interage com poucos itens.
Similaridade de cosseno
Métrica de similaridade que calcula o cosseno do ângulo entre dois vetores de avaliações em um espaço multidimensional, variando de -1 (oposição total) a 1 (similaridade perfeita), amplamente utilizada para comparar perfis de usuários ou itens.
Correlação de Pearson
Coeficiente que mede a correlação linear entre dois vetores de avaliações, centrado na média e normalizado, particularmente eficaz para capturar as tendências relativas de avaliação entre usuários ou itens.
Vizinhança k-vizinhos mais próximos
Algoritmo que identifica os k usuários ou itens mais similares a um alvo dado para formar uma vizinhança usada no cálculo das previsões, onde k é um parâmetro crucial que controla a granularidade das recomendações.
Filtragem colaborativa baseada em usuário
Abordagem baseada na similaridade entre usuários, recomendando itens que usuários similares apreciaram, necessitando o cálculo de similaridades usuário-usuário e uma gestão eficaz de perfis evolutivos.
Filtragem colaborativa baseada em item
Método baseado na similaridade entre itens, recomendando itens similares àqueles já apreciados pelo usuário, geralmente mais estável e escalável que a abordagem baseada em usuário, pois os itens evoluem menos frequentemente.
Problema de inicialização a frio
Desafio maior onde o sistema não pode gerar recomendações confiáveis para novos usuários ou itens devido à falta de dados históricos, necessitando estratégias de inicialização e coleta ativa de informações.
Matriz esparsa
Característica inerente dos sistemas de recomendação onde a maioria das células da matriz usuário-item está vazia, apresentando desafios computacionais e necessitando de estruturas de dados otimizadas e técnicas de imputação.
Avaliação explícita vs implícita
Distinção entre as avaliações diretas fornecidas voluntariamente pelos usuários (explícita) e as inferências de preferência baseadas nos comportamentos observados (implícita), cada uma com seus vieses e métodos de tratamento específicos.
Viés de popularidade
Tendência sistemática da filtragem colaborativa de super-recomendar itens populares em detrimento da diversidade, podendo criar loops de reforço e limitar a descoberta de itens de nicho relevantes.
Previsão de avaliação
Processo de estimativa da nota que um usuário daria a um item não avaliado, tipicamente calculada como uma combinação ponderada das avaliações dos usuários vizinhos ou itens similares com ajustes de viés.
Recomendações Top-N
Abordagem de recomendação gerando uma lista classificada dos N itens mais relevantes para um usuário, otimizando diferentemente os algoritmos em relação à previsão de avaliação exata e necessitando de métricas de avaliação específicas.
Normalização Z-score
Técnica de padronização das avaliações do usuário subtraindo a média e dividindo pelo desvio padrão, permitindo comparar usuários com diferentes escalas de avaliação e reduzir o impacto dos vieses individuais.
Pontuação de confiança
Métrica que quantifica a confiabilidade de uma similaridade ou previsão calculada, tipicamente baseada no número de avaliações comuns e sua variância, usada para ponderar as contribuições nos cálculos de recomendação.
Ponderação temporal
Método que atribui mais peso às avaliações recentes em relação às antigas, refletindo a evolução das preferências do usuário e garantindo que as recomendações permaneçam relevantes diante das mudanças de gostos.
Agregação de previsões
Processo de combinação de múltiplas previsões de diferentes vizinhos ou métodos em uma recomendação final, utilizando técnicas como média ponderada, mediana ou meta-aprendizagem para otimizar a precisão.
RMSE (Root Mean Square Error)
Métrica de avaliação padrão que mede a raiz quadrada da média dos quadrados dos erros entre previsões e avaliações reais, penalizando fortemente grandes erros e sendo sensível a valores atípicos.
MAE (Mean Absolute Error)
Métrica que calcula a média dos valores absolutos dos erros de previsão, oferecendo uma interpretação mais intuitiva que o RMSE e sendo menos sensível a valores atípicos na avaliação de sistemas de recomendação.