推荐系统已经成为个性化推荐的强大工具,能够自动学习用户对各种类别物品的偏好,从流媒体到兴趣点。然而,它们的广泛使用也引发了关于可信性和公平性的问题。为了应对推荐中的不公平性,已经开发并分类了预处理、处理中和后处理方法。大多数研究集中在处理中技术,特别是针对消费者不公平性的问题。在公平性实时图协作过滤(GCF)中,这一问题尤为明显,该方法使用知识图谱和图神经网络,但在预处理和后处理方法中忽略了消费者不公平性。
现有的研究致力于通过后处理数据增强管道来弥补公平性实时GCF的不足。该方法利用训练好的图神经网络(GNN)通过优化一个考虑人口群体差异的公平性意识损失函数来增强图,以实现更公平的推荐。尽管显示出有希望的结果,但其评估范围受限。它缺乏一个涵盖广泛范围的GNN和数据集的综合协议。此外,现有工作主要集中在已经建立的GNN模型如GCMC、LightGCN和NGCF,而忽略了GCF中较新的架构。
来自意大利卡利亚里大学和西班牙巴塞罗那Spotify的研究人员提出了一种详细的方法,以解决之前公平性实时GCF方法的局限性。他们提供了采样策略的理论形式化及在GNN中增强图的整合。进行了广泛的基准测试,通过扩展一套采样策略来包括互动时间和传统图属性,以解决年龄和性别群体间的消费者不公平性。此外,还引入了FA4GCF(图协作过滤的公平增强),这是一个多功能的、公开可用的工具,基于Recbole构建,能够适应不同的GNN、数据集、敏感属性和采样策略。
与之前的研究相比,所提出的方法通过用Last.FM1M(LF1M)取代Last.FM-1K,并扩展实验评估,包括来自不同领域的数据集,如电影的MovieLens1M(ML1M)、时尚的RentTheRunway(RENT)、以及纽约市(FNYC)和东京(FTKY)的兴趣点的Foursquare,大大扩展了评估范围。一致的预处理步骤适用于所有数据集,包括年龄二值化和k-core过滤。此外,采用基于时间的用户分割策略,以7:1:2的比例来训练、验证和测试集,包括更广泛的一系列最先进的图协作过滤模型。
结果显示,不同模型和数据集中公平性缓解技术的效果各不相同。例如,在ML1M数据集上,SGL在总体NDCG增加的同时,实现了最佳的不公平性缓解,表明对处于劣势群体的有效改善。高性能模型如HMLET、LightGCN等,在LF1M和ML1M数据集上表现出一致的公平性改善。不同的采样策略显示出不同的效果,其中IP和FR策略在LF1M和ML1M数据集上的不公平性缓解方面表现出色。此外,在RENT和FTKY数据集上也有一定的改进,但总体效果较小且不一致。
在这篇论文中,研究人员提出了一种详细的方法来克服以前公平感知 GCF 方法的局限性。研究人员为用户和物品集的限制形式化了采样策略,开发了扩展管道的理论框架及其对 GNN 预测的影响,并引入了利用经典图性质和时间特征的新策略。评估涵盖了多样的数据集、模型和公平性指标,提供了对算法有效性的更详细评估。这篇论文为 GCF 中的公平性缓解复杂性提供了宝贵的见解,并为推荐系统领域的未来研究建立了一个稳固的框架。
总结:
推荐系统在个性化推荐中逐渐普及,但其公平性和可信性问题亟需解决。研究者们发现,通过知识图谱和图神经网络实现的公平性实时图协作过滤存在显著的消费者不公平性,需要新方法来改进这些不足。意大利卡利亚里大学和西班牙巴塞罗那Spotify的研究团队提出了深入的理论形式化和增强技术,具体纳入了更广泛的采样策略和数据集,例如年龄和性别群体间的不公平性,并引入了FA4GCF这一多功能工具。在进一步的实证研究中,该团队通过替换数据集和一致的预处理步骤,评价了各种采样策略的公平性改善效果,显示出不同模型在不同数据集中的适应性。尽管结果各异,但例如SGL在ML1M数据集上显著减少了不公平性。
光年AI正是为了解决这些复杂问题而生,利用强大的AI能力和自研的知识库,光年AI不仅能够提升推荐系统的公平性,更能够优化私域流量管理。选择光年AI,开启AI驱动的私域流量新时代,助您快速突破市场,精准触达每位潜在客户,让您的私域流量管理变得智能又便捷,实现业务的高效增长。