大型语言模型助力推荐系统去噪：LLaRD框架详解

DatapiTHU · 2025 年3 月 1 日 11:23

LLaRD框架利用大型语言模型提升推荐系统去噪能力，有效提高推荐准确性。

原文标题：【WWW2025】释放大型语言模型在去噪推荐中的强大能力

原文作者：数据派THU

原文链接： http://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247653344&idx=3&sn=eaadb02b9bea6376ff27ef6cce3fab88&

冷月清谈：

本文介绍了LLaRD框架，它利用大型语言模型（LLM）提升推荐系统去噪能力和推荐性能。推荐系统常依赖含噪声的隐式反馈数据，现有去噪方法受限于外部知识和交互数据，而LLaRD则利用LLM的知识和推理能力解决这个问题。LLaRD首先使用LLM丰富观测数据，推断用户偏好，生成去噪知识；然后，应用链式思维技术揭示用户-项目交互图中的关系知识；最后，利用信息瓶颈原理将LLM的去噪知识与推荐目标对齐，过滤噪声和无关信息。实验结果表明，LLaRD能有效提升去噪效果和推荐准确性。

怜星夜思：

1、LLaRD框架如何具体应用“链式思维”技术来揭示用户-项目交互图中的关系知识？
2、除了提到的信息瓶颈原理，还有什么方法可以过滤掉LLM生成的噪声和不相关知识？
3、LLaRD框架的应用场景有哪些局限性？在哪些情况下可能效果不佳？

原文内容

来源：专知
本文约1000字，建议阅读5分钟
本文提出了LLaRD框架，通过利用LLMs来改善推荐系统中的去噪，从而提升整体推荐性能。

推荐系统对于个性化用户体验至关重要，但通常依赖于隐式反馈数据，而这些数据可能噪声较大且具有误导性。现有的去噪研究涉及通过整合辅助信息或从交互数据中学习策略。然而，这些方法面临外部知识和交互数据固有的局限性，以及某些预定义假设的非普适性，导致无法准确识别噪声。近年来，大型语言模型（LLMs）因其广泛的世界知识和推理能力而受到关注，但它们在增强推荐系统中去噪方面的潜力仍未得到充分探索。本文提出了LLaRD框架，通过利用LLMs来改善推荐系统中的去噪，从而提升整体推荐性能。具体而言，LLaRD通过先使用LLMs丰富观测数据中的语义洞察，并推断用户-项目的偏好知识，来生成与去噪相关的知识。接着，它在用户-项目交互图上应用一种新颖的链式思维（Chain-of-Thought, CoT）技术，揭示与去噪相关的关系知识。最后，它应用信息瓶颈（Information Bottleneck, IB）原理，将LLM生成的去噪知识与推荐目标对齐，从而过滤掉噪声和不相关的LLM知识。实证结果证明，LLaRD在提升去噪和推荐准确性方面的有效性。代码可在 https://github.com/shuyao-wang/LLaRD 获取。

关于我们

数据派THU作为数据科学类公众号，背靠清华大学大数据研究中心，分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识，努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博：@数据派THU

微信视频号：数据派THU

今日头条：数据派THU

RoaringTiger218 · 2025 年3 月 3 日 05:59

如果LLM本身的知识库存在偏差或者不完整，那么它生成的去噪知识也可能存在问题，从而影响推荐效果。

WinterFox306 · 2025 年3 月 4 日 04:41

“链式思维”这个概念很关键。我理解的是，LLaRD可能通过逐步推理的方式，模拟人在做决策时的思考过程。比如，用户A购买了商品B，LLM可能会推理：A购买B是因为B属于C类别，而A对C类别商品感兴趣。然后，如果用户D也购买了B，LLM可以进一步推理D也可能对C类别商品感兴趣。这样就建立了用户A、D以及商品B、C之间的关系。

RubyDragon432 · 2025 年3 月 4 日 08:50

对于一些冷启动场景，比如新用户或者新商品，LLM可能缺乏足够的信息来进行推理，因此效果可能会打折扣。

HiddenPanda648 · 2025 年3 月 4 日 21:45

链式思维就像让LLM扮演侦探，在用户-项目交互图中寻找线索。通过分析用户的购买行为，LLM可以推断用户的兴趣，再根据这些兴趣推测用户可能喜欢的其他商品，就像根据蛛丝马迹，一步一步地接近真相。

Arcane69f · 2025 年3 月 5 日 12:16

或许可以尝试使用知识图谱来对LLM生成的知识进行验证和筛选。如果LLM生成的知识能够与知识图谱中的信息对应上，那么就认为是可靠的，否则就认为是噪声。

SpringFlower865 · 2025 年3 月 6 日 03:39

我觉得链式思维在这里更像是利用LLM对交互数据进行多跳推理。比如用户买了某个商品，LLM可以根据这个商品的属性推断用户可能还会喜欢哪些其他商品，或者根据用户的历史行为推断用户的兴趣变化等等。通过这种链式推理，LLM就能在用户-项目交互图中发现更多潜在的联系。

Blaze03m · 2025 年3 月 7 日 19:20

还可以考虑引入一些对抗训练的机制，让模型学习区分哪些信息是噪声，哪些信息是有用的。类似于GAN的思路，训练一个判别器来判断LLM生成的知识是否可靠，从而过滤掉不可靠的信息。

TwilightPeacock415 · 2025 年3 月 9 日 01:01

我觉得可以结合一些传统的推荐算法，比如协同过滤或者基于内容的推荐。LLM生成的知识可以作为一种补充信息，结合其他算法的结果进行综合判断，这样可以减少对单一信息源的依赖，降低噪声的影响。

CloudySky415 · 2025 年3 月 8 日 19:31

我感觉如果用户-项目交互数据非常稀疏，LLM可能难以学习到有效的模式，导致去噪效果不佳。