agent for recommendation

When Large Language Model based Agent Meets User Behavior Analysis: A Novel User Simulation Paradigm

a profiling module, a memory module and an action module

  • 用户配置文件包括ID、姓名、性别、年龄、特征、职业、兴趣和行为特征。

    • (Feature:为了更准确地描述推荐域中的用户,我们使用ChatGPT来总结在线用户的五种显著行为特征,并将其纳入用户简档中。包括:

“(1) Watcher: the users with this feature will actively provide feedback and ratings to the interacted items. 将主动对交互项目提供反馈和评级

(2) Explorer: the users with this feature will actively search for items they have heard before, and produce detailed experiences. 将主动搜索他们以前听过的项目,并产生详细的体验

(3) Critic: the users with this feature demands high standards for items, and may criticize both the recommendation system and the items.

(4) Chatter: the users with this feature will always engage in private conversations, and trust friends’ recommendations. 将始终参与私人对话,并相信朋友的推荐

(5) Poster: the users with this feature enjoy publicly posting on social media and sharing content and insights with his friends.喜欢在社交媒体上公开发帖和分享内容)

  • memory:感觉记忆、短期记忆和长期记忆

    • 感觉记忆:Two individuals, David Smith and David Miller, engage in a conversation about their shared passion for mind-blowing movies, discussing and recommending films such as Interstellar, Inception, The Matrix, Blade Runner, and The Prestige, ultimately planning a movie night and inviting others to join them for a movie marathon.

    • 短期记忆:

      • “Prompt: There are some memories {MR, OB}. Can you infer from the above memories the high-level insight for this person’s character? The insight needs to be significantly different from the content and structure of the original memories. Respond in one sentence. Response in one line.” 

      • “Insight: David Miller is a curious and open-minded individual who actively seeks recommendations and discussions about mind-bending movies.”

    • 长期记忆:

  • action:

    • 推荐系统内:(1)搜索行为:通过这些行为,代理可以主动搜索感兴趣的项目。(2)浏览行为:通过这些行为,代理可以被动地接收来自系统的推荐。(3)点击行为:通过这些行为,代理可以选择他们想要观看/购买的项目。(4)下一页行为:当用户对当前推荐/搜索的项目不满意,并希望看到更多结果时,会触发这些行为。

    • 推荐系统之外的行为:(社交网络)实际上,在推荐系统中可能有大量的外部因素影响用户行为。我们认为社会影响可能是最重要的因素之一,例如,真实用户总是相互影响,人们很容易受到商品广告的影响。从不同的社会行为中,我们抽象出两种一般模式:(1)一对一聊天,两个用户讨论和交换他们的信息。这种模式包括用户行为,如通过Twitter、微信等在线聊天,或在咖啡店离线聊天。这些行为可能会触发用户与讨论的项目进行交互,或者改变他们的记忆以影响后续行动。(2)一对多发布,其中一个用户与其他用户共享信息。这种模式包括在社交媒体上发表意见或发送商业广告等用户行为。这些行为可能影响接收共享信息的用户的记忆和行动。

引入社交网络,多个agent互动–> 搜索query补足

记忆体系:感知、短期、长期

Recommender AI Agent: Integrating Large Language Models for Interactive Recommendations

对话式推荐系统

  • 提出了InteRecAgent,一个紧凑的框架,通过将LLMs与三组传统推荐模型整合,实现了对话式推荐系统的民主化。

  • 为了确保LLMs和推荐系统的有效结合,引入了InteRecAgent内的共享内存总线、动态演示增强的先规划后执行策略和反思策略。

用户通过自然语言与LLMs交互,LLMs解释用户意图并判断当前对话是否需要工具的帮助。在轻松对话中,LLMs基于自身知识回应,而在领域内的推荐任务中,LLMs通过调用一系列工具API并观察工具执行结果生成回应。

作者提出的最小工具集涵盖了以下方面:

  1. 信息查询(Information Query): 在对话互动中,InteRecAgent不仅要处理物品推荐任务,还要频繁应对用户的查询。作者引入了一个LLMs配备的项目信息查询模块,通过结构化查询语言(SQL)表达式,从后端项目信息数据库中高效检索详细的项目信息。
    例如,在游戏平台上,用户可能会问类似于“这个游戏的发布日期是什么时候?价格是多少?”的问题。为了处理这些查询,LLMs被配置了一个Item Information Query模块,可以通过结构化查询语言(SQL)表达式高效地从后端物品信息数据库中检索详细的物品信息。

  2. 项目检索(Item Retrieval): 用于提出在当前对话中满足用户意图的项目候选列表。工具分为两种类型:硬条件和软条件。硬条件是对项目的明确要求,比如“我想要一些受欢迎的体育游戏”或“推荐我一些价格低于100美元的RPG游戏”。软条件涉及无法用离散属性明确表达的需求,需要使用语义匹配模型,比如“我想要一些类似于《使命召唤》和《堡垒之夜》的游戏”。为了满足这两种条件,InteRecAgent使用SQL工具处理硬条件,从项目数据库中找到候选项目;对于软条件,采用项目到项目工具,基于潜在嵌入匹配相似项目。

  3. 项目排序(Item Ranking): 在对话中,通过分析用户的历史数据和对话中表达的偏好,排名工具对用户进行个性化推荐。排名模块设计为分析用户的历史和对话中提到的具体兴趣,将这些信息作为输入,优先考虑候选集合中的项目。通过有效地对项目进行排序,InteRecAgent可以提供更引人入胜和令人满意的用户体验,从而增强推荐系统的整体效果。

例:

当用户询问“我已经玩过Fortnite和Call of Duty,现在我想玩一些在Fortnite之后发布的益智游戏,你有什么推荐?”时,工具的执行路径如下:

    1. 信息查询(Information Query): 首先,InteRecAgent通过LLMs解析用户的意图。LLMs会理解用户提到了已经玩过的游戏,以及他们想尝试一些在Fortnite之后发布的益智游戏。在这一阶段,InteRecAgent的LLMs可能使用信息查询工具,通过SQL表达式从后端项目信息数据库中高效检索有关这些游戏的详细信息。

    2. 项目检索(Item Retrieval): 接下来,由于用户表达了明确的需求,即在Fortnite之后发布的益智游戏,InteRecAgent使用SQL检索工具处理硬性条件,从项目数据库中找到符合条件的候选项。此时,候选项将通过Candidate Memory Bus传递,确保不会将所有项附加到提示输入中。

    3. 项目排名(Item Ranking): 最后,InteRecAgent使用排名工具对这些候选项进行排序,考虑用户在对话中提到的历史数据和兴趣。这确保推荐不仅符合用户当前的意图,还符合他们的整体偏好和口味。排序后的结果将成为LLMs生成响应的观察输入,以提供更有吸引力和令人满意的用户体验。

On Generative Agents in Recommendation

(i)用户配置模块:用户配置模块包含两个组成部分,一是社会特征,二是独特的品味

社会特征包含三个关键特征,活跃性,一致性和多样性,活跃性就代表了用户和产品交互的频率和广度,一致性代表了用户的评分这些和平均情况的差异,多样性反映了用户对各种电影类型的倾向,是否是专注于一个方向。

用户独特品味:

(ii)内存模块:该模块主要是存储用户的“记忆”,本文将记忆划分为两类,一种是事实记忆,另一种是情感记忆。

事实记忆是为推荐任务量身定制的,它封装了推荐系统中的交互行为,

而情感记忆则捕捉了源于这些交互的心理感受。

具体来说,事实记忆主要包含推荐电影列表,以及用户反馈。反馈涵盖了用户是否观看电影、他相应的评级以及潜在的退出行为等方面。另一方面,情绪记忆记录了用户在系统交互过程中的感受,如疲劳程度和总体满意度。我们的目标是确保生成代理不仅基于过去的事实互动做出反应,而且考虑到感觉,从而更接近地反映真实的人类行为。

(iii)动作模块:该模块负责用户的行动,一种是受到用户偏好驱动的,一种是受到用户情感驱动的。

用户偏好驱动

情感驱动:疲劳度,退出推荐系统后追访。

基础属性

——通过前序prompt固定提供

年龄、性别

推荐整体满意程度:点展比均值,高、中、低

探索欲:点击资源的类别数/点击资源数,高、中、低

从众性:点击资源平均分发量

活跃程度:高活、中活、低活、沉默

资源质量偏好:点击资源质量分均值

资源类别偏好

“记忆”

——需要时查表

(ubs_feed.feed_dim_user_dau_shoubai_expand_di)

城市、资产状况、星座、消费水平、手机型号、教育水平、兴趣偏好、职业、人生阶段、婚姻状态


agent for recommendation
https://chunfei-he.github.io/2024/03/15/agent-for-recommendation/
作者
Chunfei He
发布于
2024年3月15日
许可协议