agent for recommendation
When Large Language Model based Agent Meets User Behavior Analysis: A Novel User Simulation Paradigm
a profiling module, a memory module and an action module
用户配置文件包括ID、姓名、性别、年龄、特征、职业、兴趣和行为特征。
- (Feature:为了更准确地描述推荐域中的用户,我们使用ChatGPT来总结在线用户的五种显著行为特征,并将其纳入用户简档中。包括:
“(1) Watcher: the users with this feature will actively provide feedback and ratings to the interacted items. 将主动对交互项目提供反馈和评级
(2) Explorer: the users with this feature will actively search for items they have heard before, and produce detailed experiences. 将主动搜索他们以前听过的项目,并产生详细的体验
(3) Critic: the users with this feature demands high standards for items, and may criticize both the recommendation system and the items.
(4) Chatter: the users with this feature will always engage in private conversations, and trust friends’ recommendations. 将始终参与私人对话,并相信朋友的推荐
(5) Poster: the users with this feature enjoy publicly posting on social media and sharing content and insights with his friends.喜欢在社交媒体上公开发帖和分享内容)
memory:感觉记忆、短期记忆和长期记忆
感觉记忆:Two individuals, David Smith and David Miller, engage in a conversation about their shared passion for mind-blowing movies, discussing and recommending films such as Interstellar, Inception, The Matrix, Blade Runner, and The Prestige, ultimately planning a movie night and inviting others to join them for a movie marathon.
短期记忆:
“Prompt: There are some memories {MR, OB}. Can you infer from the above memories the high-level insight for this person’s character? The insight needs to be significantly different from the content and structure of the original memories. Respond in one sentence. Response in one line.”
“Insight: David Miller is a curious and open-minded individual who actively seeks recommendations and discussions about mind-bending movies.”
长期记忆:
action:
推荐系统内:(1)搜索行为:通过这些行为,代理可以主动搜索感兴趣的项目。(2)浏览行为:通过这些行为,代理可以被动地接收来自系统的推荐。(3)点击行为:通过这些行为,代理可以选择他们想要观看/购买的项目。(4)下一页行为:当用户对当前推荐/搜索的项目不满意,并希望看到更多结果时,会触发这些行为。
推荐系统之外的行为:(社交网络)实际上,在推荐系统中可能有大量的外部因素影响用户行为。我们认为社会影响可能是最重要的因素之一,例如,真实用户总是相互影响,人们很容易受到商品广告的影响。从不同的社会行为中,我们抽象出两种一般模式:(1)一对一聊天,两个用户讨论和交换他们的信息。这种模式包括用户行为,如通过Twitter、微信等在线聊天,或在咖啡店离线聊天。这些行为可能会触发用户与讨论的项目进行交互,或者改变他们的记忆以影响后续行动。(2)一对多发布,其中一个用户与其他用户共享信息。这种模式包括在社交媒体上发表意见或发送商业广告等用户行为。这些行为可能影响接收共享信息的用户的记忆和行动。
引入社交网络,多个agent互动–> 搜索query补足
记忆体系:感知、短期、长期
Recommender AI Agent: Integrating Large Language Models for Interactive Recommendations
对话式推荐系统
提出了InteRecAgent,一个紧凑的框架,通过将LLMs与三组传统推荐模型整合,实现了对话式推荐系统的民主化。
为了确保LLMs和推荐系统的有效结合,引入了InteRecAgent内的共享内存总线、动态演示增强的先规划后执行策略和反思策略。
用户通过自然语言与LLMs交互,LLMs解释用户意图并判断当前对话是否需要工具的帮助。在轻松对话中,LLMs基于自身知识回应,而在领域内的推荐任务中,LLMs通过调用一系列工具API并观察工具执行结果生成回应。
作者提出的最小工具集涵盖了以下方面:
信息查询(Information Query): 在对话互动中,InteRecAgent不仅要处理物品推荐任务,还要频繁应对用户的查询。作者引入了一个LLMs配备的项目信息查询模块,通过结构化查询语言(SQL)表达式,从后端项目信息数据库中高效检索详细的项目信息。
例如,在游戏平台上,用户可能会问类似于“这个游戏的发布日期是什么时候?价格是多少?”的问题。为了处理这些查询,LLMs被配置了一个Item Information Query模块,可以通过结构化查询语言(SQL)表达式高效地从后端物品信息数据库中检索详细的物品信息。项目检索(Item Retrieval): 用于提出在当前对话中满足用户意图的项目候选列表。工具分为两种类型:硬条件和软条件。硬条件是对项目的明确要求,比如“我想要一些受欢迎的体育游戏”或“推荐我一些价格低于100美元的RPG游戏”。软条件涉及无法用离散属性明确表达的需求,需要使用语义匹配模型,比如“我想要一些类似于《使命召唤》和《堡垒之夜》的游戏”。为了满足这两种条件,InteRecAgent使用SQL工具处理硬条件,从项目数据库中找到候选项目;对于软条件,采用项目到项目工具,基于潜在嵌入匹配相似项目。
项目排序(Item Ranking): 在对话中,通过分析用户的历史数据和对话中表达的偏好,排名工具对用户进行个性化推荐。排名模块设计为分析用户的历史和对话中提到的具体兴趣,将这些信息作为输入,优先考虑候选集合中的项目。通过有效地对项目进行排序,InteRecAgent可以提供更引人入胜和令人满意的用户体验,从而增强推荐系统的整体效果。
例:
当用户询问“我已经玩过Fortnite和Call of Duty,现在我想玩一些在Fortnite之后发布的益智游戏,你有什么推荐?”时,工具的执行路径如下:
信息查询(Information Query): 首先,InteRecAgent通过LLMs解析用户的意图。LLMs会理解用户提到了已经玩过的游戏,以及他们想尝试一些在Fortnite之后发布的益智游戏。在这一阶段,InteRecAgent的LLMs可能使用信息查询工具,通过SQL表达式从后端项目信息数据库中高效检索有关这些游戏的详细信息。
项目检索(Item Retrieval): 接下来,由于用户表达了明确的需求,即在Fortnite之后发布的益智游戏,InteRecAgent使用SQL检索工具处理硬性条件,从项目数据库中找到符合条件的候选项。此时,候选项将通过Candidate Memory Bus传递,确保不会将所有项附加到提示输入中。
项目排名(Item Ranking): 最后,InteRecAgent使用排名工具对这些候选项进行排序,考虑用户在对话中提到的历史数据和兴趣。这确保推荐不仅符合用户当前的意图,还符合他们的整体偏好和口味。排序后的结果将成为LLMs生成响应的观察输入,以提供更有吸引力和令人满意的用户体验。
On Generative Agents in Recommendation
(i)用户配置模块:用户配置模块包含两个组成部分,一是社会特征,二是独特的品味
社会特征包含三个关键特征,活跃性,一致性和多样性,活跃性就代表了用户和产品交互的频率和广度,一致性代表了用户的评分这些和平均情况的差异,多样性反映了用户对各种电影类型的倾向,是否是专注于一个方向。
用户独特品味:
(ii)内存模块:该模块主要是存储用户的“记忆”,本文将记忆划分为两类,一种是事实记忆,另一种是情感记忆。
事实记忆是为推荐任务量身定制的,它封装了推荐系统中的交互行为,
而情感记忆则捕捉了源于这些交互的心理感受。
具体来说,事实记忆主要包含推荐电影列表,以及用户反馈。反馈涵盖了用户是否观看电影、他相应的评级以及潜在的退出行为等方面。另一方面,情绪记忆记录了用户在系统交互过程中的感受,如疲劳程度和总体满意度。我们的目标是确保生成代理不仅基于过去的事实互动做出反应,而且考虑到感觉,从而更接近地反映真实的人类行为。
(iii)动作模块:该模块负责用户的行动,一种是受到用户偏好驱动的,一种是受到用户情感驱动的。
用户偏好驱动
情感驱动:疲劳度,退出推荐系统后追访。
基础属性
——通过前序prompt固定提供
年龄、性别
推荐整体满意程度:点展比均值,高、中、低
探索欲:点击资源的类别数/点击资源数,高、中、低
从众性:点击资源平均分发量
活跃程度:高活、中活、低活、沉默
资源质量偏好:点击资源质量分均值
资源类别偏好
“记忆”
——需要时查表
(ubs_feed.feed_dim_user_dau_shoubai_expand_di)
城市、资产状况、星座、消费水平、手机型号、教育水平、兴趣偏好、职业、人生阶段、婚姻状态