agent for recommendation

When Large Language Model based Agent Meets User Behavior Analysis: A Novel User Simulation Paradigm

a profiling module, a memory module and an action module

用户配置文件包括ID、姓名、性别、年龄、特征、职业、兴趣和行为特征。
- （Feature：为了更准确地描述推荐域中的用户，我们使用ChatGPT来总结在线用户的五种显著行为特征，并将其纳入用户简档中。包括：

“(1) Watcher: the users with this feature will actively provide feedback and ratings to the interacted items. 将主动对交互项目提供反馈和评级

(2) Explorer: the users with this feature will actively search for items they have heard before, and produce detailed experiences. 将主动搜索他们以前听过的项目，并产生详细的体验

(3) Critic: the users with this feature demands high standards for items, and may criticize both the recommendation system and the items.

(4) Chatter: the users with this feature will always engage in private conversations, and trust friends’ recommendations. 将始终参与私人对话，并相信朋友的推荐

(5) Poster: the users with this feature enjoy publicly posting on social media and sharing content and insights with his friends.喜欢在社交媒体上公开发帖和分享内容）

memory：感觉记忆、短期记忆和长期记忆
- 感觉记忆：Two individuals, David Smith and David Miller, engage in a conversation about their shared passion for mind-blowing movies, discussing and recommending films such as Interstellar, Inception, The Matrix, Blade Runner, and The Prestige, ultimately planning a movie night and inviting others to join them for a movie marathon.
- 短期记忆：
  - “Prompt: There are some memories {MR, OB}. Can you infer from the above memories the high-level insight for this person’s character? The insight needs to be significantly different from the content and structure of the original memories. Respond in one sentence. Response in one line.”
  - “Insight: David Miller is a curious and open-minded individual who actively seeks recommendations and discussions about mind-bending movies.”
- 长期记忆：
action：
- 推荐系统内：(1)搜索行为：通过这些行为，代理可以主动搜索感兴趣的项目。（2）浏览行为：通过这些行为，代理可以被动地接收来自系统的推荐。（3）点击行为：通过这些行为，代理可以选择他们想要观看/购买的项目。（4）下一页行为：当用户对当前推荐/搜索的项目不满意，并希望看到更多结果时，会触发这些行为。
- 推荐系统之外的行为：（社交网络）实际上，在推荐系统中可能有大量的外部因素影响用户行为。我们认为社会影响可能是最重要的因素之一，例如，真实用户总是相互影响，人们很容易受到商品广告的影响。从不同的社会行为中，我们抽象出两种一般模式：（1）一对一聊天，两个用户讨论和交换他们的信息。这种模式包括用户行为，如通过Twitter、微信等在线聊天，或在咖啡店离线聊天。这些行为可能会触发用户与讨论的项目进行交互，或者改变他们的记忆以影响后续行动。（2）一对多发布，其中一个用户与其他用户共享信息。这种模式包括在社交媒体上发表意见或发送商业广告等用户行为。这些行为可能影响接收共享信息的用户的记忆和行动。

引入社交网络，多个agent互动–> 搜索query补足

记忆体系：感知、短期、长期

Recommender AI Agent: Integrating Large Language Models for Interactive Recommendations

对话式推荐系统

提出了InteRecAgent，一个紧凑的框架，通过将LLMs与三组传统推荐模型整合，实现了对话式推荐系统的民主化。
为了确保LLMs和推荐系统的有效结合，引入了InteRecAgent内的共享内存总线、动态演示增强的先规划后执行策略和反思策略。

用户通过自然语言与LLMs交互，LLMs解释用户意图并判断当前对话是否需要工具的帮助。在轻松对话中，LLMs基于自身知识回应，而在领域内的推荐任务中，LLMs通过调用一系列工具API并观察工具执行结果生成回应。

作者提出的最小工具集涵盖了以下方面：

信息查询（Information Query）： 在对话互动中，InteRecAgent不仅要处理物品推荐任务，还要频繁应对用户的查询。作者引入了一个LLMs配备的项目信息查询模块，通过结构化查询语言（SQL）表达式，从后端项目信息数据库中高效检索详细的项目信息。
例如，在游戏平台上，用户可能会问类似于“这个游戏的发布日期是什么时候？价格是多少？”的问题。为了处理这些查询，LLMs被配置了一个Item Information Query模块，可以通过结构化查询语言（SQL）表达式高效地从后端物品信息数据库中检索详细的物品信息。
项目检索（Item Retrieval）： 用于提出在当前对话中满足用户意图的项目候选列表。工具分为两种类型：硬条件和软条件。硬条件是对项目的明确要求，比如“我想要一些受欢迎的体育游戏”或“推荐我一些价格低于100美元的RPG游戏”。软条件涉及无法用离散属性明确表达的需求，需要使用语义匹配模型，比如“我想要一些类似于《使命召唤》和《堡垒之夜》的游戏”。为了满足这两种条件，InteRecAgent使用SQL工具处理硬条件，从项目数据库中找到候选项目；对于软条件，采用项目到项目工具，基于潜在嵌入匹配相似项目。
项目排序（Item Ranking）： 在对话中，通过分析用户的历史数据和对话中表达的偏好，排名工具对用户进行个性化推荐。排名模块设计为分析用户的历史和对话中提到的具体兴趣，将这些信息作为输入，优先考虑候选集合中的项目。通过有效地对项目进行排序，InteRecAgent可以提供更引人入胜和令人满意的用户体验，从而增强推荐系统的整体效果。

例：

当用户询问“我已经玩过Fortnite和Call of Duty，现在我想玩一些在Fortnite之后发布的益智游戏，你有什么推荐？”时，工具的执行路径如下：

1. 信息查询（Information Query）： 首先，InteRecAgent通过LLMs解析用户的意图。LLMs会理解用户提到了已经玩过的游戏，以及他们想尝试一些在Fortnite之后发布的益智游戏。在这一阶段，InteRecAgent的LLMs可能使用信息查询工具，通过SQL表达式从后端项目信息数据库中高效检索有关这些游戏的详细信息。
2. 项目检索（Item Retrieval）： 接下来，由于用户表达了明确的需求，即在Fortnite之后发布的益智游戏，InteRecAgent使用SQL检索工具处理硬性条件，从项目数据库中找到符合条件的候选项。此时，候选项将通过Candidate Memory Bus传递，确保不会将所有项附加到提示输入中。
3. 项目排名（Item Ranking）： 最后，InteRecAgent使用排名工具对这些候选项进行排序，考虑用户在对话中提到的历史数据和兴趣。这确保推荐不仅符合用户当前的意图，还符合他们的整体偏好和口味。排序后的结果将成为LLMs生成响应的观察输入，以提供更有吸引力和令人满意的用户体验。

On Generative Agents in Recommendation

（i）用户配置模块：用户配置模块包含两个组成部分，一是社会特征，二是独特的品味

社会特征包含三个关键特征，活跃性，一致性和多样性，活跃性就代表了用户和产品交互的频率和广度，一致性代表了用户的评分这些和平均情况的差异，多样性反映了用户对各种电影类型的倾向，是否是专注于一个方向。

用户独特品味：

（ii）内存模块：该模块主要是存储用户的“记忆”，本文将记忆划分为两类，一种是事实记忆，另一种是情感记忆。

事实记忆是为推荐任务量身定制的，它封装了推荐系统中的交互行为，

而情感记忆则捕捉了源于这些交互的心理感受。

具体来说，事实记忆主要包含推荐电影列表，以及用户反馈。反馈涵盖了用户是否观看电影、他相应的评级以及潜在的退出行为等方面。另一方面，情绪记忆记录了用户在系统交互过程中的感受，如疲劳程度和总体满意度。我们的目标是确保生成代理不仅基于过去的事实互动做出反应，而且考虑到感觉，从而更接近地反映真实的人类行为。

（iii）动作模块：该模块负责用户的行动，一种是受到用户偏好驱动的，一种是受到用户情感驱动的。

用户偏好驱动

情感驱动：疲劳度，退出推荐系统后追访。

基础属性

——通过前序prompt固定提供

年龄、性别

推荐整体满意程度：点展比均值，高、中、低

探索欲：点击资源的类别数/点击资源数，高、中、低

从众性：点击资源平均分发量

活跃程度：高活、中活、低活、沉默

资源质量偏好：点击资源质量分均值

资源类别偏好

“记忆”

——需要时查表

（ubs_feed.feed_dim_user_dau_shoubai_expand_di）

城市、资产状况、星座、消费水平、手机型号、教育水平、兴趣偏好、职业、人生阶段、婚姻状态

#LLM #推荐

agent for recommendation

https://chunfei-he.github.io/2024/03/15/agent-for-recommendation/

作者

Chunfei He

发布于

2024年3月15日

许可协议

LLM调研上一篇