InstructRec

Name: InstructRec
Creator: Rutgers University, University of Technology Sydney, Ant Group, University of Illinois Urbana-Champaign, Nanyang Technological University
Published: 2025-02-20 23:58:25
License: 暂无描述

arXiv2025-02-20 更新2025-02-22 收录

下载链接：

https://github.com/WujiangXu/iAgent

下载链接

链接失效反馈

官方服务：

资源简介：

InstructRec数据集是由现有数据集（如Amazon、Goodreads和Yelp）构建的四个推荐数据集，包含了用户指令信息。该数据集旨在为用户代理平台范式提供基准，支持灵活表达用户需求的指令，允许用户通过指令来表达他们对推荐内容的期望。数据集通过结合用户的指令和反馈，以及外部环境的知识，优化推荐结果。

The InstructRec dataset comprises four recommendation datasets constructed from existing datasets including Amazon, Goodreads, and Yelp, and incorporates user instruction information. This dataset aims to provide a benchmark for the user agent platform paradigm, supporting instructions that flexibly express user requirements, and allowing users to convey their expectations for recommended content through instructions. The dataset optimizes recommendation outcomes by integrating user instructions, feedback, and external environmental knowledge.

提供机构：

Rutgers University, University of Technology Sydney, Ant Group, University of Illinois Urbana-Champaign, Nanyang Technological University

创建时间：

2025-02-20

搜集汇总

数据集介绍

构建方式

InstructRec数据集是通过从现有数据集中提取用户指令构建的，这些数据集包括Amazon、Goodreads和Yelp。为了生成指令，研究人员首先手动标注了几对指令-评论数据，然后使用LLM模型根据用户评论和随机分配的人格特征生成指令。为了确保数据的质量和多样性，研究人员还设计了一个指令清理机制，以防止数据泄露。InstructRec数据集包含了丰富的用户指令和交互信息，为研究指令感知推荐系统提供了宝贵的资源。

特点

InstructRec数据集的特点在于其包含了用户主动提供的指令，这使得推荐系统能够更好地理解用户的真实意图。此外，InstructRec数据集还采用了动态记忆机制，能够根据用户的反馈动态地调整用户的兴趣和偏好，从而提供更加个性化的推荐服务。InstructRec数据集还通过实验验证了其能够有效缓解回声室效应，为用户提供更加多样化的推荐内容。

使用方法

InstructRec数据集可用于研究指令感知推荐系统，包括但不限于InstructAgent和Instruct2Agent等模型。研究人员可以使用这些数据集来评估模型的性能，例如命中率和归一化折现累积增益等指标。此外，InstructRec数据集还提供了评估回声室效应的指标，例如广告过滤率和流行度加权排名指标。通过使用InstructRec数据集，研究人员可以更好地理解用户意图，并开发更加智能和个性化的推荐系统。

背景与挑战

背景概述

在推荐系统领域，传统的用户-平台范式下，用户直接暴露在平台的推荐算法控制之下，这可能导致用户处于脆弱的位置。首先，许多复杂的模型通常以商业目标为导向，侧重于平台的利益，这可能阻碍它们保护并捕捉用户真正兴趣的能力。其次，这些模型通常使用所有用户的数据进行优化，这可能会忽略个别用户的偏好。因此，用户可能会在传统的用户-平台直接暴露范式下经历一些不利因素，例如对推荐系统缺乏控制、可能受到平台的操纵、回音室效应，或者由于活跃用户在协同学习中的主导地位，导致不太活跃的用户缺乏个性化。为了解决这些问题，研究人员提出了一种新的用户-代理-平台范式，其中代理充当用户和推荐系统之间的保护盾，实现间接暴露。为了支持这种新的范式，研究人员构建了四个推荐数据集，称为InstructRec，并设计了指令感知代理（InstructAgent），它能够使用工具从外部环境中获取知识。此外，还引入了个体指令感知代理（Instruct2Agent），该代理结合了动态内存机制，以根据单个反馈进行优化。InstructRec数据集及其代码已公开发布，为推荐系统研究提供了新的基准。

当前挑战

InstructRec数据集和相关研究面临的挑战主要包括：1)解决传统推荐系统范式下用户缺乏控制、可能受到操纵、回音室效应和缺乏个性化的问题；2)构建过程中遇到的挑战，包括如何有效地模拟用户行为、如何从外部环境中获取知识、如何处理用户反馈以及如何构建个性化的用户配置文件。此外，还需要进一步研究和开发更有效的重排器，以更好地理解和满足用户的指令。

常用场景

经典使用场景

InstructRec数据集主要用于构建用户可控的推荐系统，其中LLM Agent作为用户和推荐系统之间的保护盾，通过间接暴露的方式为用户提供个性化推荐。该数据集包含用户指令，为推荐系统的研究提供了新的基准。

衍生相关工作

InstructRec数据集的提出，推动了LLM Agent在推荐系统中的应用研究。基于该数据集，研究者们提出了InstructAgent和Instruct2Agent等模型，这些模型通过学习用户指令和反馈，实现了更加个性化的推荐服务。此外，InstructRec数据集还促进了推荐系统中动态记忆机制的研究，为构建更加智能的推荐系统提供了新的思路。

数据集最近研究