ConvApparel

Name: ConvApparel
Creator: Google
Published: 2026-01-22 06:01:28
License: 暂无描述

Hugging Face2026-01-22 更新2026-01-23 收录

下载链接：

https://huggingface.co/datasets/google/ConvApparel

下载链接

链接失效反馈

官方服务：

资源简介：

ConvApparel数据集包含付费评分者与AI助手之间的对话，评分者的任务是购买服装物品（鞋类、外套、上衣或裤子），并在每次会话结束时填写调查问卷。数据集包括元数据（如调查问题、评分者指令和任务ID）和对话内容（如用户和助手的发言、评分以及推荐物品的详细信息）。

提供机构：

Google

创建时间：

2026-01-22

原始信息汇总

ConvApparel 数据集概述

数据集基本信息

数据集名称：ConvApparel
发布方：Google
许可证：CC BY 4.0
语言：英语

数据集内容与目的

该数据集包含付费评估员与AI助手之间的对话。评估员的任务是购买一件服装商品（鞋类、外套、上衣或下装），并在每次会话结束时填写一份调查问卷。数据集旨在为对话推荐系统中的用户模拟器提供基准数据和验证框架。

数据结构

数据集以JSON格式组织，主要包含两个部分：

1. 元数据

questions：一个字典，将版本ID映射到调查问题。
instructions：一个字典，将任务ID映射到评估员指令。
tasks：一个任务ID列表。

2. 对话列表

每个对话包含以下字段：

task_id：元数据中tasks列表中的一个ID。
version：元数据中questions字典的一个键。
ratings：一个字典，将调查问题映射到评估员的答案。
turns：一个对话轮次列表，每个轮次包含：
- user_utterance：评估员输入的文本。
- assistant_utterance：AI助手的回复。
- ratings：一个字典，将调查问题映射到评估员的答案。
- recommendations：一个推荐商品列表，每个商品包含：
  - item_id：来自Amazon Reviews的商品ID。
  - title：商品标题。
  - description：商品描述。
  - image_url：商品图片的URL。
  - features：商品特征列表。

相关研究

详细信息可参考EACL 2026论文《ConvApparel: A Benchmark Dataset and Validation Framework for User Simulators in Conversational Recommenders》（链接即将发布）。

搜集汇总

数据集介绍

构建方式

在对话式推荐系统研究领域，构建高质量的人机交互数据至关重要。ConvApparel数据集的构建通过雇佣付费评估员与人工智能助手进行模拟购物对话来完成。评估员被赋予购买特定服装类别的任务，并在每次对话会话结束后填写详细的调查问卷。这种基于任务的对话收集方式，确保了数据围绕明确的用户意图和决策过程展开，从而为研究提供了结构化的交互序列。

特点

该数据集的核心特点在于其多层次、结构化的信息组织。它不仅完整记录了用户与助手之间的对话轮次和对应的商品推荐列表，还深度整合了会话级别的元数据、任务指令以及用户对推荐过程和结果的实时与最终评价。这种将对话、推荐项、用户反馈和任务上下文紧密结合的数据架构，为全面分析和评估对话推荐系统的性能提供了多维度的基准。

使用方法

对于研究人员而言，ConvApparel数据集可直接用于训练或评估对话推荐系统及用户模拟器。通过解析其JSON格式，可以便捷地访问对话流、关联的商品信息以及用户满意度评分。该数据集支持对系统在理解用户偏好、进行多轮澄清以及生成个性化推荐等关键能力上进行量化分析，是推动对话式人工智能在电子商务领域应用发展的宝贵资源。

背景与挑战

背景概述

在对话式推荐系统领域，构建能够模拟真实用户交互的评估框架一直是核心研究课题。ConvApparel数据集由研究团队于2026年EACL会议上提出，旨在为对话推荐系统中的用户模拟器提供基准数据与验证框架。该数据集聚焦于服装购物场景，涵盖了鞋履、外套、上衣和下装等品类，通过雇佣标注员与人工智能助手进行多轮对话，并收集会话结束后的调查反馈，以捕捉用户在寻求推荐时的复杂意图与偏好演变过程。其设计不仅推动了对话推荐系统在真实感与实用性方面的研究，也为评估推荐算法的交互性能提供了结构化标准。

当前挑战

ConvApparel数据集致力于解决对话推荐系统中用户模拟与个性化推荐的关键挑战，包括如何准确理解用户在开放域对话中动态变化的偏好，以及如何在多轮交互中平衡探索与利用以达成有效推荐。在构建过程中，研究团队面临诸多困难：一是需要设计自然且任务导向的对话流程，以覆盖从需求澄清到最终决策的完整购物环节；二是确保标注员指令与调查问卷的科学性，从而可靠地收集用户满意度、推荐相关性等细粒度评估信号；三是整合来自亚马逊评论的真实商品信息，并保持商品特征的结构化表示，这对数据的一致性与可扩展性提出了较高要求。

常用场景

经典使用场景

在对话式推荐系统领域，ConvApparel数据集为评估用户模拟器的性能提供了标准化基准。该数据集通过模拟真实购物场景中的对话交互，捕捉用户在购买服装类商品时的动态偏好与决策过程。研究人员利用这些对话数据训练和验证推荐算法，优化系统在复杂多轮对话中的响应能力，从而提升个性化推荐的准确性与自然度。

衍生相关工作

围绕ConvApparel数据集，学术界已衍生出多项经典研究，包括基于强化学习的多轮推荐策略优化、用户模拟器的可信度验证框架构建等。这些工作进一步拓展了对话推荐在冷启动缓解、可解释性增强等方面的技术边界，并为后续跨语言、多模态对话数据集的设计提供了方法论启示。

数据集最近研究