PEARL

Name: PEARL
Creator: 延世大学, 韩国
Published: 2024-04-05 19:11:01
License: 暂无描述

arXiv2024-04-05 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2403.04460v3

下载链接

链接失效反馈

官方服务：

资源简介：

PEARL数据集是由韩国延世大学创建的一个大规模对话推荐数据集，包含超过57,277个对话，覆盖4,000多名用户和9,000多种商品。该数据集通过整合真实世界评论中的用户角色和知识，使用大型语言模型（LLM）增强模拟器，以提高对话中用户偏好的具体性和推荐的相关性。PEARL数据集旨在解决现有对话推荐数据集中用户偏好表达不具体和推荐解释不足的问题，通过模拟具有明确和一致偏好的用户，以及提供基于丰富商品知识的推荐，来提升对话推荐系统的质量和用户体验。

The PEARL dataset is a large-scale conversational recommendation dataset created by Yonsei University in the Republic of Korea. It contains over 57,277 conversations, covering more than 4,000 users and over 9,000 products. This dataset integrates user personas and domain knowledge from real-world reviews, and uses large language models (LLMs) to enhance the simulator, so as to improve the specificity of user preference expressions in conversations and the relevance of recommendations. The PEARL dataset aims to address two key limitations of existing conversational recommendation datasets: the lack of specific user preference expressions and insufficient recommendation explanations. By simulating users with clear and consistent preferences and providing recommendations grounded in rich product knowledge, it seeks to elevate the quality of conversational recommendation systems and enhance user experience.

提供机构：

延世大学, 韩国

创建时间：

2024-03-07

搜集汇总

数据集介绍

构建方式

在对话式推荐系统领域，现有数据集常因用户偏好模糊与推荐解释匮乏而受限。PEARL数据集通过创新性地融合真实世界评论与大型语言模型模拟器，构建了大规模且高质量的对话语料。其构建过程涵盖五个核心步骤：首先，从IMDB平台爬取电影评论，并依据用户与物品两个维度构建用户-评论与物品-评论数据库；随后，利用大型语言模型将原始评论提炼为高层次文本，以刻画用户喜好与物品特征。在此基础上，设计基于人物角色的用户模拟器与知识增强的推荐者模拟器，前者注入真实用户的偏好信息，后者则整合物品的元数据与评论知识。通过两模拟器的多轮交互生成对话，并经过重复性检测、偏好一致性过滤等多层筛选，最终得到包含超过5.7万对话、涵盖逾4千用户与9千物品的高质量数据集。

特点

PEARL数据集在对话式推荐研究领域展现出显著优势，其核心特点在于人物角色与知识的高度融合。数据集中的用户偏好表达更为具体与多样化，得益于从真实评论中提取的人物角色，使得对话能够呈现一致且清晰的用户需求。同时，推荐者模拟器依托丰富的物品知识，不仅提供精准的推荐，还附有详尽的解释，增强了对话的信息量与可信度。相较于传统众包数据集，PEARL在用户偏好特异性、推荐解释丰富度以及对话规模上均有显著提升，且通过人工评估验证，其在用户控制、领域专业性及对话自然度等方面均优于现有数据集。

使用方法

PEARL数据集适用于训练与评估对话式推荐系统模型，尤其在提升推荐个性化与解释生成能力方面具有重要价值。研究人员可将数据集划分为训练、验证与测试集，用于微调生成式模型如BART或GPT系列，以优化推荐准确性与响应质量。在自动评估中，可采用Recall@k等指标衡量推荐性能，并利用Distinct-n等度量评估生成响应的多样性。此外，数据集支持零样本评估，可直接用于测试大型语言模型的推荐能力。为确保模型泛化性，建议在未见对话上进行交叉数据集测试，并结合人工评估对生成响应的流畅性、相关性及解释充分性进行综合评判。

背景与挑战

背景概述

在对话式推荐系统领域，随着大语言模型的迅猛发展，研究者们致力于构建能够精准捕捉用户偏好并提供个性化推荐的高质量数据集。PEARL数据集于2024年由延世大学、淑明女子大学及伊利诺伊大学厄巴纳-香槟分校的研究团队联合推出，其核心目标在于解决现有对话推荐数据集中用户偏好表达模糊、推荐解释不足的瓶颈。该数据集创新性地从真实用户评论中提炼人物角色与项目知识，并借助大语言模型模拟器生成了超过5.7万条对话，显著提升了推荐的相关性与解释性，为对话推荐系统的深入研究提供了规模庞大且信息丰富的资源。

当前挑战

PEARL数据集所应对的领域挑战，主要聚焦于提升对话推荐系统中用户偏好的具体化与推荐解释的充分性。传统数据集常因众包工作者缺乏明确偏好或领域知识，导致生成的对话流于泛泛，难以支撑高度个性化的推荐。在构建过程中，研究团队面临双重挑战：一是如何从海量用户评论中有效提取并结构化人物角色与项目知识，以确保模拟对话的真实性与一致性；二是需设计稳健的过滤机制，以消除大语言模型可能生成的重复、矛盾或信息冗余的对话，保障数据集的整体质量与可靠性。

常用场景

经典使用场景

在对话式推荐系统领域，PEARL数据集为研究者提供了一个基于真实用户评论构建的高质量对话语料库。该数据集通过融合人物角色和知识增强的大型语言模型模拟器，生成了超过57,000条对话，覆盖电影推荐场景。其经典使用场景在于训练和评估对话推荐模型，特别是在模拟用户偏好表达的具体性和推荐解释的丰富性方面，为模型提供了高度逼真的交互环境，从而推动个性化推荐算法的前沿探索。

解决学术问题

PEARL数据集有效解决了传统对话推荐数据集中用户偏好表达模糊、推荐解释不足的学术难题。通过从真实评论中提取人物角色和项目知识，该数据集确保了用户偏好的具体性和一致性，同时为推荐提供了基于经验的软属性描述。这不仅提升了推荐的相关性和个性化程度，还为研究社区提供了探索可解释推荐、用户建模与知识融合等关键问题的可靠基础，显著推动了对话推荐系统的理论发展与实证验证。

衍生相关工作

PEARL数据集的推出衍生了一系列经典研究工作，特别是在利用大型语言模型合成对话数据、增强推荐可解释性以及改进用户偏好建模方面。相关研究借鉴了其人物角色与知识增强的模拟器架构，进一步探索了多领域推荐、跨语言对话生成以及安全过滤机制等方向。这些工作不仅扩展了对话推荐系统的应用边界，还促进了数据合成技术与推荐算法的交叉创新，为后续数据集构建和模型设计提供了重要参考与启发。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集