User Willingness-aware Sales Talk Dataset
收藏arXiv2024-12-27 更新2024-12-31 收录
下载链接:
https://github.com/CyberAgentAILab/salestalk-dataset
下载链接
链接失效反馈官方服务:
资源简介:
用户意愿感知销售对话数据集由CyberAgent和东北大学的研究团队创建,旨在推动自动销售对话系统的研究。该数据集包含109条销售对话,每条对话都详细标注了用户在对话中的意愿数据,包括对话参与意愿、信息提供意愿和目标接受意愿。数据集的构建过程采用了Wizard-of-Oz方法,模拟了真实的销售对话环境,确保了数据的生态效度。数据集的应用领域主要集中在自动销售对话系统的开发,旨在通过理解用户意愿来提升销售对话的效果,最终提高用户的购买意向。
The User Intent-aware Sales Dialogue Dataset was created by a research team from CyberAgent and Tohoku University, aiming to advance research on automatic sales dialogue systems. This dataset includes 109 sales dialogues, each of which is comprehensively annotated with user intent data collected during the conversation, including willingness to engage in the dialogue, willingness to disclose information, and willingness to accept the sales target. The dataset was constructed using the Wizard-of-Oz methodology, which simulates a real-world sales dialogue environment to ensure the ecological validity of the data. The main application scope of this dataset lies in the development of automatic sales dialogue systems, with the goal of enhancing the effectiveness of sales dialogues by understanding user intents, and ultimately boosting users' purchase intentions.
提供机构:
CyberAgent, 东北大学
创建时间:
2024-12-27
搜集汇总
数据集介绍

构建方式
User Willingness-aware Sales Talk Dataset的构建采用了生态效度概念,旨在模拟真实销售对话场景。研究团队通过Wizard of Oz方法,创建了一个接近现实世界的对话环境,参与者在此环境中进行销售对话,并在话语级别上从多个角度评估其意愿。数据收集过程中,销售方与用户方配对进行对话,用户方在对话前后通过七点Likert量表评估其购买意图,并在对话过程中对销售方的每一句话进行意愿评估,分为积极、中立和消极三类。
特点
该数据集的核心特点在于其包含了三种用户意愿的详细标注:继续对话的意愿、提供信息的意愿以及接受销售目标的意愿。这些意愿数据通过高生态效度的实验配置收集,确保了数据的真实性和实用性。此外,数据集还包含了对话前后的购买意图变化,为研究销售对话策略提供了丰富的信息。数据集的对话内容涵盖了无线耳机这一特定产品类别,确保了数据的聚焦性和深度。
使用方法
该数据集可用于开发和评估基于用户意愿的自动化销售对话系统。研究人员可以利用数据集中的意愿标注数据,训练对话模型以更好地理解用户需求并优化销售策略。具体而言,可以通过分析不同意愿类型在对话中的变化,设计出更具针对性的销售策略。此外,数据集还可用于评估不同对话模型在提升用户购买意图方面的效果,为销售对话系统的优化提供实证依据。
背景与挑战
背景概述
User Willingness-aware Sales Talk Dataset是由CyberAgent与东北大学的研究团队于2024年共同开发的一个专注于销售对话中用户意愿的数据集。该数据集的创建旨在填补自动化销售对话系统研究中用户意愿数据的空白,特别是在生态效度(ecological validity)的框架下,模拟真实销售场景中的用户行为。研究团队通过构建一个接近现实对话环境的数据收集平台,捕捉了用户在对话中的三种关键意愿:参与对话的意愿、提供信息的意愿以及接受销售目标的意愿。该数据集的开发不仅为销售对话系统的研究提供了新的视角,还通过实际应用验证了其在提升用户购买意图方面的有效性。
当前挑战
User Willingness-aware Sales Talk Dataset在构建和应用过程中面临多重挑战。首先,在领域问题方面,自动化销售对话系统需要精确识别和响应用户的意愿,而用户意愿的多样性和动态变化使得这一任务尤为复杂。其次,数据集的构建过程中,研究团队需确保对话环境的生态效度,以捕捉用户在真实销售场景中的自然反应。为此,团队采用了Wizard of Oz方法,模拟用户与系统的交互,但这一方法在数据收集的效率和真实性之间需要权衡。此外,数据集的标注依赖于用户的主观评价,如何确保标注的一致性和准确性也是一个重要挑战。最后,数据集的通用性受到产品类别和语言环境的限制,未来需要进一步扩展以增强其适用性。
常用场景
经典使用场景
User Willingness-aware Sales Talk Dataset在自动销售对话系统的开发中扮演了关键角色。该数据集通过模拟真实销售场景,捕捉用户在对话过程中的意愿变化,为研究者提供了丰富的用户行为数据。经典的使用场景包括训练和评估基于用户意愿的对话模型,帮助系统更好地理解用户需求,优化销售策略。
衍生相关工作
该数据集衍生了一系列经典研究工作,包括基于用户意愿的对话模型优化和销售策略分析。例如,研究者利用该数据集开发了GPT-3.5的微调模型,显著提升了对话系统的成功率。此外,数据集还被用于探索不同用户意愿类型对销售结果的影响,为未来的自动销售系统设计提供了重要参考。
数据集最近研究
最新研究方向
在销售对话系统中,用户意愿(User Willingness)的识别与响应已成为前沿研究的热点。随着自动化销售对话系统的广泛应用,如何有效捕捉并响应用户的意愿成为提升销售效果的关键。近期研究聚焦于构建包含用户意愿标注的销售对话数据集,以推动基于用户意愿的对话系统开发。通过生态效度(Ecological Validity)概念,研究者在模拟真实销售场景的环境中收集数据,确保用户意愿的自然表达。该数据集不仅涵盖了用户参与对话、提供信息和接受销售目标的三种核心意愿类型,还通过细粒度的标注为对话系统提供了优化策略。基于该数据集的研究表明,结合用户意愿的对话系统能够显著提升用户的购买意向,尤其是在对话的早期和后期阶段,避免负面意愿的影响尤为重要。这一方向的研究为未来动态调整对话策略、实时响应用户意愿的智能销售系统奠定了基础。
相关研究论文
- 1User Willingness-aware Sales Talk DatasetCyberAgent, 东北大学 · 2024年
以上内容由遇见数据集搜集并总结生成



