five

ReDial

收藏
github2024-07-04 更新2024-07-05 收录
下载链接:
https://github.com/wangxieric/Conversational-AI-Datasets
下载链接
链接失效反馈
官方服务:
资源简介:
ReDial 数据集用于深度对话推荐研究。

The ReDial dataset is designed for research on deep conversational recommendation.
创建时间:
2024-07-04
原始信息汇总

对话式AI数据集概述

对话式问答数据集

数据集 对话数量 收集方式 年份 下载链接
QuAC 13,569 众包 2018 下载
MANtIS 80,324 Stack Exchange 2019 下载
CoQA 8,399 众包 2019 下载
ShARC 948 众包 2018 下载
MSDialog 2,199 Microsoft Community 2018 下载

对话式搜索数据集

数据集 对话数量 语料库大小 收集方式 年份 下载链接
CAsT-19,20,21,22 30 - 50 38,426,252 众包 2019 下载
OR-QuAC 5,644 11,377,951 更新QuAC以实现自包含 2020 下载

对话式推荐数据集

数据集 对话数量 话语数量 领域 收集方式 语言 年份 下载链接
ReDial 10,006 182,150 电影 Amazon Mechanical Turk (AMT) 英语 2018 下载
OpenDialKG 12,320 71,873 电影 & 书籍 KG-walk众包 英语 2019 下载
INSPIRED 1,001 35,811 电影 社交鼓励众包 (AMT) 英语 2020 下载
TG-ReDial 10,000 129,392 电影 主题驱动生成, 众包 中文 2020 下载
DuRecDial2.0 16,482 255,346 电影, 音乐, 明星, 食物, 餐厅, 天气 从DuRecDial翻译 (众包) 英语, 中文 2021 下载
INSPIRED2 1,001 35,811 电影 清理 & 增强INSPIRED 英语 2022 下载
U-NEED 7,698 53,712 电子商务 淘宝预售对话 中文 2023 下载
PEARL 57,277 548,061 电影 基于评论的合成对话 英语 2024 下载

面向任务的对话系统数据集

数据集 对话数量 话语数量 领域数量 收集方式 语言 年份 下载链接
MultiWoZ 8,438 113,556 7 Wizard-of-Oz 英语 2018 下载
SGD 16,142 329,964 16 轮廓模拟然后众包改写 英语 2020 下载

多任务对话数据集

数据集 论文 链接
MG-ShopDial MG-ShopDial: A Multi-Goal Conversational Dataset for e-Commerce 链接

跨领域对话数据集

数据集 论文 链接
DialogStudio DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI 链接
搜集汇总
数据集介绍
main_image_url
构建方式
ReDial数据集的构建基于Amazon Mechanical Turk(AMT)平台,通过众包方式收集了10,006个对话,涵盖了电影推荐领域。每个对话由多个用户和推荐系统之间的交互组成,共计182,150条语句。数据集的设计旨在模拟真实世界中的对话推荐场景,确保对话的自然性和多样性。
使用方法
ReDial数据集适用于开发和评估对话推荐系统,特别是那些需要理解和生成自然语言对话的模型。研究者可以通过下载数据集,使用其中的对话进行模型训练和测试,以提升推荐系统的交互能力和推荐准确性。数据集的多样性和丰富性使其成为对话推荐领域的重要资源。
背景与挑战
背景概述
ReDial数据集,由Amazon Mechanical Turk(AMT)于2018年创建,专注于电影领域的对话推荐系统研究。该数据集包含10,006个对话和182,150条话语,旨在推动对话式人工智能技术在推荐系统中的应用。ReDial的推出填补了对话推荐领域数据集的空白,为研究人员提供了一个标准化的测试平台,促进了对话推荐系统的算法开发和评估。
当前挑战
ReDial数据集在构建过程中面临多项挑战。首先,对话推荐系统的复杂性要求数据集能够捕捉用户与系统之间的动态交互,这需要高质量的对话数据。其次,数据集的多样性和覆盖范围也是一个挑战,确保数据集能够代表不同用户群体和电影类型的需求。此外,数据集的标注和清洗过程也需耗费大量资源,以确保数据的准确性和一致性。这些挑战共同构成了ReDial数据集在实际应用中的主要障碍。
常用场景
经典使用场景
在对话推荐系统的研究领域中,ReDial数据集以其丰富的电影推荐对话而著称。该数据集包含了10,006个对话和182,150条话语,主要用于开发和评估对话推荐系统。研究者们利用ReDial数据集来训练和测试模型,以实现更自然、更智能的对话推荐功能。通过分析用户与系统之间的交互,模型能够学习到用户的偏好,从而提供个性化的电影推荐。
解决学术问题
ReDial数据集在学术研究中解决了对话推荐系统的核心问题,即如何在对话中有效地捕捉用户的兴趣和偏好,并据此生成合适的推荐。这一数据集为研究者提供了一个标准化的测试平台,使得不同模型之间的性能比较成为可能。此外,ReDial还推动了对话推荐系统在多轮对话中的表现研究,为提升用户体验和推荐准确性提供了重要的数据支持。
实际应用
在实际应用中,ReDial数据集为电影推荐系统提供了强大的数据基础。通过训练基于ReDial的模型,电影平台可以实现更加智能和个性化的推荐服务,提升用户满意度和平台粘性。此外,该数据集的应用不仅限于电影领域,还可以扩展到其他需要对话推荐功能的场景,如音乐、书籍等,从而推动了对话推荐技术在多个行业的实际应用。
数据集最近研究
最新研究方向
在对话推荐系统领域,ReDial数据集的最新研究方向主要集中在提升推荐系统的个性化和交互性。研究者们致力于通过深度学习和自然语言处理技术,增强模型对用户意图的理解和对话上下文的捕捉,从而提供更为精准和自然的推荐。此外,跨领域对话推荐系统的研究也逐渐受到关注,旨在通过整合多领域的对话数据,提升推荐系统的泛化能力和应用场景的多样性。这些研究不仅推动了对话推荐系统的发展,也为智能客服和个性化服务提供了新的技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作