DialogSum

Name: DialogSum
Creator: maas
Published: 2025-10-14 13:08:01
License: 暂无描述

魔搭社区2025-10-14 更新2024-08-31 收录

下载链接：

https://modelscope.cn/datasets/OmniData/DialogSum

下载链接

链接失效反馈

官方服务：

资源简介：

displayName: DialogSum labelTypes: - English Corpus license: - MIT mediaTypes: - Text paperUrl: https://arxiv.org/pdf/2105.06762v4.pdf publishDate: "2021" publishUrl: https://github.com/cylnlp/DialogSum publisher: - University of Edinburgh - Zhejiang University - Westlake University - Westlake Institute for Advanced Study - Jilin University tags: - Dialogue taskTypes: - Text Summarization/Simplication - Abstractive Text Summarization - Dialogue Generation --- # 数据集介绍 ## 简介 DialogSum 是一个大规模的对话摘要数据集，由 13,460 个对话以及相应的手动标记的摘要和主题组成。我们从三个公共对话语料库中收集 DialogSum 的对话数据，即 Dailydialog (Li et al., 2017)、DREAM (Sun et al., ., 2019) 和 MuTual (Cui et al., 2019)，以及一个英语口语练习网站。这些数据集包含面对面的口语对话，涵盖广泛的日常生活主题，包括学校教育、工作、药物、购物、休闲、旅行。大多数对话发生在朋友、同事之间以及服务提供商和客户之间。_x000D_ _x000D_ 与之前的数据集相比，DialogSum 的对话有明显的特点：_x000D_ _x000D_ 丰富的现实生活场景下，包括更多样化的面向任务的场景；_x000D_ 有清晰的沟通模式和意图，作为总结来源很有价值；_x000D_ 有一个合理的长度，可以满足自动摘要的目的。 ## 引文 ``` @article{chen2021dialogsum, title={DialogSum: A real-life scenario dialogue summarization dataset}, author={Chen, Yulong and Liu, Yang and Chen, Liang and Zhang, Yue}, journal={arXiv preprint arXiv:2105.06762}, year={2021} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: 显示名称：DialogSum labelTypes: - 英文语料库（English Corpus） license: - MIT协议 mediaTypes: - 文本（Text） paperUrl: 论文链接：https://arxiv.org/pdf/2105.06762v4.pdf publishDate: "2021" publishUrl: 发布地址：https://github.com/cylnlp/DialogSum publisher: - 爱丁堡大学（University of Edinburgh） - 浙江大学 - 西湖大学 - 西湖高等研究院 - 吉林大学 tags: - 对话（Dialogue） taskTypes: - 文本摘要与简化（Text Summarization/Simplication） - 抽象式文本摘要（Abstractive Text Summarization） - 对话生成（Dialogue Generation） --- # 数据集介绍 ## 简介 DialogSum是一款大规模对话摘要数据集，包含13460条对话及其人工标注的摘要与主题。本数据集的对话数据源自三类公开对话语料库，即DailyDialog（Li等，2017）、DREAM（Sun等，2019）、MuTual（Cui等，2019），以及一个英语口语练习平台。所收录对话均为面对面口语交互，覆盖学校教育、工作、药物、购物、休闲、旅行等丰富的日常生活主题，对话参与者多为朋友、同事，以及服务提供商与客户群体。与现有同类数据集相比，DialogSum具备三项显著特征： - 覆盖的现实生活场景更为多元，且包含更多样化的任务导向型场景； - 对话具备清晰的沟通模式与交互意图，作为摘要生成的源数据具有极高研究价值； - 对话长度设置合理，完全适配自动摘要任务的应用需求。 ## 引文 @article{chen2021dialogsum, title={DialogSum: A real-life scenario dialogue summarization dataset}, author={Chen, Yulong and Liu, Yang and Chen, Liang and Zhang, Yue}, journal={arXiv preprint arXiv:2105.06762}, year={2021} } ## 数据集下载 :modelscope-code[]{type="git"}

提供机构：

maas

创建时间：

2024-07-01

5,000+

优质数据集

54 个

任务类型

进入经典数据集