five

DialogSum

收藏
魔搭社区2025-10-14 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/DialogSum
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: DialogSum labelTypes: - English Corpus license: - MIT mediaTypes: - Text paperUrl: https://arxiv.org/pdf/2105.06762v4.pdf publishDate: "2021" publishUrl: https://github.com/cylnlp/DialogSum publisher: - University of Edinburgh - Zhejiang University - Westlake University - Westlake Institute for Advanced Study - Jilin University tags: - Dialogue taskTypes: - Text Summarization/Simplication - Abstractive Text Summarization - Dialogue Generation --- # 数据集介绍 ## 简介 DialogSum 是一个大规模的对话摘要数据集,由 13,460 个对话以及相应的手动标记的摘要和主题组成。我们从三个公共对话语料库中收集 DialogSum 的对话数据,即 Dailydialog (Li et al., 2017)、DREAM (Sun et al., ., 2019) 和 MuTual (Cui et al., 2019),以及一个英语口语练习网站。这些数据集包含面对面的口语对话,涵盖广泛的日常生活主题,包括学校教育、工作、药物、购物、休闲、旅行。大多数对话发生在朋友、同事之间以及服务提供商和客户之间。_x000D_ _x000D_ 与之前的数据集相比,DialogSum 的对话有明显的特点:_x000D_ _x000D_ 丰富的现实生活场景下,包括更多样化的面向任务的场景;_x000D_ 有清晰的沟通模式和意图,作为总结来源很有价值;_x000D_ 有一个合理的长度,可以满足自动摘要的目的。 ## 引文 ``` @article{chen2021dialogsum, title={DialogSum: A real-life scenario dialogue summarization dataset}, author={Chen, Yulong and Liu, Yang and Chen, Liang and Zhang, Yue}, journal={arXiv preprint arXiv:2105.06762}, year={2021} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: 显示名称:DialogSum labelTypes: - 英文语料库(English Corpus) license: - MIT协议 mediaTypes: - 文本(Text) paperUrl: 论文链接:https://arxiv.org/pdf/2105.06762v4.pdf publishDate: "2021" publishUrl: 发布地址:https://github.com/cylnlp/DialogSum publisher: - 爱丁堡大学(University of Edinburgh) - 浙江大学 - 西湖大学 - 西湖高等研究院 - 吉林大学 tags: - 对话(Dialogue) taskTypes: - 文本摘要与简化(Text Summarization/Simplication) - 抽象式文本摘要(Abstractive Text Summarization) - 对话生成(Dialogue Generation) --- # 数据集介绍 ## 简介 DialogSum是一款大规模对话摘要数据集,包含13460条对话及其人工标注的摘要与主题。本数据集的对话数据源自三类公开对话语料库,即DailyDialog(Li等,2017)、DREAM(Sun等,2019)、MuTual(Cui等,2019),以及一个英语口语练习平台。所收录对话均为面对面口语交互,覆盖学校教育、工作、药物、购物、休闲、旅行等丰富的日常生活主题,对话参与者多为朋友、同事,以及服务提供商与客户群体。 与现有同类数据集相比,DialogSum具备三项显著特征: - 覆盖的现实生活场景更为多元,且包含更多样化的任务导向型场景; - 对话具备清晰的沟通模式与交互意图,作为摘要生成的源数据具有极高研究价值; - 对话长度设置合理,完全适配自动摘要任务的应用需求。 ## 引文 @article{chen2021dialogsum, title={DialogSum: A real-life scenario dialogue summarization dataset}, author={Chen, Yulong and Liu, Yang and Chen, Liang and Zhang, Yue}, journal={arXiv preprint arXiv:2105.06762}, year={2021} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作