DialogSum
收藏魔搭社区2025-10-14 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/DialogSum
下载链接
链接失效反馈官方服务:
资源简介:
displayName: DialogSum
labelTypes:
- English Corpus
license:
- MIT
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/2105.06762v4.pdf
publishDate: "2021"
publishUrl: https://github.com/cylnlp/DialogSum
publisher:
- University of Edinburgh
- Zhejiang University
- Westlake University
- Westlake Institute for Advanced Study
- Jilin University
tags:
- Dialogue
taskTypes:
- Text Summarization/Simplication
- Abstractive Text Summarization
- Dialogue Generation
---
# 数据集介绍
## 简介
DialogSum 是一个大规模的对话摘要数据集,由 13,460 个对话以及相应的手动标记的摘要和主题组成。我们从三个公共对话语料库中收集 DialogSum 的对话数据,即 Dailydialog (Li et al., 2017)、DREAM (Sun et al., ., 2019) 和 MuTual (Cui et al., 2019),以及一个英语口语练习网站。这些数据集包含面对面的口语对话,涵盖广泛的日常生活主题,包括学校教育、工作、药物、购物、休闲、旅行。大多数对话发生在朋友、同事之间以及服务提供商和客户之间。_x000D_
_x000D_
与之前的数据集相比,DialogSum 的对话有明显的特点:_x000D_
_x000D_
丰富的现实生活场景下,包括更多样化的面向任务的场景;_x000D_
有清晰的沟通模式和意图,作为总结来源很有价值;_x000D_
有一个合理的长度,可以满足自动摘要的目的。
## 引文
```
@article{chen2021dialogsum,
title={DialogSum: A real-life scenario dialogue summarization dataset},
author={Chen, Yulong and Liu, Yang and Chen, Liang and Zhang, Yue},
journal={arXiv preprint arXiv:2105.06762},
year={2021}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: 显示名称:DialogSum
labelTypes:
- 英文语料库(English Corpus)
license:
- MIT协议
mediaTypes:
- 文本(Text)
paperUrl: 论文链接:https://arxiv.org/pdf/2105.06762v4.pdf
publishDate: "2021"
publishUrl: 发布地址:https://github.com/cylnlp/DialogSum
publisher:
- 爱丁堡大学(University of Edinburgh)
- 浙江大学
- 西湖大学
- 西湖高等研究院
- 吉林大学
tags:
- 对话(Dialogue)
taskTypes:
- 文本摘要与简化(Text Summarization/Simplication)
- 抽象式文本摘要(Abstractive Text Summarization)
- 对话生成(Dialogue Generation)
---
# 数据集介绍
## 简介
DialogSum是一款大规模对话摘要数据集,包含13460条对话及其人工标注的摘要与主题。本数据集的对话数据源自三类公开对话语料库,即DailyDialog(Li等,2017)、DREAM(Sun等,2019)、MuTual(Cui等,2019),以及一个英语口语练习平台。所收录对话均为面对面口语交互,覆盖学校教育、工作、药物、购物、休闲、旅行等丰富的日常生活主题,对话参与者多为朋友、同事,以及服务提供商与客户群体。
与现有同类数据集相比,DialogSum具备三项显著特征:
- 覆盖的现实生活场景更为多元,且包含更多样化的任务导向型场景;
- 对话具备清晰的沟通模式与交互意图,作为摘要生成的源数据具有极高研究价值;
- 对话长度设置合理,完全适配自动摘要任务的应用需求。
## 引文
@article{chen2021dialogsum,
title={DialogSum: A real-life scenario dialogue summarization dataset},
author={Chen, Yulong and Liu, Yang and Chen, Liang and Zhang, Yue},
journal={arXiv preprint arXiv:2105.06762},
year={2021}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01



