five

JustinDuc/MultiDomain-QADialog

收藏
Hugging Face2025-04-09 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/JustinDuc/MultiDomain-QADialog
下载链接
链接失效反馈
官方服务:
资源简介:
MultiDomain-QADialog数据集是一个经过处理的、多源的数据集,用于训练对话推理的SHARE模型。该数据集结合了对话领域的三个重要资源:MediaSum、SAMSum和SODA,涵盖了正式对话、非正式对话和合成对话,以统一的格式存储在分片的Parquet文件中,以便高效地流式传输。

The MultiDomain-QADialog Dataset is a processed, multi-source dataset used to train the SHARE Model for dialogue inference. The dataset combines three prominent resources in the dialogue space: MediaSum, SAMSum, and SODA, covering formal, informal, and synthetic dialogues, harmonized into a unified format and stored in sharded Parquet files for efficient streaming.
提供机构:
JustinDuc
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作