five

pszemraj/cnn_dailymail-cleaned

收藏
Hugging Face2025-01-02 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/pszemraj/cnn_dailymail-cleaned
下载链接
链接失效反馈
官方服务:
资源简介:
cnn_dailymail数据集是一个经过清洗的英文文本摘要数据集,包含了新闻文章的文本和对应的摘要。数据集分为default和mini两个配置,default配置包含287,113个训练示例,13,368个验证示例和11,490个测试示例;mini配置包含38,500个训练示例。数据集的许可证为ODC BY。

The cnn_dailymail dataset is a cleaned English text summarization dataset, which includes news articles and their corresponding summaries. The dataset is divided into two configurations: default and mini. The default configuration contains 287,113 training examples, 13,368 validation examples, and 11,490 test examples; the mini configuration contains 38,500 training examples. The dataset is licensed under ODC BY.
提供机构:
pszemraj
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作