Biddls/Onion_News
收藏Hugging Face2023-03-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Biddls/Onion_News
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- summarization
- text2text-generation
- text-generation
- text-classification
language:
- en
pretty_name: OnionNewsScrape
---
## This is a dataset of Onion news articles:
Note
- The headers and body of the news article is split by a ' #~# ' token
- Lines with just the token had no body or no header and can be skipped
- Feel free to use the script provided to scape the latest version, it takes about 30 mins on an i7-6850K
提供机构:
Biddls
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别:
- 摘要生成
- 文本到文本生成
- 文本生成
- 文本分类
- 语言: 英语
- 数据集名称: OnionNewsScrape
数据集内容
- 内容描述: 包含洋葱新闻文章的数据集。
- 数据结构:
- 新闻文章的标题和正文通过 #~# 标记分割。
- 仅包含 #~# 标记的行表示没有正文或标题,可以跳过。
使用说明
- 提供了一个脚本,用于抓取最新版本的数据集,该过程大约需要30分钟,使用i7-6850K处理器。



