five

newswire

收藏
Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/newswire
下载链接
链接失效反馈
官方服务:
资源简介:
NewsWire是一个包含270万篇美国公共领域新闻专线文章的资源库,时间跨度从1878年到1977年。该资源库的核心定位在于提供大规模的结构化历史新闻数据,支持文本分类、文本生成、文本检索、摘要生成和问答等多种任务。每篇文章都经过地理位置标记、主题标签分类、命名实体识别,并使用实体消歧模型关联到维基百科。数据以JSON格式存储,按年份分割成不同的文件,并提供标准化数据操作,方便用户访问和使用。该数据集基于CC-BY 4.0协议发布,允许自由使用和共享。
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作