rajistics/million-headlines
收藏Hugging Face2022-07-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rajistics/million-headlines
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了过去十八年间发布的新闻标题,来源于澳大利亚的知名新闻机构ABC(澳大利亚广播公司)。每个数据实例包括一个表示日期的整数和一个新闻标题的字符串。数据集不包含任何关于作者或众包工人的个人信息,但可能包含标题中描述的人物信息。数据集代表澳大利亚的一家新闻服务,不应被视为所有新闻或标题的代表。新闻标题可能包含偏见,不应被视为中立。
This dataset contains news headlines published over the past eighteen years, sourced from ABC (Australian Broadcasting Corporation), a well-known Australian news outlet. Each data instance consists of an integer representing the date and a string containing the news headline. The dataset does not contain any personal information about authors or crowdworkers, but may include information about individuals mentioned in the headlines. This dataset represents a single Australian news service and should not be taken as representative of all news or news headlines. News headlines may contain biases and should not be considered neutral.
提供机构:
rajistics
原始信息汇总
数据集概述
数据集基本信息
- 名称: Million Headlines
- 语言: 英语 (en)
- 许可证: CC0-1.0
- 多语言性: 单语种
- 数据集大小: 1M<n<10M
- 来源: 原始数据
数据集结构
- 数据实例: 每个实例包含一个整数代表发布日期和一个字符串代表新闻标题。
- 数据字段:
publish date: 整数,代表发布日期headline: 字符串,代表新闻标题
数据集创建
- 语言创建者: 专家生成
- 来源数据: 澳大利亚广播公司(ABC)的新闻标题
- 注释: 无注释
使用数据集的考虑因素
- 社会影响: 该数据集仅代表澳大利亚的一个新闻服务,不应视为所有新闻或标题的代表。
- 偏见讨论: 新闻标题可能包含偏见,不应视为中立。
- 敏感信息: 数据集不包含作者或参与者的个人信息,但可能包含新闻标题中人物的描述。



