five

rajistics/million-headlines

收藏
Hugging Face2022-07-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rajistics/million-headlines
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了过去十八年间发布的新闻标题,来源于澳大利亚的知名新闻机构ABC(澳大利亚广播公司)。每个数据实例包括一个表示日期的整数和一个新闻标题的字符串。数据集不包含任何关于作者或众包工人的个人信息,但可能包含标题中描述的人物信息。数据集代表澳大利亚的一家新闻服务,不应被视为所有新闻或标题的代表。新闻标题可能包含偏见,不应被视为中立。

This dataset contains news headlines published over the past eighteen years, sourced from ABC (Australian Broadcasting Corporation), a well-known Australian news outlet. Each data instance consists of an integer representing the date and a string containing the news headline. The dataset does not contain any personal information about authors or crowdworkers, but may include information about individuals mentioned in the headlines. This dataset represents a single Australian news service and should not be taken as representative of all news or news headlines. News headlines may contain biases and should not be considered neutral.
提供机构:
rajistics
原始信息汇总

数据集概述

数据集基本信息

  • 名称: Million Headlines
  • 语言: 英语 (en)
  • 许可证: CC0-1.0
  • 多语言性: 单语种
  • 数据集大小: 1M<n<10M
  • 来源: 原始数据

数据集结构

  • 数据实例: 每个实例包含一个整数代表发布日期和一个字符串代表新闻标题。
  • 数据字段:
    • publish date: 整数,代表发布日期
    • headline: 字符串,代表新闻标题

数据集创建

  • 语言创建者: 专家生成
  • 来源数据: 澳大利亚广播公司(ABC)的新闻标题
  • 注释: 无注释

使用数据集的考虑因素

  • 社会影响: 该数据集仅代表澳大利亚的一个新闻服务,不应视为所有新闻或标题的代表。
  • 偏见讨论: 新闻标题可能包含偏见,不应视为中立。
  • 敏感信息: 数据集不包含作者或参与者的个人信息,但可能包含新闻标题中人物的描述。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作