five

cmunhozc/google_news_en

收藏
Hugging Face2024-01-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cmunhozc/google_news_en
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个属性:第一个属性对应Headlines 1,第二个属性对应Headlines 2,第三个属性是目标变量。这两个句子均来自Google News的新闻头条,目标变量用于指示这两个句子是否与同一事件相关(1表示相关,0表示不相关)。数据集来源于2022年7月23日至2022年7月30日的Google News头条,并经过手动标注。数据集以表格格式提供,每行代表一组两个句子及其对应的目标变量。

该数据集包含三个属性:第一个属性对应Headlines 1,第二个属性对应Headlines 2,第三个属性是目标变量。这两个句子均来自Google News的新闻头条,目标变量用于指示这两个句子是否与同一事件相关(1表示相关,0表示不相关)。数据集来源于2022年7月23日至2022年7月30日的Google News头条,并经过手动标注。数据集以表格格式提供,每行代表一组两个句子及其对应的目标变量。
提供机构:
cmunhozc
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别: 文本分类
  • 语言: 英语
  • 标签: CENIA, News
  • 数据规模: 10K<n<100K

属性

  • 包含属性:
    • 第一个属性: Headlines 1
    • 第二个属性: Headlines 2
    • 第三个属性: 目标变量
  • 描述:
    • 前两个属性是与从Google News提取的新闻相关的句子。
    • 目标变量指示两个句子是否与同一事件相关(1)或不相关(0)。

数据来源

  • 来源: Google News
  • 时间范围: 2022年7月23日至2022年7月30日
  • 标注方式: 手动标注

数据格式

  • 格式: 表格格式
  • 每行内容: 包含两句子和对应的目标变量
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作