cmunhozc/google_news_en
收藏Hugging Face2024-01-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cmunhozc/google_news_en
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个属性:第一个属性对应Headlines 1,第二个属性对应Headlines 2,第三个属性是目标变量。这两个句子均来自Google News的新闻头条,目标变量用于指示这两个句子是否与同一事件相关(1表示相关,0表示不相关)。数据集来源于2022年7月23日至2022年7月30日的Google News头条,并经过手动标注。数据集以表格格式提供,每行代表一组两个句子及其对应的目标变量。
该数据集包含三个属性:第一个属性对应Headlines 1,第二个属性对应Headlines 2,第三个属性是目标变量。这两个句子均来自Google News的新闻头条,目标变量用于指示这两个句子是否与同一事件相关(1表示相关,0表示不相关)。数据集来源于2022年7月23日至2022年7月30日的Google News头条,并经过手动标注。数据集以表格格式提供,每行代表一组两个句子及其对应的目标变量。
提供机构:
cmunhozc
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别: 文本分类
- 语言: 英语
- 标签: CENIA, News
- 数据规模: 10K<n<100K
属性
- 包含属性:
- 第一个属性: Headlines 1
- 第二个属性: Headlines 2
- 第三个属性: 目标变量
- 描述:
- 前两个属性是与从Google News提取的新闻相关的句子。
- 目标变量指示两个句子是否与同一事件相关(1)或不相关(0)。
数据来源
- 来源: Google News
- 时间范围: 2022年7月23日至2022年7月30日
- 标注方式: 手动标注
数据格式
- 格式: 表格格式
- 每行内容: 包含两句子和对应的目标变量



