hlgd
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/hlgd
下载链接
链接失效反馈官方服务:
资源简介:
Headline Grouping (HLGD) 专注于新闻标题分组,旨在判断两个新闻标题是否描述了同一事件。它包含超过2万个英文新闻标题对,并提供训练、验证和测试集划分。数据集中,每个样本包含时间线ID、两个新闻标题及其发布日期和URL,以及一个二元标签。该数据集支持文本分类任务,特别针对仅使用标题文本、标题和时间信息,或标题、时间和URL元数据进行预测的挑战。HLGD 使用 Apache-2.0 许可。
创建时间:
2024-07-19



