five

CCCP-Admiral/K-SportsSum-BetterMapped-CN

收藏
Hugging Face2023-04-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CCCP-Admiral/K-SportsSum-BetterMapped-CN
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是对K-SportsSum数据集中“新闻与评论句子根据相似度搭配”部分的实现。方法包括遍历新闻句子以获取时间信息,并在同一时间范围内查找评论句子,通过BERT-Score和ROUGE指标加权评分,选择最佳匹配并避免重复。建议使用平均数等方法过滤掉低质量的匹配。

该数据集是对K-SportsSum数据集中“新闻与评论句子根据相似度搭配”部分的实现。方法包括遍历新闻句子以获取时间信息,并在同一时间范围内查找评论句子,通过BERT-Score和ROUGE指标加权评分,选择最佳匹配并避免重复。建议使用平均数等方法过滤掉低质量的匹配。
提供机构:
CCCP-Admiral
原始信息汇总

数据集概述

数据集来源

  • 来自K-SportsSum项目,具体链接为:K-SportsSum

数据集内容

  • 实现了“新闻与评论句子根据相似度搭配”的部分。
  • 方法包括:
    • 遍历新闻句子,获取时间信息(如有)。
    • 使用两个指针确定时间范围,在此范围内搜索并评分评论句子。
    • 选择最高分的评论句子与新闻句子搭配,并删除该评论句子以防止重复。

评估指标

  • 使用BERT-Score和ROUGE指标,按7:3的比例加权计算分数。

使用建议

  • 建议使用平均数或其他方法过滤掉低分的搭配,以提高数据集质量。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作