CCCP-Admiral/K-SportsSum-BetterMapped-CN
收藏Hugging Face2023-04-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CCCP-Admiral/K-SportsSum-BetterMapped-CN
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是对K-SportsSum数据集中“新闻与评论句子根据相似度搭配”部分的实现。方法包括遍历新闻句子以获取时间信息,并在同一时间范围内查找评论句子,通过BERT-Score和ROUGE指标加权评分,选择最佳匹配并避免重复。建议使用平均数等方法过滤掉低质量的匹配。
该数据集是对K-SportsSum数据集中“新闻与评论句子根据相似度搭配”部分的实现。方法包括遍历新闻句子以获取时间信息,并在同一时间范围内查找评论句子,通过BERT-Score和ROUGE指标加权评分,选择最佳匹配并避免重复。建议使用平均数等方法过滤掉低质量的匹配。
提供机构:
CCCP-Admiral
原始信息汇总
数据集概述
数据集来源
- 来自K-SportsSum项目,具体链接为:K-SportsSum。
数据集内容
- 实现了“新闻与评论句子根据相似度搭配”的部分。
- 方法包括:
- 遍历新闻句子,获取时间信息(如有)。
- 使用两个指针确定时间范围,在此范围内搜索并评分评论句子。
- 选择最高分的评论句子与新闻句子搭配,并删除该评论句子以防止重复。
评估指标
- 使用BERT-Score和ROUGE指标,按7:3的比例加权计算分数。
使用建议
- 建议使用平均数或其他方法过滤掉低分的搭配,以提高数据集质量。



