Dureader Retrieval 语义相关性数据集
收藏魔搭社区2026-05-18 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/zyznull/dureader-retrieval-ranking
下载链接
链接失效反馈官方服务:
资源简介:
Dureader Retrieval 语义相关性数据集,包含用于语义相关性模型,文本表示模型的训练/测试数据
The Dureader Retrieval Semantic Relevance Dataset contains training and test data for semantic relevance models and text representation models.
提供机构:
maas
创建时间:
2022-09-29
搜集汇总
数据集介绍

背景与挑战
背景概述
Dureader Retrieval数据集是一个用于语义相关性模型和文本表示模型训练的中文数据集,包含86395条训练数据和2000条测试数据。训练集基于DPR检索结果top1000采样,测试集则采用官方top50结果,旨在支持篇章排序和句子表示任务。
以上内容由遇见数据集搜集并总结生成



