five

Dureader-Retrieval原始数据集

收藏
魔搭社区2026-05-18 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/zyznull/dureader-retrieval-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
Dureader原始数据集,包含corpus,train query以及dev query

杜阅读(Dureader)原始数据集涵盖语料库(corpus)、训练查询(train query)以及开发查询(dev query)
提供机构:
maas
创建时间:
2022-09-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Dureader-Retrieval是一个大规模中文篇章检索基准数据集,包含corpus、训练集query和验证集query,数据以JSON格式存储,总规模超过800万条。该数据集适用于文本嵌入和篇章排序任务,并遵循Apache 2.0许可协议。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务