DaReCzech (Dataset for text relevance ranking in Czech)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/DaReCzech
下载链接
链接失效反馈官方服务:
资源简介:
DaReCzech 是捷克语文本相关性排名的数据集。该数据集由超过 160 万个带注释的查询文档对组成,这使其成为该任务可用的最大数据集之一。
DaReCzech is a dataset for Czech textual relevance ranking. This dataset comprises over 1.6 million annotated query-document pairs, making it one of the largest available datasets for this task.
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍

背景与挑战
背景概述
DaReCzech是一个专注于捷克语文本相关性排名的数据集,由Seznam于2022年发布。该数据集包含超过160万个带注释的查询文档对,是此任务领域中规模最大的数据集之一。
以上内容由遇见数据集搜集并总结生成



