five

seongil-dn/mteb-kor-retrieval

收藏
Hugging Face2025-03-04 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/seongil-dn/mteb-kor-retrieval
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个部分:语料库(corpus)、查询与语料对应关系(default)和查询语句(queries)。语料库部分包含约464万个文本字符串,查询与语料对应关系部分包含训练数据,其中包含查询ID、语料ID和分数信息,查询语句部分包含约64万个查询文本。

The dataset consists of three parts: a corpus, a query-corpus correspondence, and query statements. The corpus part contains approximately 4.64 million text strings, the query-corpus correspondence part contains training data with query ID, corpus ID, and score information, and the query statements part contains approximately 643,000 query texts.
提供机构:
seongil-dn
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作