five

mteb/MIRACLRetrieval_th_top_250_only_w_correct

收藏
Hugging Face2024-09-23 更新2025-04-08 收录
下载链接:
https://hf-mirror.com/datasets/mteb/MIRACLRetrieval_th_top_250_only_w_correct
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个部分:corpus、default和queries。corpus部分包含了文本和标题字段,default部分包含了查询ID、语料库ID和分数字段,queries部分包含了文本字段。每个部分都有训练数据集,corpus部分的训练数据大小为约118MB,包含约116,956个示例;default部分的训练数据大小为约191KB,包含6,989个示例;queries部分的训练数据大小为约98KB,包含733个示例。

The dataset consists of three parts: corpus, default, and queries. The corpus part includes text and title fields, the default part includes query-id, corpus-id, and score fields, and the queries part includes text fields. Each part has a training dataset, with the corpus parts training data size being approximately 118MB containing 116,956 examples; the default parts training data size is approximately 191KB containing 6,989 examples; and the queries parts training data size is approximately 98KB containing 733 examples.
提供机构:
mteb
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作