five

mteb/mrtidy

收藏
Hugging Face2025-05-04 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/mteb/mrtidy
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多种语言的语料库、查询相关性和查询内容,涵盖了阿拉伯语、孟加拉语、英语、芬兰语、印尼语、日语、韩语、俄语、斯瓦希里语、泰卢固语和泰语。每个语言的配置分为corpus、qrels和queries三个部分,分别表示语料库、查询相关性和查询内容。每个部分包含特征如_id、title、text等,并且数据集被分割为train、dev和test三个部分,每个部分都有对应的文件大小和样本数量。

This dataset contains corpora, query relevance, and query content in multiple languages, including Arabic, Bengali, English, Finnish, Indonesian, Japanese, Korean, Russian, Swahili, Telugu, and Thai. Each language configuration is divided into three parts: corpus, qrels, and queries, representing the corpus, query relevance, and query content, respectively. Each part includes features such as _id, title, text, etc., and the dataset is split into train, dev, and test sections, each with corresponding file sizes and sample counts.
提供机构:
mteb
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作