five

mteb/CQADupstack-Stats-PL

收藏
Hugging Face2025-05-04 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/mteb/CQADupstack-Stats-PL
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个部分:语料库(corpus)、默认配置(default)和查询(queries)。语料库部分包含文本标题和内容,默认配置部分包含查询ID、语料库ID和分数,查询部分包含查询内容。每个部分都有测试集分割,包含不同数量的示例和字节大小。数据集适用于文本处理和查询匹配任务。

The dataset consists of three parts: corpus, default configuration, and queries. The corpus part includes text titles and content, the default configuration part includes query ID, corpus ID, and score, and the queries part includes the query content. Each part has a test split with a different number of examples and byte sizes. The dataset is suitable for text processing and query matching tasks.
提供机构:
mteb
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作