five

mteb/mind_small

收藏
Hugging Face2024-05-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mteb/mind_small
下载链接
链接失效反馈
官方服务:
资源简介:
The `test` split is the `validation` split of [MIND](https://msnews.github.io/). Labels for the original `test` split are unavailable. Thus, we renamed it to test for consistency in the MTEB benchmark.

本数据集所用的`test` 子集为[MIND](https://msnews.github.io/)的`validation` 验证子集。由于MIND原始的`test` 子集未提供标签,因此为了在MTEB基准评测中保持命名一致性,我们将该子集重命名为`test` 子集。
提供机构:
mteb
原始信息汇总

数据集概述

数据集名称

  • test

数据集用途

  • 该数据集原为MINDvalidation集。
  • 在MTEB基准测试中,为了保持一致性,将其重命名为test

标签可用性

  • 原始test集的标签不可用。
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是Massive Text Embedding Benchmark(MTEB)的一部分,名为mind_small,是一个用于文本嵌入和检索任务的基准数据集。它包含约22.5万行数据,分为训练集和测试集,每条数据由查询文本、正例文本和负例文本组成,内容涵盖多样化的新闻标题,旨在评估模型在文本相似性匹配中的性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作