mteb/mind_small
收藏Hugging Face2024-05-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mteb/mind_small
下载链接
链接失效反馈官方服务:
资源简介:
The `test` split is the `validation` split of [MIND](https://msnews.github.io/). Labels for the original `test` split are unavailable.
Thus, we renamed it to test for consistency in the MTEB benchmark.
本数据集所用的`test` 子集为[MIND](https://msnews.github.io/)的`validation` 验证子集。由于MIND原始的`test` 子集未提供标签,因此为了在MTEB基准评测中保持命名一致性,我们将该子集重命名为`test` 子集。
提供机构:
mteb
原始信息汇总
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是Massive Text Embedding Benchmark(MTEB)的一部分,名为mind_small,是一个用于文本嵌入和检索任务的基准数据集。它包含约22.5万行数据,分为训练集和测试集,每条数据由查询文本、正例文本和负例文本组成,内容涵盖多样化的新闻标题,旨在评估模型在文本相似性匹配中的性能。
以上内容由遇见数据集搜集并总结生成



