nixiesearch/ms-marco-hard-negatives
收藏Hugging Face2024-01-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nixiesearch/ms-marco-hard-negatives
下载链接
链接失效反馈官方服务:
资源简介:
MS MARCO hard negatives数据集是一个用于句子相似性任务的数据集,包含查询、正面例子和负面例子。该数据集来源于BeIR/msmarco和sentence-transformers/msmarco-hard-negatives,格式为nixietune兼容格式。数据集包含502939个查询,仅包含正面例子。
MS MARCO hard negatives数据集是一个用于句子相似性任务的数据集,包含查询、正面例子和负面例子。该数据集来源于BeIR/msmarco和sentence-transformers/msmarco-hard-negatives,格式为nixietune兼容格式。数据集包含502939个查询,仅包含正面例子。
提供机构:
nixiesearch
原始信息汇总
MS MARCO hard negatives 数据集
概述
- 语言: 英语
- 许可证: Apache 2.0
- 标签: 文本
- 大小类别: 100K<n<1M
- 源数据集:
- BeIR/msmarco
- sentence-transformers/msmarco-hard-negatives
- 任务类别: 句子相似度
数据集信息
- 配置名称: default
- 特征:
- query: 字符串
- positive: 字符串序列
- negative: 字符串序列
- 分割:
- train: 89609915 字节, 502939 个样本
训练与评估索引
- 配置: default
- 任务: 句子相似度
- 分割:
- 训练分割: train
- 评估分割: test
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: "data/train/*"



