andersonbcdefg/MEDI-NQ-subset_with_margins
收藏Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/andersonbcdefg/MEDI-NQ-subset_with_margins
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含查询、正面示例、负面示例、来源等字段,以及查询与正面示例的相似度、查询与负面示例的相似度、正面示例与负面示例的相似度和边际等数值字段。数据集可能用于训练模型以区分查询与正面和负面示例的相似度,或者用于学习排序任务。
该数据集包含查询、正面示例、负面示例、来源等字段,以及查询与正面示例的相似度、查询与负面示例的相似度、正面示例与负面示例的相似度和边际等数值字段。数据集可能用于训练模型以区分查询与正面和负面示例的相似度,或者用于学习排序任务。
提供机构:
andersonbcdefg
原始信息汇总
数据集概述
数据特征
- query: 字符串类型
- pos: 字符串类型
- neg: 字符串类型
- source: 字符串类型
- qp_sim: 浮点数类型 (float32)
- qn_sim: 浮点数类型 (float32)
- pn_sim: 浮点数类型 (float32)
- margin: 浮点数类型 (float64)
数据分割
- train: 包含35797个样本,总大小为32571587.635637943字节
数据集大小
- 下载大小: 30942084字节
- 数据集大小: 32571587.635637943字节
配置
- default: 包含训练数据文件,路径为
data/train-*



