cheafdevo56/InfluentialTriplets
收藏Hugging Face2023-12-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cheafdevo56/InfluentialTriplets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:query、pos和neg。每个特征都有其子结构,包括abstract(摘要)、corpus_id(语料库ID)和title(标题)等字段。其中,neg特征还包含一个score(评分)字段。数据集分为训练集和验证集,训练集包含19227个样本,验证集包含2137个样本。
该数据集包含三个主要特征:query、pos和neg。每个特征都有其子结构,包括abstract(摘要)、corpus_id(语料库ID)和title(标题)等字段。其中,neg特征还包含一个score(评分)字段。数据集分为训练集和验证集,训练集包含19227个样本,验证集包含2137个样本。
提供机构:
cheafdevo56
原始信息汇总
数据集概述
数据集特征
- query:
- abstract: 数据类型为字符串
- corpus_id: 数据类型为int64
- title: 数据类型为字符串
- pos:
- abstract: 数据类型为字符串
- corpus_id: 数据类型为int64
- title: 数据类型为字符串
- neg:
- abstract: 数据类型为字符串
- corpus_id: 数据类型为int64
- score: 数据类型为int64
- title: 数据类型为字符串
数据集分割
- train:
- 字节数: 73286160.22355364
- 样本数: 19227
- validation:
- 字节数: 8145447.776446358
- 样本数: 2137
数据集大小
- 下载大小: 48583049
- 数据集大小: 81431608.0
配置
- default:
- train: 路径为
data/train-* - validation: 路径为
data/validation-*
- train: 路径为



