nthakur/miracl-raft-sft-instruct-v0.1
收藏Hugging Face2024-04-08 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/nthakur/miracl-raft-sft-instruct-v0.1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括id、messages、positive_ids、negative_ids和language。messages是一个列表,包含content和role两个字段。数据集分为训练集和测试集,训练集包含95560个示例,测试集包含4000个示例。数据集的下载大小为360967058字节,总大小为733760694.0字节。
该数据集包含多个特征,包括id、messages、positive_ids、negative_ids和language。messages是一个列表,包含content和role两个字段。数据集分为训练集和测试集,训练集包含95560个示例,测试集包含4000个示例。数据集的下载大小为360967058字节,总大小为733760694.0字节。
提供机构:
nthakur
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为字符串。
- messages: 包含两个子特征:
- content: 数据类型为字符串。
- role: 数据类型为字符串。
- positive_ids: 数据类型为字符串序列。
- negative_ids: 数据类型为字符串序列。
- language: 数据类型为字符串。
数据集分割
- 训练集 (train):
- 数据量: 95560个样本。
- 存储大小: 704280553.6223383字节。
- 测试集 (test):
- 数据量: 4000个样本。
- 存储大小: 29480140.377661712字节。
数据集大小
- 下载大小: 360967058字节。
- 数据集总大小: 733760694.0字节。
数据文件配置
- 默认配置 (default):
- 训练集路径:
data/train-*。 - 测试集路径:
data/test-*。
- 训练集路径:



