anthj/sft_mw_new2
收藏Hugging Face2024-07-11 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/anthj/sft_mw_new2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于训练和评估的问答或选择类问题数据,主要特征包括question(问题)和chosen(选择)。数据集分为训练集和评估集,训练集包含130,038个例子,评估集包含14,449个例子。
This dataset contains data for training and evaluating question-answering or choice-based questions, with main features including question and chosen. The dataset is divided into a training set and an evaluation set, with the training set containing 130,038 examples and the evaluation set containing 14,449 examples.
提供机构:
anthj
原始信息汇总
数据集概述
数据集特征
- question: 数据类型为字符串(string)。
- chosen: 数据类型为字符串(string)。
- index_level_0: 数据类型为整数(int64)。
数据集划分
- train:
- 字节数: 106671530
- 样本数: 130038
- eval:
- 字节数: 11880535
- 样本数: 14449
数据集大小
- 下载大小: 29764476 字节
- 数据集总大小: 118552065 字节
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - eval: 路径为
data/eval-*
- train: 路径为
- data_files:



