helloelwin/helpful-l-20k
收藏Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/helloelwin/helpful-l-20k
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: label
dtype: string
- name: context
dtype: string
- name: A
dtype: string
- name: B
dtype: string
- name: answer
dtype: string
splits:
- name: train
num_bytes: 56692445
num_examples: 20000
- name: test
num_bytes: 10823224
num_examples: 5000
download_size: 41255872
dataset_size: 67515669
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征:
- 字段名:question(问题),数据类型:字符串(string)
- 字段名:label,数据类型:字符串(string)
- 字段名:context(上下文),数据类型:字符串(string)
- 字段名:A,数据类型:字符串(string)
- 字段名:B,数据类型:字符串(string)
- 字段名:answer(答案),数据类型:字符串(string)
数据集划分:
- 划分名称:train(训练集),字节大小:56692445,样本数量:20000
- 划分名称:test(测试集),字节大小:10823224,样本数量:5000
下载大小:41255872 字节,总数据集大小:67515669 字节
配置项:
- 配置名称:default(默认配置),数据文件:
- 训练集划分对应路径:data/train-*
- 测试集划分对应路径:data/test-*
提供机构:
helloelwin
原始信息汇总
数据集概述
数据集特征
- question:数据类型为字符串。
- label:数据类型为字符串。
- context:数据类型为字符串。
- A:数据类型为字符串。
- B:数据类型为字符串。
- answer:数据类型为字符串。
数据集分割
- 训练集:包含20000个示例,总大小为56692445字节。
- 测试集:包含5000个示例,总大小为10823224字节。
数据集大小
- 下载大小:41255872字节。
- 数据集总大小:67515669字节。
配置文件
- 默认配置:包含训练集和测试集的数据文件路径。
- 训练集路径:
data/train-* - 测试集路径:
data/test-*
- 训练集路径:



