indicbench/truthfulqa_or
收藏Hugging Face2024-03-28 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/indicbench/truthfulqa_or
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: default
features:
- name: _data_files
list:
- name: filename
dtype: string
- name: _fingerprint
dtype: string
- name: _format_columns
dtype: 'null'
- name: _format_type
dtype: 'null'
- name: _output_all_columns
dtype: bool
- name: _split
dtype: 'null'
splits:
- name: train
num_bytes: 107
num_examples: 2
download_size: 3274
dataset_size: 107
- config_name: generation
features:
- name: type
dtype: string
- name: category
dtype: string
- name: question
dtype: string
- name: best_answer
dtype: string
- name: correct_answers
sequence: string
- name: incorrect_answers
sequence: string
- name: source
dtype: string
splits:
- name: validation
num_bytes: 1091991
num_examples: 817
download_size: 347244
dataset_size: 1091991
- config_name: multiple_choice
features:
- name: question
dtype: string
- name: mc1_targets
struct:
- name: choices
sequence: string
- name: labels
sequence: int64
- name: mc2_targets
struct:
- name: choices
sequence: string
- name: labels
sequence: int64
splits:
- name: validation
num_bytes: 1516137
num_examples: 817
download_size: 450345
dataset_size: 1516137
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- config_name: generation
data_files:
- split: validation
path: generation/validation-*
- config_name: multiple_choice
data_files:
- split: validation
path: multiple_choice/validation-*
---
数据集信息:
1. 配置名称:default
特征字段:
- _data_files:列表类型,其中包含字段filename,数据类型为字符串
- _fingerprint:数据类型为字符串
- _format_columns:数据类型为 null
- _format_type:数据类型为 null
- _output_all_columns:数据类型为布尔值
- _split:数据类型为 null
数据分割:
- 分割名称:train,占用字节数:107,样本数量:2
下载总大小:3274,数据集总大小:107
2. 配置名称:generation
特征字段:
- type:数据类型为字符串
- category:数据类型为字符串
- question:数据类型为字符串
- best_answer:数据类型为字符串
- correct_answers:字符串序列类型
- incorrect_answers:字符串序列类型
- source:数据类型为字符串
数据分割:
- 分割名称:validation,占用字节数:1091991,样本数量:817
下载总大小:347244,数据集总大小:1091991
3. 配置名称:multiple_choice
特征字段:
- question:数据类型为字符串
- mc1_targets:结构体类型,包含字段:
* choices:字符串序列类型
* labels:int64 序列类型
- mc2_targets:结构体类型,包含字段:
* choices:字符串序列类型
* labels:int64 序列类型
数据分割:
- 分割名称:validation,占用字节数:1516137,样本数量:817
下载总大小:450345,数据集总大小:1516137
配置详情:
- 配置名称:default,数据文件配置:
* 分割:train,文件路径:data/train-*
- 配置名称:generation,数据文件配置:
* 分割:validation,文件路径:generation/validation-*
- 配置名称:multiple_choice,数据文件配置:
* 分割:validation,文件路径:multiple_choice/validation-*
提供机构:
indicbench
原始信息汇总
数据集概述
配置名称:default
- 特征:
_data_files: 文件名列表,数据类型为字符串。_fingerprint: 数据类型为字符串。_format_columns: 数据类型为空。_format_type: 数据类型为空。_output_all_columns: 数据类型为布尔值。_split: 数据类型为空。
- 分割:
train: 字节数为107,示例数为2。
- 下载大小: 3274字节
- 数据集大小: 107字节
配置名称:generation
- 特征:
type: 数据类型为字符串。category: 数据类型为字符串。question: 数据类型为字符串。best_answer: 数据类型为字符串。correct_answers: 数据类型为字符串序列。incorrect_answers: 数据类型为字符串序列。source: 数据类型为字符串。
- 分割:
validation: 字节数为1091991,示例数为817。
- 下载大小: 347244字节
- 数据集大小: 1091991字节
配置名称:multiple_choice
- 特征:
question: 数据类型为字符串。mc1_targets: 结构体,包含choices(字符串序列)和labels(整数序列)。mc2_targets: 结构体,包含choices(字符串序列)和labels(整数序列)。
- 分割:
validation: 字节数为1516137,示例数为817。
- 下载大小: 450345字节
- 数据集大小: 1516137字节
数据文件路径
- default:
data/train-* - generation:
generation/validation-* - multiple_choice:
multiple_choice/validation-*



