five

indicbench/truthfulqa_or

收藏
Hugging Face2024-03-28 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/indicbench/truthfulqa_or
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: default features: - name: _data_files list: - name: filename dtype: string - name: _fingerprint dtype: string - name: _format_columns dtype: 'null' - name: _format_type dtype: 'null' - name: _output_all_columns dtype: bool - name: _split dtype: 'null' splits: - name: train num_bytes: 107 num_examples: 2 download_size: 3274 dataset_size: 107 - config_name: generation features: - name: type dtype: string - name: category dtype: string - name: question dtype: string - name: best_answer dtype: string - name: correct_answers sequence: string - name: incorrect_answers sequence: string - name: source dtype: string splits: - name: validation num_bytes: 1091991 num_examples: 817 download_size: 347244 dataset_size: 1091991 - config_name: multiple_choice features: - name: question dtype: string - name: mc1_targets struct: - name: choices sequence: string - name: labels sequence: int64 - name: mc2_targets struct: - name: choices sequence: string - name: labels sequence: int64 splits: - name: validation num_bytes: 1516137 num_examples: 817 download_size: 450345 dataset_size: 1516137 configs: - config_name: default data_files: - split: train path: data/train-* - config_name: generation data_files: - split: validation path: generation/validation-* - config_name: multiple_choice data_files: - split: validation path: multiple_choice/validation-* ---

数据集信息: 1. 配置名称:default 特征字段: - _data_files:列表类型,其中包含字段filename,数据类型为字符串 - _fingerprint:数据类型为字符串 - _format_columns:数据类型为 null - _format_type:数据类型为 null - _output_all_columns:数据类型为布尔值 - _split:数据类型为 null 数据分割: - 分割名称:train,占用字节数:107,样本数量:2 下载总大小:3274,数据集总大小:107 2. 配置名称:generation 特征字段: - type:数据类型为字符串 - category:数据类型为字符串 - question:数据类型为字符串 - best_answer:数据类型为字符串 - correct_answers:字符串序列类型 - incorrect_answers:字符串序列类型 - source:数据类型为字符串 数据分割: - 分割名称:validation,占用字节数:1091991,样本数量:817 下载总大小:347244,数据集总大小:1091991 3. 配置名称:multiple_choice 特征字段: - question:数据类型为字符串 - mc1_targets:结构体类型,包含字段: * choices:字符串序列类型 * labels:int64 序列类型 - mc2_targets:结构体类型,包含字段: * choices:字符串序列类型 * labels:int64 序列类型 数据分割: - 分割名称:validation,占用字节数:1516137,样本数量:817 下载总大小:450345,数据集总大小:1516137 配置详情: - 配置名称:default,数据文件配置: * 分割:train,文件路径:data/train-* - 配置名称:generation,数据文件配置: * 分割:validation,文件路径:generation/validation-* - 配置名称:multiple_choice,数据文件配置: * 分割:validation,文件路径:multiple_choice/validation-*
提供机构:
indicbench
原始信息汇总

数据集概述

配置名称:default

  • 特征:
    • _data_files: 文件名列表,数据类型为字符串。
    • _fingerprint: 数据类型为字符串。
    • _format_columns: 数据类型为空。
    • _format_type: 数据类型为空。
    • _output_all_columns: 数据类型为布尔值。
    • _split: 数据类型为空。
  • 分割:
    • train: 字节数为107,示例数为2。
  • 下载大小: 3274字节
  • 数据集大小: 107字节

配置名称:generation

  • 特征:
    • type: 数据类型为字符串。
    • category: 数据类型为字符串。
    • question: 数据类型为字符串。
    • best_answer: 数据类型为字符串。
    • correct_answers: 数据类型为字符串序列。
    • incorrect_answers: 数据类型为字符串序列。
    • source: 数据类型为字符串。
  • 分割:
    • validation: 字节数为1091991,示例数为817。
  • 下载大小: 347244字节
  • 数据集大小: 1091991字节

配置名称:multiple_choice

  • 特征:
    • question: 数据类型为字符串。
    • mc1_targets: 结构体,包含choices(字符串序列)和labels(整数序列)。
    • mc2_targets: 结构体,包含choices(字符串序列)和labels(整数序列)。
  • 分割:
    • validation: 字节数为1516137,示例数为817。
  • 下载大小: 450345字节
  • 数据集大小: 1516137字节

数据文件路径

  • default: data/train-*
  • generation: generation/validation-*
  • multiple_choice: multiple_choice/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作