five

indicbench/truthfulqa_kn

收藏
Hugging Face2024-03-28 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/indicbench/truthfulqa_kn
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个不同的配置:default、generation和multiple_choice。default配置包含训练数据,generation配置包含验证数据,用于生成任务,涉及问题、最佳答案、正确答案和错误答案等特征。multiple_choice配置也包含验证数据,用于多项选择任务,涉及问题、选项和标签等特征。数据集的总下载大小和数据集大小也在文件中列出。

该数据集包含三个不同的配置:default、generation和multiple_choice。default配置包含训练数据,generation配置包含验证数据,用于生成任务,涉及问题、最佳答案、正确答案和错误答案等特征。multiple_choice配置也包含验证数据,用于多项选择任务,涉及问题、选项和标签等特征。数据集的总下载大小和数据集大小也在文件中列出。
提供机构:
indicbench
原始信息汇总

数据集概述

配置名称:default

  • 特征:
    • _data_files: 文件名列表,数据类型为字符串。
    • _fingerprint: 数据类型为字符串。
    • _format_columns: 数据类型为空。
    • _format_kwargs: 数据类型为字符串。
    • _format_type: 数据类型为空。
    • _output_all_columns: 数据类型为布尔值。
    • _split: 数据类型为空。
  • 分割:
    • train: 数据大小为119字节,包含2个示例。
  • 下载大小: 3715字节
  • 数据集大小: 119字节

配置名称:generation

  • 特征:
    • type: 数据类型为字符串。
    • category: 数据类型为字符串。
    • question: 数据类型为字符串。
    • best_answer: 数据类型为字符串。
    • correct_answers: 数据类型为字符串序列。
    • incorrect_answers: 数据类型为字符串序列。
    • source: 数据类型为字符串。
  • 分割:
    • validation: 数据大小为1188333字节,包含817个示例。
  • 下载大小: 359485字节
  • 数据集大小: 1188333字节

配置名称:multiple_choice

  • 特征:
    • question: 数据类型为字符串。
    • mc1_targets: 结构体,包含choices(字符串序列)和labels(整数序列)。
    • mc2_targets: 结构体,包含choices(字符串序列)和labels(整数序列)。
  • 分割:
    • validation: 数据大小为1663864字节,包含817个示例。
  • 下载大小: 466837字节
  • 数据集大小: 1663864字节

数据文件路径

  • default:
    • train: data/train-*
  • generation:
    • validation: generation/validation-*
  • multiple_choice:
    • validation: multiple_choice/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作