indicbench/truthfulqa_kn
收藏Hugging Face2024-03-28 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/indicbench/truthfulqa_kn
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个不同的配置:default、generation和multiple_choice。default配置包含训练数据,generation配置包含验证数据,用于生成任务,涉及问题、最佳答案、正确答案和错误答案等特征。multiple_choice配置也包含验证数据,用于多项选择任务,涉及问题、选项和标签等特征。数据集的总下载大小和数据集大小也在文件中列出。
该数据集包含三个不同的配置:default、generation和multiple_choice。default配置包含训练数据,generation配置包含验证数据,用于生成任务,涉及问题、最佳答案、正确答案和错误答案等特征。multiple_choice配置也包含验证数据,用于多项选择任务,涉及问题、选项和标签等特征。数据集的总下载大小和数据集大小也在文件中列出。
提供机构:
indicbench
原始信息汇总
数据集概述
配置名称:default
- 特征:
- _data_files: 文件名列表,数据类型为字符串。
- _fingerprint: 数据类型为字符串。
- _format_columns: 数据类型为空。
- _format_kwargs: 数据类型为字符串。
- _format_type: 数据类型为空。
- _output_all_columns: 数据类型为布尔值。
- _split: 数据类型为空。
- 分割:
- train: 数据大小为119字节,包含2个示例。
- 下载大小: 3715字节
- 数据集大小: 119字节
配置名称:generation
- 特征:
- type: 数据类型为字符串。
- category: 数据类型为字符串。
- question: 数据类型为字符串。
- best_answer: 数据类型为字符串。
- correct_answers: 数据类型为字符串序列。
- incorrect_answers: 数据类型为字符串序列。
- source: 数据类型为字符串。
- 分割:
- validation: 数据大小为1188333字节,包含817个示例。
- 下载大小: 359485字节
- 数据集大小: 1188333字节
配置名称:multiple_choice
- 特征:
- question: 数据类型为字符串。
- mc1_targets: 结构体,包含choices(字符串序列)和labels(整数序列)。
- mc2_targets: 结构体,包含choices(字符串序列)和labels(整数序列)。
- 分割:
- validation: 数据大小为1663864字节,包含817个示例。
- 下载大小: 466837字节
- 数据集大小: 1663864字节
数据文件路径
- default:
- train: data/train-*
- generation:
- validation: generation/validation-*
- multiple_choice:
- validation: multiple_choice/validation-*



