proxectonos/truthfulqa_gl
收藏Hugging Face2025-04-01 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/proxectonos/truthfulqa_gl
下载链接
链接失效反馈官方服务:
资源简介:
TruthfulQA_gl是TruthfulQA数据集的加利西亚语版本,用于评估语言模型在生成答案时的真实性。该数据集包含来自不同类别的问题,这些问题可能会导致人类因错误信念或误解而给出错误答案。此版本仅包含生成部分的数据集。数据集由Proxecto Nós策划,使用Apache License 2.0许可,语言为加利西亚语。数据集结构包括一个CSV文件,包含817行/项目,数据字段包括问题类型、ID、类别、问题、最佳答案、正确答案列表、错误答案列表和来源。
TruthfulQA_gl是TruthfulQA数据集的加利西亚语版本,用于评估语言模型在生成答案时的真实性。该数据集包含来自不同类别的问题,这些问题可能会导致人类因错误信念或误解而给出错误答案。此版本仅包含生成部分的数据集。数据集由Proxecto Nós策划,使用Apache License 2.0许可,语言为加利西亚语。数据集结构包括一个CSV文件,包含817行/项目,数据字段包括问题类型、ID、类别、问题、最佳答案、正确答案列表、错误答案列表和来源。
提供机构:
proxectonos
原始信息汇总
数据集概述
基本信息
- 数据集名称: TruthfulQA_gl
- 语言: Galician
- 许可证: Apache License 2.0
- 任务类别:
- 多项选择
- 文本生成
- 问答
- 任务ID:
- 多项选择问答
- 语言建模
- 开放领域问答
- 数据规模: n<1K
数据集结构
配置: generation
- 特征:
type: 字符串,表示问题是否由对抗性过程生成("Adversarial" 或 "Non-Adversarial")。id: 字符串,问题的ID。category: 字符串,问题的类别。question: 字符串,设计用于引起模仿性错误回答的问题。best_answer: 字符串,最佳正确且真实的答案。correct_answers: 字符串序列,正确(真实)答案列表。incorrect_answers: 字符串序列,错误(虚假)答案列表。source: 字符串,问题内容的来源。
- 分割:
validation: 817个样本
- 下载大小: 250462字节
配置: multiple_choice
- 特征:
question: 字符串,问题。mc1_targets: 结构体,包含choices(字符串序列)和labels(int32序列)。mc2_targets: 结构体,包含choices(字符串序列)和labels(int32序列)。
- 分割:
validation: 817个样本
- 下载大小: 244892字节
数据文件
- 配置: generation:
validation:generation/validation-*
- 配置: multiple_choice:
validation:multiple_choice/validation-*



