five

proxectonos/truthfulqa_gl

收藏
Hugging Face2025-04-01 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/proxectonos/truthfulqa_gl
下载链接
链接失效反馈
官方服务:
资源简介:
TruthfulQA_gl是TruthfulQA数据集的加利西亚语版本,用于评估语言模型在生成答案时的真实性。该数据集包含来自不同类别的问题,这些问题可能会导致人类因错误信念或误解而给出错误答案。此版本仅包含生成部分的数据集。数据集由Proxecto Nós策划,使用Apache License 2.0许可,语言为加利西亚语。数据集结构包括一个CSV文件,包含817行/项目,数据字段包括问题类型、ID、类别、问题、最佳答案、正确答案列表、错误答案列表和来源。

TruthfulQA_gl是TruthfulQA数据集的加利西亚语版本,用于评估语言模型在生成答案时的真实性。该数据集包含来自不同类别的问题,这些问题可能会导致人类因错误信念或误解而给出错误答案。此版本仅包含生成部分的数据集。数据集由Proxecto Nós策划,使用Apache License 2.0许可,语言为加利西亚语。数据集结构包括一个CSV文件,包含817行/项目,数据字段包括问题类型、ID、类别、问题、最佳答案、正确答案列表、错误答案列表和来源。
提供机构:
proxectonos
原始信息汇总

数据集概述

基本信息

  • 数据集名称: TruthfulQA_gl
  • 语言: Galician
  • 许可证: Apache License 2.0
  • 任务类别:
    • 多项选择
    • 文本生成
    • 问答
  • 任务ID:
    • 多项选择问答
    • 语言建模
    • 开放领域问答
  • 数据规模: n<1K

数据集结构

配置: generation

  • 特征:
    • type: 字符串,表示问题是否由对抗性过程生成("Adversarial" 或 "Non-Adversarial")。
    • id: 字符串,问题的ID。
    • category: 字符串,问题的类别。
    • question: 字符串,设计用于引起模仿性错误回答的问题。
    • best_answer: 字符串,最佳正确且真实的答案。
    • correct_answers: 字符串序列,正确(真实)答案列表。
    • incorrect_answers: 字符串序列,错误(虚假)答案列表。
    • source: 字符串,问题内容的来源。
  • 分割:
    • validation: 817个样本
  • 下载大小: 250462字节

配置: multiple_choice

  • 特征:
    • question: 字符串,问题。
    • mc1_targets: 结构体,包含choices(字符串序列)和labels(int32序列)。
    • mc2_targets: 结构体,包含choices(字符串序列)和labels(int32序列)。
  • 分割:
    • validation: 817个样本
  • 下载大小: 244892字节

数据文件

  • 配置: generation:
    • validation: generation/validation-*
  • 配置: multiple_choice:
    • validation: multiple_choice/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作