five

anab/ACORN

收藏
Hugging Face2024-05-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/anab/ACORN
下载链接
链接失效反馈
官方服务:
资源简介:
ACORN数据集包含3500条人类编写和LLM生成的解释,每条解释都有由人类给出的质量评分。数据集的主要字段包括问题、选择、标签、解释、投票评分和工人评分。解释质量评价包括一般评分和细粒度评分,假设理想的解释是流畅、充分、最小化和对比性的。数据集的来源包括ECQA、CoS-E、COPA-SSE等多个来源,每个来源有500个样本,总计3500个样本。

ACORN数据集包含3500条人类编写和LLM生成的解释,每条解释都有由人类给出的质量评分。数据集的主要字段包括问题、选择、标签、解释、投票评分和工人评分。解释质量评价包括一般评分和细粒度评分,假设理想的解释是流畅、充分、最小化和对比性的。数据集的来源包括ECQA、CoS-E、COPA-SSE等多个来源,每个来源有500个样本,总计3500个样本。
提供机构:
anab
原始信息汇总

ACORN 数据集概述

基本信息

  • 许可证: MIT
  • 语言: 英语
  • 标签: 解释评估, 解释评级, 常识推理
  • 大小类别: 1K<n<10K
  • 任务类别: 文本分类, 文本生成
  • 美观名称: ACORN
  • 配置:
    • 配置名称: data
    • 数据文件: ACORN.jsonl

数据集描述

  • 内容: 包含3,500个人类编写和LLM生成的解释,每个解释都有人类给出的方面质量评级。
  • 文件: 数据集文件为ACORN.jsonl,每行包含解释文本、相关信息、聚合评级和所有工人的评级。
  • 基本字段:
    • question: 问题文本
    • choices: 答案选项列表
    • label: 正确答案索引
    • explanation: 解释文本
    • voted_ratings: 多数投票评级
    • worker_ratings: 所有工人评级,以字典形式存储(工人ID → 评级字典)

质量方面

  • 评级标准: 包括一般评级和细粒度的解释质量方面,追求流畅、充分、最小和对比的解释。

数据来源

  • 来源: 数据集包含来自多个来源的解释,包括ECQA、CoS-E、COPA-SSE、Commonsense QA的生成解释、Balanced COPA的生成解释、新收集的Balanced COPA解释以及GPT-3.5编辑的CoS-E和COPA-SSE版本。

额外字段

  • id: 测试样本ID
  • q_id: 原始问题ID
  • e_id: 原始解释ID
  • q_source: 问题来源(Commonsense QA或Balanced COPA)
  • e_source: 解释来源
  • triples: 三元组形式的解释(仅COPA-SSE)
  • postivies, negatives: 正负陈述(仅ECQA)

引用信息

@article{brassard2024acorn, title = {ACORN: Aspect-wise Commonsense Reasoning Explanation Evaluation}, author = {Ana Brassard and Benjamin Heinzerling and Keito Kudo and Keisuke Sakaguchi and Kentaro Inui}, year = {2024}, journal = {arXiv preprint arXiv: 2405.04818} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作