anab/ACORN
收藏Hugging Face2024-05-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/anab/ACORN
下载链接
链接失效反馈官方服务:
资源简介:
ACORN数据集包含3500条人类编写和LLM生成的解释,每条解释都有由人类给出的质量评分。数据集的主要字段包括问题、选择、标签、解释、投票评分和工人评分。解释质量评价包括一般评分和细粒度评分,假设理想的解释是流畅、充分、最小化和对比性的。数据集的来源包括ECQA、CoS-E、COPA-SSE等多个来源,每个来源有500个样本,总计3500个样本。
ACORN数据集包含3500条人类编写和LLM生成的解释,每条解释都有由人类给出的质量评分。数据集的主要字段包括问题、选择、标签、解释、投票评分和工人评分。解释质量评价包括一般评分和细粒度评分,假设理想的解释是流畅、充分、最小化和对比性的。数据集的来源包括ECQA、CoS-E、COPA-SSE等多个来源,每个来源有500个样本,总计3500个样本。
提供机构:
anab
原始信息汇总
ACORN 数据集概述
基本信息
- 许可证: MIT
- 语言: 英语
- 标签: 解释评估, 解释评级, 常识推理
- 大小类别: 1K<n<10K
- 任务类别: 文本分类, 文本生成
- 美观名称: ACORN
- 配置:
- 配置名称: data
- 数据文件: ACORN.jsonl
数据集描述
- 内容: 包含3,500个人类编写和LLM生成的解释,每个解释都有人类给出的方面质量评级。
- 文件: 数据集文件为
ACORN.jsonl,每行包含解释文本、相关信息、聚合评级和所有工人的评级。 - 基本字段:
question: 问题文本choices: 答案选项列表label: 正确答案索引explanation: 解释文本voted_ratings: 多数投票评级worker_ratings: 所有工人评级,以字典形式存储(工人ID → 评级字典)
质量方面
- 评级标准: 包括一般评级和细粒度的解释质量方面,追求流畅、充分、最小和对比的解释。
数据来源
- 来源: 数据集包含来自多个来源的解释,包括ECQA、CoS-E、COPA-SSE、Commonsense QA的生成解释、Balanced COPA的生成解释、新收集的Balanced COPA解释以及GPT-3.5编辑的CoS-E和COPA-SSE版本。
额外字段
id: 测试样本IDq_id: 原始问题IDe_id: 原始解释IDq_source: 问题来源(Commonsense QA或Balanced COPA)e_source: 解释来源triples: 三元组形式的解释(仅COPA-SSE)postivies,negatives: 正负陈述(仅ECQA)
引用信息
@article{brassard2024acorn, title = {ACORN: Aspect-wise Commonsense Reasoning Explanation Evaluation}, author = {Ana Brassard and Benjamin Heinzerling and Keito Kudo and Keisuke Sakaguchi and Kentaro Inui}, year = {2024}, journal = {arXiv preprint arXiv: 2405.04818} }



