five

WorkInTheDark/FairytaleQA

收藏
Hugging Face2023-08-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/WorkInTheDark/FairytaleQA
下载链接
链接失效反馈
官方服务:
资源简介:
这是FairytaleQA数据集的存储库,一个专注于叙事理解的开源数据集,目标用户是从幼儿园到八年级的学生。FairytaleQA数据集由教育专家基于证据支持的理论框架进行注释。它包含10,580个明确和隐含的问题,这些问题来源于278个适合儿童的故事,涵盖了七种叙事元素或关系。
提供机构:
WorkInTheDark
原始信息汇总

数据集概述:FairytaleQA

数据集描述

  • 数据集名称:FairytaleQA
  • 数据集目的:专注于叙事理解,针对幼儿园至八年级学生。
  • 数据集规模:包含10,580个明确和隐含问题,源自278个儿童友好故事。
  • 数据集特点:由教育专家基于证据的理论框架进行标注,涵盖七种类型的叙事元素或关系。

支持的任务

  • 问答(Question-Answering)
  • 问题生成(Question-Generation)
  • 问答对生成(Question-Answer Pair Generation)

语言

  • 英语(English)

数据集结构

数据实例

  • 示例字段
    • story_name:故事名称
    • story_section:与问答对相关的故事部分
    • question:问题内容
    • answer1:第一个答案
    • answer2:第二个答案(仅在测试/验证集提供)
    • local-or-sum:问题关联的故事部分类型(局部或总结)
    • attribute:由教育专家分类的七种叙事元素之一
    • ex-or-im:答案的明确性(明确或隐含)
    • ex-or-im2:另一个标注者的明确性标注(仅在测试/验证集提供)

数据分割

  • 训练集:232本书,8548个问答对
  • 验证集:23本书,1025个问答对
  • 测试集:23本书,1007个问答对

许可证

  • Apache-2.0

引用信息

@inproceedings{xu2022fairytaleqa, author={Xu, Ying and Wang, Dakuo and Yu, Mo and Ritchie, Daniel and Yao, Bingsheng and Wu, Tongshuang and Zhang, Zheng and Li, Toby Jia-Jun and Bradford, Nora and Sun, Branda and Hoang, Tran Bao and Sang, Yisi and Hou, Yufang and Ma, Xiaojuan and Yang, Diyi and Peng, Nanyun and Yu, Zhou and Warschauer, Mark}, title = {Fantastic Questions and Where to Find Them: Fairytale{QA} -- An Authentic Dataset for Narrative Comprehension}, publisher = {Association for Computational Linguistics}, year = {2022} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作