five

benjleite/FairytaleQA-translated-ptPT

收藏
Hugging Face2024-06-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/benjleite/FairytaleQA-translated-ptPT
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是欧洲葡萄牙语(pt-PT)机器翻译版本,源自英文FairytaleQA数据集,旨在增强从幼儿园到八年级学生的叙事理解能力。数据集包含10,580个明确和隐含的问题,这些问题来自278个儿童友好故事,涵盖了七种叙事元素或关系。数据集支持问答、问题生成和问答对生成任务。

该数据集是欧洲葡萄牙语(pt-PT)机器翻译版本,源自英文FairytaleQA数据集,旨在增强从幼儿园到八年级学生的叙事理解能力。数据集包含10,580个明确和隐含的问题,这些问题来自278个儿童友好故事,涵盖了七种叙事元素或关系。数据集支持问答、问题生成和问答对生成任务。
提供机构:
benjleite
原始信息汇总

数据集概述

数据集名称

  • FairytaleQA-translated-ptPT

数据集描述

  • 语言: 欧洲葡萄牙语 (pt-PT)
  • 任务类别:
    • 问答
    • 文本生成
  • 标签:
    • 问答
    • 问题生成
    • 教育
    • 儿童教育
  • 大小: 10K<n<100K

数据集内容

  • 概述: 该数据集是原始英语FairytaleQA数据集的机器翻译版本,专为提高从幼儿园到八年级学生的叙事理解能力而设计。包含10,580个明确和隐含的问题,源自278个儿童友好故事,覆盖七种叙事元素或关系。
  • 翻译: 使用DeepL翻译,作为研究“FairytaleQA Translated: Enabling Educational Question and Answer Generation in Less-Resourced Languages”的一部分。

数据集结构

  • 字段:
    • story_name: 故事名称
    • story_section: 故事节选
    • question: 问题内容
    • answer: 答案内容
    • local_or_sum: 局部或总结
    • attribute: 属性分类
    • ex_or_im1: 明确或隐含
    • ex_or_im2: 明确或隐含(仅限测试/验证集)

数据分割

  • 分割详情:
    分割 书籍数量 QA对数量
    训练 232 8548
    验证 23 1025
    测试 23 1007

许可证

  • 许可证: Apache-2.0

联系信息

  • 联系人: Bernardo Leite (bernardo.leite@fe.up.pt)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作