five

indolem/indo_story_cloze

收藏
Hugging Face2023-08-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/indolem/indo_story_cloze
下载链接
链接失效反馈
官方服务:
资源简介:
IndoCloze数据集包含2,325个印尼语故事,每个故事由四句话的前提、一个正确的结尾和一个错误的结尾组成。数据集被分为训练集(1,000个故事)、开发集(200个故事)和测试集(1,135个故事)。该数据集由七名印尼大学生在一个月内每人编写500个短故事创建而成,并在ACL 2022的CSRR研讨会上获得了最佳论文奖。

IndoCloze数据集包含2,325个印尼语故事,每个故事由四句话的前提、一个正确的结尾和一个错误的结尾组成。数据集被分为训练集(1,000个故事)、开发集(200个故事)和测试集(1,135个故事)。该数据集由七名印尼大学生在一个月内每人编写500个短故事创建而成,并在ACL 2022的CSRR研讨会上获得了最佳论文奖。
提供机构:
indolem
原始信息汇总

数据集概述

数据集名称

IndoCloze

数据集内容

  • 故事结构:每个故事包含四句话的前提、一句正确的结尾和一句错误的结尾。
  • 语言:印度尼西亚语(id)
  • 数据量:总共2,325个故事,分为训练集(1,000个)、开发集(200个)和测试集(1,135个)。

数据集创建

  • 创建者:七名印度尼西亚大学学生
  • 创建过程:每位学生在一个月内编写500个短故事,共计3,500个故事。

数据集用途

  • 研究论文:用于论文《Cloze Evaluation for Deeper Understanding of Commonsense Stories in Indonesian》,该论文在CSRR(ACL 2022)获得最佳论文奖。

许可证

  • 许可证类型:CC-BY-SA-4.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作