ROCStories
收藏arXiv2025-09-30 收录
下载链接:
https://cs.rochester.edu/nlp/rocstories/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个庞大的众包短篇小说集合,它被用于对故事生成模型进行预训练。此外,该数据集还包含了用于预训练故事生成器的相关信息。
This dataset is a large-scale crowdsourced collection of short stories, intended for pre-training story generation models. Furthermore, it also contains relevant information for pre-training story generators.
搜集汇总
数据集介绍

背景与挑战
背景概述
ROCStories是一个包含98,159个五句话常识故事的数据集,专注于捕获日常事件之间的因果和时间关系,用于故事理解和生成。同时,它支持Story Cloze Test评估框架,该框架包含3,744个实例,要求系统为四句话的故事选择正确结尾,以测试常识推理能力。
以上内容由遇见数据集搜集并总结生成



