story_cloze_filtered_10k
收藏Hugging Face2025-07-26 更新2025-07-27 收录
下载链接:
https://huggingface.co/datasets/pkoerner/story_cloze_filtered_10k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个字段:提示(prompt)、选中(chosen)和拒绝(rejected),均为文本类型。测试集包含245个示例,数据集总大小为63206字节,下载大小为43352字节。
创建时间:
2025-07-26
原始信息汇总
数据集概述
基本信息
- 数据集名称: pkoerner/story_cloze_filtered_10k
- 下载大小: 139069字节
- 数据集大小: 229195字节
数据集结构
- 特征:
prompt: 字符串类型chosen: 字符串类型rejected: 字符串类型
- 拆分:
test:- 字节数: 229195
- 样本数: 871
配置信息
- 默认配置:
- 数据文件:
- 拆分:
test - 路径:
data/test-*
- 拆分:
- 数据文件:
搜集汇总
数据集介绍

构建方式
在叙事理解与生成领域,story_cloze_filtered_10k数据集的构建采用了精细的筛选机制。该数据集从原始故事文本中提取关键情节节点,通过人工标注构建了871组三元组样本,每组包含原始提示文本(prompt)、优选结局(chosen)和劣选结局(rejected)。数据采集过程注重叙事逻辑的连贯性,确保每个样本都能有效反映故事情节发展的合理性与完整性。
使用方法
研究人员可将该数据集应用于叙事理解模型的微调与评估。典型使用场景包括:将prompt作为输入,训练模型在chosen和rejected结局间做出正确选择;或作为生成模型的对比学习数据,提升模型生成合乎逻辑的故事结局的能力。数据集仅包含测试集,建议使用者采用交叉验证等方式确保模型评估的可靠性。数据以标准文本格式存储,可直接加载至主流机器学习框架进行处理。
背景与挑战
背景概述
story_cloze_filtered_10k数据集是近年来自然语言处理领域针对故事连贯性评估任务而构建的重要资源,由前沿研究团队在2020年代初期发布。该数据集聚焦于叙事文本的逻辑连贯性判断,通过提供prompt(故事前文)与两种可能结局(chosen/rejected),要求模型选择更合理的后续发展。其设计灵感来源于认知语言学对叙事理解的研究,旨在推动机器对长文本逻辑关系的建模能力,已成为评估故事生成和阅读理解模型性能的基准工具之一。
当前挑战
该数据集面临的核心挑战体现在语义推理和因果关联两个维度:其一,模型需深入理解故事线中隐含的时间、因果及情感逻辑,这对现有神经网络的长距离依赖建模提出了更高要求;其二,数据构建过程中需确保rejected结局具有表面合理性但内在逻辑缺陷,要求标注者具备专业的叙事分析能力,这种精细标注导致数据筛选成本显著提升。此外,测试集仅含871个样本的规模限制,也对统计显著性验证形成制约。
常用场景
经典使用场景
在自然语言处理领域,story_cloze_filtered_10k数据集被广泛应用于故事连贯性评估任务。该数据集通过提供故事开头(prompt)和两个可能的结局(chosen与rejected),要求模型选择逻辑连贯的结局,为研究叙事理解和生成提供了标准化的测试平台。其独特的对抗性构造方式,使得模型必须深入理解故事情节的内在逻辑才能做出正确判断。
解决学术问题
该数据集有效解决了叙事连贯性评估缺乏标准化基准的学术难题。通过精心设计的对抗性样本,研究者能够定量分析模型对故事逻辑、常识推理和时序关系的理解能力。这种评估方式突破了传统语言模型评估仅关注表面特征的局限,为深度语义理解研究提供了新的方法论支撑。
实际应用
在智能写作辅助系统中,story_cloze_filtered_10k数据集被用于训练模型识别故事逻辑漏洞的能力。教育科技公司利用该数据集开发的故事完整性检测工具,能够实时评估学生创意写作的连贯性。数字出版领域则运用相关技术自动化筛选符合叙事逻辑的网络文学作品。
数据集最近研究
最新研究方向
在自然语言处理领域,story_cloze_filtered_10k数据集因其独特的结构设计成为叙事理解和生成研究的重要基准。该数据集通过提供prompt(提示)、chosen(优选结局)和rejected(拒绝结局)三元组,为模型评估和优化提供了丰富的上下文信息。近年来,研究者们借助该数据集探索了多种前沿方向,包括基于对比学习的叙事连贯性评估、生成式模型的结局预测能力优化,以及多模态叙事理解的跨领域应用。特别是在大语言模型(LLM)快速发展的背景下,该数据集被广泛用于测试模型对叙事逻辑和人类偏好的捕捉能力,为可解释AI和伦理对齐研究提供了重要数据支撑。随着对话系统和创意写作辅助工具的兴起,story_cloze_filtered_10k在提升模型叙事合理性方面的价值正持续凸显。
以上内容由遇见数据集搜集并总结生成



