ko-MuSR-v0.1

Hugging Face2025-08-19 更新2025-08-22 收录

下载链接：

https://huggingface.co/datasets/chanwoopark/ko-MuSR-v0.1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个子数据集：谋杀之谜、物体放置和团队分配。每个子数据集都由故事叙述、问题、选项、正确答案以及编辑前后的故事叙述组成。这些数据集适用于测试，每个子数据集都有250个示例。

创建时间：

2025-08-11

搜集汇总

数据集介绍

构建方式

在叙事推理研究领域，ko-MuSR-v0.1数据集通过精心设计的三个独立配置构建而成。murder_mysteries、object_placements和team_allocation每个子集均包含250个测试样本，采用叙事文本与多选项问题的配对结构。原始叙事经过特定编辑处理，生成narrative_before_edit和narrative的对比版本，旨在通过文本变换构建推理挑战。数据采集过程注重叙事逻辑的连贯性与选项的合理性，确保每个样本包含完整的叙事背景、问题陈述和标准答案标注。

使用方法

研究者可通过HuggingFace数据集库直接加载三个子配置进行使用。每个子集提供标准化的测试分割，包含叙事文本、问题、选项和答案字段。典型应用场景包括：评估模型在叙事理解、多步推理和选项分析方面的能力；通过对比编辑前后的叙事文本，研究文本变化对推理结果的影响；作为基准数据集用于测试机器学习模型在复杂推理任务中的表现。使用时应注重保持测试集的完整性以确保评估结果的可靠性。

背景与挑战

背景概述

在人工智能推理能力评估领域，ko-MuSR-v0.1数据集由韩国研究团队于2023年推出，专注于多步骤推理任务的基准测试。该数据集通过谋杀谜案、物品摆放和团队分配三个独特情境，构建了包含叙事文本、问题及多项选择题的复杂结构，旨在推动机器对长文本逻辑关系和隐含信息的深度理解。其设计体现了对叙事性推理任务系统化评估的学术追求，为自然语言处理领域的推理模型提供了重要的验证平台。

当前挑战

该数据集核心挑战在于解决叙事性多步骤推理中的语义连贯性判断与隐含关系挖掘问题，要求模型克服长文本依赖和逻辑链断裂的难点。构建过程中需确保叙事编辑前后逻辑一致性，同时维持问题与选项的语义平衡，避免标注偏差。此外，跨场景的泛化能力验证与文化语境适配性亦是构建时面临的关键技术障碍。

常用场景

经典使用场景

在自然语言推理与常识推理研究领域，ko-MuSR-v0.1数据集通过谋杀谜案、物品摆放和团队分配三大情境，为多跳推理与反事实推理任务提供了标准评估框架。其叙事文本与多选项问题的结合，能够有效检验模型在复杂语境下的逻辑链条构建能力和情境适应性，尤其适用于测试模型对隐含信息的捕捉与推理精度。

解决学术问题

该数据集致力于解决人工智能在反事实推理与情境化理解中的关键挑战，如模型对编辑后叙事的敏感性、对多步骤逻辑关系的处理能力，以及常识知识与上下文融合的机制。通过提供编辑前后的叙事对比，它为探究模型推理鲁棒性与可解释性提供了重要实验基础，推动了语义理解与推理技术的前沿发展。

实际应用

ko-MuSR-v0.1可应用于智能问答系统、对话代理与教育辅助工具的开发，特别是在需要动态情境调整与逻辑一致性维护的场景中。例如在游戏剧情生成、法律案件推理辅助或团队协作决策支持系统中，该数据集能够帮助提升模型在真实场景中的推理可靠性与人性化交互能力。

数据集最近研究