Omanic
收藏Hugging Face2026-03-25 更新2026-03-26 收录
下载链接:
https://huggingface.co/datasets/li-lab/Omanic
下载链接
链接失效反馈官方服务:
资源简介:
Omanic数据集旨在评估大型语言模型的多跳推理能力,包含两个部分:OmanicSynth(10,296个机器生成的训练示例)和OmanicBench(967个经过专家评审的人工标注评估示例)。每个数据实例代表一个4跳推理问题,包含以下关键字段:唯一标识符(id)、分解后的单跳子问题链(single_hop)、最终多跳问题(multi_hop_question)、多跳问题正确答案(multi_hop_answer)、多选题选项(multiple_choice_options)、正确答案标签(correct_answer_label)以及推理图拓扑类型(motif_type)。单跳问题链中的每个子问题包含问题文本、答案、选项、正确答案标签和语义领域(domain)。数据集支持多种推理拓扑结构,包括桥接式(Bridge)、链式(Chain)和汇聚式(Converging)。该数据集适用于多跳推理任务的研究和评估。
提供机构:
LiLab
创建时间:
2026-03-17



