Incomplete Questions with Conditions
收藏LLM-Fail-to-Acquire-Context 数据集概述
数据集简介
- 名称: LLM-Fail-to-Acquire-Context
- 用途: 评估大型语言模型(LLMs)在数学问题中请求缺失信息的能力
- 核心问题: 研究LLMs在关键上下文缺失时的两种表现:
- 直接回答导致性能显著下降
- 产生特殊类型的幻觉假设导致完全错误答案
数据集内容
- 版本: 大型版本(包含1912个样本)
- 名称: "Incomplete Questions with Conditions" (大型数据集)
- 存储位置: HuggingFace Dataset
- 样本结构:
- 不完整的问题(缺少条件)
- 条件本身
- 答案
- 原始完整问题
数据示例
json { "index": 130, "question": "Given the sets $A={1,2,3,4}$ and $B={x|y=2x,y\in A}$, then $A\cap B=$u3000u3000()
A: ${2}$
B: ${1,2}$
C: ${2,4}$
D: ${1,2,4}$",
"new_question": "Given the set $B={x|y=2x,y\in A}$, then $A\cap B=$u3000u3000() A: ${2}$ B: ${1,2}$ C: ${2,4}$ D: ${1,2,4}$",
"condition": "$A={1,2,3,4}$",
"answer": "B"
}
测试提示示例
Given sets b={0,1,2}, then a∩b=( )
a: {0}
b: {1}
c: {1,2}
d: {0,1,2}. Return answer in oxed{}.
引用信息
bibtex @misc{shen2025llmfail, title={LLM Fail to Acquire Context}, author={Shen, Xinjie}, year={2025}, howpublished={url{https://sunset-jupiter-cf3.notion.site/Failing-to-Acquire-Context-A-Benchmark-for-Evaluating-LLMs-Ability-to-Request-Missing-Information--20fb7e977237802ca126ed554ccb8083}}, note={Notion Blog}, }




