MisVisBench
收藏MisVisBench 数据集概述
数据集基本信息
- 数据集名称: Evaluating Vision-Language Models on Misleading Data Visualizations (MisVisBench)
- 语言: 英语
- 数据规模: 1K<n<10K
- 许可证: CC-BY-NC-SA 4.0
- 关联论文: https://arxiv.org/abs/2603.22368
- 代码仓库: https://github.com/Harsh-Lalai/Evaluating-Vision-Language-Models-on-Misleading-Data-Visualizations
- 联系人: lalaiharsh26@gmail.com
数据集目的
该数据集旨在评估视觉语言模型在检测数据可视化-标题对中误导性信息的能力,并判断其能否正确将误导性来源归因于适当的错误类型:标题层面的推理错误和可视化设计错误。
数据集结构
数据集遵循 2 × 2 误导性分解框架,包含以下四个子集:
- △: 标题存在推理错误,可视化无误
- ○: 可视化存在设计错误,标题无误
- ■: 标题和可视化均存在误导性
- ∅: 标题和可视化均无误(对照组)
对应的顶层数据键为:
Misleading_Caption_Non_Misleading_VisNon_Misleading_Caption_Misleading_VisMisleading_Caption_Misleading_VisNon_Misleading_Caption_Non_Misleading_Vis
数据统计
| 子集 | 样本数量 |
|---|---|
| △ | 793 |
| ○ | 1110 |
| ■ | 501 |
| ∅ | 611 |
| 总计 | 3015 |
数据来源
| 子集 | 来源 |
|---|---|
| △ | X/Twitter |
| ○ | X/Twitter 和 subreddit DataIsUgly |
| ■ | X |
| ∅ | subreddit DataIsBeautiful |
数据文件与格式
数据集以单个JSON文件 data.json 提供。
数据结构示例如下:
json
{
"data_type_name": {
"sample_id": {
"reasoning_error_names": [...],
"visualization_error_names": [...],
"text": "... (仅存在于 Misleading_Caption_Misleading_Vis 样本中)"
}
}
}
数据字段说明
| 字段 | 描述 |
|---|---|
| sample_id | 对应原始帖子(推文或Reddit帖子)的标识符 |
| reasoning_error_names | 样本中存在的标题层面推理错误列表 |
| visualization_error_names | 图表中存在的可视化设计错误列表 |
| text | 标题文本(仅提供给 ■ 样本) |
关于 text 字段的重要说明:该字段仅存在于 ■ 样本中。对于这些样本,标题由作者编写,旨在引入特定的推理错误,同时复用原有的可视化图表。其他三个子集(△、○ 和 ∅)不包含标题文本,因此这些条目中不存在 text 字段。
错误分类法
标题层面推理错误
- Cherry-picking
- Causal inference
- Setting an arbitrary threshold
- Failure to account for statistical nuance
- Incorrect reading of chart
- Issues with data validity
- Misrepresentation of scientific studies
可视化设计错误
- Truncated axis
- Dual axis
- Value encoded as area or volume
- Inverted axis
- Uneven binning
- Unclear encoding
- Inappropriate encoding
使用方式
可通过Hugging Face datasets 库加载数据集。具体代码示例详见数据集README。
引用格式
@article{lalai2026visuals, title={When Visuals Arent the Problem: Evaluating Vision-Language Models on Misleading Data Visualizations}, author={Lalai, Harsh Nishant and Shah, Raj Sanjay and Pfister, Hanspeter and Varma, Sashank and Guo, Grace}, journal={arXiv preprint arXiv:2603.22368}, year={2026} }




