VisComplexity2K
收藏arXiv2025-10-09 更新2025-11-19 收录
下载链接:
https://osf.io/bdet6/overview
下载链接
链接失效反馈官方服务:
资源简介:
VisComplexity2K数据集包含了1800张可视化图像,这些图像由349名参与者进行了视觉复杂性评分。数据集旨在研究哪些图像特征会影响视觉复杂性,并通过12种基于图像的特征指标进行分析。数据集的创建过程涉及大规模众包实验和图像特征指标的计算。该数据集可用于研究可视化图像的视觉复杂性,以及如何通过计算指标来解释人类的感知响应。
The VisComplexity2K dataset comprises 1800 visualization images, whose visual complexity was rated by 349 participants. This dataset is designed to investigate which image features influence visual complexity, with analysis conducted using 12 image-based feature metrics. The creation of this dataset involves large-scale crowdsourcing experiments and the calculation of image feature metrics. This dataset can be utilized to study the visual complexity of visualization images, as well as how computational metrics can explain human perceptual responses.
提供机构:
俄亥俄州立大学, 诺丁汉大学, 斯图加特大学
创建时间:
2025-10-09
搜集汇总
数据集介绍

构建方式
VisComplexity2K数据集的构建基于大规模众包实验,通过349名参与者对1,800幅可视化图像进行感知评分。采用多阶段主动采样算法优化配对比较流程,显著减少所需试验次数同时保持评分可靠性。图像来源于真实场景的VIS30K和MASSVIS数据库,涵盖科学图表与传播类可视化,确保数据多样性和生态效度。通过贝叶斯排名算法TrueSkill计算每幅图像的视觉复杂度得分,形成人类感知与图像特征的量化关联。
特点
该数据集包含人类评定的视觉复杂度分数及12种客观图像质量指标,涵盖信息熵、视觉杂乱度、色彩多样性和形状结构等维度。其独特之处在于引入文本墨水比和有意义颜色数量两个新型对象级指标,揭示文本标注与复杂度间的非线性关系。图像类型覆盖节点链接图、热力图等典型可视化形式,兼具离散与连续空间表征,为多尺度视觉感知研究提供丰富样本。
使用方法
研究者可通过公开数据集获取图像、人类评分及指标数据,结合提供的计算代码复现指标分析。采用偏最小二乘回归等多元统计方法可解析各指标对复杂度的贡献度,特别适用于跨可视化类型的感知建模。该数据集支持视觉设计评估、自动化复杂度预测等应用,其量化管道为理解高阶认知体验与低阶图像特征的联系提供实证基础。
背景与挑战
背景概述
VisComplexity2K数据集由俄亥俄州州立大学、诺丁汉大学和斯图加特大学的研究团队于2025年创建,旨在系统量化数据可视化图像的感知视觉复杂性。该数据集通过大规模众包实验收集了349名参与者对1,800张可视化图像的复杂度评分,并融合了12种基于图像特征的客观度量指标,涵盖信息论、视觉杂乱度、色彩和对象级特征等多个维度。其核心研究问题聚焦于揭示人类感知与计算指标之间的关联机制,为可视化设计、认知评估和人机交互研究提供了实证基础,显著推进了可视化科学中高阶感知体验的量化研究。
当前挑战
VisComplexity2K面临的领域挑战在于精准建模人类对可视化复杂度的主观判断,需解决多尺度特征(如边缘密度与颜色数量)对感知的差异化影响,以及文本注释与视觉元素交互产生的非线性效应。构建过程中的挑战包括:大规模众包数据采集的可靠性与效率优化,需采用多阶段主动采样算法以平衡计算成本与评分一致性;客观度量指标的设计与验证,特别是在连续色彩映射中定义语义颜色数量的计算方法,需克服像素级噪声与人类感知阈值的对齐问题。
常用场景
经典使用场景
在可视化感知研究领域,VisComplexity2K数据集被广泛用于探索人类对图像复杂度的主观感知与客观图像度量之间的关联。该数据集通过大规模众包实验收集了349名参与者对1800幅可视化图像的复杂度评分,为量化分析视觉复杂度提供了丰富样本。研究者常利用该数据集验证信息论度量、颜色多样性、边缘密度等12项图像特征对人类感知的影响,尤其在节点链接图、热力图等典型可视化形式中,揭示了角点数量、颜色种类等特征对复杂度判断的稳健预测能力。
衍生相关工作
基于该数据集衍生的经典研究包括对节点链接图复杂度的深化分析,复现并扩展了Purchase等人的网络美学研究框架。后续工作将特征拥堵度量应用于连续色彩纹理可视化,验证了其在热力图复杂度预测中的特异性。另有研究结合文本墨水比率的非线性发现,开发了自适应标注布局算法。这些衍生成果共同推动了感知驱动可视化评估范式的发展,为多模态复杂度建模奠定了方法论基础。
数据集最近研究
最新研究方向
在可视化感知复杂度研究领域,VisComplexity2K数据集正推动对图像度量与人类感知关联机制的深入探索。前沿研究聚焦于多尺度视觉特征的量化分析,通过边缘密度、特征点分布等低层几何属性与色彩数量、文本占比等高层语义要素的协同建模,揭示视觉复杂度的形成规律。当前热点集中于特征拥堵模型的跨域迁移,该信息论度量在连续色彩纹理可视化中展现出卓越的预测能力,同时文本注释与复杂度呈现的U型关联规律引发对信息编码效率的重新审视。这些发现不仅为自动化可视化评估提供量化基准,更通过构建人类感知与计算度量的桥梁,推动可视化设计从经验导向向认知驱动范式转变。
相关研究论文
- 1通过俄亥俄州立大学, 诺丁汉大学, 斯图加特大学 · 2025年
以上内容由遇见数据集搜集并总结生成



