MASSVIS dataset

github2024-04-11 更新2024-05-31 收录

下载链接：

https://github.com/massvis/dataset

下载链接

链接失效反馈

官方服务：

资源简介：

MASSVIS数据集包含5,814个单面板和多面板可视化，从七个不同的在线来源收集，涵盖政府和世界组织、新闻媒体、信息图表和科学出版物四个类别。数据集用于研究可视化的记忆性和识别度，提供了详细的元数据和标签，以及用于实验的特定子集。

The MASSVIS dataset comprises 5,814 single-panel and multi-panel visualizations, collected from seven distinct online sources. These sources span four categories: government and world organizations, news media, infographics, and scientific publications. The dataset is utilized for investigating the memorability and recognizability of visualizations, offering detailed metadata and labels, along with specific subsets for experimental purposes.

创建时间：

2015-07-16

原始信息汇总

数据集概述

本数据集包含多个子集，主要用于研究可视化的记忆性和识别度，与以下两篇论文相关：

What Makes a Visualization Memorable?
- 作者：Borkin, M., Vo, A., Bylinskii, Z., Isola, P., Sunkavalli, S., Oliva, A., & Pfister, H.
- 发表于：IEEE Transactions on Visualization and Computer Graphics (Proceedings of InfoVis 2013)
Beyond Memorability: Visualization Recognition and Recall.
- 作者：Borkin, M., Bylinskii, Z., Kim, N.W., Bainbridge C.M., Yeh, C.S., Borkin, D., Pfister, H., & Oliva, A.
- 发表于：IEEE Transactions on Visualization and Computer Graphics (Proceedings of InfoVis 2015)

数据集子集

all5k
- 包含：5,814个单面板和多面板可视化
- 来源：七个不同在线来源，分为四个类别（政府和世界组织、新闻媒体、信息图表、科学出版物）
- 提供信息：原始URL、来源和类别标签、可视化类型（单面板或多面板）
single2k
- 包含：2,068个单面板独立可视化
- 来源：all5k的子集
- 提供信息：原始URL、来源和类别标签、可视化类型
targets410
- 包含：410个目标可视化，用于Amazon Mechanical Turk实验
- 提供信息：6个属性（数据墨水比、颜色数、黑白、视觉密度、可识别对象、人物描绘）、原始URL、来源和类别标签、可视化类型、标题及位置、记忆性评分
targets393
- 包含：393个可视化，用于眼动追踪实验
- 提供信息：targets410的所有信息，加上记忆性评分（实验室长期暴露实验）、数据和信息冗余、33名参与者的眼动数据、自由形式描述及其质量评估

使用许可

本数据集的使用仅限于研究和教育目的，禁止商业使用、复制或分发。在研究论文或技术报告中使用时，不得超过缩略图大小。

搜集汇总

数据集介绍

构建方式

MASSVIS数据集的构建基于从网络中抓取的5,814个单面板和多面板可视化图表，这些图表来源于七个不同的在线资源，涵盖了政府和世界组织、新闻媒体、信息图表以及科学出版物四大类别。数据集通过详细的元数据和标签，记录了每个可视化图表的原始URL、来源、类别以及是否为单面板或多面板。此外，数据集还通过Amazon Mechanical Turk实验，对其中410个单面板可视化图表进行了记忆性评分，并标注了数据墨水比、颜色数量等六个属性。

特点

MASSVIS数据集的显著特点在于其多样性和详尽的标注。数据集不仅包含了广泛的可视化类型和来源，还通过实验获取了记忆性评分和眼动追踪数据，提供了深入的认知分析基础。此外，数据集还包含了用户生成的自由描述，这些描述经过手动评估，进一步丰富了数据集的分析维度。

使用方法

使用MASSVIS数据集时，用户可以通过提供的元数据和标签进行可视化分析，特别是记忆性和认知相关的研究。数据集支持多种格式的访问，包括CSV和Matlab格式，便于不同研究需求的使用。需要注意的是，使用数据集中的图像时，应遵守相关的许可协议，确保仅用于研究和教育目的，并且在学术论文或技术报告中使用时，图像不应超过缩略图大小。

背景与挑战

背景概述

MASSVIS数据集由Borkin等人创建，主要研究可视化记忆性及其识别与回忆的机制。该数据集的核心研究问题围绕可视化设计的记忆性展开，探讨何种视觉元素能够增强可视化的记忆效果。数据集的构建基于2013年和2015年的两项重要研究，分别发表于IEEE Transactions on Visualization and Computer Graphics。MASSVIS数据集不仅为可视化设计提供了丰富的实验数据，还为研究者提供了深入理解人类视觉认知的工具，对可视化领域的研究产生了深远影响。

当前挑战

MASSVIS数据集在构建过程中面临多项挑战。首先，数据集的多样性来源于从不同来源（如政府组织、新闻媒体、科学出版物等）收集的5,814个单面板和多面板可视化，这要求对数据进行细致的分类和标注。其次，为了评估可视化的记忆性，数据集通过Amazon Mechanical Turk实验收集了大量用户反馈，这涉及到实验设计和数据质量控制的问题。此外，数据集还包含了眼动追踪实验和用户记忆描述的分析，这些都需要精确的数据处理和分析方法，以确保结果的可靠性和有效性。

常用场景

经典使用场景

MASSVIS数据集在可视化记忆性研究中具有经典应用场景。该数据集通过收集和分析来自不同来源的单面板和多面板可视化图像，为研究者提供了丰富的数据资源，用于探索可视化设计如何影响人们的记忆和认知。特别是，数据集中的targets410和targets393子集，分别用于评估可视化的记忆性评分和眼动追踪实验，为可视化设计的优化提供了科学依据。

解决学术问题

MASSVIS数据集解决了可视化领域中关于记忆性和认知效率的关键学术问题。通过提供详细的可视化图像及其记忆性评分、眼动追踪数据和用户描述，该数据集帮助研究者深入理解可视化设计元素（如数据墨水比、颜色使用等）对用户记忆和认知的影响。这不仅推动了可视化设计理论的发展，还为设计更有效、更具记忆性的可视化工具提供了实证支持。

衍生相关工作

MASSVIS数据集的发布催生了一系列相关研究工作。例如，基于该数据集的研究已经扩展到可视化记忆性的神经科学基础，探索大脑如何处理和记忆视觉信息。此外，还有研究利用该数据集开发新的可视化设计工具和算法，以自动优化可视化的记忆性和认知效率。这些衍生工作不仅丰富了可视化领域的研究内容，还推动了可视化技术在实际应用中的进一步发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集