VisAnatomy

Name: VisAnatomy
Creator: 马里兰大学计算机科学系
Published: 2024-10-16 14:08:53
License: 暂无描述

arXiv2024-10-16 更新2024-10-18 收录

下载链接：

https://VisAnatomy.github.io/

下载链接

链接失效反馈

官方服务：

资源简介：

VisAnatomy是一个包含942个真实世界SVG图表的语义标签数据集，由马里兰大学计算机科学系创建。该数据集涵盖40种图表类型，由超过50种工具生成，具有丰富的结构和视觉风格多样性。数据集的创建过程包括手动收集和专家标注，确保了标签的高质量。VisAnatomy主要应用于图表类型分类、图表分解、动画制作和可访问性导航等领域，旨在解决现有图表数据集语义标签不足的问题。

VisAnatomy is a semantic labeling dataset consisting of 942 real-world SVG diagrams, developed by the Department of Computer Science at the University of Maryland. This dataset covers 40 chart types, generated by over 50 different tools, and features rich structural and visual style diversity. The dataset was constructed through manual collection and expert annotation, ensuring high-quality labels. VisAnatomy is primarily applied in fields including chart type classification, chart decomposition, animation production, and accessibility navigation, aiming to address the shortage of semantic labels in existing chart datasets.

提供机构：

马里兰大学计算机科学系

创建时间：

2024-10-16

搜集汇总

数据集介绍

构建方式

VisAnatomy数据集通过手动在线搜索和采样真实世界的图表来构建，确保了图表的质量和多样性。首先，团队通过浏览三个可视化分类目录来确定目标图表类型，并专注于由基本几何形状构成的可视化。随后，通过浏览在线图表工具库、社区和使用搜索引擎收集SVG图表，确保每个图表类型至少包含20种设计。每周团队会议审查收集的图表，移除不合格的图表，并确保选择标准的统一性。最终，经过28周的努力，收集了942个图表，涵盖40种图表类型和超过50种图表工具。

特点

VisAnatomy数据集的显著特点在于其多层次的细粒度语义标签，包括每个图形元素的类型、角色和位置，以及元素的分层分组、组布局和视觉编码。这些标签不仅提供了图表的高层次类型信息，还深入到每个元素的具体属性和它们之间的关系。此外，数据集在图表结构和视觉风格上具有多样性，涵盖了40种图表类型和超过50种图表工具，确保了数据集的广泛适用性和研究价值。

使用方法

VisAnatomy数据集可用于多种可视化研究任务，如图表类型分类、图表分解、动画制作和可访问性导航。通过其丰富的语义标签，研究人员可以开发和评估基于图表结构和内容的算法和工具。例如，数据集可以用于训练图神经网络进行图表类型分类，或用于验证图表分解和重用系统的性能。此外，语义标签还可以支持半自动化的动画制作工具，以及为视觉障碍用户提供丰富的图表导航体验。

背景与挑战

背景概述

VisAnatomy是由马里兰大学计算机科学系的一组研究人员创建的，旨在推动数据可视化研究的发展。该数据集包含了942个来自50多种工具的实际SVG图表，涵盖了40种图表类型，并具有丰富的结构和风格设计变化。VisAnatomy的核心研究问题是如何为图表提供多层次的细粒度语义标签，以支持更广泛的应用，如图表重用、动画和可访问性。该数据集的创建时间为2018年，主要研究人员包括Chen Chen、Hannah K. Bako等人。VisAnatomy对数据可视化领域的影响在于其提供了比现有图表语料库更详细的语义标签，从而推动了交互式应用的发展。

当前挑战

VisAnatomy在解决图像分类等领域的挑战时，面临的主要挑战包括：1) 现有图表语料库的标签多为高层次，缺乏细粒度语义标签，限制了其应用范围；2) 构建过程中遇到的挑战，如自动提取图表图像中的标记信息存在误差，以及从程序中提取编码和布局的启发式方法受限于特定的可视化语言。此外，现有SVG图表语料库在工具使用上的多样性不足，进一步限制了交互系统的通用性。VisAnatomy通过提供多层次的细粒度语义标签，旨在解决这些挑战，但其构建和维护过程中仍需面对手动标注的高成本和时间消耗。

常用场景

经典使用场景

VisAnatomy数据集的经典使用场景主要集中在数据可视化的研究与应用领域。该数据集通过提供942个真实世界的SVG图表，涵盖40种图表类型，并附有细粒度的语义标签，包括每个图形元素的类型、角色、位置、层次分组、组布局和视觉编码，极大地促进了图表类型分类、图表分解、动画创作和可访问性导航等应用的研究。这些细粒度的标签使得研究人员能够更深入地理解和分析图表的结构和功能，从而推动了数据可视化技术的进步。

衍生相关工作

VisAnatomy数据集的发布催生了一系列相关的经典工作。例如，基于该数据集的图表类型分类研究，开发了新的图神经网络模型（如GNN4SVG）；在图表分解和重用方面，Mystique系统的性能得到了验证和扩展；在动画创作领域，CAST工具的兼容性得到了提升；在可访问性方面，Zong等人的研究得以在更广泛的图表类型上实现。这些工作不仅丰富了数据可视化的研究内容，也推动了相关技术的实际应用。

数据集最近研究