nvBench 2.0
收藏arXiv2025-03-17 更新2025-03-19 收录
下载链接:
https://nvbench2.github.io/
下载链接
链接失效反馈官方服务:
资源简介:
nvBench 2.0是由香港科技大学创建的一个自然语言到可视化任务的数据集,包含7878条自然语言查询和24076个相应的可视化结果,这些数据来源于780个表格,覆盖153个领域。该数据集通过控制模糊注入管道构建,能够生成具有多个有效解释的模糊查询。每个查询-可视化对都配有推理路径,解释模糊是如何解决的,确保了解释的可解释性。
nvBench 2.0 is a natural language to visualization task dataset developed by The Hong Kong University of Science and Technology. It consists of 7,878 natural language queries and 24,076 corresponding visualization results, which are derived from 780 tables and span 153 domains. This dataset is built through a controlled ambiguity injection pipeline, enabling the generation of ambiguous queries that admit multiple valid interpretations. Each query-visualization pair is accompanied by a reasoning path that explains how the ambiguity is resolved, thus ensuring the interpretability of the explanations.
提供机构:
香港科技大学(HKUST)
创建时间:
2025-03-17
搜集汇总
数据集介绍

构建方式
nvBench 2.0的构建采用了可控的模糊注入流程,通过反向生成工作流生成模糊的自然语言查询。该流程从明确的种子可视化开始,通过选择性注入模糊性,生成多个有效的解释。每个模糊查询都通过逐步推理路径与其对应的可视化相关联,确保生成的每个可视化都能准确反映查询的模糊意图。这一方法不仅保证了数据集的多样性和复杂性,还提供了清晰的推理路径,使得模糊性处理过程透明且可解释。
特点
nvBench 2.0包含了7,878个自然语言查询和24,076个对应的可视化,涵盖了153个领域的780个表格。该数据集的特点在于其高度模糊性,每个查询可能对应多个有效的可视化结果,反映了现实世界中用户查询的模糊性。此外,数据集还提供了逐步推理路径,详细解释了每个模糊查询如何被解析为不同的可视化结果,确保了模糊性处理的准确性和可解释性。
使用方法
nvBench 2.0可用于评估自然语言到可视化(nl2vis)系统在处理模糊查询时的性能。研究人员可以使用该数据集来训练和测试模型,特别是那些旨在处理模糊性的模型。通过逐步推理路径,用户可以深入理解模型在处理模糊查询时的决策过程,从而优化模型的性能。此外,数据集还可用于开发新的模糊性处理算法,推动nl2vis领域的研究进展。
背景与挑战
背景概述
nvBench 2.0是由香港科技大学(广州)的研究团队于2025年推出的一个专注于自然语言到可视化(nl2vis)任务的基准数据集。该数据集旨在解决自然语言查询中的模糊性问题,帮助用户通过自然语言生成可视化图表。nvBench 2.0包含7,878个自然语言查询和24,076个对应的可视化图表,涵盖了153个领域的780个表格。通过引入可控的模糊性注入管道,该数据集能够生成多个有效的可视化解释,并通过逐步推理路径追踪每个模糊查询的对应可视化。这一数据集的推出为nl2vis系统在模糊查询场景下的评估提供了坚实的基础,推动了相关领域的研究进展。
当前挑战
nvBench 2.0面临的主要挑战包括两个方面:首先,自然语言查询中的模糊性使得单一查询可能对应多个有效的可视化解释,这要求nl2vis系统具备处理多义性的能力。其次,在数据集的构建过程中,如何通过反向生成工作流注入模糊性,并确保每个模糊查询都能生成多个有效的可视化解释,是一个复杂的技术挑战。此外,数据集的多样性和广泛性要求系统能够处理不同领域和复杂度的数据,进一步增加了构建和评估的难度。
常用场景
经典使用场景
nvBench 2.0 数据集主要用于评估自然语言到可视化(nl2vis)系统在处理模糊查询时的表现。通过提供包含模糊性的自然语言查询及其对应的多种有效可视化结果,nvBench 2.0 能够帮助研究人员测试和优化nl2vis系统在真实场景中的表现。该数据集特别适用于研究如何从模糊的用户查询中生成多种合理的可视化结果,并评估系统在处理数据层和可视化层模糊性时的能力。
衍生相关工作
nvBench 2.0 的推出催生了一系列相关研究工作,特别是在模糊nl2vis任务上的模型优化和评估。例如,基于该数据集的研究提出了Step-nl2vis模型,通过逐步偏好优化(Step-DPO)技术显著提升了模型在模糊场景下的表现。此外,nvBench 2.0 还为其他nl2vis基准提供了参考,推动了自然语言到可视化领域的进一步发展,特别是在处理模糊性和多解释性方面的研究。
数据集最近研究
最新研究方向
近年来,自然语言到可视化(nl2vis)领域的研究逐渐聚焦于处理模糊查询的挑战。nvBench 2.0作为该领域的前沿数据集,首次引入了模糊查询的评估基准,旨在解决用户在自然语言表达中的不确定性。通过构建包含7,878个自然语言查询和24,076个对应可视化的数据集,nvBench 2.0为nl2vis系统提供了多样化的模糊场景测试环境。研究热点包括如何通过逐步推理路径解析模糊查询,以及如何利用大语言模型(LLMs)优化模糊查询的可视化生成。Step-nl2vis模型的提出进一步推动了这一方向的发展,通过逐步偏好优化显著提升了模糊查询处理的性能。该数据集的影响在于为nl2vis系统提供了更贴近实际应用场景的评估框架,推动了自然语言与可视化交互的智能化发展。
相关研究论文
- 1nvBench 2.0: A Benchmark for Natural Language to Visualization under Ambiguity香港科技大学(HKUST) · 2025年
以上内容由遇见数据集搜集并总结生成



