3dvs2026_papers
收藏github2026-03-17 更新2026-03-19 收录
下载链接:
https://github.com/harpreetsahota204/awesome_3DVision_2026_conference
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了2026年3D视觉会议上接受的论文,这些论文已被解析为FiftyOne格式。
This dataset contains papers accepted at the 2026 Conference on 3D Vision, all of which have been parsed into the FiftyOne format.
创建时间:
2026-03-17
原始信息汇总
数据集概述
数据集基本信息
- 数据集名称: Awesome 3DV 2026 Papers
- 关联会议: 3DV 2026 — 13th International Conference on 3D Vision (2026年3月20-23日,温哥华)
- 数据格式: 已解析为FiftyOne格式的已接收论文
- 数据集卡片: 可查看 DATASET_CARD.md
- 数据源: 该数据集托管于 Voxel51 Hugging Face Org
数据集获取与使用
-
安装依赖:
pip install -U fiftyone -
加载数据集: python import fiftyone as fo from fiftyone.utils.huggingface import load_from_hub dataset = load_from_hub("Voxel51/3dvs2026_papers")
-
启动应用:
session = fo.launch_app(dataset)
数据集内容主题分类
数据集包含以下10个研究主题的论文信息,括号内为各主题的论文数量:
- 3D生成与编辑 (23)
- 3D重建与新视角合成 (58)
- 自动驾驶与户外感知 (7)
- 深度与立体估计 (5)
- 动态与4D场景 (13)
- 几何视觉基础 (18)
- 手-物与人与场景交互 (9)
- 人体化身与运动 (28)
- 新型传感器与专业领域 (3)
- 语义3D理解 (12)
数据记录示例(以“3D生成与编辑”主题部分论文为例)
数据集以表格形式组织论文信息,包含以下字段:
| 标题 | 作者 | 所属机构 | 会议环节 | 摘要(开头部分) | 链接 | 贡献类型 |
|---|---|---|---|---|---|---|
| 3D-GENERALIST: Vision-Language-Action Models for Crafting 3D Worlds | Fan-Yun Sun, Shengguang Wu, Christian Jacobsen, 等 | Stanford University, NVIDIA | Poster 6 · 11:00 | Creating 3D graphics content for immersive and interactive worlds remains labor-intensive, limiting our ability to create large-scale synthetic data that can serve as training data to foundation models. Recent methods have been proposed to alleviate this, but they often focus on one particular aspec… | PDF Project Page | Model, Method |
| A Scalable Attention-Based Approach for Image-to-3D Texture Mapping | Arianna Rampini, Kanika Madan, Bruno Roy, 等 | Autodesk Research, Mila & Autodesk Research | Poster 5 · 15:30 | High-quality textures are critical for realistic 3D content creation, yet existing generative methods are slow, rely on UV maps, and often fail to remain faithful to a reference image. To address these challenges, we propose a transformer-based framework that predicts a 3D texture field directly fro… | Method | |
| CamC2V: Context-aware Controllable Video Generation | Luis Denninger, Sina Mokhtarzadeh Azar, Juergen Gall | University of Bonn, Lamarr Institute for Machine Learning and Artificial Intelligence | Poster 5 · 15:30 | Recently, image-to-video (I2V) diffusion models have demonstrated impressive scene understanding and generative quality, incorporating image conditions to guide generation. However, these models primarily animate static images without extending beyond their provided context. Introducing additional c… | PDF Project Page | Model, Method |
注: 上表仅展示部分字段和记录示例。完整数据集包含所有主题下的论文,每条记录均包含标题、作者、机构、会议环节、摘要、资源链接(PDF、项目主页等)以及贡献类型标识(如Model, Method, Dataset)。
搜集汇总
数据集介绍

构建方式
在三维视觉研究领域,系统化的学术资源整合对推动前沿进展至关重要。3dvs2026_papers数据集通过解析第十三届国际三维视觉会议(3DV 2026)的录用论文构建而成,其核心方法是将会议官方接受的论文元数据转换为结构化的FiftyOne格式。这一过程涉及自动化提取每篇论文的标题、作者、所属机构、会议场次、摘要、原文链接及贡献类型等关键信息,并按照生成编辑、重建合成、自动驾驶感知、深度估计、动态场景、几何基础、交互理解、人体建模、新型传感器、语义理解等十大主题进行分类整理,从而形成一个可供机器直接读取与可视化探索的标准化知识库。
特点
该数据集显著特点在于其高度的结构化和主题导向性。它不仅收录了涵盖三维视觉全领域的学术论文,更通过精细的元数据标注与分类体系,呈现出清晰的学术脉络。每篇论文均附带标准化标识,如模型、方法、数据集等贡献类型标签,便于研究者快速识别论文性质。数据集以FiftyOne格式存储,支持动态可视化查询与交互式浏览,使得用户能够直观把握会议热点分布与技术趋势。这种设计既保留了学术会议的权威性,又赋予了数据以机器可操作的灵活性,为三维视觉领域的文献调研与知识发现提供了高效工具。
使用方法
对于希望利用该数据集的研究者而言,其使用流程简洁而高效。用户需首先安装FiftyOne库,随后通过调用专门的Hugging Face数据加载接口,即可将数据集轻松导入本地环境。数据加载后,用户可启动FiftyOne交互式应用界面,以可视化方式浏览所有论文条目,并根据主题、作者、贡献类型等多种维度进行筛选与检索。该数据集可直接服务于文献综述、研究趋势分析、相关论文查找等场景,其结构化格式也便于进一步的数据挖掘与自动化处理,为三维视觉领域的学术研究提供了即用型的数据支撑。
背景与挑战
背景概述
三维视觉作为计算机视觉领域的重要分支,致力于从二维图像或视频中恢复和理解三维世界的结构与动态。随着虚拟现实、增强现实以及自动驾驶等技术的迅猛发展,对高质量三维数据的需求日益迫切。3dvs2026_papers数据集应运而生,由Voxel51机构于2026年国际三维视觉会议(3DV 2026)期间创建并发布。该数据集系统性地收录了会议接收的学术论文,涵盖三维生成与编辑、三维重建与新视角合成、自动驾驶与室外感知等多个前沿主题。其核心研究问题聚焦于推动三维内容生成、场景理解及交互技术的创新,通过提供结构化的论文元数据,为研究人员提供了便捷的文献检索与分析平台,显著促进了三维视觉领域最新成果的传播与交叉融合。
当前挑战
该数据集旨在解决三维视觉领域内诸多复杂问题的文献整合与知识发现挑战,具体包括如何高效地从海量学术文献中提取并结构化关键信息,以支持跨主题的趋势分析与方法比较。在构建过程中,挑战主要源于论文数据的异构性与规模性。需要从多样化的来源(如OpenReview、项目主页)准确解析论文的标题、作者、摘要、贡献类型及链接,并确保数据格式的统一与完整性。同时,面对快速演进的研究方向,如何动态更新分类体系以涵盖新兴主题(如高斯溅射编辑、神经表面表示),并维持数据集的时效性与权威性,亦是构建过程中需克服的关键难题。
常用场景
经典使用场景
在三维视觉领域,数据集作为研究进展的集合,其经典使用场景体现在为学术界提供系统化的文献索引与知识图谱构建。通过将国际会议收录的论文结构化整理为标准化格式,研究人员能够高效地检索和比较不同主题下的创新方法,例如三维生成与编辑、重建与视图合成等前沿方向。这种组织形式不仅加速了文献调研过程,还促进了跨领域方法的交叉验证与灵感激发,成为推动学科发展的关键基础设施。
实际应用
在实际应用层面,此类数据集为工业界与学术界搭建了桥梁,直接服务于虚拟现实、自动驾驶、数字内容创作等关键领域。例如,基于数据集中的生成式模型研究,企业能够开发自动化三维场景构建工具,大幅降低游戏开发与影视特效的制作成本。同时,在机器人交互与室内设计等场景中,数据集衍生的布局生成技术为智能系统提供了可扩展的仿真环境,推动了实体人工智能的落地进程。
衍生相关工作
围绕该数据集衍生的经典工作涵盖了多个三维视觉子领域的前沿探索。例如,在三维生成方向,PASTA等自回归变换器架构推动了部件感知的形状生成;在编辑任务中,VoxHammer实现了无需训练的原生空间精确编辑。这些工作不仅拓展了神经渲染、扩散模型等技术在三维领域的应用边界,还催生了如语义布局合成、高斯溅射变形等一系列创新方法,共同构筑了当前三维内容生成与理解的技术体系。
以上内容由遇见数据集搜集并总结生成



