five

Pix3D|3D建模数据集|计算机视觉数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
3D建模
计算机视觉
下载链接:
https://opendatalab.org.cn/OpenDataLab/Pix3D
下载链接
链接失效反馈
资源简介:
我们从单个图像研究3D形状建模,并在三个方面对其做出贡献。首先,我们介绍了 Pix3D,这是一个具有像素级 2D-3D 对齐的各种图像形状对的大规模基准。 Pix3D 在形状相关的任务中有着广泛的应用,包括重建、检索、视点估计等。然而,构建这样一个大规模的数据集是非常具有挑战性的;现有数据集要么仅包含合成数据,要么缺乏 2D 图像和 3D 形状之间的精确对齐,或者只有少量图像。其次,我们通过行为研究校准了 3D 形状重建的评估标准,并用它们来客观、系统地对 Pix3D 上的尖端重建算法进行基准测试。第三,我们设计了一个同时执行 3D 重建和姿态估计的新模型;我们的多任务学习方法在这两个任务上都实现了最先进的性能。
提供机构:
OpenDataLab
创建时间:
2022-05-09
AI搜集汇总
数据集介绍
main_image_url
构建方式
Pix3D数据集的构建基于对大量室内场景图像的深度分析与三维重建。研究团队通过先进的计算机视觉技术,从公开的室内设计图像库中筛选出高质量的图像,并利用多视角几何和深度学习算法,对这些图像进行三维模型的重建。这一过程不仅包括对物体形状的精确捕捉,还涉及纹理映射和光照条件的模拟,以确保生成的三维模型在视觉上与原始图像高度一致。
特点
Pix3D数据集的显著特点在于其高精度的三维模型和丰富的纹理信息。该数据集包含了多种室内家具和装饰品的详细三维模型,每个模型都附带有相应的二维图像和标注信息,便于研究者进行多模态数据分析。此外,Pix3D还提供了多样化的场景布局和光照条件,使得研究者能够在不同环境下测试和验证其算法。
使用方法
Pix3D数据集适用于多种计算机视觉和图形学研究任务,如三维物体识别、场景理解、以及虚拟现实中的环境建模。研究者可以通过加载数据集中的三维模型和二维图像,进行深度学习模型的训练和测试。此外,Pix3D还支持多视角图像的生成和分析,为研究者提供了丰富的实验数据。数据集的开放性和多样性,使其成为推动相关领域研究的重要资源。
背景与挑战
背景概述
Pix3D数据集由斯坦福大学和Adobe研究院的研究团队于2018年创建,旨在推动三维物体识别与重建领域的发展。该数据集包含了从互联网上收集的超过10,000张图像,每张图像都对应一个三维模型,涵盖了家具、电器等多种日常物品。Pix3D的核心研究问题是如何在二维图像中准确识别并重建三维物体,这对于增强现实、机器人视觉和智能家居等领域具有重要意义。该数据集的发布极大地促进了计算机视觉和图形学领域的研究,为研究人员提供了一个标准化的测试平台,推动了相关技术的进步。
当前挑战
Pix3D数据集在构建过程中面临了多重挑战。首先,图像与三维模型之间的对应关系需要精确建立,这要求高精度的图像识别和匹配技术。其次,数据集的多样性和复杂性带来了数据标注和处理的困难,如何确保标注的一致性和准确性是一个重要问题。此外,三维模型的重建精度依赖于图像的质量和视角,不同视角下的物体变形和遮挡问题增加了重建的复杂性。最后,数据集的规模和多样性要求高效的算法和计算资源,如何在有限的资源下实现高效的三维重建是一个持续的挑战。
发展历史
创建时间与更新
Pix3D数据集由斯坦福大学和Adobe研究院于2018年联合创建,旨在为三维形状重建和图像合成提供高质量的二维图像和三维模型对齐数据。该数据集自创建以来,未有公开的更新记录。
重要里程碑
Pix3D数据集的发布标志着计算机视觉领域在三维形状重建和图像合成方面的重要进展。其包含了来自9个类别的383个对象的10,000多张图像,以及相应的三维模型,为研究人员提供了丰富的数据资源。这一数据集的推出,极大地推动了基于图像的三维重建技术的发展,尤其是在深度学习和计算机视觉算法的训练和验证方面。
当前发展情况
目前,Pix3D数据集已成为三维形状重建和图像合成研究中的重要基准。其在学术界和工业界的广泛应用,促进了相关算法的创新和性能提升。随着深度学习技术的不断进步,Pix3D数据集的应用范围也在不断扩展,从最初的物体识别和三维重建,逐渐延伸到虚拟现实、增强现实和机器人视觉等多个领域。该数据集的持续影响力,为未来的研究提供了坚实的基础和丰富的灵感。
发展历程
  • Pix3D数据集首次发表于CVPR(计算机视觉与模式识别会议),由上海交通大学和微软亚洲研究院共同发布。该数据集旨在为三维物体检测和重建提供高质量的二维图像和三维模型对齐数据。
    2018年
  • Pix3D数据集首次应用于三维物体检测和重建研究,显著提升了相关算法在真实世界图像上的性能。
    2019年
  • Pix3D数据集被广泛应用于多个计算机视觉领域的研究,包括但不限于三维形状匹配、场景理解以及增强现实技术。
    2020年
  • Pix3D数据集的扩展版本发布,增加了更多的物体类别和场景多样性,进一步推动了三维视觉研究的发展。
    2021年
常用场景
经典使用场景
在计算机视觉领域,Pix3D数据集以其丰富的三维物体模型和对应的二维图像而著称。该数据集广泛应用于三维重建、物体检测和图像分割等经典场景。通过提供精确的二维图像与三维模型对应关系,Pix3D为研究人员提供了一个标准化的基准,用以评估和改进现有算法的性能。
衍生相关工作
基于Pix3D数据集,许多经典工作得以展开。例如,研究人员利用Pix3D进行深度学习模型的训练,开发出更高效的三维重建算法。此外,Pix3D还激发了关于多视角图像合成和三维模型生成的新研究方向。这些衍生工作不仅丰富了计算机视觉领域的研究内容,还为实际应用提供了更多可能性。
数据集最近研究
最新研究方向
在计算机视觉领域,Pix3D数据集近期研究聚焦于三维物体建模与识别的精细化处理。该数据集包含了丰富的二维图像与对应的三维模型,为研究者提供了多视角、多尺度的数据支持。前沿研究方向包括利用深度学习技术提升三维重建的精度和效率,以及探索如何将二维图像中的语义信息有效映射到三维模型中。此外,Pix3D数据集还被广泛应用于增强现实(AR)和虚拟现实(VR)领域,推动了这些技术在实际应用中的表现和用户体验的提升。
相关研究论文
  • 1
    Pix3D: Dataset and Methods for Single-Image 3D Shape ModelingUniversity of California, Berkeley · 2018年
  • 2
    3D Shape Reconstruction from 2D Images with Disentangled Attribute FlowTsinghua University · 2020年
  • 3
    Learning to Reconstruct 3D Objects with a GANStanford University · 2019年
  • 4
    3D-R2N2: A Unified Approach for Single and Multi-view 3D Object ReconstructionUniversity of California, Berkeley · 2016年
  • 5
    Pix2Vox: Context-aware 3D Reconstruction from Single and Multi-view ImagesTsinghua University · 2019年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域地面气象要素驱动数据集 v2.0(1951-2024)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 74 年(1951~2024 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。

国家青藏高原科学数据中心 收录

EdNet

displayName: EdNet license: - CC BY-NC 4.0 paperUrl: https://arxiv.org/pdf/1912.03072v3.pdf publishDate: "2019" publishUrl: https://github.com/riiid/ednet publisher: - University of Michigan - Yale University - University of California, Berkeley - Riiid AI Research tags: - Student Activities taskTypes: - Knowledge Tracing --- # 数据集介绍 ## 简介 圣诞老人收集的各种学生活动的大规模分层数据集,一个配备人工智能辅导系统的多平台自学解决方案。 EdNet 包含 2 年多来收集的 784,309 名学生的 131,441,538 次互动,这是迄今为止向公众发布的 ITS 数据集中最大的。资料来源:EdNet:教育中的大规模分层数据集 ## 引文 ``` @inproceedings{choi2020ednet, title={Ednet: A large-scale hierarchical dataset in education}, author={Choi, Youngduck and Lee, Youngnam and Shin, Dongmin and Cho, Junghyun and Park, Seoyon and Lee, Seewoo and Baek, Jineon and Bae, Chan and Kim, Byungsoo and Heo, Jaewe}, booktitle={International Conference on Artificial Intelligence in Education}, pages={69--73}, year={2020}, organization={Springer} } ``` ## Download dataset :modelscope-code[]{type="git"}

魔搭社区 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

MHEALTH Dataset

该数据集名为MHEALTH,包含了12种人类活动,这些活动是由10位不同的受试者进行的,每位受试者在左脚踝和右手腕上佩戴了运动传感器。数据由128个时间步长的序列组成;正常活动被标记为正常,而其他活动被视为异常。该数据集具有18个维度,来自10位受试者,其任务是进行异常检测。

arXiv 收录

SWaT Dataset

SWaT Dataset是一个用于工业控制系统(ICS)安全研究的数据集,包含了模拟的网络攻击和正常操作的数据。该数据集由新加坡科技设计大学(Singapore University of Technology and Design)发布,旨在帮助研究人员开发和测试用于检测工业控制系统中网络攻击的算法和模型。

itrust.sutd.edu.sg 收录