five

ModelNet40-C|3D点云数据集|抗干扰数据集

收藏
arXiv2022-01-29 更新2024-07-30 收录
3D点云
抗干扰
下载链接:
https://github.com/jiachens/ModelNet40-C
下载链接
链接失效反馈
资源简介:
首个针对3D点云数据抗干扰能力的综合基准,包含15种常见且真实的干扰。
创建时间:
2022-01-29
原始信息汇总

数据集概述

数据集名称

ModelNet40-C

数据集描述

ModelNet40-C 是一个用于评估 3D 点云识别模型对常见损坏鲁棒性的基准数据集。该数据集基于 ModelNet40,包含了多种损坏类型的点云数据。

数据集下载

数据集生成

生成 ModelNet40-C 数据集的步骤如下:

  1. 下载 ModelNet40 数据集: bash ./download.sh modelnet40

  2. 生成 ModelNet40-C 数据集: bash python data/process.py python data/generate_c.py

注意:生成过程需要连接显示器,因为 Open3D 库不支持后台渲染。

预训练模型

预训练模型可以通过以下命令下载:

  • 标准训练的预训练模型: bash ./download.sh cor_exp

  • 使用不同数据增强策略的预训练模型: bash ./download.sh runs

数据集排行榜

架构+数据增强排行榜

Architecture Data Augmentation Corruption Error Rate (%) Clean Error Rate (%) Checkpoint
PCT PointCutMix-R 16.3 7.2 checkpoint
PCT PointCutMix-K 16.5 6.9 checkpoint
DGCNN PointCutMix-R 17.3 6.8 checkpoint
PCT RSMix 17.3 6.9 checkpoint
DGCNN PointCutMix-K 17.3 7.4 checkpoint
RSCNN PointCutMix-R 17.9 7.6 checkpoint
DGCNN RSMix 18.1 7.1 checkpoint
PCT PGD Adv Train 18.4 8.9 checkpoint
PointNet++ PointCutMix-R 19.1 7.1 checkpoint
PointNet++ PointMixup 19.3 7.1 checkpoint
PCT PointMixup 19.5 7.4 checkpoint
SimpleView PointCutMix-R 19.7 7.9 checkpoint
RSCNN PointMixup 19.8 7.2 checkpoint
PointNet++ PointCutMix-K 20.2 6.7 checkpoint

架构排行榜

Architecture Corruption Error Rate (%) Clean Error Rate (%) Checkpoint
CurveNet 22.7 6.6 checkpoint
PointNet++ 23.6 7.0 checkpoint
PCT 25.5 7.1 checkpoint
GDANet 25.6 7.5 checkpoint
DGCNN 25.9 7.4 checkpoint
RSCNN 26.2 7.7 checkpoint
SimpleView 27.2 6.1 checkpoint
PointNet 28.3 9.3 checkpoint
PointMLP 31.9 6.3 checkpoint
PointMLP-Elite 32.4 7.2 checkpoint

参考文献

  • Sun, Jiachen, et al. "Benchmarking Robustness of 3D Point Cloud Recognition against Common Corruptions." arXiv preprint arXiv:2201.12296 (2022).
  • Goyal, Ankit, et al. "Revisiting Point Cloud Shape Classification with a Simple and Effective Baseline." International Conference on Machine Learning (2021).
AI搜集汇总
数据集介绍
main_image_url
构建方式
ModelNet40-C 数据集的构建基于 ModelNet40,通过引入 15 种常见的和现实的 3D 点云数据损坏类型,每种损坏类型又分为 5 个严重级别,共计 75 种损坏情况。这些损坏类型被分为密度、噪声和变换三大类,涵盖了现实世界中点云数据可能遇到的各种失真情况。构建过程中,研究团队精心设计了这些损坏类型,确保它们在模拟现实应用场景的同时,仍能保留点云的原始语义信息。
特点
ModelNet40-C 数据集的主要特点在于其全面性和现实性。它不仅包含了多种常见的点云数据损坏类型,还通过不同的严重级别,提供了对模型鲁棒性进行细致评估的可能性。此外,该数据集的设计考虑了点云数据在安全关键应用中的重要性,旨在推动 3D 点云识别模型在面对数据损坏时的鲁棒性研究。
使用方法
ModelNet40-C 数据集主要用于测试和评估 3D 点云识别模型在面对常见数据损坏时的鲁棒性。研究者可以使用该数据集来测试现有模型的性能,并探索提高模型鲁棒性的方法。数据集应仅在测试阶段使用,而不应用于训练过程。通过在 ModelNet40-C 上的表现,可以评估模型在实际应用中可能遇到的挑战,从而指导模型设计和训练策略的改进。
背景与挑战
背景概述
在三维计算机视觉领域,点云数据因其灵活性和多样性而被广泛应用于自动驾驶、机器人、医学成像和虚拟现实等安全关键应用中。然而,深度神经网络在处理点云数据时的鲁棒性研究相对较少。为了填补这一研究空白,Jiachen Sun等人于2022年创建了ModelNet40-C数据集,这是首个针对三维点云数据鲁棒性的综合性基准测试。该数据集包含15种常见且现实的点云数据损坏类型,旨在评估现有最先进(SOTA)模型在面对这些损坏时的性能。通过深入分析,研究团队揭示了不同架构在点云识别中的鲁棒性差异,并提出了结合PointCutMix-R和TENT的简单有效方法来缩小性能差距。这项研究不仅为未来的点云数据鲁棒性研究提供了宝贵的见解,还推动了三维点云领域鲁棒训练策略和架构设计的发展。
当前挑战
ModelNet40-C数据集的构建和应用面临多重挑战。首先,点云数据的损坏类型多样且复杂,涵盖密度、噪声和变换等多种模式,这要求模型具备广泛的鲁棒性。其次,构建过程中需要确保损坏类型在各种应用场景中具有现实性,同时保持点云数据的原始语义。此外,评估现有模型的鲁棒性时,发现即使在干净数据上表现良好的模型,在面对损坏数据时性能显著下降,这表明现有模型在处理点云数据时存在固有的脆弱性。最后,尽管已有研究集中在对抗性攻击的鲁棒性上,但针对常见损坏的鲁棒性研究仍处于起步阶段,这为未来的研究提供了广阔的空间。
常用场景
经典使用场景
ModelNet40-C 数据集的经典使用场景在于评估和提升三维点云识别模型的鲁棒性。通过引入15种常见且现实的点云数据损坏类型,该数据集为研究人员提供了一个全面的基准,用于测试和比较现有最先进(SOTA)模型在面对这些损坏时的表现。这种评估不仅揭示了模型在清洁数据上的性能,还突显了其在真实世界应用中可能遇到的挑战,特别是在自动驾驶、机器人和医疗成像等安全关键领域。
衍生相关工作
ModelNet40-C 数据集的发布催生了一系列相关研究工作,特别是在三维点云处理和深度学习领域。例如,基于该数据集的研究已经提出了多种增强点云模型鲁棒性的方法,包括结合PointCutMix-R和TENT的简单有效策略。此外,Transformer架构在点云识别中的应用也因该数据集的分析而得到了进一步的验证和优化。这些研究不仅提升了现有模型的性能,还为未来的三维视觉任务提供了新的思路和方法。
数据集最近研究
最新研究方向
在三维点云识别领域,最新研究方向聚焦于提升模型对常见损坏的鲁棒性。ModelNet40-C数据集的引入,标志着对三维点云数据在实际应用中可能遇到的损坏情况进行系统评估的开始。该数据集包含15种常见且现实的损坏类型,揭示了现有最先进模型在面对这些损坏时的显著性能下降。研究者们通过结合PointCutMix-R和TENT等方法,提出了一种简单而有效的策略来缩小这一性能差距。此外,研究发现基于Transformer的架构在提升点云识别模型的鲁棒性方面表现出显著优势,预示着未来在三维视觉任务中采用此类架构的潜力。这些研究不仅为三维点云识别模型的鲁棒性训练提供了新的视角,也为开发更加健壮的架构和训练策略奠定了基础。
相关研究论文
  • 1
    Benchmarking Robustness of 3D Point Cloud Recognition Against Common Corruptions · 2022年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

长江干流实时水位观测数据集(2024年)

该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。

国家地球系统科学数据中心 收录

MedChain

MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。

arXiv 收录