ShapeSplat|3D光栅化数据集|机器学习数据集
收藏ShapeSplat-Gaussian-MAE 数据集概述
数据集简介
ShapeSplat 是一个大规模的 3D 高斯光栅化(3DGS)数据集,使用常用的 ShapeNet 和 ModelNet 数据集构建。该数据集包含来自 87 个独特类别的 65,000 个对象,其标签与各自的数据集保持一致。创建该数据集使用了相当于 2 个 GPU 年(在 TITAN XP GPU 上)的计算量。
数据集用途
该数据集主要用于无监督预训练和有监督微调,以用于分类和分割任务。通过该数据集,研究者可以探索 3D 高斯光栅化表示空间中的 3D 理解。
数据集特点
- 大规模: 包含 65,000 个对象。
- 多类别: 涵盖 87 个独特类别。
- 标签一致性: 标签与 ShapeNet 和 ModelNet 数据集保持一致。
- 计算资源: 创建过程使用了 2 个 GPU 年的计算量。
数据集构建方法
数据集的构建方法包括:
- 使用 ShapeNet 和 ModelNet 数据集。
- 利用 3D 高斯光栅化技术生成数据。
- 进行无监督预训练和有监督微调。
数据集相关研究
研究者通过该数据集引入了 Gaussian-MAE,突出了从高斯参数进行表示学习的独特优势,并提供了几个有价值的见解,包括:
- 优化后的 GS 中心的分布与均匀采样的点云相比有显著差异。
- 这种分布变化在仅使用中心时导致分类任务的性能下降,但分割任务的性能提升。
- 提出了在归一化特征空间中进行高斯特征分组,并结合散点池化层,有效分组和嵌入相似高斯,显著提升了微调任务的性能。
数据集发布计划
- 代码即将发布。
- 数据集发布:正在与 ShapeNet 团队积极讨论细节,将尽快提供更新。
引用
如果该数据集对您的研究有帮助,请考虑引用以下论文:
@misc{ma2024shapesplatlargescaledatasetgaussian, title={ShapeSplat: A Large-scale Dataset of Gaussian Splats and Their Self-Supervised Pretraining}, author={Qi Ma and Yue Li and Bin Ren and Nicu Sebe and Ender Konukoglu and Theo Gevers and Luc Van Gool and Danda Pani Paudel}, year={2024}, eprint={2408.10906}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2408.10906}, }

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录