five

S3DIS Dataset|3D场景解析数据集|室内空间分析数据集

收藏
github2023-11-23 更新2024-05-31 收录
3D场景解析
室内空间分析
下载链接:
https://github.com/kargarisaac/PointNet-SemSeg-indoor3d-dataset
下载链接
链接失效反馈
资源简介:
用于3D室内场景解析的数据集,版本1.2。该数据集用于训练和测试,支持数据预处理和模型评估。

A dataset for 3D indoor scene parsing, version 1.2. This dataset is designed for training and testing purposes, supporting data preprocessing and model evaluation.
创建时间:
2018-07-11
原始信息汇总

数据集概述

数据集下载

  • 预处理后的HDF5训练数据可通过执行sh download_data.sh下载。
  • 可选地,可下载3D室内解析数据集(S3DIS Dataset)版本1.2,用于测试和可视化,下载链接为S3DIS Dataset

数据准备

  • 若需自行准备HDF5数据,首先需下载3D室内解析数据集,然后使用python collect_indoor3d_data.py进行数据重组,并使用python gen_indoor3d_h5.py生成HDF5文件。

训练

  • 训练前需下载或自行准备HDF5文件,使用命令python train.py --log_dir log6 --test_area 6启动训练,默认使用基于vanilla PointNet的简单模型,测试集为Area 6。

测试

  • 测试前需下载3D室内解析数据集并预处理,使用batch_inference.py命令对测试集中的房间进行分割。例如,测试model6的命令为:

    python batch_inference.py --model_path log6/model.ckpt --dump_dir log6/dump --output_filelist log6/output_filelist.txt --room_data_filelist meta/area6_data_label.txt --visu

  • 测试结果将在log6/dump中生成OBJ文件用于预测可视化。

评估

  • 评估6个模型在其对应测试区域的整体分割准确性,使用eval_iou_accuracy.py生成点分类准确率和IoU,如论文所述。
AI搜集汇总
数据集介绍
main_image_url
构建方式
S3DIS数据集的构建过程涉及对原始3D室内解析数据集的预处理和转换。首先,用户需下载原始数据集,随后通过`collect_indoor3d_data.py`脚本对数据进行重新组织,以便于后续处理。接着,使用`gen_indoor3d_h5.py`脚本将重新组织后的数据转换为HDF5格式,以便于高效存储和快速访问。这一过程确保了数据集在训练和测试阶段的高效利用。
特点
S3DIS数据集的主要特点在于其专注于室内场景的语义分割,提供了丰富的3D点云数据,涵盖了多种室内环境。数据集的版本1.2经过精心处理,确保了数据的质量和一致性。此外,数据集支持6折交叉验证,通过在不同区域间轮换训练和测试集,增强了模型的泛化能力。
使用方法
使用S3DIS数据集进行训练时,用户可以选择下载预处理好的HDF5文件,或自行准备数据。训练过程通过`train.py`脚本启动,默认使用基于PointNet的简单模型。测试阶段则需使用`batch_inference.py`脚本对测试集进行分割,并生成预测结果的可视化OBJ文件。最终,通过`eval_iou_accuracy.py`脚本评估模型的分割准确性和IoU指标。
背景与挑战
背景概述
S3DIS数据集,全称为Stanford Large-Scale 3D Indoor Spaces Dataset,是由斯坦福大学创建的室内场景语义分割数据集。该数据集的核心研究问题在于如何有效地对室内场景中的三维点云数据进行语义分割,从而为室内导航、场景理解等应用提供基础。S3DIS数据集的创建时间为2016年,主要研究人员来自斯坦福大学的计算机视觉与几何实验室。该数据集包含了多个室内场景的详细三维点云数据,涵盖了多种室内物体和结构,如墙壁、家具、地板等。其影响力在于为三维点云处理和室内场景理解领域的研究提供了标准化的数据集,推动了相关算法的发展与评估。
当前挑战
S3DIS数据集在构建过程中面临了多个挑战。首先,室内场景的复杂性使得三维点云数据的采集和标注变得异常困难,需要高精度的设备和大量的手工标注工作。其次,数据集的规模庞大,如何高效地存储和处理这些数据成为了一个技术难题。此外,由于室内场景的多样性和复杂性,语义分割任务的准确性受到多种因素的影响,如光照变化、物体遮挡等。在算法层面,如何设计高效的模型以应对这些挑战,同时保持较高的分割精度,是当前研究的重点和难点。
常用场景
经典使用场景
S3DIS数据集在室内场景的语义分割任务中展现了其经典应用。该数据集通过提供详细的3D室内场景点云数据,支持研究人员和工程师训练和测试基于点云的深度学习模型,如PointNet。通过预处理和生成HDF5文件,用户可以高效地进行数据组织和模型训练,从而实现对室内场景中各个对象的精确语义分割。
实际应用
在实际应用中,S3DIS数据集被广泛用于机器人导航、增强现实和室内设计等领域。通过精确的语义分割,机器人可以更好地理解并导航复杂的室内环境,增强现实系统可以提供更逼真的交互体验,而室内设计工具则可以利用这些数据进行空间规划和布局优化。这些应用极大地提升了相关技术的实用性和用户体验。
衍生相关工作
基于S3DIS数据集,许多相关工作得以展开,包括改进的点云处理算法和更高效的模型训练方法。例如,研究者们提出了多种基于PointNet的变体模型,以提高分割精度和处理速度。此外,该数据集还促进了跨领域的研究,如结合图像和点云数据的混合模型,进一步推动了3D视觉技术的发展和应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

2000-2018年中国典型生态系统植物生长节律数据

该数据集涵盖了森林、草地、荒漠、沼泽、农田生态系统2000年-2020年CERN长期定位监测的植物物候数据和主要作生育期数据,包括木本植物、草本植物、水稻、小麦、玉米物候数据表,木本植物数据表有18个台站、291个物种的芽开放期、展叶期、开花始期、开花盛期、果实或种子成熟期、叶秋季变色期和落叶期共计3814条记录;草本植物数据表有22个台站、312个物种的萌动期、开花期、果实或种子成熟期、种子散布期和黄枯期共计3032条数据;水稻数据表有9个台站的出苗期、拔节期、蜡熟期等10个生育期共551条记录;小麦数据表有9个台站不同生育期382条记录;玉米数据表有18个台站不同生育期532条数据。

地球大数据科学工程 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

Houston2013, Berlin, Augsburg

本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。

arXiv 收录