S3DIS Dataset|3D场景解析数据集|室内空间分析数据集
收藏数据集概述
数据集下载
- 预处理后的HDF5训练数据可通过执行
sh download_data.sh
下载。 - 可选地,可下载3D室内解析数据集(S3DIS Dataset)版本1.2,用于测试和可视化,下载链接为S3DIS Dataset。
数据准备
- 若需自行准备HDF5数据,首先需下载3D室内解析数据集,然后使用
python collect_indoor3d_data.py
进行数据重组,并使用python gen_indoor3d_h5.py
生成HDF5文件。
训练
- 训练前需下载或自行准备HDF5文件,使用命令
python train.py --log_dir log6 --test_area 6
启动训练,默认使用基于vanilla PointNet的简单模型,测试集为Area 6。
测试
-
测试前需下载3D室内解析数据集并预处理,使用
batch_inference.py
命令对测试集中的房间进行分割。例如,测试model6的命令为:python batch_inference.py --model_path log6/model.ckpt --dump_dir log6/dump --output_filelist log6/output_filelist.txt --room_data_filelist meta/area6_data_label.txt --visu
-
测试结果将在
log6/dump
中生成OBJ文件用于预测可视化。
评估
- 评估6个模型在其对应测试区域的整体分割准确性,使用
eval_iou_accuracy.py
生成点分类准确率和IoU,如论文所述。

CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
2000-2018年中国典型生态系统植物生长节律数据
该数据集涵盖了森林、草地、荒漠、沼泽、农田生态系统2000年-2020年CERN长期定位监测的植物物候数据和主要作生育期数据,包括木本植物、草本植物、水稻、小麦、玉米物候数据表,木本植物数据表有18个台站、291个物种的芽开放期、展叶期、开花始期、开花盛期、果实或种子成熟期、叶秋季变色期和落叶期共计3814条记录;草本植物数据表有22个台站、312个物种的萌动期、开花期、果实或种子成熟期、种子散布期和黄枯期共计3032条数据;水稻数据表有9个台站的出苗期、拔节期、蜡熟期等10个生育期共551条记录;小麦数据表有9个台站不同生育期382条记录;玉米数据表有18个台站不同生育期532条数据。
地球大数据科学工程 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
Houston2013, Berlin, Augsburg
本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。
arXiv 收录