hmxiong/3D_LLM
收藏Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hmxiong/3D_LLM
下载链接
链接失效反馈官方服务:
资源简介:
该数据集专为3D_LLM训练设计,包含了预处理好的点云信息、ScanQA训练集与验证集、预训练数据JSON文件等。数据集还提供了处理数据ID的脚本和用于Q-Former结构的Bert权重。此外,数据集缺失了一个重要的文件,即voxelized_features_sam_nonzero_preprocess,该文件是特征提取后的数据,占用空间220G。
该数据集专为3D_LLM训练设计,包含了预处理好的点云信息、ScanQA训练集与验证集、预训练数据JSON文件等。数据集还提供了处理数据ID的脚本和用于Q-Former结构的Bert权重。此外,数据集缺失了一个重要的文件,即voxelized_features_sam_nonzero_preprocess,该文件是特征提取后的数据,占用空间220G。
提供机构:
hmxiong
原始信息汇总
3D_LLM训练数据集概述
数据集内容
-
预处理点云信息
- 文件夹:
/voxelized_voxels_sam_nonzero_preprocess - 描述:提前进行预处理好的点云信息。
- 文件夹:
-
ScanQA数据集
- 文件夹:
/ScanQA - 描述:包含完整的ScanQA原版训练集与验证集。
- 文件夹:
-
预训练数据文件
- 文件:
data_part2_scene_v2.json - 描述:原版3D-LLM使用的预训练数据,但ID需要处理才能和场景ID对应上。
- 文件:
-
可直接使用的预训练数据
- 文件:
data_scene_v2.json - 描述:可以直接使用的3D-LLM预训练数据,ID已经和场景ID对应上,所有出现的场景均为ScanNet中的场景。
- 文件:
-
预训练数据ID对应map
- 文件:
final_scene_map_dict_v2.json - 描述:预训练数据ID与原始的ScanNet数据ID对应map。
- 文件:
-
数据处理脚本
- 文件:
chang_3d_llm_train_id.py - 描述:用于处理预训练数据ID的脚本。
- 文件:
-
Bert权重
- 文件夹:
/bert-base-uncased - 描述:3D-LLM中使用的Q-Former结构的Bert权重。
- 文件夹:
-
SQA训练数据
- 文件:
SQA_***.json - 描述:用于训练SQA的数据。
- 文件:
缺失数据
- 预处理特征数据
- 文件夹:
voxelized_features_sam_nonzero_preprocess - 描述:已经用不同的模型将特征提取好之后的数据,占用空间220G。
- 文件夹:



