five

hmxiong/3D_LLM

收藏
Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hmxiong/3D_LLM
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专为3D_LLM训练设计,包含了预处理好的点云信息、ScanQA训练集与验证集、预训练数据JSON文件等。数据集还提供了处理数据ID的脚本和用于Q-Former结构的Bert权重。此外,数据集缺失了一个重要的文件,即voxelized_features_sam_nonzero_preprocess,该文件是特征提取后的数据,占用空间220G。

该数据集专为3D_LLM训练设计,包含了预处理好的点云信息、ScanQA训练集与验证集、预训练数据JSON文件等。数据集还提供了处理数据ID的脚本和用于Q-Former结构的Bert权重。此外,数据集缺失了一个重要的文件,即voxelized_features_sam_nonzero_preprocess,该文件是特征提取后的数据,占用空间220G。
提供机构:
hmxiong
原始信息汇总

3D_LLM训练数据集概述

数据集内容

  1. 预处理点云信息

    • 文件夹:/voxelized_voxels_sam_nonzero_preprocess
    • 描述:提前进行预处理好的点云信息。
  2. ScanQA数据集

    • 文件夹:/ScanQA
    • 描述:包含完整的ScanQA原版训练集与验证集。
  3. 预训练数据文件

    • 文件:data_part2_scene_v2.json
    • 描述:原版3D-LLM使用的预训练数据,但ID需要处理才能和场景ID对应上。
  4. 可直接使用的预训练数据

    • 文件:data_scene_v2.json
    • 描述:可以直接使用的3D-LLM预训练数据,ID已经和场景ID对应上,所有出现的场景均为ScanNet中的场景。
  5. 预训练数据ID对应map

    • 文件:final_scene_map_dict_v2.json
    • 描述:预训练数据ID与原始的ScanNet数据ID对应map。
  6. 数据处理脚本

    • 文件:chang_3d_llm_train_id.py
    • 描述:用于处理预训练数据ID的脚本。
  7. Bert权重

    • 文件夹:/bert-base-uncased
    • 描述:3D-LLM中使用的Q-Former结构的Bert权重。
  8. SQA训练数据

    • 文件:SQA_***.json
    • 描述:用于训练SQA的数据。

缺失数据

  • 预处理特征数据
    • 文件夹:voxelized_features_sam_nonzero_preprocess
    • 描述:已经用不同的模型将特征提取好之后的数据,占用空间220G。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作