onandon/SOLE
收藏Hugging Face2024-05-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/onandon/SOLE
下载链接
链接失效反馈官方服务:
资源简介:
SOLE模型是一个高度通用的模型,能够根据各种语言指令(如视觉问题、属性描述和功能描述)分割相应的实例。该数据集包含了预处理的三维数据(如ScanNet和ScanNet200)、预计算的CLIP特征、MCA和MEA特征,以及模型的权重文件。预处理的数据集通过运行特定的Python脚本进行处理,预计算的CLIP特征提供了每个点的特征向量,MCA特征提供了每个实例的生成描述及其对应的CLIP文本特征,MEA特征提供了每个实例的实体级描述的CLIP文本特征。
SOLE模型是一个高度通用的模型,能够根据各种语言指令(如视觉问题、属性描述和功能描述)分割相应的实例。该数据集包含了预处理的三维数据(如ScanNet和ScanNet200)、预计算的CLIP特征、MCA和MEA特征,以及模型的权重文件。预处理的数据集通过运行特定的Python脚本进行处理,预计算的CLIP特征提供了每个点的特征向量,MCA特征提供了每个实例的生成描述及其对应的CLIP文本特征,MEA特征提供了每个实例的实体级描述的CLIP文本特征。
提供机构:
onandon
原始信息汇总
数据集概述
数据集名称
- Segment Any 3D Object with Language
数据集内容
-
预处理数据
- 3D数据
- ScanNet
- ScanNet200
- 预计算的每个点CLIP特征
- ScanNet
- 预计算的MCA和MEA特征
- ScanNet: MCA, MEA
- ScanNet200: MCA, MEA
- 3D数据
-
权重
- 主干网络权重
- ScanNet
- ScanNet200
- 官方权重
- ScanNet
- ScanNet200
- 主干网络权重
数据集配置
- 预处理数据
- 通过运行
datasets/preprocessing/scannet_preprocessing.py脚本处理官方ScanNet数据集。
- 通过运行
- 预计算的每个点CLIP特征
- 提供每个场景中点的CLIP特征,形状为
torch.Size([N, 768])。
- 提供每个场景中点的CLIP特征,形状为
- 预计算的MCA特征
- 提供每个场景实例的生成标题和相应的CLIP文本特征。
- 预计算的MEA特征
- 提供每个场景实例的实体级标题的CLIP文本特征。
数据集许可证
- MIT
任务类别
- 目标检测
语言
- 英语
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



