five

ZackaryJing/dm-cad.lmdb

收藏
Hugging Face2026-04-02 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/ZackaryJing/dm-cad.lmdb
下载链接
链接失效反馈
官方服务:
资源简介:
# Multimodal CAD Dataset A comprehensive multimodal dataset for CAD (Computer-Aided Design) understanding and generation tasks. ## Description This dataset contains multiple modalities of CAD data, designed for research in CAD understanding, generation, and multi-modal learning. Each CAD model is represented in several complementary formats. ## Data Modalities | Modality | Directory | Format | Description | |----------|-----------|--------|-------------| | **Description** | `cad_desc/` | JSON | Natural language descriptions of CAD models | | **Image** | `cad_img/` | PNG | Multi-view renderings (8 views per model) | | **Point Cloud** | `cad_ply/` | PLY | 3D point cloud representations | | **STEP** | `cad_step/` | STEP | Original CAD parametric format | | **Vector** | `cad_vec/` | TXT | Vector representations of CAD commands | | **JSON** | `cad_json/` | JSON | Structured CAD parameter data | ## Data Organization - `cad_img/{category}/{model_id}/{view}.png` - Images organized by category and model ID - `cad_vec/{category}/{model_id}/{file}.txt` - Vector files organized similarly - `cad_desc/{id}.json` - Description files with numeric IDs - `cad_ply/{category}/{model_id}.ply` - Point cloud files - `cad_step/{category}/{model_id}.step` - STEP files - `cad_json/{category}/{model_id}.json` - JSON parameter files ## Data Splits The dataset is divided into train/validation/test splits. The ID lists are provided in: - `train_ids.txt` - Training set IDs (models that have all modalities) - `valid_ids.txt` - Validation set IDs - `test_ids.txt` - Test set IDs These IDs represent the **intersection** of models that have all three core modalities: - `cad_vec` (vector commands) - `cad_img` (rendered images) - `cad_desc` (descriptions) ## Statistics See `partition_stats.json` for detailed statistics including: - Total counts per modality - Train/valid/test split sizes - Missing data counts per modality ## Usage This dataset is intended for research purposes, including but not limited to: - CAD generation from text descriptions - Multi-view CAD understanding - Cross-modal retrieval (text-to-CAD, image-to-CAD) - CAD representation learning ## License This dataset is provided for research purposes. ## Citation If you use this dataset in your research, please cite our work (citation to be added). ## Contact For questions or issues, please open an issue on the repository.

# 多模态计算机辅助设计数据集(Multimodal CAD Dataset) 本数据集为面向计算机辅助设计(CAD,Computer-Aided Design)理解与生成任务的综合性多模态数据集。 ## 数据集简介 本数据集包含多模态CAD数据,旨在支撑CAD理解、生成及多模态学习领域的研究工作。每个CAD模型均以多种互补格式进行存储与呈现。 ## 数据模态 | 模态类型 | 存储目录 | 文件格式 | 说明 | |----------|-----------|--------|-------------| | **自然语言描述** | `cad_desc/` | JSON | 用于存储CAD模型的自然语言描述文本 | | **图像** | `cad_img/` | PNG | 多视角渲染图(单模型共8个视角) | | **点云** | `cad_ply/` | PLY | 三维点云表征形式 | | **STEP格式文件** | `cad_step/` | STEP | 原始CAD参数化格式文件 | | **向量表征** | `cad_vec/` | TXT | CAD指令的向量表示 | | **结构化参数数据** | `cad_json/` | JSON | 结构化CAD参数数据集 | ## 数据组织方式 - `cad_img/{类别}/{模型ID}/{视角编号}.png`:按类别与模型ID组织的图像文件 - `cad_vec/{类别}/{模型ID}/{文件}.txt`:采用相同组织方式的向量文件 - `cad_desc/{数字ID}.json`:采用数字ID命名的描述文件 - `cad_ply/{类别}/{模型ID}.ply`:点云文件 - `cad_step/{类别}/{模型ID}.step`:STEP格式文件 - `cad_json/{类别}/{模型ID}.json`:JSON格式参数文件 ## 数据集划分 本数据集已划分为训练集、验证集与测试集,各集合的ID列表存储于以下文件: - `train_ids.txt`:训练集ID列表(包含全部模态的模型) - `valid_ids.txt`:验证集ID列表 - `test_ids.txt`:测试集ID列表 上述ID均为同时具备以下三类核心模态的模型的唯一标识:`cad_vec`(CAD指令向量)、`cad_img`(渲染图像)与`cad_desc`(自然语言描述)。 ## 统计信息 可通过`partition_stats.json`文件查看详细统计信息,包括: - 各模态的数据总规模 - 训练/验证/测试集的划分尺寸 - 各模态的数据缺失量 ## 使用场景 本数据集仅用于学术研究,适用场景包括但不限于: - 基于文本描述的CAD模型生成 - 多视角CAD模型理解 - 跨模态检索(文本转CAD、图像转CAD) - CAD表征学习 ## 授权协议 本数据集仅用于学术研究用途。 ## 引用说明 若您在研究中使用本数据集,请引用本工作(引用信息待补充)。 ## 联系方式 如有疑问或问题,请在代码仓库中提交Issue。
提供机构:
ZackaryJing
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作