MajutsuDataset

Hugging Face2026-01-15 更新2026-01-16 收录

下载链接：

https://huggingface.co/datasets/SereinH/MajutsuDataset

下载链接

链接失效反馈

官方服务：

资源简介：

MajutsuDataset是一个包含布局/高程、3D建筑模型、材质资产和天空盒的多组件数据集。布局/高程部分包含分割地图和高程地图，3D建筑模型部分包含不同方法和艺术风格的3D模型及其描述，材质资产部分包含来自ambientCG和PolyHeaven的材质纹理和描述文件，天空盒部分包含HDR文件和可视化图像及其描述。

创建时间：

2026-01-05

原始信息汇总

MajutsuDataset 数据集概述

数据集结构

数据集包含四个主要部分：布局/高程图、3D建筑模型、材质资产和天空盒。

1. 布局/高程图 (Layout/Elevation)

路径： ./layout
内容：
- 布局分割图 (seg/<name>_seg_color.png)。
- 高程图 (depth/<name>_bld_instance_u8.png)，格式为uint8。
数据划分文件：
- 分割图生成列表：seg_generation_<train / val>.txt，内容格式为 <image_name, image_relative_path, caption>。
- 高度图生成列表：height_generation_<train / val>.txt，内容格式为 <depth_name, seg_relative_path, depth_relative_path>。

2. 3D建筑模型 (3D Building Models)

路径： ./3D
内容： 包含多种方法生成的3D模型，涵盖不同艺术风格。
方法： hitem3d, hunyuan3d, hyper3d, meshy, tripo。
艺术风格： christmas, cyberpunk, european, genshin, ghibli, halloween, mc, springfest, techical, vangogh。
文件结构：
- 描述文件：caption/caption_<num>.txt。
- 参考图像：images/image_<num>.png。
- 3D模型：models/model_<num>.glb。

3. 材质资产 (Material Assets)

路径： ./material
内容： 包含来自两个来源的材质纹理贴图集。
AmbientCG数据集：
- 文件包括：基础色图、高度图、金属度图、DirectX法线图、OpenGL法线图、粗糙度图、材质描述文件 (.mltx)、通用场景描述文件 (.usdc)、预览图以及描述文件 (caption.txt)。
PolyHeaven数据集：
- 文件包括：环境光遮蔽图、ARM打包图、漫反射图、高度图、DirectX法线图、OpenGL法线图、粗糙度图以及描述文件 (caption.txt)。

4. 天空盒 (Skybox)

路径： ./skybox
内容： 每个天空盒包含一个HDR文件 (<skybox_name>.hdr)、一个可视化图像 (<skybox_name>.png) 和一个描述文件 (caption.txt)。

搜集汇总

数据集介绍

构建方式

在三维场景生成与建筑可视化领域，MajutsuDataset的构建体现了系统化的数据整合策略。该数据集通过精心组织的目录结构，将布局高程图、三维建筑模型、材质资产及天空盒资源分门别类。布局部分包含语义分割图与高程图，并配有对应的文本描述文件；三维模型则按生成方法与艺术风格细分，每个模型均附带参考图像与描述文本；材质资产整合了AmbientCG与PolyHeaven两大知名资源库，提供完整的纹理贴图与材质描述；天空盒资源则以高动态范围图像为核心，辅以可视化预览与文字说明。这种模块化的构建方式确保了数据的一致性与可扩展性。

特点

MajutsuDataset的突出特点在于其多模态与高结构化的数据呈现。数据集不仅涵盖了从二维布局到三维模型的完整视觉表达链条，更融入了多样化的艺术风格，如赛博朋克、吉卜力、梵高等，为创意生成提供了丰富的风格化基底。材质部分提供了包括基础色、法线、粗糙度、金属度、高度等多通道纹理贴图，支持基于物理的渲染流程。所有资源均配有详尽的文本描述，实现了视觉内容与语义信息的对齐，为跨模态学习任务奠定了坚实基础。这种全面而精细的数据组织，使其在建筑可视化、场景合成及生成式AI研究中具有独特价值。

使用方法

针对计算机图形学与生成式人工智能的研究，MajutsuDataset提供了清晰的使用路径。研究者可根据任务需求，灵活调用数据集的各个模块。对于布局生成任务，可结合分割图、高程图及其文本描述进行训练；在三维建筑生成方面，可利用不同风格的三维模型及其对应图像与描述，学习风格化建模；材质与天空盒资源则可直接用于增强场景的真实感与艺术表现力。数据集附带的文本描述文件便于构建图文对，支持文本到布局、文本到三维模型或文本到材质生成的端到端训练。这种即插即用的模块化设计，极大简化了复杂三维场景构建的研究流程。

背景与挑战

背景概述

MajutsuDataset是近年来在计算机视觉与三维图形学交叉领域涌现的一个综合性数据集，由研究团队于2024年构建并发布，旨在推动生成式三维场景构建与材质建模的前沿探索。该数据集整合了布局高程图、多样化三维建筑模型、高精度材质资产及天空盒资源，核心研究问题聚焦于如何通过多模态数据驱动，实现高质量、风格可控的三维场景自动生成与编辑。其结构化、大规模的数据组织为三维生成模型、神经渲染以及场景理解等研究方向提供了关键支撑，显著促进了虚拟现实、游戏开发与数字孪生等应用领域的技术进步。

当前挑战

MajutsuDataset所针对的领域挑战在于三维场景生成的复杂性与真实性平衡问题，即如何从有限的二维布局或文本描述中，合成具有几何一致性、材质物理准确且视觉逼真的三维环境。具体挑战包括：布局到三维结构的精确映射、多样化艺术风格的真实感保持、以及跨模态数据（如图像、文本与三维网格）的语义对齐。在构建过程中，数据集面临多源异构数据的标准化整合难题，例如不同三维建模工具输出的格式统一、高分辨率材质贴图的采集与标注一致性，以及大规模天空盒HDR图像的质量控制与描述生成，这些均对数据集的完整性、可用性与可扩展性构成了考验。

常用场景

经典使用场景

在计算机视觉与三维重建领域，MajutsuDataset以其多模态结构为生成式模型提供了丰富的训练素材。该数据集整合了布局分割图、高程深度图、三维建筑模型、材质资产及天空盒资源，经典应用场景集中于基于文本或图像提示的建筑物生成与编辑任务。研究人员可利用其标注数据，训练模型从语义布局推断三维几何，或根据风格描述合成具有特定艺术风格的建筑外观，推动了可控内容生成技术的发展。

衍生相关工作

基于MajutsuDataset，学术界衍生了一系列经典研究工作，主要集中在三维生成与编辑模型的开发。例如，利用其布局与高程数据训练的条件生成对抗网络，实现了从语义地图到三维建筑的端到端合成；结合材质资产的纹理迁移研究，提升了生成模型的视觉保真度。这些工作不仅拓展了多模态融合的算法框架，还为后续的开放世界构建、实时渲染优化等方向奠定了数据基础与实验范式。

数据集最近研究