gvecchio/MatSynth
收藏Hugging Face2024-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gvecchio/MatSynth
下载链接
链接失效反馈官方服务:
资源简介:
MatSynth是一个专为现代AI应用设计的基于物理渲染(PBR)材料数据集,包含超过4,000个超高分辨率的材料,提供了无与伦比的规模、多样性和细节。数据集中的每个材料都通过一组常见的映射(如Basecolor、Diffuse、Normal等)来表示,这些映射模拟了材料的反射和微结构。此外,每个材料都附有丰富的元数据,包括其来源、许可详情、类别、标签、创建方法等,这些元数据有助于用户精确选择和利用材料。数据集分为测试集和训练集,分别包含89和3,980个材料。数据集的设计支持多种材料相关任务,如材料获取、材料生成和合成数据生成等。
MatSynth is a physically based rendering (PBR) material dataset designed for modern AI applications, containing over 4,000 ultra-high resolution materials and offering unparalleled scale, diversity and detail. Each material in the dataset is represented by a set of common maps (such as Basecolor, Diffuse, Normal, etc.) that simulate the material's reflection and microstructure. In addition, each material is accompanied by rich metadata including its source, license details, category, tags, creation method and more, which enables users to accurately select and utilize the materials. The dataset is divided into a test set and a training set, which contain 89 and 3,980 materials respectively. The design of the dataset supports a variety of material-related tasks, such as material acquisition, material generation and synthetic data generation.
提供机构:
gvecchio
原始信息汇总
MatSynth 数据集概述
数据集基本信息
- 名称: MatSynth
- 语言: 英语
- 大小: 1K<n<10K
- 任务类别:
- image-to-image
- unconditional-image-generation
- image-classification
- text-to-image
- 美观名称: MatSynth
数据集特征
- 数据结构:
- name: 字符串类型
- category: 分类标签,包括陶瓷、混凝土等13种材料类别
- metadata: 结构化数据,包含作者、类别、描述、高度因子、高度均值、许可证、链接、地图、方法、名称、物理尺寸、来源、静态状态、标签、版本日期等信息
- 图像特征:
- basecolor
- diffuse
- displacement
- height
- metallic
- normal
- opacity
- roughness
- specular
- blend_mask
数据集分割
- 训练集: 5700个样本,数据大小为430581667965.1字节
- 测试集: 89个样本,数据大小为7443356066.0字节
数据集配置
- 默认配置:
- 测试集路径: data/test-*
- 训练集路径: data/train-*
数据集标签
- materials
- pbr
- 4d
- graphics
- rendering
- svbrdf
- synthetic
数据集描述
MatSynth是一个大规模的Physically Based Rendering (PBR)材料数据集,包含超过4000个超高分辨率的材料样本,适用于现代AI应用。每个材料样本包含一系列地图,如Basecolor、Diffuse、Normal等,以及丰富的元数据,如来源、许可证、类别、标签等。
数据集结构
数据集分为训练和测试两个部分,分别包含3980和89个材料样本。
数据集来源
数据集从多个在线资源收集,包括AmbientCG、CGBookCase等,遵循CC0和CC-BY许可证。
数据集使用
MatSynth可通过Python库访问,支持数据加载、处理和格式化,适用于图像处理和机器学习任务。



