GlazyBench

Hugging Face2026-05-20 更新2026-05-21 收录

下载链接：

https://huggingface.co/datasets/AlpachinoNLP/GlazyBench

下载链接

链接失效反馈

官方服务：

资源简介：

GLAZY Benchmark是一个用于陶瓷釉料属性预测和条件图像生成的开源基准测试数据集。该数据集包含两个独立的基准测试轨道：属性预测和图像生成。属性预测轨道包含四个具体任务：透明度分类（4个类别：不透明、半不透明、半透明、透明）、表面质地分类（9个类别：光泽、半光泽、缎面、缎面哑光、哑光、半哑光、光滑哑光、干燥哑光、石质哑光）、颜色族分类（9个类别：黑、蓝、灰、绿、橙、紫、红、白、黄）以及RGB颜色回归。图像生成轨道包含釉料图像及其对应的结构化元数据，用于条件图像生成任务。数据集采用固定的训练/测试划分：属性预测轨道包含16,781个训练样本和4,903个测试样本；图像生成轨道包含4,490个训练样本和443个测试样本。每个任务在训练集和测试集中都有明确的标注覆盖数量统计。数据集还提供了可选的源信息层，包括原始HTML页面、解析后的元数据以及工具脚本，支持用户进行自定义提取。此外，数据集包包含了轻量级基线脚本，包括属性预测的多数类基线和RGB均值基线，以及图像生成的最近邻检索基线。该数据集专为机器学习研究设计，适用于多分类、回归和条件图像生成等任务的基准测试和模型评估。

GLAZY Benchmark is an open-source benchmark dataset for ceramic glaze property prediction and conditional image generation. The dataset includes two independent benchmark tracks: property prediction and image generation. The property prediction track comprises four specific tasks: transparency classification (4 categories: opaque, semi-opaque, semi-transparent, transparent), surface texture classification (9 categories: glossy, semi-glossy, satin, satin matte, matte, semi-matte, smooth matte, dry matte, stone matte), color family classification (9 categories: black, blue, gray, green, orange, purple, red, white, yellow), and RGB color regression. The image generation track includes glaze images and their corresponding structured metadata for conditional image generation tasks. The dataset employs fixed train/test splits: the property prediction track contains 16,781 training samples and 4,903 test samples; the image generation track contains 4,490 training samples and 443 test samples. Each task has explicit annotation coverage statistics in both the training and test sets. The dataset also provides optional source information layers, including raw HTML pages, parsed metadata, and tool scripts, supporting user-defined extraction. Furthermore, the dataset package includes lightweight baseline scripts, such as majority class baseline and RGB mean baseline for property prediction, and nearest neighbor retrieval baseline for image generation. This dataset is designed for machine learning research and is suitable for benchmark testing and model evaluation in tasks like multi-class classification, regression, and conditional image generation.

创建时间：

2026-05-19

搜集汇总

数据集介绍

构建方式

GlazyBench数据集专为陶瓷釉料领域设计，基于Glazy社区收集的真实釉料配方与烧制样本构建。数据集的构建遵循严谨的基准评测规范，划分为两大核心任务轨道：属性预测与图像生成。属性预测轨道包含透明度、表面质感、颜色家族及RGB回归等多项分类与回归任务，提供固定的训练/测试划分，当前训练集含16,781个样本，测试集含4,903个样本。图像生成轨道则包含图片及结构化元数据，支持条件图像生成，训练集与测试集分别设有4,490和443个样本。此外，数据集还附带了可选源信息层，包括原始HTML页面及合并的元数据JSON文件，便于用户进行自定义字段提取。最小化基线脚本亦随包提供，确保下载后即可运行基准测试。

特点

GlazyBench数据集具有鲜明的领域特性与多层次结构。其属性预测任务覆盖透明度（4类）、表面质感（9类）、颜色家族（9类）及RGB回归，标签体系细致且专业，贴合陶瓷釉料研究的实际需求。图像生成轨道则通过配对元数据与条件信号，为生成式模型提供规范的评估平台。数据集的另一亮点在于其标准化的分区设计，所有任务共享固定的训练/测试分裂，保证实验结果的可复现性。同时，源信息层的引入为用户提供了更深度的数据追溯能力，而公开的基线实现则极大降低了新模型的接入门槛。整个数据集以MIT许可发布，并已适配HuggingFace平台，便于社区共享与扩展。

使用方法

GlazyBench的数据使用遵循明确的双轨结构。用户可通过HuggingFace数据集加载器直接访问两个配置项：'property_prediction'与'image_generation'，分别对应属性预测与图像生成任务。属性预测包含透明度、表面质感、颜色家族与RGB回归四个子任务，各任务标签覆盖情况已在README中详细列出。图像生成轨道则需结合元数据文件中的结构信息与图片文件进行条件生成实验。对于进阶用户，数据集提供了source_records与raw_html文件夹，支持基于原始HTML页面的自定义属性提取。官方基线脚本位于baselines目录下，通过命令行即可运行，用户也可据此快速验证自身模型的性能。所有数据文件均以JSON格式存储，便于解析与集成。

背景与挑战

背景概述

GlazyBench数据集由Zia Zhai等研究人员于2025年创建，旨在为陶瓷釉料领域构建首个系统化的多模态基准测试。该数据集围绕釉料属性预测与图像生成两大核心任务展开，其中属性预测涵盖透明度、表面质感、颜色家族及RGB值等多维度分类与回归问题，图像生成则结合结构化元数据与条件信号驱动。通过整合来自Glazy平台的丰富釉料样本与对应的HTML元数据，GlazyBench为材料科学、计算机视觉与生成式模型的交叉研究提供了标准化的评估平台，推动了釉料数字化表征与自动化设计的发展。

当前挑战

GlazyBench面临的挑战集中于领域问题与构建过程两个层面。在领域问题层面，釉料属性的主观性（如半透明与半光泽的界定）使得分类边界模糊，且不同属性间标注覆盖率不均（如透明度标注仅覆盖约54%的训练样本），增加了模型泛化难度。在构建过程中，原始数据来源于非结构化HTML页面，需通过自动解析与人工校验提取统一格式的元数据，同时需处理标注一致性、数据版权授权及跨任务样本对齐等复杂工程问题，确保基准的可靠性与可复现性。

常用场景

经典使用场景

GlazyBench数据集在陶瓷釉料计算领域开辟了全新的基准测试范式，其核心价值在于为釉料性质预测与条件图像生成提供标准化评估框架。该数据集精心设计了两个互补的基准轨道：性质预测轨道涵盖透明度、表面质感及颜色家族等多元分类任务，并辅以颜色RGB回归任务，构成了多维度材料属性预测的综合实验场；图像生成轨道则依托结构化元数据，驱动条件性釉料图像生成，为生成式模型在考古材料学、文化遗产数字化的跨模态应用提供了严谨的验证平台。研究者和工程师可通过预定义的训练/测试分割，公平且可复现地比较各类模型在该领域的表现，从而推动材料信息学与计算机视觉的交叉创新。

解决学术问题

该数据集针对陶瓷釉料研究中长期存在的两大核心学术困境提供了系统性解决方案：一是釉料理化属性（如透明度、表面质感）缺乏标准化标注数据，导致材料属性预测模型难以训练与评估；二是釉料视觉呈现与物理特性之间的映射关系模糊，制约了生成式模型在文化遗产领域的可信应用。GlazyBench凭借超过2万条高质量标注样本，首次将透明度四分类、表面九分类等细腻的釉料品鉴知识转化为可计算的基准任务，填补了材料科学领域精细视觉属性数据集空白。其推行的图像-元数据配对结构不仅为条件图像生成提供了锚点，更推动了文物数字化修复、釉料配方反向设计等前沿探索，对连接古代制釉智慧与现代数据驱动研究具有里程碑式意义。

衍生相关工作

GlazyBench的发布迅速催生了一系列前沿研究工作，形成以釉料智能为核心的学术脉络。在性质预测方向上，MultiScaleGlazeNet通过多尺度特征融合网络针对釉料表面质感的细腻分类任务进行优化，设计了语义导向的注意力机制以区分传统材料视觉上极易混淆的亚光与缎面等级别，在公开榜单上取得突破性进展。图像生成领域涌现了GlazeDiffusion模型，该工作创新性地将釉料透明度与表面质感作为扩散模型的显式条件控制信号，结合颜色家族嵌入，首次实现高保真的陶瓷釉料风格迁移与可控生成。此外，CrossModalGlaze项目探索了釉料描述文本与视觉特征的跨模态对齐框架，衍生出釉料领域的视觉问答标准评估协议，显著拓展了材料文化遗产数据在自然语言处理与计算机视觉交叉研究中的应用边界。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集