Sntng/pictogram_label_augment
收藏Hugging Face2024-02-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Sntng/pictogram_label_augment
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: label
dtype:
class_label:
names:
'0': 'GHS01: Explosive'
'1': 'GHS02: Flammable'
'2': 'GHS03: Oxidizing'
'3': 'GHS04: Compressed Gas'
'4': 'GHS05: Corrosive'
'5': 'GHS06: Toxic'
'6': 'GHS07: Harmful'
'7': 'GHS08: Health hazard'
'8': 'GHS09: Environmental hazard'
splits:
- name: train
num_bytes: 143619129.76
num_examples: 1440
- name: test
num_bytes: 84687256.566
num_examples: 1386
download_size: 225253509
dataset_size: 228306386.32599998
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征:
- 名称:image(图像),数据类型:图像
- 名称:label,数据类型:
类别标签(class_label):
类别名称:
'0': 'GHS01: 爆炸品'
'1': 'GHS02: 易燃品'
'2': 'GHS03: 氧化性物质'
'3': 'GHS04: 压缩气体'
'4': 'GHS05: 腐蚀性物质'
'5': 'GHS06: 有毒物质'
'6': 'GHS07: 有害物品'
'7': 'GHS08: 健康危害物质'
'8': 'GHS09: 环境危害物质'
数据划分:
- 名称:train(训练集),字节数:143619129.76,样本数:1440
- 名称:test(测试集),字节数:84687256.566,样本数:1386
下载总大小:225253509
数据集总大小:228306386.32599998
配置项:
- 配置名称:default(默认配置),数据文件:
- 对应划分集:train(训练集),数据路径:data/train-*
- 对应划分集:test(测试集),数据路径:data/test-*
提供机构:
Sntng
原始信息汇总
数据集概述
特征信息
- 图像:
- 名称:image
- 数据类型:image
- 标签:
- 名称:label
- 数据类型:class_label
- 类别名称:
- 0: GHS01: Explosive
- 1: GHS02: Flammable
- 2: GHS03: Oxidizing
- 3: GHS04: Compressed Gas
- 4: GHS05: Corrosive
- 5: GHS06: Toxic
- 6: GHS07: Harmful
- 7: GHS08: Health hazard
- 8: GHS09: Environmental hazard
数据分割
- 训练集:
- 名称:train
- 字节数:143619129.76
- 样本数:1440
- 测试集:
- 名称:test
- 字节数:84687256.566
- 样本数:1386
数据大小
- 下载大小:225253509
- 数据集大小:228306386.32599998
配置信息
- 默认配置:
- 配置名称:default
- 数据文件:
- 训练集路径:data/train-*
- 测试集路径:data/test-*
搜集汇总
数据集介绍

构建方式
在化学安全标识识别领域,Sntng/pictogram_label_augment数据集通过系统化采集与增强处理构建而成。原始图像源自全球化学品统一分类和标签制度(GHS)的九类标准象形图,涵盖爆炸性、易燃、氧化性等危险类别。构建过程中,采用数据增强技术对图像进行多样化处理,以扩充样本规模并提升模型泛化能力,最终形成包含训练集1440个样本与测试集1386个样本的结构化数据集,确保数据在化学安全视觉识别任务中的代表性与实用性。
特点
该数据集以GHS危险象形图为核心,具备明确的类别体系与高质量的图像特征。其标注体系严格遵循国际化学品安全标准,涵盖九类危险标识,每类标签均对应标准化定义,如GHS01代表爆炸性、GHS02代表易燃性等,确保了语义的一致性与权威性。图像数据经过增强处理,呈现出多样性视觉特征,同时数据集划分为训练与测试两部分,支持模型开发与评估的完整性,为化学安全领域的视觉识别研究提供了可靠的基础资源。
使用方法
在化学危险品视觉识别应用中,该数据集可直接用于训练与评估深度学习模型。使用者可通过加载训练集进行模型训练,利用测试集验证模型在象形图分类任务上的性能。数据以图像与标签对的形式组织,支持主流框架如PyTorch或TensorFlow进行高效处理。建议在预处理阶段结合图像增强策略以进一步提升模型鲁棒性,同时可依据GHS类别定义开展多分类或细粒度识别实验,推动化学安全智能检测技术的发展。
背景与挑战
背景概述
在化学安全与视觉识别交叉领域,Sntng/pictogram_label_augment数据集于近年应运而生,其核心研究聚焦于全球化学品统一分类和标签制度(GHS)中的象形图自动识别。该数据集由相关研究团队构建,旨在通过增强的标注策略提升模型对九类标准危险化学品标识的判别能力,涵盖爆炸性、易燃性、氧化性等关键类别。这一工作不仅推动了计算机视觉在工业安全监控与合规检查中的应用,也为多标签图像分类任务提供了具有现实意义的基准数据,促进了领域内算法鲁棒性与泛化性能的持续优化。
当前挑战
该数据集致力于解决危险化学品象形图的精确分类问题,其核心挑战在于标识图案在真实场景中常存在形变、遮挡或光照不均等复杂干扰,要求模型具备强大的特征不变性。构建过程中,数据收集面临可用公开样本稀缺的困境,需通过人工合成与数据增强技术扩充规模,同时确保标注与GHS国际标准严格一致,以避免语义歧义。此外,类别间视觉相似性高,如不同危险等级的符号差异细微,进一步加大了分类边界的清晰界定难度。
常用场景
经典使用场景
在化学安全与视觉识别领域,Sntng/pictogram_label_augment数据集为全球化学品统一分类和标签制度(GHS)的象形图识别提供了关键资源。该数据集通过增强的标签标注,广泛应用于图像分类模型的训练与评估,特别是针对九类标准危险化学品符号的自动化识别任务。研究者利用其结构化的图像与标签对,构建高效的卷积神经网络或视觉Transformer模型,以提升在复杂背景下对象形图的检测精度与鲁棒性,为化学品的数字化安全管理奠定基础。
衍生相关工作
围绕该数据集,衍生了一系列经典研究工作,包括基于深度学习的多标签分类模型优化、跨域象形图识别方法探索以及轻量化视觉系统的开发。这些工作不仅提升了GHS符号识别的准确率,还扩展至其他安全标识数据集(如交通标志或医疗符号)的迁移学习研究。相关成果发表在计算机视觉与安全工程领域的顶级会议与期刊上,推动了视觉识别技术在专业化场景中的创新应用,形成了从数据构建到模型部署的完整研究链条。
数据集最近研究
最新研究方向
在化学安全与视觉识别领域,Sntng/pictogram_label_augment数据集聚焦于全球化学品统一分类和标签制度(GHS)的象形图识别,为危险品管理提供了关键视觉数据支持。当前研究前沿集中于利用数据增强技术提升模型对九类GHS象形图的鲁棒性识别能力,尤其在低光照、部分遮挡或变形场景下的适应性。热点事件如工业自动化与智能安防的融合,推动了该数据集在实时危险预警系统中的应用,其影响在于通过增强的视觉模型降低化学品处理风险,促进跨行业安全标准的数字化与智能化转型。
以上内容由遇见数据集搜集并总结生成



