five

abhayakumar01/metal_scrap_dataset

收藏
Hugging Face2026-04-04 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/abhayakumar01/metal_scrap_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image dtype: image - name: label dtype: string splits: - name: train num_bytes: 1200004805.39 num_examples: 13895 download_size: 1235208203 dataset_size: 1200004805.39 configs: - config_name: default data_files: - split: train path: data/train-* --- # Metal Scrap Dataset ## Overview This dataset contains synthetic images of metal scraps, categorized into three grades based on quality and recyclability. The images were generated using Stable Diffusion and augmented to enhance variety and robustness for machine learning tasks. ## Dataset Details - **Total Images**: ~13,895 (after augmentation) - **Categories**: - **Grade A**: 5,085 images (1,017 original) - Clean, rust-free metals. - **Grade B**: 5,570 images (1,114 original) - Lightly rusted, recyclable metals. - **Grade C**: 3,240 images (648 original) - Unrecyclable, heavily degraded scrap. - **Image Size**: 224x224 pixels - **Format**: PNG ## Data Augmentation Each original image was resized and augmented with 4 variations using the following transforms: - Resize to 224x224 - Random horizontal and vertical flips - Random rotation (up to 30°) - Color jitter (brightness, contrast, saturation, hue) - Random affine (rotation, translation, scaling) - Random perspective distortion - Random grayscale conversion ## Usage Intended for training models in metal scrap classification, recycling analysis, or computer vision research. Load the dataset via Hugging Face: ```python from datasets import load_dataset dataset = load_dataset("iDharshan/metal_scrap_dataset")

dataset_info: 数据集信息: 特征: - 名称:图像(image),数据类型:图像 - 名称:标签(label),数据类型:字符串 划分集: - 名称:训练集(train),字节数:1200004805.39,样本数:13895 下载大小:1235208203,数据集总大小:1200004805.39 configs: - 配置名称:默认(default),数据文件: - 划分集:训练集,路径:data/train-* --- # 金属废料数据集 ## 概述 本数据集包含金属废料的合成图像,依据质量与可回收性分为三个等级。图像通过稳定扩散模型(Stable Diffusion)生成,并经过数据增强以提升多样性与机器学习任务的鲁棒性。 ## 数据集详情 - **总图像量**:增强后约13895张 - **分类类别**: - **A级**:5085张(原始样本1017张)——洁净无锈金属材料 - **B级**:5570张(原始样本1114张)——轻度锈蚀、可回收金属材料 - **C级**:3240张(原始样本648张)——不可回收、严重降解的废料 - **图像尺寸**:224×224像素 - **格式**:PNG ## 数据增强 每张原始图像均被调整尺寸,并通过以下变换生成4种变体以增强数据: - 调整尺寸至224×224像素 - 随机水平、垂直翻转 - 随机旋转(最大旋转角度30°) - 色彩抖动(调整亮度、对比度、饱和度与色相) - 随机仿射变换(包含旋转、平移、缩放) - 随机透视畸变 - 随机灰度转换 ## 应用场景 本数据集旨在用于金属废料分类、回收分析或计算机视觉研究的模型训练。可通过Hugging Face加载该数据集: python from datasets import load_dataset dataset = load_dataset("iDharshan/metal_scrap_dataset")
提供机构:
abhayakumar01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作