geometric-shapes

Hugging Face2024-09-11 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/0-ma/geometric-shapes

下载链接

链接失效反馈

官方服务：

资源简介：

几何形状数据集是一个合成数据集，包含各种几何形状的图像，图像上叠加了随机文本。每个图像都有一个随机颜色的背景，背景上有一个几何形状（或仅是文本），几何形状被一个随机的短字符串部分遮挡。该数据集设计用于形状分类、图像识别和计算机视觉模型的鲁棒性测试等任务。

创建时间：

2024-09-02

原始信息汇总

Geometric Shapes Dataset

数据集描述

数据集概述

Geometric Shapes Dataset 是一个合成数据集，包含各种几何形状的图像，图像上叠加了随机文本。每个图像在随机颜色的背景上显示一个多边形（或仅文本），并有一串随机字符部分遮挡形状。该数据集设计用于形状分类、图像识别和计算机视觉模型的鲁棒性测试等任务。

支持的任务和排行榜

图像分类：该数据集的主要任务是多类图像分类，目标是识别每张图像中的形状类型。

数据实例

每个数据实例包含：

一张图像（50x50像素，RGB）
一个标签，指示形状类型

数据字段

image：一个50x50像素的RGB图像，以numpy数组格式存储。
label：一个字符串，指示形状类型。标签对应以下形状：
- "1"：无形状，仅在彩色背景上有随机文本
- "2"：类似圆形的形状（100边多边形）
- "3"：三角形
- "4"：正方形
- "5"：五边形

每张图像包含：

随机颜色的背景
指定的几何形状（标签"1"除外），填充不同的随机颜色
一个短字符串（4个字符）的随机字母数字文本叠加在顶部，部分遮挡形状

注意：“圆形”（标签"2"）通过100边多边形近似，在给定分辨率下看起来是圆形的。

数据分割

数据集分为训练集（70%）、验证集（10%）和测试集（20%）。

数据集创建

数据集创建理由

该数据集是为了在图像分类模型测试中提供一个简单、受控的环境，特别是在几何形状被文本部分遮挡的情况下。

源数据

初始数据收集和归一化

数据是使用自定义Python脚本合成生成的，未使用外部数据源。

注释

注释过程

注释（标签）在图像创建过程中自动生成。

个人和敏感信息

该数据集不包含任何个人或敏感信息。

其他已知限制

数据集仅限于一组预定义的形状。
图像分辨率固定为50x50像素。
文本叠加始终存在，这可能无法反映所有现实世界场景。

许可信息

该数据集在MIT许可证下发布。

搜集汇总

数据集介绍

构建方式

Geometric Shapes数据集通过合成方式构建，利用Python脚本生成包含不同几何形状的图像。每张图像均包含一个随机颜色的背景，并在其上叠加一个几何形状（如圆形、三角形等）以及部分遮挡形状的随机文本。该数据集旨在为图像分类任务提供一个简单且可控的环境，特别适用于测试模型在形状被部分遮挡时的表现。

特点

Geometric Shapes数据集的特点在于其图像均为50x50像素的RGB格式，包含六种标签类别：无形状、圆形、三角形、正方形、五边形和六边形。每张图像均包含随机背景颜色、几何形状以及部分遮挡形状的4字符随机文本。数据集的合成性质使其适用于图像分类模型的鲁棒性测试，尤其是针对形状被文本遮挡的场景。

使用方法

该数据集主要用于多类别图像分类任务，用户可通过加载训练集、验证集和测试集进行模型训练与评估。数据集已按70%训练集、10%验证集和20%测试集的比例划分，用户可直接使用这些划分进行实验。此外，由于数据集为合成生成，用户还可根据需求调整生成脚本以扩展数据规模或修改图像属性。

背景与挑战

背景概述

Geometric Shapes Dataset 是一个合成数据集，旨在为计算机视觉模型提供简单的测试环境，特别是在主要目标（几何形状）被部分遮挡的情况下。该数据集由研究人员通过项目 https://github.com/0-ma/geometric-shape-detector 生成，主要用于图像分类任务。数据集包含多种几何形状的图像，每张图像上叠加了随机文本，背景颜色随机生成。该数据集的设计初衷是为了测试模型在复杂背景和部分遮挡情况下的鲁棒性，适用于形状分类、图像识别等任务。自发布以来，该数据集为计算机视觉领域的研究提供了重要的基准测试工具。

当前挑战

Geometric Shapes Dataset 面临的挑战主要体现在两个方面。首先，该数据集主要用于解决图像分类任务中的形状识别问题，特别是在形状被部分遮挡的情况下。然而，由于数据集中的形状种类有限，且图像分辨率固定为50x50像素，这限制了模型在更复杂场景下的泛化能力。其次，在数据集的构建过程中，尽管通过合成数据避免了真实数据采集的复杂性，但文本遮挡的固定模式可能无法完全反映真实世界中的多样性。此外，数据集中的几何形状仅包含几种基本类型，缺乏更复杂的形状变化，这可能影响模型在实际应用中的表现。

常用场景

经典使用场景

Geometric Shapes Dataset 主要用于图像分类任务，特别是在几何形状识别领域。该数据集通过生成包含随机文本叠加的几何形状图像，为计算机视觉模型提供了一个理想的测试环境。研究人员可以利用该数据集训练和评估模型在复杂背景下的形状识别能力，尤其是在形状被部分遮挡的情况下。

解决学术问题

该数据集解决了计算机视觉领域中图像分类模型在复杂背景和遮挡情况下的鲁棒性问题。通过提供包含随机文本叠加的几何形状图像，研究人员能够评估模型在真实场景中的表现，尤其是在形状被部分遮挡时的识别能力。这为改进模型的鲁棒性和泛化能力提供了重要的实验数据。

衍生相关工作

基于 Geometric Shapes Dataset，许多经典的研究工作得以展开。例如，研究人员开发了多种深度学习模型，用于在复杂背景下识别几何形状，并提出了改进模型鲁棒性的新方法。此外，该数据集还被用于研究图像分类中的对抗样本生成和防御技术，推动了计算机视觉领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集