five

Geometric Shapes Dataset

收藏
github2024-09-12 更新2024-09-13 收录
下载链接:
https://github.com/0-ma/geometric-shape-detector
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含几何形状图像,包括具有不同边数的多边形和随机文本,适用于形状分类或图像识别等机器学习任务。

This dataset comprises images of geometric shapes, including polygons with varying numbers of sides and random text, and is suitable for machine learning tasks such as shape classification and image recognition.
创建时间:
2024-09-11
原始信息汇总

Geometric Shapes Dataset

概述

该数据集包含几何形状的图像,适用于形状分类或图像识别等机器学习任务。数据集中的图像包括多边形,边数可变,并带有随机文本。

功能

  • 生成多边形图像,边数可定制
  • 为每张图像添加随机文本
  • 创建包含训练、验证和测试集的数据集
  • 可选地将数据集推送到Hugging Face Hub
  • 使用生成的数据集训练形状分类模型
  • 在验证集和测试集上评估模型
  • 可选地将训练好的模型推送到Hugging Face Hub

安装

  1. 克隆仓库:

    git clone https://github.com/0-ma/geometric-shape-detector.git cd geometric-shape-detector

  2. 安装依赖:

    pip install -r requirements.txt

使用

生成数据集

运行以下命令生成数据集:

python generate_geometric_shapes_dataset.py [OPTIONS]

数据集生成选项

  • --output_dir: 数据集输出目录
  • --nb_samples: 生成的样本总数(默认:21000)
  • --output_hub_model_name: 推送到Hugging Face Hub的仓库名称(可选)
  • --output_hub_token: 推送到Hugging Face Hub的令牌(可选)

数据集生成示例

  1. 本地生成数据集:

    python generate_geometric_shapes_dataset.py --output_dir ./my_dataset --nb_samples 5000

  2. 生成数据集并推送到Hugging Face Hub:

    python generate_geometric_shapes_dataset.py --output_dir ./my_dataset --nb_samples 5000 --push_to_hub --hub_name my-username/my-dataset

训练模型

生成数据集后,使用以下命令训练形状分类模型:

python train_shape_detector.py [OPTIONS]

模型训练选项

  • --dataset_name: 使用的数据集名称(必填)
  • --base_checkpoint: 基础模型检查点(默认:"WinKawaks/vit-tiny-patch16-224")
  • --output_hub_model_name: HuggingFace Hub的输出模型名称(可选)
  • --output_hub_token: HuggingFace Hub的令牌(可选)
  • --num_epochs: 训练轮数(默认:10)
  • --learning_rate: 学习率(默认:5e-5)
  • --batch_size: 训练和评估的批量大小(默认:16)

模型训练示例

  1. 使用本地数据集训练模型:

    python train_shape_detector.py --dataset_name ./my_dataset

  2. 训练模型并推送到Hugging Face Hub:

    python train_shape_detector.py --dataset_name ./my_dataset --output_hub_model_name my-username/my-model --output_hub_token your_token_here

模型训练过程

训练脚本执行以下步骤:

  1. 加载指定数据集
  2. 准备图像处理器和模型
  3. 设置训练参数
  4. 初始化训练器
  5. 训练模型
  6. 在验证集上评估模型
  7. 如果存在测试集,在测试集上评估模型
  8. 可选地将训练好的模型推送到Hugging Face Hub

脚本会自动处理数据集分割(如果未提供验证集),确保在训练期间和训练后进行适当的评估。

搜集汇总
数据集介绍
main_image_url
构建方式
在几何形状数据集的构建过程中,首先通过生成脚本创建包含不同边数的多边形图像,并随机添加文本以增加图像的复杂性。该数据集的生成支持自定义样本数量,并可根据需求将数据集分割为训练集、验证集和测试集。此外,用户可以选择将生成的数据集推送到Hugging Face Hub,以便于共享和进一步使用。
特点
几何形状数据集的一个显著特点是其多样性和灵活性。数据集中的图像涵盖了多种多边形,从三角形到多边形,每种形状都具有不同的边数,这为形状分类和图像识别任务提供了丰富的训练样本。此外,随机文本的添加进一步增加了图像的复杂性,使得模型在实际应用中更具鲁棒性。
使用方法
使用几何形状数据集时,用户可以通过运行生成脚本来自定义数据集的输出目录和样本数量,并选择是否将数据集推送到Hugging Face Hub。在数据集生成后,用户可以利用提供的训练脚本对形状分类模型进行训练,支持从本地数据集或Hugging Face Hub加载数据。训练过程中,脚本会自动处理数据集分割,并支持将训练好的模型推送到Hugging Face Hub,以便于模型共享和部署。
背景与挑战
背景概述
几何形状数据集(Geometric Shapes Dataset)是由0-ma开发的一个用于几何形状图像生成和分类训练的项目。该数据集包含了具有不同边数的多边形图像,并随机添加了文本,适用于形状分类和图像识别等机器学习任务。该数据集已被用于创建HuggingFace上的多个模型,如[0-ma/vit-geometric-shapes-base](https://huggingface.co/0-ma/vit-geometric-shapes-base)等。通过生成具有可定制边数的多边形图像,并提供训练脚本,该数据集为研究人员提供了一个标准化的工具,用于评估和改进形状分类算法。
当前挑战
几何形状数据集在构建过程中面临的主要挑战包括:1) 生成具有不同边数的多边形图像,确保图像的多样性和复杂性;2) 在图像中随机添加文本,增加数据集的复杂度和实际应用场景的模拟;3) 数据集的分割和模型训练过程中,确保训练、验证和测试集的合理划分,以避免数据泄露和过拟合问题。此外,该数据集在形状分类任务中面临的挑战还包括:1) 不同形状之间的细微差别识别;2) 文本干扰对形状识别的影响;3) 模型在处理复杂背景和噪声时的鲁棒性。
常用场景
经典使用场景
几何形状数据集(Geometric Shapes Dataset)的经典使用场景主要集中在形状分类和图像识别任务中。该数据集通过生成包含不同边数的多边形图像,并随机添加文本,为机器学习模型提供了丰富的训练样本。研究者可以利用这些图像进行形状分类模型的训练,从而在图像识别领域中实现对几何形状的精确分类。
解决学术问题
几何形状数据集在学术研究中解决了形状分类和图像识别中的关键问题。通过提供多样化的几何形状图像,该数据集帮助研究者训练和验证形状分类算法,从而提高了模型在复杂图像环境中的识别能力。此外,数据集中的随机文本添加进一步增加了图像的复杂性,使得模型在实际应用中更具鲁棒性。
衍生相关工作
几何形状数据集的发布催生了一系列相关研究和工作。例如,基于该数据集,研究者开发了多种形状分类模型,如Vision Transformer(ViT)和ResNet,这些模型在几何形状识别任务中表现出色。此外,数据集的生成和训练脚本也被广泛应用于其他形状识别任务中,推动了图像识别技术的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作