Seenka/banners

Name: Seenka/banners
Creator: Seenka
Published: 2023-07-19 13:20:46
License: 暂无描述

Hugging Face2023-07-19 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Seenka/banners

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: image dtype: image - name: label dtype: class_label: names: '0': none '1': videograph '2': zocalo - name: image_640x640 dtype: image - name: cropped_image dtype: image - name: embeddings_640x640 sequence: float32 - name: embeddings_cropped sequence: float32 - name: embeddings sequence: float32 splits: - name: train num_bytes: 1259070755.518 num_examples: 2369 - name: test num_bytes: 123028562.0 num_examples: 279 download_size: 1377254060 dataset_size: 1382099317.518 --- # Dataset Card for "banners" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息：特征字段： - 字段名：image，数据类型：图像（image） - 字段名：label，数据类型为类别标签（class_label），类别名称映射如下： '0': 无（none） '1': 视频图形（videograph） '2': 佐卡洛（zocalo） - 字段名：image_640x640，数据类型：图像（image） - 字段名：cropped_image，数据类型：图像（image） - 字段名：embeddings_640x640，数据类型：float32序列 - 字段名：embeddings_cropped，数据类型：float32序列 - 字段名：embeddings，数据类型：float32序列数据集划分： - 划分名称：训练集（train），占用字节数：1259070755.518，样本总数：2369 - 划分名称：测试集（test），占用字节数：123028562.0，样本总数：279 下载总大小：1377254060 字节数据集总存储大小：1382099317.518 字节 # “横幅（banners）”数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

Seenka

原始信息汇总

数据集概述

数据集特征

image: 图像数据
label: 分类标签，包含以下类别：
- 0: none
- 1: videograph
- 2: zocalo
image_640x640: 图像数据，分辨率为640x640
cropped_image: 裁剪后的图像数据
embeddings_640x640: 图像的嵌入向量，数据类型为float32
embeddings_cropped: 裁剪图像的嵌入向量，数据类型为float32
embeddings: 图像的嵌入向量，数据类型为float32

数据集分割

train: 训练集，包含2369个样本，总大小为1259070755.518字节
test: 测试集，包含279个样本，总大小为123028562.0字节

数据集大小

下载大小: 1377254060字节
数据集总大小: 1382099317.518字节

搜集汇总

数据集介绍

构建方式

在深度学习与计算机视觉研究领域，_seenka/banners_数据集的构建采取了图像采集与标签标注相结合的方式。该数据集从不同场景中抽取图像，包括无标签（'none'）、视频图像（'videograph'）和广场图像（'zocalo'）三种类型，并针对每张图像生成不同尺寸的变体以及对应的特征嵌入向量，以适应不同的模型训练需求。数据集分为训练集和测试集，确保了模型的训练与验证过程的准确性。

特点

_seenka/banners_数据集的特点在于其多样化的图像类型和丰富的特征表示。数据集中的图像不仅包含了原始尺寸，还提供了640x640像素的标准化尺寸以及裁剪后的图像，便于研究者根据需求选择合适的输入尺寸。此外，数据集还提供了图像的嵌入向量，这为深度学习模型提供了额外的特征维度，有助于提高模型的识别精度和效率。

使用方法

使用_seenka/banners_数据集时，研究者可以根据自己的需求下载整个数据集或仅下载特定的split。数据集的每一部分都包含了图像和标签信息，以及图像的嵌入向量。这些数据可以直接用于模型训练、验证和测试。由于数据集已经预先划分好了训练集和测试集，研究者可以方便地进行模型的性能评估，加速研究流程。

背景与挑战

背景概述

在数字图像处理与识别领域，_seenka/banners_数据集应运而生，其创建旨在为研究者提供一个针对横幅图像分类的基准。该数据集由 Seenka 团队于近年构建，核心研究问题是如何准确识别并分类横幅图像中的不同类型，如 videograph 和 zocalo。作为该领域的一项重要资源，它对图像识别技术的发展与评估提供了有力支持，推动了相关研究的深入进行。

当前挑战

该数据集在构建过程中面临的主要挑战包括：一是横幅图像种类的多样性和复杂性，导致分类任务颇具难度；二是数据集规模相对有限，可能限制了模型训练的深度和广度；三是图像嵌入特征的准确提取，这对于后续的分类任务至关重要。此外，如何在保持数据质量的同时，优化数据集的存储和访问效率，也是构建过程中必须考虑的问题。

常用场景

经典使用场景

在图像识别与分类研究领域，Seenka/banners数据集以其独特的图像特征和标签体系，成为学者们探究机器学习模型在横幅广告识别中的性能表现的重要资源。该数据集常被用于训练深度学习模型，以识别并分类横幅广告中的不同元素，如视频图形、中心区域等。

解决学术问题

该数据集有效解决了图像分类中的细粒度识别问题，提供了精确到特定广告元素的分类标签，从而帮助研究人员评估并改进模型的分辨率和准确性。其在学术研究中具有重要意义，因为它为横幅广告内容的自动识别与分类提供了基准。

衍生相关工作

基于该数据集的研究衍生出了多项相关工作，包括但不限于横幅广告的自动生成、基于内容的广告推荐系统，以及针对不同场景下的横幅广告识别算法改进，这些研究为数字广告领域带来了新的视角和技术进步。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集