five

Seenka/banners-clean

收藏
Hugging Face2023-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Seenka/banners-clean
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image dtype: image - name: label dtype: class_label: names: '0': none '1': videograph '2': zocalo - name: image_640x640 dtype: image - name: cropped_image dtype: image - name: embeddings_640x640 sequence: float32 - name: embeddings_cropped sequence: float32 - name: embeddings sequence: float32 - name: ocr_out list: - name: bbox sequence: sequence: float64 - name: confidence dtype: float64 - name: text dtype: string splits: - name: train num_bytes: 653964448.75 num_examples: 1182 - name: test num_bytes: 123117389.0 num_examples: 279 download_size: 657176988 dataset_size: 777081837.75 --- # Dataset Card for "banners-clean" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征项: - 名称:image,数据类型:图像 - 名称:label,数据类型:类别标签(class_label),其类别映射为:0: 无(none),1: 视频横幅(videograph),2: 佐卡洛(zocalo) - 名称:image_640x640,数据类型:图像 - 名称:cropped_image,数据类型:图像 - 名称:embeddings_640x640,数据类型:32位浮点型序列 - 名称:embeddings_cropped,数据类型:32位浮点型序列 - 名称:embeddings,数据类型:32位浮点型序列 - 名称:ocr_out,数据类型:列表结构,包含以下子项: - 名称:边界框(bbox),数据类型:二维64位浮点型序列 - 名称:置信度(confidence),数据类型:64位浮点型 - 名称:文本(text),数据类型:字符串 数据集划分: - 名称:训练集(train),占用字节数:653964448.75,样本数量:1182 - 名称:测试集(test),占用字节数:123117389.0,样本数量:279 下载大小:657176988 数据集总大小:777081837.75 --- # 「banners-clean」数据集卡片(Dataset Card) [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Seenka
原始信息汇总

数据集概述

数据集名称

  • 名称: banners-clean

数据集特征

  • image: 图像数据
  • label: 类别标签,包含以下类别:
    • none
    • videograph
    • zocalo
  • image_640x640: 图像数据,分辨率为640x640
  • cropped_image: 裁剪后的图像数据
  • embeddings_640x640: 640x640图像的嵌入向量,数据类型为float32序列
  • embeddings_cropped: 裁剪图像的嵌入向量,数据类型为float32序列
  • embeddings: 嵌入向量,数据类型为float32序列
  • ocr_out: OCR输出结果,包含以下子特征:
    • bbox: 边界框坐标,数据类型为float64序列
    • confidence: 置信度,数据类型为float64
    • text: 识别的文本,数据类型为字符串

数据集划分

  • train:
    • 样本数量: 1182
    • 数据大小: 653964448.75字节
  • test:
    • 样本数量: 279
    • 数据大小: 123117389.0字节

数据集大小

  • 下载大小: 657176988字节
  • 总数据大小: 777081837.75字节
搜集汇总
数据集介绍
main_image_url
构建方式
在数字媒体与广告设计领域,Seenka/banners-clean数据集通过系统化的数据采集与处理流程构建而成。该数据集从实际应用场景中收集了原始横幅图像,并经过严格的清洗与标注过程,确保数据质量与一致性。每张图像均被转换为标准格式,并辅以多维度标注信息,包括类别标签、裁剪版本及嵌入向量等,构建过程注重细节与完整性,为后续分析奠定了坚实基础。
使用方法
使用Seenka/banners-clean数据集时,研究者可基于其清晰的数据分割进行模型训练与评估。训练集包含1182个样本,测试集含279个样本,用户可直接加载图像与对应标签进行监督学习,或利用嵌入向量进行特征提取与迁移学习。OCR输出可用于文本检测与识别任务,而多版本图像支持分辨率适应性实验。通过标准数据加载工具,该数据集能便捷地集成到机器学习流程中,促进广告自动化与内容分析等应用。
背景与挑战
背景概述
在数字媒体与广告设计领域,横幅广告作为视觉传达的核心载体,其内容分析与识别技术对于自动化营销与用户体验优化至关重要。数据集Seenka/banners-clean由相关研究机构或团队于近期构建,专注于解决横幅广告图像的多模态理解问题,核心研究目标在于通过整合图像特征、文本识别及嵌入表示,推动计算机视觉与自然语言处理的交叉应用。该数据集通过提供丰富的标注信息,如类别标签、裁剪图像及光学字符识别输出,为广告内容分类、视觉元素检测等任务提供了标准化基准,对提升智能广告系统的精准度与效率具有显著影响力。
当前挑战
该数据集旨在应对横幅广告图像的多模态分析挑战,包括广告类型分类、文本与视觉元素的联合理解,以及复杂背景下的信息提取。在构建过程中,研究人员面临数据收集与清洗的困难,例如广告图像的多样性与噪声干扰,需确保样本的代表性与质量;同时,多模态特征的融合与对齐也是一大难点,涉及图像嵌入、文本识别结果的整合,以保持数据的一致性与可用性。这些挑战要求精细的标注策略与算法设计,以支撑后续研究的可靠性。
常用场景
经典使用场景
在计算机视觉与文档分析领域,Seenka/banners-clean数据集以其精心标注的横幅图像为研究提供了宝贵资源。该数据集最经典的使用场景在于训练和评估图像分类与目标检测模型,特别是针对横幅中特定元素如'videograph'和'zocalo'的识别。通过提供原始图像、裁剪后的图像以及多种尺寸的嵌入表示,研究者能够深入探索模型在不同分辨率与预处理条件下的性能表现,为视觉任务中的特征提取与分类精度优化奠定基础。
解决学术问题
该数据集有效解决了视觉文档分析中常见的学术研究问题,例如复杂背景下的文本与图形元素分离、多类别横幅的精确分类以及小目标检测的挑战。其包含的OCR输出与边界框标注,使得研究者能够系统研究自然场景中文本检测与识别的鲁棒性,推动文档理解、信息提取等领域的发展。这一资源的意义在于填补了特定横幅类型数据集的空白,为跨模态视觉语言模型提供了实验验证的基础,促进了学术社区在真实世界应用中的算法创新。
实际应用
在实际应用层面,Seenka/banners-clean数据集广泛应用于广告分析、内容审核与数字媒体管理。例如,在广告行业中,该数据集可用于自动化识别横幅中的设计元素,优化广告投放效果;在内容审核系统中,它帮助检测违规或敏感图像,提升平台安全性与合规性。此外,结合OCR技术,该数据集支持从横幅中提取关键文本信息,用于市场趋势分析或用户行为研究,为商业智能与自动化处理提供可靠的数据驱动解决方案。
数据集最近研究
最新研究方向
在数字媒体与广告设计领域,Seenka/banners-clean数据集以其丰富的图像特征与多模态标注,正推动着前沿研究方向。该数据集聚焦于横幅广告的视觉识别与内容分析,结合图像分类、OCR文本提取及嵌入向量表示,为智能广告生成与评估提供了关键支撑。当前研究热点集中于跨模态融合技术,通过整合图像特征与文本信息,提升广告内容的语义理解与个性化推荐精度。这一进展不仅促进了广告行业的自动化转型,还为计算机视觉与自然语言处理的交叉应用开辟了新路径,具有显著的实践意义与学术价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作