chart-info-yolo
收藏Hugging Face2025-11-10 更新2025-11-11 收录
下载链接:
https://huggingface.co/datasets/StephanAkkerman/chart-info-yolo
下载链接
链接失效反馈官方服务:
资源简介:
Chart Info YOLO数据集是一个包含注释金融图表屏幕截图的数据集,旨在训练能够检测UI元素的小型YOLO模型,这些UI元素用于下游的光学字符识别(OCR)任务。数据集包含两种类型的注释:图表顶部的标题块(symbol_title)和右侧价格轴上的圆形价格标签(last_price_pill)。数据集按照YOLO的经典结构组织,包括图片和标签文件,以及一个描述数据集划分的data.yml文件。
Chart Info YOLO Dataset is a collection of annotated financial chart screenshots, purpose-built to train lightweight YOLO models for detecting UI elements that facilitate downstream optical character recognition (OCR) tasks. The dataset includes two annotation categories: the symbol_title header block at the top of the chart, and the circular last_price_pill price labels on the right-hand price axis. It is structured in the canonical YOLO directory format, comprising image files, label files, and a data.yml file that defines the dataset splits.
创建时间:
2025-11-09
原始信息汇总
Chart Info YOLO 数据集概述
数据集基本信息
- 名称:Chart Info YOLO
- 任务类型:目标检测
- 许可证:Apache-2.0
- 语言:英语
- 数据规模:小型(n<1K)
数据集结构
数据特征
- image:图像数据
- split:数据分割标识
- bboxes:边界框坐标列表(float64)
- labels:标签列表(int64)
数据分割
| 分割类型 | 样本数量 | 数据大小 |
|---|---|---|
| 训练集 | 150 | 35,419,499 字节 |
| 验证集 | 40 | 9,066,986 字节 |
| 测试集 | 40 | 9,666,104 字节 |
总体统计
- 下载大小:54,148,967 字节
- 数据集大小:54,152,589 字节
数据内容
目标类别
- 类别0:symbol_title - 图表顶部的代码和名称标题块
- 类别1:last_price_pill - 右侧价格轴上的圆形价格标签(当前/最后价格)
数据来源
- 图像来源于金融图表截图(如TradingView)
- 原始图像样本来自:https://huggingface.co/datasets/StephanAkkerman/stock-charts
数据格式
目录结构
images/ train/.png val/.png test/.png labels/ train/.txt val/.txt test/.txt data.yml
标签格式
<class_id> <x_center> <y_center> <width> <height>
- 所有坐标已归一化到[0, 1]范围
- 部分图表未标注(仅标注TradingView图表)
用途
- 检测图表UI元素(symbol_title, last_price_pill)
- 裁剪元素用于OCR提取代码、名称和当前价格
相关标签
yolo、finance、trading、charts、object-detection、chart-object-detection、financial-chart、financial-chart-analysis、financial-charts、financial-charts-analysis
搜集汇总
数据集介绍

构建方式
在金融图表分析领域,该数据集通过系统化标注流程构建而成。原始图像来源于公开的股票图表数据集,专业标注人员采用YOLO格式对交易界面中的关键元素进行边界框标注。标注过程聚焦于TradingView平台图表,针对符号标题区域和价格标签元素建立标准化坐标体系,所有坐标值均归一化处理以保持尺度一致性。未标注图表被明确区分,确保了数据质量的可靠性。
使用方法
对于实践应用而言,研究者可通过HuggingFace库直接下载数据集至本地目录。使用过程中需重点关注数据配置文件路径的准确指向,按照YOLO标准训练流程配置模型参数。典型应用场景包括调用YOLOv12n等轻量架构进行目标检测训练,将识别结果输入OCR系统实现金融信息的自动化提取。这种端到端的解决方案为量化分析研究提供了可靠的技术支撑。
背景与挑战
背景概述
随着金融科技领域的快速发展,自动化分析交易图表成为量化投资与算法交易的关键环节。Chart Info YOLO数据集由StephanAkkerman团队于2024年构建,专注于解决金融图表界面元素的智能检测问题。该数据集通过标注TradingView等主流金融平台的图表截图,针对符号标题区域与实时价格标签两类核心界面元素进行目标检测标注,为金融图表结构化解析提供了标准化基准。其采用YOLO目标检测框架的标注格式,显著推动了金融可视化数据分析与自动化交易系统的集成研究。
当前挑战
金融图表目标检测面临多重技术挑战:图表界面元素在不同平台间存在视觉差异,要求模型具备强泛化能力;实时价格标签的动态更新特性增加了检测时序一致性难度。数据集构建过程中,标注人员需应对高分辨率图表中微小元素的精确定位问题,同时需处理非标准UI布局导致的边界框标注歧义。此外,原始图表数据源中未标注样本的存在,进一步提升了数据清洗与质量控制的复杂度。
常用场景
经典使用场景
在金融图表分析领域,Chart Info YOLO数据集为对象检测任务提供了标准化标注框架。该数据集主要应用于训练轻量级YOLO模型,通过识别交易界面中的关键视觉元素,包括位于图表顶部的股票代码标题区域和右侧价格轴上的实时价格标签。这种标注方案使得模型能够精准定位金融图表中的结构化信息,为后续自动化分析流程奠定基础。
解决学术问题
该数据集有效解决了金融图表自动解析中的核心学术难题。通过提供高质量的边界框标注,它克服了传统方法在复杂界面元素检测中的局限性,显著提升了金融数据提取的准确率。其标注体系为研究界建立了可复现的基准,推动了基于深度学习的图表理解技术发展,特别是在小样本学习与领域自适应方面具有重要参考价值。
实际应用
在金融科技实践中,该数据集支撑着智能交易系统的关键组件开发。训练得到的检测模型可集成至自动化交易平台,实时捕捉图表中的价格标签与资产标识,为量化策略提供结构化输入。此外,在金融数据服务平台中,该技术能加速历史图表数据的数字化进程,大幅降低人工标注成本,提升金融信息处理的效率与规模。
数据集最近研究
最新研究方向
在金融图表智能分析领域,Chart Info YOLO数据集正推动基于目标检测的界面元素识别技术发展。当前研究聚焦于结合轻量化YOLO架构与多模态学习,通过定位符号标题和价格标签等关键组件,为后续OCR流程提供精准的视觉锚点。随着量化交易对实时数据解析需求的增长,该数据集支撑的端到端分析系统已成为行业热点,显著提升了金融图表结构化信息的提取效率与自动化水平。
以上内容由遇见数据集搜集并总结生成



