five

dtgsl/CandleBench

收藏
Hugging Face2026-04-08 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/dtgsl/CandleBench
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 task_categories: - visual-document-retrieval - visual-question-answering tags: - finance - image-text - cross-modal-retrieval - candlestick-chart - stock - technical-analysis pretty_name: CandleBench - Financial Chart Cross-Modal Retrieval Benchmark size_categories: - 100K<n<1M --- # 📁 Dataset Structure - Total images: **103,301** - Annotations: **5 captions per image** - Markets: CN (A-share), US (Stock) - Timeframes: Daily, Weekly, Monthly - Resolution: PC + Mobile --- # 📈 Expert Human Evaluation (1–5, higher=better) | Metric | PGCC | MLLM | PGCC | MLLM | PGCC | MLLM | PGCC | MLLM | PGCC | MLLM | PGCC | MLLM | |---|---|---|---|---|---|---|---|---|---|---|---|---| | | CN-D | CN-D | CN-W | CN-W | CN-M | CN-M | US-D | US-D | US-W | US-W | US-M | US-M | | Pattern Accuracy | **4.6** | 2.8 | **4.4** | 3.4 | **4.2** | 3.2 | **4.8** | 3.2 | **4.8** | 3.6 | **4.8** | 3.4 | | Numerical Precision | **4.6** | 3.2 | **4.6** | 3.2 | **4.6** | 3.2 | **4.6** | 3.2 | **4.8** | 3.2 | **4.6** | 3.2 | | Dimension Richness | **4.2** | 2.6 | **4.2** | 2.6 | **4.2** | 2.6 | **4.6** | 2.8 | **4.6** | 2.8 | **4.6** | 2.6 | *D=Daily, W=Weekly, M=Monthly* --- # 🧪 Model Performance Comparison | Retriever | I2T R@1 | I2T R@5 | I2T R@10 | DCG | T2I R@1 | T2I R@5 | T2I R@10 | DCG | |---|---:|---:|---:|---:|---:|---:|---:|---:| | tomoro-colqwen3-embed-4b | **2.75** | **11.34** | **18.92** | – | 7.52 | 23.71 | 35.27 | – | | llama-nemoretriever-colembed-3b | 1.20 | 5.73 | 10.68 | – | **15.36** | **42.12** | **57.96** | – | | ColQwen2.5-v0.2 3B | 1.24 | 5.74 | 10.68 | – | 11.47 | 33.46 | 46.48 | – | | Qwen3-VL-Embedding 8B | 1.70 | 6.80 | 12.30 | 1.84 | 2.37 | 9.44 | 16.48 | 1.76 | | RZEN-Embed 8B | 1.59 | 6.78 | 12.24 | **2.09** | 2.24 | 8.47 | 14.68 | 2.05 | | OPS-MM-Embedding-v1 7B | 0.78 | 3.86 | 7.77 | 1.56 | 0.76 | 3.88 | 7.82 | **2.06** | | CLIP | 0.82 | 3.87 | 7.78 | 1.24 | 0.83 | 3.91 | 7.77 | 1.24 | | VSE++ | 0.76 | 3.84 | 7.81 | 1.56 | 0.75 | 3.79 | 7.63 | 1.35 | | BLIP | 0.78 | 3.88 | 7.78 | 1.77 | 0.77 | 3.87 | 7.74 | 1.85 | | BLIP2 | 0.75 | 3.86 | 7.73 | 1.50 | 0.77 | 3.87 | 7.74 | 1.67 | --- # 🚀 How to Use ```python from datasets import load_dataset dataset = load_dataset("dtgsl/CandleBench")

许可证:Apache-2.0 任务类别: - 视觉文档检索(visual-document-retrieval) - 视觉问答(visual-question-answering) 标签: - 金融 - 图文 - 跨模态检索(cross-modal-retrieval) - K线图(candlestick-chart) - 股票 - 技术分析(technical-analysis) 可视化名称:CandleBench——金融图表跨模态检索基准数据集 样本规模类别:10万<样本量<100万 # 📁 数据集结构 - 总图像量:**103,301** - 标注配置:每张图像对应5条描述文本 - 覆盖市场:中国A股(CN)、美国股市(US) - 时间周期:日线、周线、月线 - 分辨率适配:支持PC端与移动端 # 📈 专家人工评估(1–5分,分值越高表现越好) | 评估指标 | 中国A股日线 | | 中国A股周线 | | 中国A股月线 | | 美国股市日线 | | 美国股市周线 | | 美国股市月线 | | |---|---|---|---|---|---|---|---|---|---|---|---|---| | | PGCC | MLLM | PGCC | MLLM | PGCC | MLLM | PGCC | MLLM | PGCC | MLLM | PGCC | MLLM | | 形态准确率 | **4.6** | 2.8 | **4.4** | 3.4 | **4.2** | 3.2 | **4.8** | 3.2 | **4.8** | 3.6 | **4.8** | 3.4 | | 数值精度 | **4.6** | 3.2 | **4.6** | 3.2 | **4.6** | 3.2 | **4.6** | 3.2 | **4.8** | 3.2 | **4.6** | 3.2 | | 维度丰富度 | **4.2** | 2.6 | **4.2** | 2.6 | **4.2** | 2.6 | **4.6** | 2.8 | **4.6** | 2.8 | **4.6** | 2.6 | *注:D代表日线(Daily),W代表周线(Weekly),M代表月线(Monthly)* # 🧪 模型性能对比 | 检索模型 | 图像到文本召回率@1 | 图像到文本召回率@5 | 图像到文本召回率@10 | 折损累计增益(DCG) | 文本到图像召回率@1 | 文本到图像召回率@5 | 文本到图像召回率@10 | 折损累计增益(DCG) | |---|---:|---:|---:|---:|---:|---:|---:|---:| | tomoro-colqwen3-embed-4b | **2.75** | **11.34** | **18.92** | – | 7.52 | 23.71 | 35.27 | – | | llama-nemoretriever-colembed-3b | 1.20 | 5.73 | 10.68 | – | **15.36** | **42.12** | **57.96** | – | | ColQwen2.5-v0.2 3B | 1.24 | 5.74 | 10.68 | – | 11.47 | 33.46 | 46.48 | – | | Qwen3-VL-Embedding 8B | 1.70 | 6.80 | 12.30 | 1.84 | 2.37 | 9.44 | 16.48 | 1.76 | | RZEN-Embed 8B | 1.59 | 6.78 | 12.24 | **2.09** | 2.24 | 8.47 | 14.68 | 2.05 | | OPS-MM-Embedding-v1 7B | 0.78 | 3.86 | 7.77 | 1.56 | 0.76 | 3.88 | 7.82 | **2.06** | | CLIP | 0.82 | 3.87 | 7.78 | 1.24 | 0.83 | 3.91 | 7.77 | 1.24 | | VSE++ | 0.76 | 3.84 | 7.81 | 1.56 | 0.75 | 3.79 | 7.63 | 1.35 | | BLIP | 0.78 | 3.88 | 7.78 | 1.77 | 0.77 | 3.87 | 7.74 | 1.85 | | BLIP2 | 0.75 | 3.86 | 7.73 | 1.50 | 0.77 | 3.87 | 7.74 | 1.67 | # 🚀 使用方式 python from datasets import load_dataset dataset = load_dataset("dtgsl/CandleBench")
提供机构:
dtgsl
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作