MME-Finance|金融分析数据集|多模态学习数据集
收藏MME-Finance 数据集概述
数据集简介
MME-Finance 是一个面向金融领域的多模态基准测试数据集,旨在评估和推动大型金融多模态模型的发展。该数据集专注于金融领域的视觉问答(VQA)任务,包含多种类型的金融图表和专业问题,由金融行业专家进行标注和审核。
主要特点
- 领域专业性:数据集包含金融领域特有的图表(如蜡烛图、技术指标图)和专业知识(如期货、换手率)。
- 实际应用导向:图表包括电脑截图、手机拍摄等多种形式,模拟真实应用场景。
- 专家标注:问题和答案由具有10年以上金融行业经验的专家进行审核和标注。
数据收集与生成
- 数据收集:通过电脑截图、手机拍摄和手机应用截图等方式收集金融图表,分为蜡烛图、技术指标图、统计图、表格、文档和混合图六种类型。
- 问题生成:使用GPT-4o生成问题和答案,并由专家进行审核,确保数据集的质量。
评估方法
- 评估流程:设计了针对金融特性的评估流程,包括推理阶段的提示设计、模型输出的标准化评估,以及基于LLM的评分系统。
- 评分系统:评分系统分为六个等级,从0(完全错误)到5(完全正确),总分为所有样本的平均分。
数据集统计
- 样本数量:包含1,171个图像-问题-答案对,涵盖11个不同任务,分为3个能力等级。
- 图表类型分布:统计图表占主要比例,混合图表最少。
- 图像风格分布:电脑截图和手机拍摄各占约47.3%和40.5%,垂直和水平手机截图样本数量相近。
实验结果
- 模型表现:在MME-Finance上,主流多模态语言模型(MLLMs)的表现差异显著,许多模型准确率较低,表明该基准测试的挑战性。
- 最佳模型:开源模型Qwen2VL-72B和闭源模型GPT-4o分别获得65.69和63.18的最高分,但在与金融最相关的图表类型(如蜡烛图和技术指标图)上表现较差。
相关链接

中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
Awesome JSON Datasets
一个精选的无需认证的JSON数据集列表。
github 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录