five

FAMMA|金融问答数据集|多模态数据数据集

收藏
arXiv2024-10-08 更新2024-10-09 收录
金融问答
多模态数据
下载链接:
https://famma-bench.github.io/famma/
下载链接
链接失效反馈
资源简介:
FAMMA是一个开源的金融多语言多模态问答基准数据集,由浙江大学和Ant Group共同创建。该数据集包含1758个精心收集的问题-答案对,涵盖了公司金融、资产管理、金融工程等8个主要金融子领域。数据集中的问题以中、英、法三种语言呈现,并结合了文本和异构图像类型,如图表、表格和图示。创建过程中,数据集通过两阶段质量控制确保数据准确性,并根据CFA课程标准进行难度分类。FAMMA旨在评估多模态大语言模型在复杂金融知识问答中的能力,推动金融领域专家系统的研究。
提供机构:
浙江大学
创建时间:
2024-10-06
AI搜集汇总
数据集介绍
main_image_url
构建方式
FAMMA数据集的构建基于对金融领域多语言多模态问答能力的评估需求。该数据集精心收集了来自大学教材和考试的1,758个问答对,涵盖了公司金融、资产管理、金融工程等8个主要子领域。这些问答对不仅包括英文,还涵盖了中文和法文,且问题形式多样,结合了文本和异质图像类型,如图表、表格和图示。通过这种方式,FAMMA旨在全面反映金融从业者在日常工作中处理的真实问题。
使用方法
FAMMA数据集适用于评估和提升多模态大语言模型在金融领域的问答能力。用户可以通过该数据集进行模型训练和验证,以提高其在处理多语言和多模态金融问题上的表现。数据集的详细解释和图像支持也为用户提供了丰富的上下文信息,有助于更准确地理解和应用这些问答对。此外,FAMMA的开放性和多样性使其成为研究和开发金融领域专家系统的宝贵资源。
背景与挑战
背景概述
FAMMA数据集由Ant Group和浙江大学联合开发,旨在评估多模态大语言模型在金融领域中的问答能力。该数据集于2024年发布,包含了1,758个精心收集的问题-答案对,涵盖了公司金融、资产管理、金融工程等8个主要子领域。这些问题不仅涉及复杂的金融知识,还结合了文本和异质图像类型,如图表、表格和图示。FAMMA的推出填补了金融推理领域高质量基准的空白,为研究人员提供了一个评估和提升模型性能的平台。
当前挑战
FAMMA数据集面临的挑战主要体现在两个方面。首先,金融领域的复杂性和专业性要求模型具备深厚的领域知识和高水平的推理能力。尽管如GPT-4o和Claude-35-Sonnet等先进模型在FAMMA上的准确率仅为42%,远低于人类表现,这表明现有模型在处理金融问题时仍存在显著不足。其次,数据集的构建过程中,如何确保问题的多样性和高质量是一个重大挑战。FAMMA不仅包含了多语言(如中文和法语)的问题,还涉及多种数据模态,这增加了数据收集和处理的复杂性。
常用场景
经典使用场景
FAMMA数据集的经典使用场景主要集中在评估多模态大语言模型(MLLMs)在金融领域中的问答能力。该数据集通过包含1,758个精心收集的问题-答案对,涵盖了公司金融、资产管理、金融工程等8个主要子领域,旨在测试模型在处理复杂金融知识和推理问题上的表现。这些问题不仅涉及文本,还包括图表、表格和图示等多种图像类型,从而全面评估模型在多模态环境下的性能。
解决学术问题
FAMMA数据集解决了现有金融领域问答基准数据集的不足,特别是那些仅包含文本问题且仅限于英语的数据集。FAMMA通过引入多语言(包括中文和法语)和多模态(图像)的问题,填补了这一领域的空白。这不仅提升了对模型在复杂金融环境中理解和推理能力的评估,还为开发更专业的金融问答系统提供了基础,推动了金融领域人工智能研究的进步。
实际应用
在实际应用中,FAMMA数据集可以用于训练和验证金融领域的智能助手和聊天机器人,这些系统能够帮助金融从业者处理日常工作中的复杂查询。例如,风险管理专家可以使用这些系统来快速获取和分析市场数据,而投资顾问则可以利用这些系统为客户提供更精准的投资建议。此外,FAMMA还可以用于开发自动化的财务报告分析工具,提高金融分析师的工作效率。
数据集最近研究
最新研究方向
近年来,金融领域的多语言多模态问答(QA)系统研究取得了显著进展,其中FAMMA数据集的引入为这一领域带来了新的挑战和机遇。FAMMA数据集不仅涵盖了金融领域的多个子领域,如公司金融、资产管理、金融工程等,还包含了多种语言(如英语、中文、法语)和多模态数据(如图表、表格、图像),旨在评估多模态大语言模型(MLLMs)在复杂金融知识问答中的能力。研究者们通过在FAMMA数据集上的实验,发现即使是如GPT-4o和Claude-35-Sonnet这样的先进系统,准确率也仅为42%,显示出这些模型在处理金融领域复杂问题时的局限性。此外,研究还探索了GPT o1-style推理链以增强模型的推理能力,显著提高了错误纠正的效果。这些研究不仅推动了金融QA系统的发展,也为未来开发更专业的金融问答系统提供了宝贵的参考。
相关研究论文
  • 1
    FAMMA: A Benchmark for Financial Domain Multilingual Multimodal Question Answering浙江大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

PlantVillage

在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录