FinEval

Name: FinEval
Creator: Salesforce
Published: 2025-01-27 12:41:35
License: 暂无描述

Hugging Face2025-01-27 更新2025-02-10 收录

下载链接：

https://huggingface.co/datasets/Salesforce/FinEval

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是用于评估金融领域大语言模型（LLM）的领域自适应后训练框架FinDAP的一部分。数据集包含多个配置，如CFA-Challenge、CFA-Easy、CRA-Bigdata等，每个配置都有不同的特征和测试集大小。数据集的特征包括查询、答案、文本、选项和黄金标准等。该数据集的发布是为了支持学术研究，并提供了引用信息。

This dataset is part of the domain-adaptive post-training framework FinDAP, which is developed to evaluate large language models (LLMs) in the financial domain. The dataset includes multiple configurations such as CFA-Challenge, CFA-Easy, CRA-Bigdata, and others. Each configuration has distinct characteristics and a varying test set size. The features of the dataset cover queries, answers, texts, options, and gold standards, among others. This dataset is released to support academic research, and relevant citation information is provided.

提供机构：

Salesforce

创建时间：

2025-01-27

搜集汇总

数据集介绍

构建方式

FinEval数据集是针对金融领域语言模型的域适应后训练的评价数据集。它包含了多个子数据集，涵盖了金融问答、文本摘要、命名实体识别等多种金融场景。该数据集通过整合不同来源的金融数据，构建了一个全面的后训练评价框架，旨在评估和促进金融领域语言模型的发展。

特点

FinEval数据集的特点在于其多样性、全面性和针对性。它不仅包含了不同难度的金融问答数据，还涵盖了金融文本摘要和命名实体识别等任务，为金融领域语言模型的评价提供了丰富的场景。此外，数据集遵循Creative Commons BY-NC 4.0许可，保证了数据的合法使用。

使用方法

使用FinEval数据集时，用户需先下载相应的子数据集，并根据具体的任务需求进行数据加载和预处理。数据集以测试集的形式提供，用户可以将其应用于模型的后训练阶段，以评估模型在金融领域的表现。同时，数据集的读取和使用需遵循相应的许可协议。

背景与挑战

背景概述

FinEval数据集是为了评估金融领域自适应后训练方法而创建的，其背景源于如何将具有强大通用能力的预训练语言模型（如Llama3-8b-instruct）有效地适应目标领域。该数据集与Demystifying Domain-adaptive Post-training for Financial LLMs研究论文紧密相关，该论文探讨了成功适应的准则以及与数据及模型相关的有效训练方法。FinEval作为FinDAP框架的一部分，包含了一个全面的评估框架、最先进的模型检查点和一个训练配方。该数据集的创建旨在支持对指令微调的LLM进行领域自适应后训练的案例研究，由SalesforceAIResearch团队提供。

当前挑战

在构建FinEval数据集的过程中，研究团队面临了多个挑战。首先，确保数据集能够全面覆盖金融领域的多样性，以便对模型进行有效的后训练是一个挑战。其次，构建一个能够准确评估模型在金融领域适应性的评估框架同样具有挑战性。此外，数据集的构建还需考虑到伦理问题，包括对原始数据集的版权和责任的评估。在使用该数据集时，研究人员需要解决如何有效利用数据集进行领域自适应后训练，以及如何准确衡量模型在金融领域的表现等问题。

常用场景

经典使用场景

FinEval数据集是针对金融领域语言模型适应性后训练的评估而构建的。该数据集在金融领域中被广泛使用，其经典使用场景包括对预训练语言模型进行领域适应性训练，以提升其在金融领域的问答、摘要、实体识别等任务上的性能。

解决学术问题

该数据集解决了如何评估和优化金融领域语言模型的问题，对于学术研究而言，FinEval提供了丰富的金融文本，有助于研究者探究领域适应性后训练的有效性，进而推动金融自然语言处理技术的发展。其意义在于为金融领域的语言模型研究提供了实验基础，促进了学术界的交流与合作。

衍生相关工作

基于FinEval数据集，研究者们已经开展了一系列相关工作，包括但不限于开发新的金融文本分类模型、构建金融领域问答系统、以及进行金融文本的实体识别和关系抽取等，这些研究进一步推动了金融领域自然语言处理技术的实用化和普及化。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集