EnglishFinance2Retrieval-sample

Hugging Face2025-09-16 更新2025-09-17 收录

下载链接：

https://huggingface.co/datasets/mteb-private/EnglishFinance2Retrieval-sample

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于金融性能检索评估的示例数据集，包含6个描述信息需求的查询、10个相应的文档以及6个将查询与文档相关联的相关性判断。数据集采用标准的MTEB检索格式，并略微修改以用于演示，同时保留了原始结构和含义。

创建时间：

2025-09-12

原始信息汇总

EnglishFinance2Retrieval-sample 数据集概述

基本信息

语言：英语
多语言性：单语
许可证：其他
标注来源：衍生

任务类别

主要任务类别：文本检索
具体任务：文档检索

数据集结构

配置与特征

corpus配置
- 特征字段：_id（字符串）、title（字符串）、text（字符串）
- 数据分割：训练集（10个样本）
default配置
- 特征字段：query-id（字符串）、corpus-id（字符串）、score（int64）
- 数据分割：测试集（6个样本）
queries配置
- 特征字段：_id（字符串）、text（字符串）
- 数据分割：训练集（6个样本）

文件组成

corpus/corpus-00000-of-00001.parquet：包含10个文档
queries/queries-00000-of-00001.parquet：包含6个查询
data/test-00000-of-00001.parquet：包含6个相关性判断

领域

金融
交通运输

用途

用于金融绩效检索评估的样本数据集，遵循标准MTEB检索格式。

样本内容

6个描述信息需求的查询
10个对应文档
6个连接查询与文档的相关性判断

使用说明

可通过MTEB库加载该数据集并进行嵌入模型评估，需提供huggingface令牌（因数据集为封闭数据集）。

搜集汇总

数据集介绍

构建方式

在金融信息检索领域，EnglishFinance2Retrieval-sample数据集采用派生式构建方法，基于原始金融文档进行结构化处理。数据集严格遵循MTEB检索评估框架标准，通过专业标注流程构建了包含查询语句、文档语料及相关性判定的三元组结构。构建过程中注重保持金融术语的准确性和文本语义的完整性，确保数据质量符合检索任务的专业要求。

特点

该数据集呈现典型的金融领域文本检索特征，包含精心设计的10篇金融文档和6组专业查询语句。文档内容涵盖交通运输等金融细分领域，具有专业术语密集、语义复杂度高的特点。数据集采用标准化parquet格式存储，配备完整的元数据描述体系，支持高效的批量数据处理和检索性能评估。其小规模样本特性使其成为模型快速验证的理想选择。

使用方法

使用者可通过MTEB评估框架直接加载该数据集进行检索模型性能测试。具体操作流程包括使用mteb.get_task方法获取任务实例，初始化评估器后传入自定义嵌入模型即可自动完成检索评估。评估过程将计算查询-文档匹配度指标，输出标准化的性能评估报告。需要注意的是，完整数据集访问需提供相应的身份验证凭证。

背景与挑战

背景概述

金融信息检索领域对专业文本处理能力提出特殊要求，EnglishFinance2Retrieval-sample数据集应运而生。该数据集由MTEB评估框架支持开发，专注于金融与交通运输领域的文档检索任务，采用标准化的三元组结构构建，包含查询文本、文档语料及相关性标注。其设计旨在评估嵌入模型在专业领域的语义匹配性能，为金融科技领域的自然语言处理研究提供精准的评估基准。

当前挑战

金融领域文档检索面临专业术语密集和语义复杂度高的核心挑战，要求模型准确理解财务报告与运输数据的专业表述。数据集构建过程中需克服领域知识标注的准确性难题，包括专业术语的标准化处理和多维度相关性评判标准的建立。同时，受限的样本规模对统计显著性构成挑战，需要精心设计查询-文档对以保证评估效度。

常用场景

经典使用场景

在金融信息检索领域，EnglishFinance2Retrieval-sample数据集作为标准评估基准，主要用于测试嵌入模型在财务文档匹配任务中的性能表现。该数据集通过精心设计的查询-文档对，模拟真实金融分析师查找企业财报、市场分析报告等专业文献的场景，为模型提供精准的语义匹配能力验证平台。

衍生相关工作

基于该数据集衍生的经典研究包括MTEB基准测试框架下的多模态检索模型优化、领域自适应预训练技术探索以及金融术语增强的嵌入方法开发。这些工作不仅推动了BERT、RoBERTa等模型在专业领域的微调创新，还催生了针对金融语义相似度计算的专用评估指标，为后续大规模金融语料库建设奠定了方法论基础。

数据集最近研究