TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_AT_STAR-SFT-longmult_3dig-eval_sft

Name: TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_AT_STAR-SFT-longmult_3dig-eval_sft
Creator: TAUR-dev
Published: 2025-11-10 08:42:15
License: 暂无描述

Hugging Face2025-11-10 更新2025-11-15 收录

下载链接：

https://hf-mirror.com/datasets/TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_AT_STAR-SFT-longmult_3dig-eval_sft

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了问题（question）、答案（answer）、任务配置（task_config）、任务来源（task_source）、提示（prompt）、模型响应（model_responses）及其评估信息、原始分割（original_split）、元数据（metadata）等字段。数据集分为测试集（test），包含1000个示例。此外，数据集中还包含了模型响应的多种评估指标和元数据信息。

The dataset includes fields such as question, answer, task configuration, task source, prompt, model responses and their evaluation information, original split, metadata, etc. The dataset is split into a test set containing 1000 examples. In addition, the dataset contains various evaluation metrics and metadata information for model responses.

提供机构：

TAUR-dev

5,000+

优质数据集

54 个

任务类型

进入经典数据集