TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_3args_NoReflects-RL-letter_countdown_4o-eval_rl

Name: TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_3args_NoReflects-RL-letter_countdown_4o-eval_rl
Creator: TAUR-dev
Published: 2025-11-10 06:00:02
License: 暂无描述

Hugging Face2025-11-10 更新2025-11-15 收录

下载链接：

https://hf-mirror.com/datasets/TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_3args_NoReflects-RL-letter_countdown_4o-eval_rl

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含问题、答案以及相关元数据的数据集，用于评估模型在回答问题时的性能。数据集字段包括问题文本、答案文本、任务配置、数据源、提示信息等，并提供了针对模型响应的详细评估指标。

This dataset includes questions, answers, and related metadata for evaluating model performance in answering questions. The dataset fields include question text, answer text, task configuration, data source, prompt information, and detailed evaluation metrics for model responses.

提供机构：

TAUR-dev

5,000+

优质数据集

54 个

任务类型

进入经典数据集