TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_AT_STAR-SFT-countdown_6arg-eval_sft

Name: TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_AT_STAR-SFT-countdown_6arg-eval_sft
Creator: TAUR-dev
Published: 2025-11-10 07:19:04
License: 暂无描述

Hugging Face2025-11-10 更新2025-11-15 收录

下载链接：

https://hf-mirror.com/datasets/TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_AT_STAR-SFT-countdown_6arg-eval_sft

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含问题和答案以及相关任务配置和评估指标的数据集，适用于测试模型在回答问题方面的性能。数据集包含测试集，并提供了详细的评估数据，如正确率和技能计数等。

This is a dataset containing questions, answers, related task configurations, and evaluation metrics, which is suitable for testing the performance of models in answering questions. The dataset includes a test set and provides detailed evaluation data such as accuracy and skill counts.

提供机构：

TAUR-dev

5,000+

优质数据集

54 个

任务类型

进入经典数据集