TAUR-dev/D-ExpTracker__FinEval_16k_fulleval_3args_Random-RL-letter_countdown_5o__v1
收藏Hugging Face2025-11-09 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/TAUR-dev/D-ExpTracker__FinEval_16k_fulleval_3args_Random-RL-letter_countdown_5o__v1
下载链接
链接失效反馈官方服务:
资源简介:
这是一个评估实验数据集,用于评估FinEval_16k_fulleval_3args_Random-RL在letter_countdown_5o任务上的表现。数据集包括问答对、模型响应、评估结果、实验日志和元数据。
This is an evaluation experiment dataset for assessing the performance of FinEval_16k_fulleval_3args_Random-RL on the letter_countdown_5o task. The dataset includes question-answer pairs, model responses, evaluation results, experiment logs, and metadata.
提供机构:
TAUR-dev



