TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_3args_NoReflects-RL-letter_countdown_4o-eval_rl
收藏Hugging Face2025-11-10 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/TAUR-dev/D-EVAL__standard_eval_v3__FinEval_16k_fulleval_3args_NoReflects-RL-letter_countdown_4o-eval_rl
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含问题、答案以及相关元数据的数据集,用于评估模型在回答问题时的性能。数据集字段包括问题文本、答案文本、任务配置、数据源、提示信息等,并提供了针对模型响应的详细评估指标。
This dataset includes questions, answers, and related metadata for evaluating model performance in answering questions. The dataset fields include question text, answer text, task configuration, data source, prompt information, and detailed evaluation metrics for model responses.
提供机构:
TAUR-dev



