twinkle-ai/gpt-oss-eval-logs-and-scores
收藏Hugging Face2025-08-13 更新2025-09-13 收录
下载链接:
https://hf-mirror.com/datasets/twinkle-ai/gpt-oss-eval-logs-and-scores
下载链接
链接失效反馈官方服务:
资源简介:
这个数据集包含了使用Twinkle Eval工具测试的gpt-oss模型的详细评估结果,每个条目都记录了在多个基准测试套件中每个问题的得分情况。
This dataset contains the detailed evaluation results of gpt-oss models tested using Twinkle Eval, a robust and efficient AI evaluation tool developed by Twinkle AI. Each entry includes per-question scores across multiple benchmark suites.
提供机构:
twinkle-ai



