five

kshitijthakkar/smoltrace-results-20251112_110229

收藏
Hugging Face2025-11-12 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/kshitijthakkar/smoltrace-results-20251112_110229
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个记录模型执行任务的情况的数据集,包含了模型的名称、评估日期、任务ID、代理类型、难度、提示信息、是否成功、是否调用工具、工具是否正确、是否调用最终答案、响应是否正确、使用的工具列表、步骤数、响应内容、错误信息、跟踪ID、执行时间、总标记数和成本等信息。数据集分为训练集,其中包含了15个示例。

This dataset records the performance of a model on tasks, including information such as model name, evaluation date, task ID, agent type, difficulty, prompt, success or failure, tool invocation, correctness of the tool, invocation of the final answer, correctness of the response, list of tools used, number of steps, response content, error information, trace ID, execution time, total tokens, and cost. The dataset is split into a training set which contains 15 examples.
提供机构:
kshitijthakkar
二维码
社区交流群
二维码
科研交流群
商业服务