five

ToolBench评测集

收藏
魔搭社区2026-05-22 更新2025-05-17 收录
下载链接:
https://modelscope.cn/datasets/AI-ModelScope/ToolBench-Static
下载链接
链接失效反馈
官方服务:
资源简介:
# ToolBench-Static 评测模型工具调用的能力,该任务涉及集成 API 调用以完成任务,其中智能体必须准确选择适当的 API 并组合必要的 API 请求。 - in_domain 数量:1588 - out_domain 数量:781 #### 下载方法 :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"}

# ToolBench-Static 本数据集ToolBench-Static旨在评测模型的工具调用能力,此类任务需集成API调用来完成目标任务,要求AI智能体(AI Agent)精准选取适配的API并组合必要的API请求。 - 领域内(in_domain)样本量:1588 - 领域外(out_domain)样本量:781 #### 下载方法 :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2025-05-13
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ToolBench评测集用于评估模型调用工具的能力,包含in_domain(1588样本)和out_domain(781样本)两部分,支持通过SDK或GIT下载。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作