mukunda1729/tool-arg-validation-cases

Name: mukunda1729/tool-arg-validation-cases
Creator: mukunda1729
Published: 2026-04-27 16:13:37
License: 暂无描述

Hugging Face2026-04-27 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/mukunda1729/tool-arg-validation-cases

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为Tool Arg Validation Cases，包含20个配对的（模式、参数、预期结果）测试用例，专门用于测试大型语言模型（LLM）工具调用验证器。每个测试用例包括工具定义、LLM生成的参数以及验证结果（通过或失败，失败时包含预期的错误信息）。数据集适用于属性测试、生成重试反馈语料库以及为新工程师提供工具调用验证的示例。数据集字段包括工具名称（tool）、模式（schema）、参数（args）、验证结果（valid）和错误信息（error）。

--- 许可证：MIT许可证语言： - 英语标签： - 大语言模型（Large Language Model） - 工具调用 - AI智能体（AI Agent） - 验证 - 模式（Schema） - 测试数据集规模类别： - 样本数少于1000（n<1K）美观名称：工具参数验证用例集配置项： - 配置名称：默认配置数据文件： - 数据划分：训练集文件路径：data.jsonl --- # 工具参数验证用例集本数据集包含20组配对的（模式Schema、参数、预期结果）测试夹具，用于测试大语言模型（Large Language Model）的工具调用验证器。每一行数据均包含一项工具定义、大语言模型拟传入的参数，以及验证是否应当通过的结果（若验证不通过，还会附带预期的错误信息）。 python from datasets import load_dataset ds = load_dataset("mukunda1729/tool-arg-validation-cases", split="train") for case in ds: if case["valid"]: assert validator(case["schema"], case["args"]).valid else: assert validator(case["schema"], case["args"]).error == case["error"] ## 模式规范 | 字段名 | 数据类型 | 说明 | |---|---|---| | `tool` | 字符串 | 工具名称（仅供参考） | | `schema` | 对象 | 字段名→类型规范。类型名称后加`?`表示该字段为可选。支持的数据类型包括：`str`（字符串）、`int`（整数）、`float`（浮点数）、`bool`（布尔值）、`list`（列表）、`dict`（字典） | | `args` | 对象 | 大语言模型生成的参数 | | `valid` | 布尔值 | 预期的验证结果 | | `error` | 字符串 | 当`valid: false`时的预期错误信息 | ## 应用场景 - 为[`agentvet-py`](https://pypi.org/project/agentvet-py/)、[`tool-call-contracts-py`](https://pypi.org/project/tool-call-contracts-py/)、[`@mukundakatta/agentvet`](https://www.npmjs.com/package/@mukundakatta/agentvet) 提供基于属性的测试用例。 - 为难以适配工具参数格式的模型生成重试反馈语料库，用于模型微调。 - 为首次集成工具调用验证功能的工程师提供入门示例。本数据集隶属于[智能体可靠性工具栈](https://mukundakatta.github.io/agent-stack/)。 ## 许可证 MIT许可证。

提供机构：

mukunda1729

5,000+

优质数据集

54 个

任务类型

进入经典数据集