five

seankski/tool-parameters-v1-1

收藏
Hugging Face2024-07-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/seankski/tool-parameters-v1-1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置具有不同的特征和数据分割。主要特征包括用户查询、工具参数、工具种子组、套件名称、工具名称、工具调用次数、主题、数据生成消息、微调消息、套件模式、工具模式、LLM作为裁判、响应、原始套件模式、新套件模式、理由消息、拒绝消息和增强等。数据分割主要包含训练集,每个配置的训练集大小和示例数量也有所不同。

This dataset contains multiple configurations, each with different features and data splits. The main features include user query, tool parameters, tool seed group, suite name, tool names, number of tool calls, topics, messages from data generation, messages for finetuning, suite schemas, tool schemas, LLM as a judge, response, original suite schemas, new suite schemas, rationale messages, refusal messages, and augmentation. The data splits mainly include the training set, and the size and number of examples of the training set for each configuration are also different.
提供机构:
seankski
原始信息汇总

数据集概述

数据集配置

配置名称:augmented

  • 特征
    • user_query: string
    • tool_parameters: string
    • tool_seed_group: string
    • suite_name: string
    • tool_names: string
    • n_tool_calls: int64
    • topics: string
    • messages_from_data_generation: string
    • messages_for_finetuning: string
    • suite_schemas: string
    • tool_schemas: string
    • llm_as_a_judge: string
    • response: string
    • original_suite_schemas: string
    • new_suite_schemas: string
    • rationale_messages: string
    • refusal_messages: string
    • augmentation: string
  • 分割
    • train:
      • num_bytes: 4692786
      • num_examples: 60
  • 下载大小:1214967
  • 数据集大小:4692786

配置名称:finetuning-messages-only

  • 特征
    • messages:
      • content: string
      • role: string
  • 分割
    • train:
      • num_bytes: 45405834
      • num_examples: 6712
  • 下载大小:13450364
  • 数据集大小:45405834

配置名称:passing-judgments-augmented

  • 特征
    • user_query: string
    • tool_parameters: string
    • tool_seed_group: string
    • suite_name: string
    • tool_names: string
    • n_tool_calls: int64
    • topics: string
    • messages_from_data_generation: string
    • messages_for_finetuning: string
    • suite_schemas: string
    • tool_schemas: string
    • llm_as_a_judge: string
    • response: string
    • original_suite_schemas: string
    • new_suite_schemas: string
    • rationale_messages: string
    • refusal_messages: string
    • augmentation: string
  • 分割
    • train:
      • num_bytes: 464471329
      • num_examples: 6712
  • 下载大小:95095092
  • 数据集大小:464471329

配置名称:raw

  • 特征
    • user_query: string
    • tool_parameters: string
    • tool_seed_group: string
    • suite_name: string
    • tool_names: string
    • n_tool_calls: int64
    • topics: string
    • messages_from_data_generation: string
    • messages_for_finetuning: string
    • suite_schemas: string
    • tool_schemas: string
    • llm_as_a_judge: string
  • 分割
    • train:
      • num_bytes: 1060911731
      • num_examples: 26634
  • 下载大小:216496003
  • 数据集大小:1060911731

数据文件路径

  • 配置名称:augmented
    • train: augmented/train-*
  • 配置名称:finetuning-messages-only
    • train: finetuning-messages-only/train-*
  • 配置名称:passing-judgments-augmented
    • train: passing-judgments-augmented/train-*
  • 配置名称:raw
    • train: raw/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作