Tool-learning-it/Toucan-converted-dataset
收藏Hugging Face2025-12-22 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/Tool-learning-it/Toucan-converted-dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: Kimi-K2
features:
- name: uuid
dtype: string
- name: subset_name
dtype: string
- name: messages
list:
- name: content
dtype: string
- name: helpfulness_score
dtype: 'null'
- name: name
dtype: string
- name: quality_score
dtype: 'null'
- name: reasoning_content
dtype: string
- name: role
dtype: string
- name: type
dtype: string
- name: question
dtype: string
- name: target_tools
dtype: string
- name: question_quality_assessment
dtype: string
- name: response_quality_assessment
dtype: string
- name: metadata
dtype: string
- name: tools
list:
- name: description
dtype: string
- name: name
dtype: string
- name: parameters_json
dtype: string
splits:
- name: train
num_bytes: 16129687768
num_examples: 518516
download_size: 5274987672
dataset_size: 16129687768
- config_name: OSS
features:
- name: uuid
dtype: string
- name: subset_name
dtype: string
- name: messages
list:
- name: content
dtype: string
- name: helpfulness_score
dtype: 'null'
- name: name
dtype: string
- name: quality_score
dtype: 'null'
- name: reasoning_content
dtype: string
- name: role
dtype: string
- name: type
dtype: string
- name: question
dtype: string
- name: target_tools
dtype: string
- name: question_quality_assessment
dtype: string
- name: response_quality_assessment
dtype: string
- name: metadata
dtype: string
- name: tools
list:
- name: description
dtype: string
- name: name
dtype: string
- name: parameters_json
dtype: string
splits:
- name: train
num_bytes: 19301597518
num_examples: 457130
download_size: 7069135281
dataset_size: 19301597518
- config_name: Qwen3
features:
- name: uuid
dtype: string
- name: subset_name
dtype: string
- name: messages
list:
- name: content
dtype: string
- name: helpfulness_score
dtype: 'null'
- name: name
dtype: string
- name: quality_score
dtype: 'null'
- name: reasoning_content
dtype: string
- name: role
dtype: string
- name: type
dtype: string
- name: question
dtype: string
- name: target_tools
dtype: string
- name: question_quality_assessment
dtype: string
- name: response_quality_assessment
dtype: string
- name: metadata
dtype: string
- name: tools
list:
- name: description
dtype: string
- name: name
dtype: string
- name: parameters_json
dtype: string
splits:
- name: train
num_bytes: 17909149325
num_examples: 551613
download_size: 5589229132
dataset_size: 17909149325
- config_name: SFT
features:
- name: uuid
dtype: string
- name: subset_name
dtype: string
- name: question
dtype: string
- name: target_tools
dtype: string
- name: messages
list:
- name: content
dtype: string
- name: helpfulness_score
dtype: 'null'
- name: name
dtype: string
- name: quality_score
dtype: 'null'
- name: reasoning_content
dtype: string
- name: role
dtype: string
- name: type
dtype: string
- name: tools
list:
- name: description
dtype: string
- name: name
dtype: string
- name: parameters_json
dtype: string
splits:
- name: train
num_bytes: 1219558611
num_examples: 119287
download_size: 370755025
dataset_size: 1219558611
configs:
- config_name: Kimi-K2
data_files:
- split: train
path: Kimi-K2/train-*
- config_name: OSS
data_files:
- split: train
path: OSS/train-*
- config_name: Qwen3
data_files:
- split: train
path: Qwen3/train-*
- config_name: SFT
data_files:
- split: train
path: SFT/train-*
---
数据集信息:
- 配置名称:Kimi-K2
特征字段:
- 通用唯一识别码(UUID):字符串类型
- 子集名称:字符串类型
- 对话消息(列表类型):
- 内容:字符串类型
- 有用性评分:空类型
- 名称:字符串类型
- 质量评分:空类型
- 推理内容:字符串类型
- 角色:字符串类型
- 类型:字符串类型
- 问题:字符串类型
- 目标工具:字符串类型
- 问题质量评估:字符串类型
- 回复质量评估:字符串类型
- 元数据:字符串类型
- 工具(列表类型):
- 描述:字符串类型
- 名称:字符串类型
- JSON格式参数:字符串类型
划分集:
- 名称:训练集
字节数:16129687768
样本数量:518516
下载大小:5274987672
数据集大小:16129687768
- 配置名称:OSS
特征字段:
- 通用唯一识别码(UUID):字符串类型
- 子集名称:字符串类型
- 对话消息(列表类型):
- 内容:字符串类型
- 有用性评分:空类型
- 名称:字符串类型
- 质量评分:空类型
- 推理内容:字符串类型
- 角色:字符串类型
- 类型:字符串类型
- 问题:字符串类型
- 目标工具:字符串类型
- 问题质量评估:字符串类型
- 回复质量评估:字符串类型
- 元数据:字符串类型
- 工具(列表类型):
- 描述:字符串类型
- 名称:字符串类型
- JSON格式参数:字符串类型
划分集:
- 名称:训练集
字节数:19301597518
样本数量:457130
下载大小:7069135281
数据集大小:19301597518
- 配置名称:Qwen3
特征字段:
- 通用唯一识别码(UUID):字符串类型
- 子集名称:字符串类型
- 对话消息(列表类型):
- 内容:字符串类型
- 有用性评分:空类型
- 名称:字符串类型
- 质量评分:空类型
- 推理内容:字符串类型
- 角色:字符串类型
- 类型:字符串类型
- 问题:字符串类型
- 目标工具:字符串类型
- 问题质量评估:字符串类型
- 回复质量评估:字符串类型
- 元数据:字符串类型
- 工具(列表类型):
- 描述:字符串类型
- 名称:字符串类型
- JSON格式参数:字符串类型
划分集:
- 名称:训练集
字节数:17909149325
样本数量:551613
下载大小:5589229132
数据集大小:17909149325
- 配置名称:SFT
特征字段:
- 通用唯一识别码(UUID):字符串类型
- 子集名称:字符串类型
- 问题:字符串类型
- 目标工具:字符串类型
- 对话消息(列表类型):
- 内容:字符串类型
- 有用性评分:空类型
- 名称:字符串类型
- 质量评分:空类型
- 推理内容:字符串类型
- 角色:字符串类型
- 类型:字符串类型
- 工具(列表类型):
- 描述:字符串类型
- 名称:字符串类型
- JSON格式参数:字符串类型
划分集:
- 名称:训练集
字节数:1219558611
样本数量:119287
下载大小:370755025
数据集大小:1219558611
配置项:
- 配置名称:Kimi-K2,数据文件:划分集为训练集,路径为Kimi-K2/train-*
- 配置名称:OSS,数据文件:划分集为训练集,路径为OSS/train-*
- 配置名称:Qwen3,数据文件:划分集为训练集,路径为Qwen3/train-*
- 配置名称:SFT,数据文件:划分集为训练集,路径为SFT/train-*
提供机构:
Tool-learning-it



