recastai/glaive-v2-single-turn-func-call-chatml
收藏Hugging Face2024-03-18 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/recastai/glaive-v2-single-turn-func-call-chatml
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由Re:cast AI创建,旨在将现有数据集转换为chatml友好格式,用于预训练模型的SFT任务。原始数据集经过过滤和修改,去除了不产生函数完成响应的示例,保留了单轮对话和自定义系统提示的示例,并保留了用户查询无法由助手满足的示例。过滤后,数据集从112,960行减少到29,537行,减少了约74%。
该数据集由Re:cast AI创建,旨在将现有数据集转换为chatml友好格式,用于预训练模型的SFT任务。原始数据集经过过滤和修改,去除了不产生函数完成响应的示例,保留了单轮对话和自定义系统提示的示例,并保留了用户查询无法由助手满足的示例。过滤后,数据集从112,960行减少到29,537行,减少了约74%。
提供机构:
recastai
原始信息汇总
数据集概述
数据集名称
- 名称: glaive-v2-single-turn-func-call-chatml
数据集创建者
- 创建者: Re:cast AI
数据集描述
- 描述: 该数据集由Re:cast AI创建,旨在将原始数据集glaiveai/glaive-function-calling-v2转换为适合SFT任务的chatml格式,以便与预训练模型一起使用。
数据集特征
- 特征:
- messages:
- content (dtype: string)
- role (dtype: string)
- messages:
数据集结构
- 数据集结构: python messages = [ {content: You are a helpful assistant with access to the following functions ... etc., role: system}, {content: Can you tell me the latest news headlines for the United States?, role: user}, {content: {"name": "get_news_headlines", "arguments": {"country": "United States"}}, role: assistant} ]
数据集大小
- 训练集大小:
- 示例数量: 29537
- 字节数: 40910956.92511341
- 下载大小: 5494056
- 数据集总大小: 40910956.92511341
数据集分割
- 分割:
- train
许可证
- 许可证: apache-2.0
任务类别
- 任务类别: text-generation
语言
- 语言: en
标签
- 标签: function-calling
数据集美观名称
- 美观名称: glaive-v2-single-turn-func-call-chatml
大小类别
- 大小类别: 10K<n<100K
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



