five

recastai/glaive-v2-single-turn-func-call-chatml

收藏
Hugging Face2024-03-18 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/recastai/glaive-v2-single-turn-func-call-chatml
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由Re:cast AI创建,旨在将现有数据集转换为chatml友好格式,用于预训练模型的SFT任务。原始数据集经过过滤和修改,去除了不产生函数完成响应的示例,保留了单轮对话和自定义系统提示的示例,并保留了用户查询无法由助手满足的示例。过滤后,数据集从112,960行减少到29,537行,减少了约74%。

该数据集由Re:cast AI创建,旨在将现有数据集转换为chatml友好格式,用于预训练模型的SFT任务。原始数据集经过过滤和修改,去除了不产生函数完成响应的示例,保留了单轮对话和自定义系统提示的示例,并保留了用户查询无法由助手满足的示例。过滤后,数据集从112,960行减少到29,537行,减少了约74%。
提供机构:
recastai
原始信息汇总

数据集概述

数据集名称

  • 名称: glaive-v2-single-turn-func-call-chatml

数据集创建者

  • 创建者: Re:cast AI

数据集描述

  • 描述: 该数据集由Re:cast AI创建,旨在将原始数据集glaiveai/glaive-function-calling-v2转换为适合SFT任务的chatml格式,以便与预训练模型一起使用。

数据集特征

  • 特征:
    • messages:
      • content (dtype: string)
      • role (dtype: string)

数据集结构

  • 数据集结构: python messages = [ {content: You are a helpful assistant with access to the following functions ... etc., role: system}, {content: Can you tell me the latest news headlines for the United States?, role: user}, {content: {"name": "get_news_headlines", "arguments": {"country": "United States"}}, role: assistant} ]

数据集大小

  • 训练集大小:
    • 示例数量: 29537
    • 字节数: 40910956.92511341
  • 下载大小: 5494056
  • 数据集总大小: 40910956.92511341

数据集分割

  • 分割:
    • train

许可证

  • 许可证: apache-2.0

任务类别

  • 任务类别: text-generation

语言

  • 语言: en

标签

  • 标签: function-calling

数据集美观名称

  • 美观名称: glaive-v2-single-turn-func-call-chatml

大小类别

  • 大小类别: 10K<n<100K
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作