atis_function_calling
收藏Hugging Face2024-08-01 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/ashu42/atis_function_calling
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个合成的、对话式的、函数调用格式的数据集,采用Llama-3格式,专门为基于航空旅行的客户支持而创建。通过使用Atis问题意图数据集,并利用gpt-3.5-turbo模型生成多轮对话。对话采用Llama-3格式,助手使用客户服务适当的语言,并使用在对话上下文中提供的函数来获取更多数据。数据集的创建过程中,首先使用Atis的基本问题意图生成对话,然后通过第二次LLM调用来修正格式错误。该数据集主要用于创建需要函数调用能力的客户服务机器人。
创建时间:
2024-07-31
原始信息汇总
数据集卡片:Atis Function Calling
数据集概述
一个合成生成的、对话式的、函数调用格式的数据集,采用Llama-3格式,专为基于航空旅行的客户支持设计。
数据集详情
数据集描述
利用Atis问题意图数据集,并通过gpt-3.5-turbo提示,创建了这个多轮对话数据集。对话采用Llama-3格式,助手使用客户服务适当的语言,并使用在对话上下文中提供的函数来获取更多数据。
- 语言(NLP): 英语
数据集结构
数据集包含一个列,每个字符串中仅包含多轮对话,采用Llama-3格式。
数据集创建
数据收集和处理
通过提示各种模型,提供来自Atis数据集的语句和意图,要求其创建Llama-3格式的对话数据。最终选择了特定的提示和模型(gpt-3.5-turbo),生成了约300个对话,并通过另一次LLM调用纠正格式错误。
源数据生产者
[https://www.kaggle.com/datasets/siddhadev]
偏差、风险和限制
该数据集仅使用一个提示创建,通过随机选择的Atis数据集样本作为示例。这意味着数据集的多样性和泛化能力有待提高。
搜集汇总
数据集介绍

构建方式
该数据集基于ATIS意图分类数据集,通过GPT-3.5-turbo模型生成多轮对话,采用Llama-3格式进行格式化。首先,利用ATIS数据集中的单意图用户话语作为基础,生成多轮函数调用对话。随后,通过第二次LLM调用修正格式错误,确保对话格式的一致性。整个生成过程通过特定提示和模型选择,确保了对话的准确性和连贯性。
特点
该数据集以航空旅行为背景,专注于客户支持场景中的多轮对话生成。其独特之处在于采用了Llama-3格式,使得助手能够使用函数调用来获取定制化的响应。数据集包含约300个对话,每个对话都经过精心设计,确保语言风格符合客户支持场景的需求。此外,数据集还提供了明确的输入输出参数,便于模型理解和生成相关响应。
使用方法
该数据集可用于训练和微调具有函数调用能力的客户服务机器人。用户可以直接使用该数据集进行原型设计,或进一步在私有数据上进行微调,以适应特定的业务需求。数据集中的多轮对话格式为Llama-3,适合用于训练Llama-3-8B-Instruct等模型。通过该数据集,开发者可以快速构建出高效、准确的客户支持系统。
背景与挑战
背景概述
ATIS Function Calling数据集是一个基于航空旅行客户支持场景的合成对话数据集,旨在通过多轮对话模拟真实客户服务中的函数调用需求。该数据集由Surjo和Ashu于近期创建,基于ATIS意图分类数据集,并利用GPT-3.5-turbo模型生成多轮对话。其核心研究问题在于如何通过函数调用机制提升对话系统的交互能力,特别是在航空旅行信息查询等复杂场景中的应用。该数据集的推出为开发具备函数调用能力的客户服务机器人提供了高质量的训练数据,推动了对话系统在特定领域中的精细化发展。
当前挑战
ATIS Function Calling数据集在构建过程中面临多重挑战。首先,原始ATIS数据集仅包含单轮用户话语,需通过模型生成多轮对话,这对生成模型的上下文理解与连贯性提出了较高要求。其次,尽管使用了GPT-3.5-turbo模型进行对话生成,但仍需额外的模型调用以修正格式错误,增加了数据处理的复杂性。此外,数据集的多样性和泛化能力受限,因其仅基于单一提示模板生成,可能导致模型在真实场景中的表现不够全面。这些挑战凸显了在特定领域构建高质量对话数据集的难度,同时也为未来研究提供了改进方向。
常用场景
经典使用场景
在航空旅行客户服务领域,atis_function_calling数据集被广泛应用于构建多轮对话系统。该数据集通过模拟真实场景中的用户与客服之间的互动,提供了丰富的对话样本,特别适用于训练具有函数调用能力的对话模型。这些模型能够理解用户意图,并通过调用预定义的函数来提供定制化的响应,从而提升客户服务的效率和质量。
衍生相关工作
atis_function_calling数据集催生了一系列相关研究工作,特别是在基于Llama-3格式的多轮对话系统开发方面。研究人员利用该数据集训练了多个先进的对话模型,如Llama-3-8B-Instruct模型,这些模型在航空旅行客户服务中表现出色。此外,该数据集还为其他领域的多轮对话系统研究提供了参考,推动了对话生成技术的进一步发展。
数据集最近研究
最新研究方向
近年来,随着自然语言处理技术的飞速发展,基于对话系统的客户服务应用逐渐成为研究热点。atis_function_calling数据集作为一项专注于航空旅行领域的多轮对话数据集,其独特之处在于结合了Llama-3格式的对话生成与函数调用功能。这一特性使得该数据集在开发具有复杂交互能力的客户服务机器人方面具有重要价值。当前,研究者们正致力于利用该数据集进一步优化对话系统的上下文理解能力,特别是在多轮对话中如何更精准地调用外部函数以提供定制化响应。此外,随着大语言模型(如GPT-3.5-turbo)的广泛应用,如何通过微调提升模型在特定领域的表现也成为前沿研究方向之一。atis_function_calling数据集的推出,不仅填补了高质量对话数据集的空白,还为航空旅行领域的智能客服系统开发提供了重要支持。
以上内容由遇见数据集搜集并总结生成



