Telecom-Function-Calling-Evaluation
收藏Hugging Face2024-11-07 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/ZTE-AIM/Telecom-Function-Calling-Evaluation
下载链接
链接失效反馈官方服务:
资源简介:
TFCE数据集是一个用于评估通信领域函数调用能力的数据集,包含1800余个函数和917道Python题目。数据集分为四种类型:简单函数、多函数、并行函数和并行多函数,涵盖了4G LTE、5G技术、6G探索、无线通信、物联网、移动通信系统、网络安全等多个领域。数据集的结构包括问题、函数和答案,函数部分由名称、描述和参数组成。数据集中的问题文本为中文,其他部分为英文。
创建时间:
2024-11-07
原始信息汇总
TFCE(Telecom Function-Calling Evaluation)数据集
数据集摘要
TFCE是一个评估通信领域函数调用能力的数据集,由1800余个函数构成917道Python题目,应用于通信领域的Simple(简单函数)、Multiple(多函数)、Parallel(并行函数)、Parallel-Multiple(并行多函数)等场景,涉及4G LTE、5G技术与6G探索、无线通信与网络优化、物联网(IoT)与M2M通信、移动通信系统与实施、网络安全与协议等方面的内容。
语言
- 数据集中question的文本是中文。
- 其他部分的文本是英文。
数据集结构
TFCE数据集中的数据按照“question-function-required”的结构,其中“function”由“name”、“description”、“parameters”组成,“parameters”由“type”和“properties”组成。数据集可分为以下四种类型:
| 数据集类别 | 数据集介绍 |
|---|---|
| 简单函数 | 包含1个问题、1个函数、1个答案,用户提供一个单一的JSON函数文档,且每次仅调用一个函数。 |
| 多函数 | 包含1个问题,2-4个函数、1个答案,并根据该问题从多个JSON函数文档中仅调用1个可用函数,其余函数对于该问题均不可用。 |
| 并行函数 | 包含1个问题,1个函数、2-4个答案,根据需要多次调用该函数,因此产生了多个答案。 |
| 并行多函数 | 包含1个问题,2-4个函数、2-4个答案,可看作是并行函数和多函数两种类别的组合。使用并行多函数时,将根据需要对应调用可用函数及调用次数。 |
数据实例
简单函数&并行函数
简单函数和并行函数在“question”与“function”的结构上基本相同,仅在“possible_answer”部分,简单函数为1次调用的结果,而并行函数由于多次调用构成了列表形式。
多函数&并行多函数
多函数和并行多函数同样在“question”与“function”的结构上基本相同,仅在“possible_answer”部分,多函数为1次调用的结果,而并行多函数由于多次调用构成了列表形式。
数据字段
TFCE数据集中的数据按照“问题-函数-答案”的结构,以下为各字段的解释:
- question:一道关于通信领域需要调用函数解决的问题。
- function:回答相应问题所需要调用的函数,该部分由函数名称、函数描述、必需参数组成。
- possible_answer:函数调用的结果,由各个必需函数的结果组成。
数据集组成
| 类型 | Simple | Parallel | Multiple | Parallel-Multiple |
|---|---|---|---|---|
| 数量 | 300 | 166 | 88 | 363 |
鸣谢
感谢@MeiManlin、@ZhangJing、@YuanKejia对本数据集的贡献。
搜集汇总
数据集介绍

构建方式
TFCE数据集通过精心设计的结构,围绕通信领域的函数调用能力进行评估。该数据集由1800余个函数构成917道Python题目,涵盖了4G LTE、5G技术与6G探索、无线通信与网络优化、物联网(IoT)与M2M通信、移动通信系统与实施、网络安全与协议等多个领域。数据按照“question-function-required”的结构组织,其中“function”部分包含函数名称、描述和参数,参数则由类型和属性组成。数据集进一步分为简单函数、多函数、并行函数和并行多函数四种类别,以满足不同场景的需求。
特点
TFCE数据集的显著特点在于其多样化的函数调用场景和广泛的技术覆盖范围。数据集不仅包含简单函数调用,还涉及多函数、并行函数以及并行多函数等复杂场景,能够全面评估函数调用的能力。此外,数据集中的问题文本采用中文,而函数描述和参数部分则使用英文,这种双语设计有助于提升数据集的国际化应用价值。数据集的实例展示了如何通过函数调用解决通信领域的具体问题,如频段选择、路径损耗计算等,具有较强的实用性和针对性。
使用方法
使用TFCE数据集时,用户可以根据具体需求选择不同的函数调用场景进行测试和评估。对于简单函数,用户只需调用单一函数并获取结果;对于多函数,用户需要从多个函数中选择合适的函数进行调用;并行函数则要求用户多次调用同一函数以生成多个结果;并行多函数则结合了多函数和并行函数的特点,用户需要调用多个函数并生成多个结果。数据集提供了详细的JSON格式示例,用户可以通过解析这些示例来理解函数调用的具体流程和参数设置,从而在实际应用中实现高效的函数调用评估。
背景与挑战
背景概述
Telecom-Function-Calling-Evaluation(TFCE)数据集由Mei Manlin、Zhang Jing和Yuan Kejia等研究人员共同创建,旨在评估通信领域中的函数调用能力。该数据集涵盖了4G LTE、5G技术、6G探索、无线通信与网络优化、物联网(IoT)与M2M通信、移动通信系统与实施、网络安全与协议等多个通信技术领域。TFCE数据集通过917道Python题目,模拟了简单函数、多函数、并行函数和并行多函数等不同场景,为通信领域的研究人员提供了一个全面的评估工具。该数据集的创建不仅推动了通信技术领域的研究进展,还为相关技术的实际应用提供了重要参考。
当前挑战
TFCE数据集在构建和应用过程中面临多重挑战。首先,通信技术领域的复杂性和多样性要求数据集必须涵盖广泛的技术场景,这对数据集的全面性和准确性提出了极高要求。其次,函数调用能力的评估需要精确模拟实际应用中的各种情境,包括简单函数、多函数、并行函数和并行多函数等,这对数据集的多样性和复杂性提出了挑战。此外,数据集的构建过程中,如何确保函数调用的正确性和一致性,以及如何有效处理多函数和并行函数之间的依赖关系,也是构建过程中需要解决的关键问题。这些挑战不仅考验了数据集的构建技术,也对相关领域的研究提出了更高的要求。
常用场景
经典使用场景
在通信技术领域,TFCE数据集被广泛应用于评估函数调用能力,特别是在4G LTE、5G技术及6G探索、无线通信与网络优化、物联网(IoT)与M2M通信、移动通信系统与实施、网络安全与协议等方面。通过提供1800余个函数构成的917道Python题目,该数据集能够模拟从简单函数到并行多函数的多种调用场景,为研究人员提供了一个全面的测试平台。
实际应用
在实际应用中,TFCE数据集被广泛用于通信系统的开发和测试。例如,在5G网络部署中,通过调用数据集中的函数,工程师可以快速评估不同频段和地理区域的适用性,从而优化网络配置。此外,该数据集还可用于物联网设备的通信协议测试,确保设备在不同环境下的稳定性和可靠性。
衍生相关工作
基于TFCE数据集,许多经典研究工作得以展开。例如,研究人员利用该数据集开发了新型的通信协议优化算法,显著提升了网络传输效率。此外,该数据集还被用于训练和测试机器学习模型,以自动识别和解决通信系统中的函数调用问题。这些衍生工作不仅丰富了通信技术的研究内容,还为实际应用提供了有力的技术支持。
以上内容由遇见数据集搜集并总结生成



