five

fitness-coach-function-calling

收藏
Hugging Face2026-01-23 更新2026-01-24 收录
下载链接:
https://huggingface.co/datasets/tengomucho/fitness-coach-function-calling
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为'tengomucho/fitness-coach-function-calling',包含将健身相关查询映射到函数调用的合成示例。数据集包括消息和工具等特征,每个特征都有详细的结构。支持的功能包括获取步数、睡眠时长和心率等健身指标。数据集有一个'train'分割,包含213个示例。
创建时间:
2026-01-13
原始信息汇总

数据集概述

数据集基本信息

  • 数据集名称: tengomucho/fitness-coach-function-calling
  • 数据集地址: https://huggingface.co/datasets/tengomucho/fitness-coach-function-calling
  • 数据集内容: 包含将健身相关查询映射到函数调用的合成示例。

数据集结构与特征

  • 数据格式: 包含 messagestools 两个主要字段。
  • messages 字段结构:
    • content: 字符串类型,表示消息内容。
    • role: 字符串类型,表示消息角色。
    • tool_calls: 列表类型,包含工具调用信息。
      • function: 结构体,包含函数信息。
        • arguments: 字符串类型,表示函数参数。
        • name: 字符串类型,表示函数名称。
      • type: 字符串类型,表示工具调用类型。
  • tools 字段结构:
    • function: 结构体,包含函数定义信息。
      • description: 字符串类型,表示函数描述。
      • name: 字符串类型,表示函数名称。
      • parameters: 结构体,包含参数信息。
        • properties: 字符串类型,表示参数属性。
        • type: 字符串类型,表示参数类型。
      • return: 结构体,包含返回值信息。
        • description: 字符串类型,表示返回值描述。
        • prefixItems: 列表类型,包含前缀项信息。
          • type: 字符串类型,表示前缀项类型。
        • type: 字符串类型,表示返回值类型。
    • type: 字符串类型,表示工具类型。

数据集配置与规模

  • 配置名称: default
  • 数据文件:
    • 分割: train
    • 路径: data/train-*
  • 数据集规模:
    • 训练集样本数: 213
    • 训练集大小: 344,880 字节
    • 数据集总大小: 344,880 字节
    • 下载大小: 13,731 字节

支持的功能

  • get_steps() - 获取今日步数
  • get_daily_step_goal() - 获取每日步数目标
  • get_goal_progress() - 获取步数目标进度
  • get_sleeping_minutes() - 获取睡眠时长
  • get_active_minutes() - 获取活动分钟数
  • get_heart_rate() - 获取当前心率
  • get_body_battery_level() - 获取身体电量水平
搜集汇总
数据集介绍
main_image_url
构建方式
在健身与健康监测领域,数据集的构建往往需要模拟真实场景下的用户交互。fitness-coach-function-calling数据集通过合成方法生成,专门针对健身教练功能调用任务设计。其构建过程基于预定义的健身相关查询与对应函数调用之间的映射关系,涵盖了步数统计、睡眠监测、心率获取等核心健康指标。数据集以对话形式组织,每条记录包含用户消息、系统角色及工具调用信息,确保了数据结构的规范性与一致性,为模型训练提供了高质量的监督信号。
特点
该数据集的特点体现在其专注于健身健康领域的函数调用场景,支持包括获取步数、睡眠时长、心率及身体能量水平在内的七种核心功能。数据以结构化对话格式呈现,每条样本均附带详细的工具定义与参数说明,便于模型理解与执行具体操作。数据集规模适中,包含213个训练样本,覆盖了多样化的用户查询模式,既保证了数据的代表性,又避免了过度冗余,适合用于微调或评估功能调用模型在垂直领域的性能。
使用方法
使用该数据集时,可将其应用于健身健康类对话系统的开发与优化。研究人员或开发者可通过加载数据集中的训练样本,指导模型学习如何将自然语言查询映射到相应的函数调用。典型应用包括训练或微调大型语言模型,使其能够准确识别用户意图并触发正确的健康监测功能。数据集中提供的工具定义与消息结构可直接集成到模型训练流程中,支持端到端的功能调用任务,助力构建智能、响应迅速的健身助手系统。
背景与挑战
背景概述
在人工智能与健康科学交叉领域,智能健身助手系统正逐渐成为研究热点,旨在通过自然语言交互提供个性化的健康管理支持。fitness-coach-function-calling数据集由tengomucho团队创建,专注于解决健身领域中的函数调用任务,其核心研究问题在于如何准确地将用户关于步数、睡眠、心率等健康指标的查询映射到相应的数据检索函数。该数据集的构建反映了当前大语言模型在特定垂直领域应用中的精细化需求,通过合成对话示例,为模型训练提供了结构化的指令遵循与工具调用能力,推动了健康辅助智能体在现实场景中的实用化进程。
当前挑战
该数据集致力于解决健身健康领域中的自然语言到函数调用映射问题,其核心挑战在于准确理解用户多样化的健身查询意图,并将其转化为规范化的数据检索操作,例如从“我今天走了多少步”到`get_steps()`函数的精确映射。在构建过程中,面临的挑战包括合成数据的真实性与多样性保障,需模拟真实用户的多变表达方式与复杂上下文;同时,确保函数调用结构的逻辑一致性,避免参数错误或语义歧义,以支撑模型在动态健康管理场景中的可靠部署与应用。
常用场景
经典使用场景
在健康监测与个性化健身指导领域,该数据集为大型语言模型提供了精准的函数调用范例,以模拟健身教练的交互场景。通过将用户关于步数、睡眠、心率等健康指标的查询映射到预定义函数,数据集支持模型学习如何解析自然语言指令并触发相应的数据检索操作,从而在虚拟健身助手或健康管理应用中实现动态响应。
解决学术问题
该数据集主要解决了智能体系统中自然语言到结构化函数调用的映射难题,为研究语言模型在工具使用和任务导向对话中的泛化能力提供了基准。它有助于探索模型如何理解模糊的用户意图,并准确选择和执行底层API,推动了对话式AI在垂直领域的可操作性和可靠性研究,对提升人机协作的效率和精准度具有重要理论意义。
衍生相关工作
围绕该数据集衍生的经典工作包括基于函数调用的对话系统架构设计、多模态健康数据融合方法,以及小样本学习在垂直领域工具使用中的适应性研究。这些工作进一步扩展了健康AI的应用边界,促进了如个性化运动计划生成、异常健康状态预警等高级功能的开发,为智能健康生态系统奠定了基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作