five

TeichAI/Hunter-Alpha-UIGEN-T3-Agent-SFT

收藏
Hugging Face2026-04-01 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/TeichAI/Hunter-Alpha-UIGEN-T3-Agent-SFT
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit language: - en --- # Hunter Alpha UIGEN T3 All of the prompts for this dataset were sourced from [**Tesslate/UIGEN-T3-Dataset-Extended-Reasoning**](https://huggingface.co/datasets/Tesslate/UIGEN-T3-Dataset-Extended-Reasoning), and the rest were generated. Unfortunately the model was taken down from openrouter and revealed as [**xiaomi/mimo-v2-pro**](https://openrouter.ai/xiaomi/mimo-v2-pro) in the middle of the dataset creation, and only 2.6k entries were finished when this happened. Each prompt was given to [**Hunter-Alpha**](https://openrouter.ai/openrouter/hunter-alpha) (The stealth model recently revealed to be xiaomi/mimo-v2-pro) with the follow tools and system prompt: - `read_file` - Read file contents from workspace - `write_file` - Write content to a file - `edit_file` - Replace text in a file - `list_directory` - List files and directories - `search_code` - Search for patterns in files - `run_command` - Execute shell commands (with timeout) - `web_search` - Web search (powered by searxng) - `context7:*` - Context7 MCP tools ``` You are a helpful coding assistant with access to file operations and code analysis tools. Complete the user's task thoroughly and efficiently. When given a coding task, create working code files in the workspace. ``` ## Stats | Metric | Value | | --- | --- | | **Total prompt tokens** | 414,026,943 | | **Total completion tokens** | 35,621,925 | | **Total tokens** | 449,648,868 | | **Total cost** | $0.0 (USD) | | **Average turns** | 22.49 | | **Average tool calls** | 10.05 | --- This dataset was generated using [***TeichAI/agentic-datagen***](https://github.com/TeichAI/agentic-datagen) Please see the repository link for more info on how the dataset was made and/or how you can make datasets just like these.
提供机构:
TeichAI
搜集汇总
数据集介绍
main_image_url
构建方式
在人工智能辅助编程领域,数据集的构建质量直接影响模型对复杂任务的理解与执行能力。Hunter-Alpha-UIGEN-T3-Agent-SFT数据集的构建基于Tesslate/UIGEN-T3-Dataset-Extended-Reasoning中的提示词进行扩展与生成,通过Hunter-Alpha模型(后确认为xiaomi/mimo-v2-pro)在特定工具集与系统提示下交互完成。该过程模拟了真实编程环境,模型能够调用文件读写、代码搜索、命令行执行及网络搜索等多种工具,以多轮对话形式生成响应,最终形成了包含约2.6千条条目的高质量对话数据。
使用方法
针对编程智能体的监督微调任务,该数据集可直接用于训练模型理解复杂指令并执行多步骤操作。使用者可加载数据中的对话序列,将用户提示与模型响应作为输入输出对,通过标准语言模型训练流程进行微调。数据中的工具调用记录与文件操作痕迹可作为额外监督信号,帮助模型学习任务分解与工具选择策略。在实际应用中,建议结合原始提示词来源与生成代码,对数据质量进行验证,并依据具体任务需求对对话长度与工具使用模式进行适应性调整,以优化模型在代码辅助与环境交互方面的性能。
背景与挑战
背景概述
Hunter-Alpha-UIGEN-T3-Agent-SFT数据集聚焦于智能体指令微调领域,旨在通过高质量交互数据提升模型在复杂任务中的推理与执行能力。该数据集由研究团队基于Tesslate/UIGEN-T3-Dataset-Extended-Reasoning扩展构建,核心研究问题在于如何生成具备多轮对话、工具调用及代码操作能力的训练样本,以推动通用人工智能助手在真实场景中的应用。其构建过程体现了对开源协作与数据生成的重视,通过整合文件读写、代码搜索及网络查询等多种工具,为后续模型优化提供了关键支持。
当前挑战
该数据集致力于解决智能体在开放环境中执行多步骤任务时的泛化与可靠性挑战,例如模型需准确理解用户指令、动态调用工具并生成可执行代码。在构建过程中,面临模型中途变更(如Hunter-Alpha被揭示为xiaomi/mimo-v2-pro)导致数据收集中断,仅完成约2.6万条样本,影响了数据规模与完整性。此外,生成高质量多轮交互需平衡工具使用的多样性与逻辑连贯性,对自动化流程的设计提出了较高要求。
常用场景
经典使用场景
在智能体与代码生成领域,Hunter-Alpha-UIGEN-T3-Agent-SFT数据集为训练具备多工具操作能力的智能体提供了关键资源。该数据集通过模拟真实编程环境中的文件读写、代码搜索与命令执行等任务,构建了丰富的交互轨迹,使得模型能够学习如何高效利用工具链完成复杂编码指令。其经典使用场景聚焦于智能体在受限工作空间内进行代码生成与自动化任务处理,为研究智能体在结构化环境中的推理与执行能力奠定了数据基础。
解决学术问题
该数据集主要针对智能体研究中的工具使用与规划问题,解决了传统代码生成模型缺乏环境交互能力的局限。通过提供包含多轮对话与工具调用的轨迹数据,它支持研究智能体如何分解任务、选择适当工具并处理执行结果,从而推动在具身智能、自动化编程以及任务导向对话系统领域的学术探索。其意义在于弥合了纯文本生成与可执行动作之间的鸿沟,为构建更实用、可靠的智能体系统提供了实证数据支撑。
实际应用
在实际应用中,该数据集能够助力开发高级编程助手与自动化运维工具。基于此类数据训练的模型可集成到开发环境或持续集成流水线中,辅助工程师完成代码重构、文件管理、系统调试等重复性任务。例如,智能体可依据用户指令自动搜索代码库、编辑配置文件或执行测试命令,显著提升软件开发的效率与标准化程度,在DevOps、智能编码平台等场景展现出广泛的应用潜力。
数据集最近研究
最新研究方向
在智能体与代码生成领域,Hunter-Alpha-UIGEN-T3-Agent-SFT数据集聚焦于增强模型的多工具协同与上下文推理能力。该数据集源自扩展推理任务,通过集成文件操作、代码搜索、网络查询及上下文管理工具,模拟真实开发环境中的复杂交互场景。前沿研究正探索如何利用此类高质量指令微调数据,提升智能体在长序列任务中的规划与执行效率,特别是在自动化编程和软件工程辅助方面。这一方向与当前多模态智能体及自主AI系统的热点发展紧密相连,为构建更可靠、可扩展的代码生成模型提供了关键训练资源,推动了人机协作编程的实用化进程。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作