pokkit-mini-dataset

Hugging Face2026-02-19 更新2026-02-20 收录

下载链接：

https://huggingface.co/datasets/wittlesus/pokkit-mini-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

pokkit-mini 是一个用于微调 Pokkit AI 代理的小型语言模型的数据集。该数据集包含约 2,000 条合成的对话数据，采用 ChatML 格式，专门针对手机控制任务、工具调用及 Pokkit 个性特征进行训练。数据通过 `generate_dataset.py` 脚本生成，每条对话包含系统角色、用户输入、助手响应及工具调用等字段。数据集适用于微调模型以快速理解内置工具、准确调用工具、体现 Pokkit 个性及拒绝后台自动化等场景。训练采用 LoRA 方法（rank 16），通过 Unsloth 实现高效微调，支持在 RTX 3060 及以上显卡或免费 Colab T4 上运行。数据集文件包括训练集（train.jsonl）和评估集（eval.jsonl），并配套提供训练脚本、导出工具及 Colab 笔记本。

创建时间：

2026-02-19

搜集汇总

数据集介绍

构建方式

在移动智能体领域，为提升模型对特定任务的响应效率，pokkit-mini数据集通过合成对话的方式构建。该数据集利用generate_dataset.py脚本自动生成了约2000条模拟真实手机控制场景的对话，每条对话均遵循ChatML格式，并嵌入了精确的工具调用模式。数据生成过程聚焦于工具使用、任务执行与角色一致性，确保了训练样本在语义与结构上的高质量。随后，采用LoRA（低秩适应）方法，以Qwen2.5-3B-Instruct或Phi-3.5-mini-instruct为基础模型，在Unsloth框架下进行高效微调，整个训练过程仅需数十分钟，显著降低了计算资源需求。

特点

pokkit-mini数据集的核心特点在于其高度专业化与集成化。数据集紧密围绕Pokkit智能体的功能设计，内置了完整的工具模式与调用规范，使模型无需额外学习即可准确执行手机控制指令。对话样本中融入了智能体的个性化特征，如自动化拒绝机制与插件理解能力，确保了响应的一致性与合规性。此外，数据集采用轻量化的LoRA微调策略，在保持基础模型强大推理能力的同时，实现了快速部署与低资源消耗，适用于边缘设备或云端协作环境。

使用方法

使用pokkit-mini数据集时，开发者可遵循清晰的流程实现模型训练与应用集成。首先通过generate_dataset.py脚本生成定制化的训练数据，随后利用train.py脚本在本地GPU或Google Colab平台进行LoRA微调，支持RTX 3060及以上显卡或免费T4资源。训练完成后，通过export.py脚本将模型导出为GGUF或ONNX格式，便于在Ollama等推理框架中部署。最终，用户可在Pokkit应用程序中直接调用微调后的模型，实现高效、个性化的手机自动化任务处理。

背景与挑战

背景概述

随着人工智能代理技术的快速发展，面向特定任务的轻量化语言模型微调成为研究热点。pokkit-mini-dataset应运而生，其创建旨在为Pokkit AI智能体提供专门优化的训练数据，以增强其在手机控制、工具调用及个性化交互方面的能力。该数据集由相关研究团队于近期构建，核心研究问题聚焦于如何通过高质量合成对话数据，使小型模型在有限参数下精准掌握复杂工具模式与合规性约束，从而推动边缘设备智能代理的实用化进程。

当前挑战

该数据集致力于解决智能代理领域中的工具调用与个性化适应挑战，要求模型在理解用户指令后能准确选择并执行预定义工具，同时保持一致的个性风格与安全合规。在构建过程中，主要挑战在于生成大规模、高质量的合成对话数据，需确保工具调用模式的多样性、参数结构的精确性，以及对话逻辑的自然流畅，同时避免数据偏差并满足严格的计算效率约束，以适配轻量化训练框架。

常用场景

经典使用场景

在移动设备自动化与智能助手领域，pokkit-mini-dataset专为训练轻量级语言模型以执行手机控制任务而设计。该数据集通过合成对话模拟真实用户指令，如设置闹钟、调用工具等，使模型能够精准理解并执行具体操作指令，无需额外系统提示即可展现个性化交互风格。其经典使用场景集中于模型微调过程，旨在优化小型语言模型在资源受限环境下的工具调用能力与响应效率。

衍生相关工作

围绕该数据集衍生的经典工作主要包括基于LoRA微调技术的轻量级模型优化方法。研究团队利用Unsloth框架实现了高效参数微调，大幅缩短了训练时间；同时，通过导出GGUF与ONNX格式模型，促进了模型在Ollama等部署平台的标准化应用。这些工作不仅扩展了Qwen2.5-3B-Instruct与Phi-3.5-mini-instruct等基础模型在工具调用场景的性能边界，还为开源社区提供了可复现的合成数据生成与模型蒸馏范例。

数据集最近研究