tw-function-call-reasoning-10k

Name: tw-function-call-reasoning-10k
Creator: maas
Published: 2026-01-07 10:45:39
License: 暂无描述

魔搭社区2026-01-07 更新2025-05-24 收录

下载链接：

https://modelscope.cn/datasets/twinkle-ai/tw-function-call-reasoning-10k

下载链接

链接失效反馈

官方服务：

资源简介：

# Dataset Card for tw-function-call-reasoning-10k  ![image/png](https://cdn-uploads.huggingface.co/production/uploads/618dc56cbc345ca7bf95f3cd/6tenWtLBOFTQTZsKCfwK_.png) 本資料集為繁體中文版本的函式呼叫（Function Calling）資料集，翻譯自 [AymanTarig/function-calling-v0.2-with-r1-cot](https://huggingface.co/datasets/AymanTarig/function-calling-v0.2-with-r1-cot)，而該資料集本身是 [Salesforce/xlam-function-calling-60k](https://huggingface.co/datasets/Salesforce/xlam-function-calling-60k) 的修正版。我們利用語言模型翻譯後，經人工修改，旨在打造高品質的繁體中文工具使用語料。 ## Dataset Details ### Dataset Description  **tw-function-call-reasoning-10k** 是一個專為語言模型「工具使用能力（Function Calling）」訓練所設計的繁體中文資料集。其內容源自 [AymanTarig/function-calling-v0.2-with-r1-cot](https://huggingface.co/datasets/AymanTarig/function-calling-v0.2-with-r1-cot)，該資料集又為 [Salesforce/xlam-function-calling-60k](https://huggingface.co/datasets/Salesforce/xlam-function-calling-60k) 的修正版。我們透過語言模型將資料轉譯為繁體中文，並保留原始的 Chain-of-Thought（CoT）推理結構。此資料集可作為未來擴充**繁體中文 function-calling 語料**的基石，並有助於強化 LLM 在實際應用中的推理能力與工具整合能力。 - **Curated by:** [Minyi Chen](https://huggingface.co/minyichen) - **Funded by:** [APMIC](https://www.apmic.ai/) - **Shared by:** [Minyi Chen](https://huggingface.co/minyichen) - **Language(s) (NLP):** Traditional Chinese & English - **License:** Creative Commons Attribution 4.0 ### Dataset Sources  - **Repository:** [twinkle-ai/tw-function-call-reasoning-10k](https://huggingface.co/datasets/twinkle-ai/tw-function-call-reasoning-10k) ## Uses  ### Direct Use  - **語言模型工具使用能力訓練：** 可用於指令微調（Instruction Tuning），提升語言模型在對話中準確選擇工具（Tool Selection）與生成結構化輸入（Tool Input）的能力。 - **Chain-of-Thought 推理建構：** 資料集中保留了逐步思考與推導過程，適合用於訓練具多步驟邏輯推理能力的模型。 - **繁體中文指令式語料建構基礎：** 作為日後構建更大規模繁體中文工具使用資料集的重要起點。 - **代理人系統（LLM Agent）訓練場景模擬：** 可用於模擬 agent 在使用 API 工具或外部函式時的互動語境與結構。 ### Out-of-Scope Use  - **不當工具呼叫生成：** 本資料集假設輸出格式符合固定結構，並不適用於開放式、無約束的 API 呼叫語境。 - **對資料品質要求極高之產業應用：** 雖已盡力保留語意與格式，但此資料為翻譯自英文語料，部分語句仍可能存有潛在語用或語調偏差，不建議直接部署於高風險應用（如醫療、法律）。 - **用於訓練具偏見或攻擊性的工具選擇模型：** 本資料集不包含針對敏感議題或潛在有害工具操作的處理，不適合用於開發會執行未經審核動作之系統。 ## Dataset Structure  > ⚠️*注意*: messages 採取 *Hermes* 格式設計。 ```json { 'id', # 樣本唯一編號 'query', # 英文任務指令（原始輸入） 'tools', # 可使用的工具清單（含名稱、參數定義等 JSON 結構） 'query_zhtw', # 指令的繁體中文翻譯版本 'think', # 模型的思考推理過程（繁體中文） 'answer', # 預期執行的工具與參數（JSON 格式） 'messages' # 完整對話歷程（包含角色與訊息內容，用於 SFT 微調） } ``` ## Dataset Creation ### Curation Rationale  本資料集的建立，旨在填補「繁體中文語境下的函式呼叫訓練資料」之嚴重缺口。儘管英文語料（如 [Salesforce/xlam-function-calling-60k](https://huggingface.co/datasets/Salesforce/xlam-function-calling-60k)）在 tool calling 領域已有初步建構，但繁體中文語料的缺乏導致中文大型語言模型（LLM）在相關任務上的泛化能力受限。因此，我們以 AymanTarig 所釋出的 [function-calling-v0.2-with-r1-cot](https://huggingface.co/datasets/AymanTarig/function-calling-v0.2-with-r1-cot) 為藍本，進一步運用語言模型將其翻譯為繁體中文，並保留推理（Chain-of-Thought）內容，使其可廣泛應用於指令微調、工具選擇與 agent 推理等繁體中文 LLM 實驗。 ### Source Data  #### Data Collection and Processing  本資料集是根據 [AymanTarig/function-calling-v0.2-with-r1-cot](https://huggingface.co/datasets/AymanTarig/function-calling-v0.2-with-r1-cot) 所提供的英文函式呼叫資料，利用譯語言模型自動轉譯為繁體中文後，再經人工清洗。處理流程包括： - 篩選原始英文資料集中包含 tool calling 和推理步驟的樣本（我們取樣 [AymanTarig/function-calling-v0.2-with-r1-cot](https://huggingface.co/datasets/AymanTarig/function-calling-v0.2-with-r1-cot) 10k 條）； - 翻譯 user, assistant, tool_input 等欄位，保留原始資料格式 - 人工審核部分翻譯結果，確保語意通順與邏輯一致性 - 最終格式與原始資料相同，便於與英文版本並行訓練與比較 ## Bias, Risks, and Limitations  本資料集為從英文資料翻譯而來，儘管已使用高品質模型進行語意轉換，仍可能存在以下限制： - **語言風格偏誤：** 原始資料以英文邏輯與對話風格為主，翻譯後可能出現不符合中文語境的表達方式，或過於直接、不自然的語序。 - **工具輸入格式敏感：** 資料中包含大量 tool_input 欄位的 JSON 結構，雖已保留結構正確性，但仍建議訓練前進行驗證清洗，避免因特殊符號造成格式錯誤。 - **語意準確度依賴模型輸出：** 翻譯過程依賴自動化模型，可能遺漏原始推理中部分細節、反應不完全，對需要精準語意理解的應用造成風險。 - **語境偏向開發者工具任務：** 資料主要集中在模擬工具使用情境，如天氣查詢、計算、轉換等任務，可能不適合應用於開放式、情感導向、或文化語境相關的對話建模。 ### Recommendations  - 適用於結構化任務與代理人系統（Agent）訓練，如 chat 工具選擇、API 任務執行等。 - 不建議直接用於無監督學習、生成文本任務，因資料格式具明確結構，且偏重邏輯推理與工具使用場景。 - 建議於訓練前進行資料驗證與格式校正，尤其針對 tool_input 欄位。 - 應搭配人工評估驗證翻譯品質，特別是部署至需高度語意一致性與語言文化敏感度的應用時。 ## Citation  ```yaml @misc{twinkle2024functioncalling, title = {twinkle-ai/tw-function-call-reasoning-10k: A Traditional Chinese Dataset for Function Calling with Chain-of-Thought Reasoning}, author = {Twinkle AI}, year = {2025}, note = {Available at: \url{https://huggingface.co/datasets/twinkle-ai/tw-function-call-reasoning-10k}; Translated from AymanTarig/function-calling-v0.2-with-r1-cot} } ``` ## Dataset Card Authors [Twinkle AI](https://huggingface.co/twinkle-ai) ## Dataset Card Contact [Twinkle AI](https://huggingface.co/twinkle-ai)

# 数据集卡片：tw-function-call-reasoning-10k ![image/png](https://cdn-uploads.huggingface.co/production/uploads/618dc56cbc345ca7bf95f3cd/6tenWtLBOFTQTZsKCfwK_.png) 本数据集为繁体中文版本的函数调用（Function Calling）数据集，翻译自 [AymanTarig/function-calling-v0.2-with-r1-cot](https://huggingface.co/datasets/AymanTarig/function-calling-v0.2-with-r1-cot)，而该数据集本身是 [Salesforce/xlam-function-calling-60k](https://huggingface.co/datasets/Salesforce/xlam-function-calling-60k) 的修正版本。我们通过大语言模型（Large Language Model，LLM）完成自动翻译后，经人工校对修改，旨在打造高质量的繁体中文工具使用语料。 ## 数据集详情 ### 数据集描述 **tw-function-call-reasoning-10k** 是一个专为大语言模型的「工具使用能力（Function Calling）」训练设计的繁体中文数据集。其内容源自 [AymanTarig/function-calling-v0.2-with-r1-cot](https://huggingface.co/datasets/AymanTarig/function-calling-v0.2-with-r1-cot)，该数据集又是 [Salesforce/xlam-function-calling-60k](https://huggingface.co/datasets/Salesforce/xlam-function-calling-60k) 的修正版本。我们通过大语言模型将原始数据集翻译为繁体中文，并保留了原始的思维链（Chain-of-Thought，CoT）推理结构。此数据集可作为未来扩充**繁体中文函数调用语料**的基石，并有助于强化大语言模型在实际应用中的推理能力与工具整合能力。 - **数据整理者：** [Minyi Chen](https://huggingface.co/minyichen) - **资助方：** [APMIC](https://www.apmic.ai/) - **共享方：** [Minyi Chen](https://huggingface.co/minyichen) - **语言（自然语言处理）：** 繁体中文与英文 - **授权协议：** 知识共享署名4.0（Creative Commons Attribution 4.0） ### 数据集来源 - **代码仓库：** [twinkle-ai/tw-function-call-reasoning-10k](https://huggingface.co/datasets/twinkle-ai/tw-function-call-reasoning-10k) ## 数据集用途 ### 直接使用场景 - **语言模型工具使用能力训练：** 可用于指令微调（Instruction Tuning），提升大语言模型在对话中精准选择工具（Tool Selection）与生成结构化输入（Tool Input）的能力。 - **思维链（Chain-of-Thought，CoT）推理构建：** 数据集保留了逐步思考与推导过程，适用于训练具备多步骤逻辑推理能力的模型。 - **繁体中文指令式语料构建基础：** 作为日后构建更大规模繁体中文工具使用数据集的重要起点。 - **AI智能体（AI Agent）训练场景模拟：** 可用于模拟智能体在调用API工具或外部函数时的交互语境与结构。 ### 不适用场景 - **不当工具调用生成：** 本数据集假设输出格式符合固定结构，不适用于开放式、无约束的API调用语境。 - **对数据质量要求极高的产业应用：** 尽管已尽力保留语义与格式，但本数据集由英文语料翻译而来，部分语句仍可能存在潜在语用或语调偏差，不建议直接部署于高风险应用（如医疗、法律领域）。 - **用于训练带有偏见或攻击性的工具选择模型：** 本数据集未包含针对敏感议题或潜在有害工具操作的处理逻辑，不适用于开发会执行未审核动作的系统。 ## 数据集结构 > ⚠️**注意**：messages 字段采用 Hermes 格式规范。 json { 'id', # 样本唯一编号 'query', # 英文任务指令（原始输入） 'tools', # 可使用的工具清单（包含名称、参数定义等JSON结构） 'query_zhtw', # 指令的繁体中文翻译版本 'think', # 模型的思考推理过程（繁体中文） 'answer', # 预期执行的工具与参数（JSON格式） 'messages' # 完整对话历程（包含角色与消息内容，用于监督微调SFT） } ## 数据集构建 ### 构建动机本数据集的构建，旨在填补「繁体中文语境下的函数调用训练数据」的严重缺口。尽管英文语料（如 [Salesforce/xlam-function-calling-60k](https://huggingface.co/datasets/Salesforce/xlam-function-calling-60k)）在工具调用领域已具备初步基础，但繁体中文语料的匮乏导致中文大语言模型在相关任务上的泛化能力受限。因此，我们以AymanTarig发布的 [function-calling-v0.2-with-r1-cot](https://huggingface.co/datasets/AymanTarig/function-calling-v0.2-with-r1-cot) 为蓝本，通过大语言模型将其翻译为繁体中文，并保留了思维链推理内容，使其可广泛应用于指令微调、工具选择与AI智能体推理等繁体中文大语言模型实验场景。 ### 源数据 #### 数据收集与处理本数据集基于 [AymanTarig/function-calling-v0.2-with-r1-cot](https://huggingface.co/datasets/AymanTarig/function-calling-v0.2-with-r1-cot) 提供的英文函数调用数据，先通过大语言模型自动翻译为繁体中文，再经人工清洗校对。处理流程包括： - 从原始英文数据集中筛选包含工具调用与推理步骤的样本（我们从 [AymanTarig/function-calling-v0.2-with-r1-cot](https://huggingface.co/datasets/AymanTarig/function-calling-v0.2-with-r1-cot) 中抽取10,000条样本）； - 翻译user、assistant、tool_input等字段，保留原始数据格式； - 人工审核部分翻译结果，确保语义通顺与逻辑一致性； - 最终格式与原始数据集保持一致，便于与英文版本并行训练与对比。 ## 偏差、风险与局限性本数据集由英文语料翻译而来，尽管已采用高质量模型进行语义转换，仍存在以下限制： - **语言风格偏差：** 原始数据以英文逻辑与对话风格为主，翻译后可能出现不符合中文语境的表达方式，或过于直接、不自然的语序。 - **工具输入格式敏感：** 数据集中包含大量tool_input字段的JSON结构，尽管已保留结构正确性，但仍建议在训练前进行格式校验与清洗，避免因特殊符号导致格式错误。 - **语义准确性依赖翻译模型输出：** 翻译过程依赖自动化模型，可能遗漏原始推理中的部分细节、表达不完整，对需要精准语义理解的应用造成潜在风险。 - **语境偏向开发者工具任务：** 数据主要集中在模拟工具使用场景，如天气查询、计算、格式转换等任务，可能不适用于开放式、情感导向或文化语境相关的对话建模。 ### 建议 - 适用于结构化任务与AI智能体训练场景，如对话工具选择、API任务执行等。 - 不建议直接用于无监督学习、文本生成任务，因数据集格式具有明确结构，且偏重逻辑推理与工具使用场景。 - 建议在训练前进行数据验证与格式校正，尤其针对tool_input字段。 - 部署至需要高度语义一致性与语言文化敏感度的应用时，建议搭配人工评估以验证翻译质量。 ## 引用格式 yaml @misc{twinkle2024functioncalling, title = {"twinkle-ai/tw-function-call-reasoning-10k: A Traditional Chinese Dataset for Function Calling with Chain-of-Thought Reasoning"}, author = {Twinkle AI}, year = {2025}, note = {Available at: url{https://huggingface.co/datasets/twinkle-ai/tw-function-call-reasoning-10k}; Translated from AymanTarig/function-calling-v0.2-with-r1-cot} } ## 数据集卡片作者 [Twinkle AI](https://huggingface.co/twinkle-ai) ## 数据集卡片联系方式 [Twinkle AI](https://huggingface.co/twinkle-ai)

提供机构：

maas

创建时间：

2025-05-20

搜集汇总

数据集介绍