Ecom-Chatbot-Finetuning-Dataset
收藏Hugging Face2026-03-25 更新2026-03-26 收录
下载链接:
https://huggingface.co/datasets/V1rtucious/Ecom-Chatbot-Finetuning-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
Ecom Chatbot Fine-Tuning Dataset 是一个统一的电子商务聊天机器人微调数据集,整合了5个来源数据集(总计40,098个示例),涵盖产品发现、订单管理、客户支持、退货等多个方面。数据集包含多个分片,包括Amazon产品元数据(5,000个示例)、Amazon产品评论(23,100个示例)、ASOS时尚电子商务数据(2,000个示例)、Bitext客户支持数据(5,000个示例)和Bitext零售电子商务数据(4,998个示例)。每个数据条目包含多个字段,如唯一标识符(id)、来源数据集(source)、系统提示(system)、用户消息(prompt)、预期助手响应(response)、语言和地区信息(language/locale)、意图标签(intent_category/intent/sub_intent)等。该数据集适用于电子商务聊天机器人的微调和相关任务。
创建时间:
2026-03-25
原始信息汇总
Ecom Chatbot Fine-Tuning Dataset 概述
数据集基本信息
- 许可证: Apache 2.0
- 语言: 英语 (en)
- 标签: 电子商务 (e-commerce)、聊天机器人 (chatbot)、客户支持 (customer-support)、对话式 (conversational)、微调 (fine-tuning)
- 总下载大小: 22,413,441 字节
- 总数据集大小: 68,551,906 字节
- 总示例数: 40,098 个
数据子集划分
数据集包含7个子集,具体信息如下:
| 子集名称 | 示例数量 | 数据大小(字节) | 数据来源描述 |
|---|---|---|---|
amazon_reviews |
23,100 | 30,820,225 | Amazon 产品评论 |
amazon_meta |
5,000 | 12,521,068 | Amazon 产品元数据 |
asos |
2,000 | 4,710,702 | ASOS 时尚电子商务数据 |
bitext_retail |
4,998 | 5,297,710 | Bitext 零售电子商务数据(无占位符) |
bitext_customer |
5,000 | 4,843,246 | Bitext 客户支持数据(无占位符) |
synthetic_train |
9,000 | 9,149,948 | 合成训练数据 |
synthetic_test |
1,000 | 1,209,007 | 合成测试数据 |
数据集特征
每个数据条目包含以下特征字段:
id: 唯一标识符source: 原始数据集来源group: 训练/测试分组 (A/B)system: 助手使用的系统提示prompt: 用户消息response_type: 响应类型 (text或tool_call)response: 期望的助手响应language: 语言元数据locale: 区域设置元数据annotator: 标注来源domain: 电子商务领域intent_category: 意图类别标签intent: 意图标签sub_intent: 子意图标签capability: 能力标签test_tier: 测试层级history: 先前的对话轮次 (JSON 字符串)context: 检索到的文档、购物车状态、订单详情 (JSON 字符串)tools: 可用的功能工具 (JSON 字符串)difficulty: 任务难度 (1–3)quality_score: 标注质量分数 (0–1)
数据集描述
这是一个统一的电子商务聊天机器人微调数据集,结合了5个源数据集(总计40,098个示例),涵盖产品发现、订单管理、客户支持、退货等场景。



