five

Ecom-Chatbot-Finetuning-Dataset

收藏
Hugging Face2026-03-25 更新2026-03-26 收录
下载链接:
https://huggingface.co/datasets/V1rtucious/Ecom-Chatbot-Finetuning-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Ecom Chatbot Fine-Tuning Dataset 是一个统一的电子商务聊天机器人微调数据集,整合了5个来源数据集(总计40,098个示例),涵盖产品发现、订单管理、客户支持、退货等多个方面。数据集包含多个分片,包括Amazon产品元数据(5,000个示例)、Amazon产品评论(23,100个示例)、ASOS时尚电子商务数据(2,000个示例)、Bitext客户支持数据(5,000个示例)和Bitext零售电子商务数据(4,998个示例)。每个数据条目包含多个字段,如唯一标识符(id)、来源数据集(source)、系统提示(system)、用户消息(prompt)、预期助手响应(response)、语言和地区信息(language/locale)、意图标签(intent_category/intent/sub_intent)等。该数据集适用于电子商务聊天机器人的微调和相关任务。
创建时间:
2026-03-25
原始信息汇总

Ecom Chatbot Fine-Tuning Dataset 概述

数据集基本信息

  • 许可证: Apache 2.0
  • 语言: 英语 (en)
  • 标签: 电子商务 (e-commerce)、聊天机器人 (chatbot)、客户支持 (customer-support)、对话式 (conversational)、微调 (fine-tuning)
  • 总下载大小: 22,413,441 字节
  • 总数据集大小: 68,551,906 字节
  • 总示例数: 40,098 个

数据子集划分

数据集包含7个子集,具体信息如下:

子集名称 示例数量 数据大小(字节) 数据来源描述
amazon_reviews 23,100 30,820,225 Amazon 产品评论
amazon_meta 5,000 12,521,068 Amazon 产品元数据
asos 2,000 4,710,702 ASOS 时尚电子商务数据
bitext_retail 4,998 5,297,710 Bitext 零售电子商务数据(无占位符)
bitext_customer 5,000 4,843,246 Bitext 客户支持数据(无占位符)
synthetic_train 9,000 9,149,948 合成训练数据
synthetic_test 1,000 1,209,007 合成测试数据

数据集特征

每个数据条目包含以下特征字段:

  • id: 唯一标识符
  • source: 原始数据集来源
  • group: 训练/测试分组 (A/B)
  • system: 助手使用的系统提示
  • prompt: 用户消息
  • response_type: 响应类型 (texttool_call)
  • response: 期望的助手响应
  • language: 语言元数据
  • locale: 区域设置元数据
  • annotator: 标注来源
  • domain: 电子商务领域
  • intent_category: 意图类别标签
  • intent: 意图标签
  • sub_intent: 子意图标签
  • capability: 能力标签
  • test_tier: 测试层级
  • history: 先前的对话轮次 (JSON 字符串)
  • context: 检索到的文档、购物车状态、订单详情 (JSON 字符串)
  • tools: 可用的功能工具 (JSON 字符串)
  • difficulty: 任务难度 (1–3)
  • quality_score: 标注质量分数 (0–1)

数据集描述

这是一个统一的电子商务聊天机器人微调数据集,结合了5个源数据集(总计40,098个示例),涵盖产品发现、订单管理、客户支持、退货等场景。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作